2022 Python 计算生态六月推荐榜 第52期

22年6月10日 · Python123 3455 人阅读
![]() |
看见更大的世界,遇见更好的自己
See a better world to meet better for ourselves.
异常检测(anomaly detection)是对不符合预期模式或数据集中其他项目、事件、观测值的识别,通常异常项目会转变成结构缺陷、文本错误等类型的问题。有三大类异常检测方法,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器。半监督式异常检测方法根据一个给定的正常训练数据集建立一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。
2022年06月,在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性,好事者特别推荐10款优秀的Python计算生态,帮助您了解Python 的异常检测。
pyod
pyod(Python Outlier
Detection)是一个集成了30余种异常检测方法和模型的Python工具箱。从经典的 LOF (SIGMOD 2000) 到最新的
ECOD (TKDE 2022) 。
https://github.com/yzhao062/pyod
Detect
Alibi Detect 是一个专注于异常值、对抗性和漂移检测的机器学习专用库。
![]() |
https://github.com/SeldonIO/alibi-detect
flow-forecast
用于时间序列预测、分类和异常检测的深度学习 PyTorch 库(最初用于洪水预测)。
https://github.com/AIStream-Peelout/flow-forecast
anomalib
一个异常检测库,包含最先进的算法和功能,例如实验管理、超参数优化和边缘推理。
![]() |
https://github.com/openvinotoolkit/anomalib
ADTK
Anomaly Detection
Toolkit (ADTK) 是一个 Python 包,用于无监督/基于规则的时间序列异常检测。
https://github.com/arundo/adtk
tods
TODS 是一个自动化机器学习检测系统,主要任务序列数据。时间(时间序列处理,特征分析(特征分析),检测(检测,算法,强化模块)。提供的功能包括常见的数据处理、时间序列的数据处理模块)算法或模块该可以处理时间异常序列检测:点的时间异常(异常是域的异常) 、模式的异常检测(异常是子序列)、系统的异常检测(异常是时间序列包的集合)。TODS提供了相应的算法。
https://github.com/datamllab/tods
pygod
Pygod 是一个用于图异常检测(异常检测)的Python 库。
![]() |
https://github.com/pygod-team/pygod
suod
一种用于大规模无监督异构异常检测的加速系统。
https://github.com/yzhao062/suod
pytod
基于张量的异常值检测,通用 GPU 加速框架。
https://github.com/yzhao062/pytod
skyline
Skyline 是一个实时异常检测、时间序列分析和性能监控系统,旨在实现对指标的被动监控,无需为每个指标配置模型/阈值。它旨在用于需要持续监控的大量高分辨率时间序列的任何地方。
Python3Turtle