本文摘要(由AI生成):
这段文本主要介绍了异常检测的行业背景及现状,并通过一个具体案例展示了如何利用机器学习工具 Altair(®) Knowledge Studio(®) 和实时可视化工具 Altair Panopticon™ 实现异常检测。文本重点介绍了实施状态监测的常用方法和行业应用中异常检测模型的应用情况,并详细讲解了案例中数据准备、数据分析和实时可视化的步骤。
行业背景及现状
异常检测(或离群值检测),是从事件或观察结果中识别出罕见现象,这些事件由于与大多数数据有着显著差异而被怀疑为异常。
通常,异常数据会与某些问题或罕见事件关联,例如银行欺诈、医疗问题、结构缺陷、设备故障等。因为从业务角度来看,识别这些事件通常非常有趣,所以这种关联让人们有兴趣找出哪些数据点可以视为异常。
实施状态监测最常见方法是监控机器上的每个传感器测量值,并对其施加最小和最大值限制。如果当前值在范围之内,则机器运行状况良好。如果当前值超出范围,则机器运行不正常,并发送警报。
在行业应用里面,基于先知经验的模型还在继续使用,但是基于机器学习的模型也开始得到应用和推广。
应用示例
本例以某一项目异常检测为例,说明如何利用 机器学习工具 Altair® Knowledge Studio® 和实时可视化工具 Altair Panopticon™ 结合,帮助用户实现异常检测目的。
示例讲解
● 数据准备
首先进行数据准备工作,包括预览数据,了解各统计量,同时,对数据集的缺失值进行填充,绘制特征变量,观察趋势等。
● 数据分析
然后利用不同的异常值检测方法分析数据,分析报告中包括使用的检测方法、有异常值的变量信息等。
另外,用户可以根据业务需要,编写Python代码进行异常值检测。
● 实时可视化
最后,把训练好的异常检测模型输出 Python 代码并导入到 Panopticon 中,以实时可视化的方式进行在线异常检测状态显示。