论文题目:
A Multi-Indicator Fusion-Based Approach for Fault Feature Selection and Classification of Rolling Bearings
论文期刊:IEEE Transactions on Industrial Informatics
论文日期:2023年8月
论文链接:
https://ieeexplore.ieee.org/document/9944141
作者:Cheng Peng (a), Yuyao Ouyang (a), Weihua Gui (b), Changqing Shen (a), Zhaohui Tang (b)
机构:
a: School of Computer, Hunan University of Technology, Zhuzhou, 412007, PR China;
b: School of Automation, Central South University, Changsha 410083, PR China.
作者简介:彭成,中南大学计算机应用技术博士,中南大学控制科学与工程博士后,教授,硕士生导师,湖南省青年骨干教师,国家公派丹麦奥尔堡大学访问学者,株洲市高层次人才,湖南工业大学精英人才,现任计算机学院副院长。长期从事工业装备健康分析、矿物泡沫浮选工艺研究,主持国家自然科学基金面上项目、国家自然科学基金联合项目,湖南省自然科学基金青年、面上、联合项目,教育厅青年、重点项目等,主持湖南省教育厅高等学校教育改革项目3项。发表论文50多篇,其中SCI检索20多篇,发明专利15项。(来源:湖南工业大学计算机学院官网)
1 摘要
2 引言
3 提出的方法
3.1 改进的CELMD分解方法
3.2 多指标选择算法
4 实验研究
4.1 采样点选择准则
4.2 CWRU数据集的实验结果及性能分析
5 总结
针对滚动轴承振动信号中故障特征提取困难、分类精度差的问题,提出了一种基于多指标融合的故障特征选择与分类方法。首先,利用改进的互补集成局部均值分解方法将原始信号分解为多个物理意义乘积函数 (PF) 和单个残差分量;然后,结合峰度、相关系数、Kulback-Leibler散度三个指标,提取最适合信号重构的PF分量。最后,将重构信号的多域特征和熵值特征输入到LightGBM分类器中进行分类,实现滚动轴承故障的智能诊断。统计结果表明,该方法可以有效地识别功能PF分量,并在不同实验数据集的特征提取和故障检测方面具有显著的优势。
关键词:互补集成局部均值分解 (CELMD),故障诊断,多指标选择 (MIS),乘积函数 (PF),滚动轴承
如今,旋转机械被广泛应用于不同的行业,包括石油化工、航空航天、电力和加工工业。滚动轴承作为旋转机械系统的重要组成部分,其故障可能会导致部件的严重故障,直接影响到整机的性能。但是,如果不及时有效地发现故障,则可能导致整个设备停止工作,造成相当大的经济损失。在最糟糕的情况下,操作员的生命可能处于危险之中。
利用现代技术,人们可以在滚动轴承中收集不同模式的信号进行故障检测。然而,早期脉冲信号容易受到环境噪声的影响。当轴承信号中噪声的信息干扰分量较大时,会产生难以提取的特征,影响轴承故障诊断[1]、[2]、[3]的分类精度,因此通过信号分解来达到故障识别的效果。
国内外学者对这一问题进行了广泛的研究。Zhao等人[4]提出了一种新的基于经验均值分解 (EMD) 和核相关的欠定盲源提取方法。他们采用仿真信号和列车车轴滚动轴承信号验证了所提方法的适用性。Zhou等人[5]提出了一种新的集成经验模态分解轴承长短期记忆故障诊断方法。在小样本量的情况下,该方法可以显著提高故障诊断的准确率。Ma等人[6]提出了一种结合奇异值差分谱去噪和局部平均分解 (LMD)[7]的故障诊断方法。Wang等人[8]设计了一种基于集 合局部平均分解 (ELMD) 和快速峭图的旋转机械故障诊断时频分析方法。
Chai等人[9]应用齿轮箱柔度故障诊断方法中的积函数互补集成局部平均分解 (PF-CELMD),在ELMD的基础上加入配对白噪声结合对准熵 (AE) 对LMD进行优化。令人遗憾的是,CELMD分解技术往往会重复添加幅度相似的白噪声,并且这种白噪声的幅度是人为预定的。当信号点过多时,如果仅用固定幅度进行信号分解,可能会对信号分解产生不利影响。因此,本文提出了一种改进的CELMD分解方法,即在原始CELMD分解的基础上,通过对白噪声的幅度进行多次修改,最终对多次分解产生的PF分量进行平均处理,作为最终结果。
PF分量的选择是故障诊断的关键步骤,现有研究一般采用相关系数[10]、[11]、[12]、峰度[13]、[14]或Kulback-Leibler (K-L) 散度[15]、[16]进行选择。沿着故障识别的特征提取过程,Yu和Fang[17]使用了相关系数和Hjorth参数。Jing等人[18] 建立了一种更好的方法来诊断滚动轴承故障,该方法简化了EMD和频谱峰度。Kumar等人[19] 使用K-L散度设计了独特的设备健康退化指标。在计算两个分量的相关系数时,结果越接近1,它们之间的线性关系就越接近,但相关系数有明显的缺陷,即相关系数接近1的程度与数据集的数量n成正比。当n较小时,其值波动较大,部分样本的相关系数的绝对值容易接近1;当n较大时,相关系数的总值容易偏小。当样本数量很少或不清楚时,仅用相关系数不能告诉我们两个变量是否有密切的线性关系。
随着故障的出现,振动信号中的幅值概率密度增大,当标准曲线偏斜或分散或峰度增大时,相应的信号幅值分布偏离正态分布。如果信号峰度值达到3,则可以进行诊断,判断部件是否存在损坏情况[20]。不幸的是,经过信号分解后,一些故障的PF分量的峰度值非常接近。因此只看峰度值是不可能分辨出哪些成分是真实的,哪些是误导的。即使给定相关系数,从小样本中选择最佳PF组件也是具有挑战性的。
K-L散度可以度量两个概率分布P和q之间差异的不对称性。一旦两个分布相差很大且不重叠,则不应计算K-L散度值。Wasserstein度量[21],[22],[23]相对于K-L散度的优势在于,即使两个分布的支持集不重叠或重叠很少,该度量仍然可以反映两个分布的距离。考虑到这些问题,本文试图将上述相关系数、峰度值和Wasserstein度量这三个指标结合起来,并通过计算每个PF分量的相关系数、峰度值和Wasserstein度量的总和,选取占主要比例的PF分量作为最佳分量进行最终选择。然后利用LightGBM[24] 分类器对最优分量进行重构和分析,进行故障诊断和识别。
本文提出了一种基于多指标融合的故障特征选择和分类方法。现将这些贡献概述如下:
1. 对于轴承故障诊断,该技术可以应用于各种数据集,保证了其通用性。
2. 基于信号分解特征,提出了一种改进的CELMD分解方法,进一步改善了现有方法的模态混合现象和端点影响。
3. 以选择最优PF分量为目标,给出了一种多指标选择 (MIS) 算法。
图1 分类总体流程图
轴承、齿轮、电机等旋转机械在运行过程中会产生各种各样的振动信号,对这些振动信号进行处理是故障诊断的关键步骤。LMD方法是一种新的自适应非光滑信号处理方法。与EMD分解相比,LMD分解在端点效应、上包络、下包络等方面具有一定的优势 [25]。该分解方法使用需要多次迭代来执行的滑动平均算法来计算局部均值函数和局部包络函数。随着迭代次数的增加,端点效应和模态重叠现象明显。在本研究中,本文探索了CELMD分解,通过多次改变附加白色噪声幅度,然后平均适当的PF分量来解决上述问题。
这种改进的CELMD分解方法具有以下具体分解过程。
原始信号
其中,
对带正噪声和负噪声的信号进行LMD分解,将
完成上述公式后,
修改噪声幅值,重复上述步骤
上述等式是最终获得的
改进的CELMD分解后得到多个PF分量,然后对PF分量进行选择,本文设计了多指标选择算法,涉及峰度、相关系数、Wasserstein度量。
公式中的Cov(x,Y)为X和Y的协方差,
首先分别计算峰度L1、相关因子L2和Wasserstein度量的倒数L3共三个度量的值,然后计算每个分量的相应度量的百分比之和
图2 MIS算法流程
图3中的计算过程示出了原始信号通过数据进行处理、变换和排序。
图3 具体的运算过程
当阈值A被设置为0.85时,最终选择的PF分量可以被导出为PF 2、PF 7、PF 1、PF 3和PF 4,并且它们被用作用于重构的最佳分量。重构信号比原始信号更不易受干扰,更有利于故障诊断。
4.1 采样点选择准则
图4 渥太华大学轴承试验台
本文通过对原始信号按照不同的采样点进行切片,每个切片添加128个采样点,提取多域特征和熵特征,以7:3的比例划分训练集和测试集,进行LightGBM建模和分类。最佳样本点由准确率、精确率、召回率和F1分数确定。
图5 (b) - (d) 显示了不同条件和分类下的准确率、召回率和F1-score,可以看出,在128 ~ 512采样点处,准确率、召回率和F1-score总体上有较大的提高。所得值在某些条件下波动较大。从图5 (b)可以看出,当转速条件先降后升时,外圈故障的精度率在采样点 [256,512] 之间波动较大。此时转速条件上升的外圈故障在此区间内也有明显的上升,而从图5 (c)中可以看出,转速条件先上升后下降的外圈故障在此区间内波动明显。在各种情况下,滚动体和外圈的失效情况如图5 (d)所示。虽然其价值在越过平稳线后仍在继续提高,但总体而言,这种增长并不十分明显。因此,在512采样点处对信号进行切片是最合乎逻辑的,并且该采样点可用于各种情况以避免过拟合;因此,在接下来的实验中,本文选择512作为采样点。
图5 采样点选择标准
为了验证改进的CELMD-MIS和LightGBM方法在轴承故障诊断中的有效性,采用了来自凯斯西储大学 (CWRU) 的数据集,该数据集来自传动系统试验台,包括交流电机、被测轴承和压力缸。在正常、内圈、外圈和滚动体故障四种健康状态下,对6205轴承进行了振动数据采集。需要注意的是,每个故障的直径分别被加工为0.1778、0.3556和0.5334 mm,因此可以产生被测轴承 (标记为0-9) 的总共10个信号状态,每个类别的轴承信号数据如表1所示。实验中,采样频率设置为12 kHz。电机转速设为1730 r/min。在3hp的运行条件下收集各健康状态的数据。轴承由液压缸加载,最大载荷可达20 kN。采样点个数为512个。
表1 轴承信息
使用改进的CELMD分解方法对原始振动信号进行分解,MIS算法通过计算峰度、相关系数和Wasserstein度量,进行数据处理,然后使用特定的计算参数进行加权(以0.1778 mm的故障直径为例,并选择0.85的阈值A)来计算
表2 内圈故障信号参数信息
表3 滚动体故障信号参数信息
表4 外圈故障信号参数信息
可以看出,当故障直径为0.1778 mm的轴承采用改进的CELMD-MIS算法时,内圈故障信号选择PF1、PF2、PF4、PF3作为重构信号,滚动体故障信号选择PF1、PF2、PF6、PF8、PF5作为重构信号;外圈故障信号选择PF1和PF2作为重构信号。
MIS算法对选取的PF成分进行重构后,需要将数据集分为训练集和测试集,不同特征个数的不同测试集的平均分类正确性结果如图6所示。在图6 (a)中,显示了不同测试集中不同特征数量下的总体平均分类准确率波动情况。很明显,随着特征数量的增加,缺陷诊断的准确性也在提高。对于具有20个或更多特征的测试集,总体准确率上升到95%以上。图6 (b) - (d)显示了不同测试集内圈、滚动体和外圈故障的差异。如图6所示,增加特征的数量可以提高故障分类的准确性。在特征数量相同的情况下,测试集占用率对分类准确率的影响不太明显。
图6 平均分类准确率随测试集中 特征数量比例变化的趋势
为了更清楚地了解分类影响,从重建的信号中检索了20个特征。将数据随机分为70%的训练集和30%的测试集,然后将其输入LightGBM 多分类器进行故障诊断。一种称为主成分分析 (PCA) 的方法被用于最小化多域和熵数据维度,因为它们不适合可视化处理。故障分类如图7所示,而混淆矩阵如图8所示。
图7 不同故障尺寸的分类结果
图8 分类结果的混淆矩阵
在图7中很容易区分哪些类别属于哪些类别,它显示了如何使用PCA降尺度多维特征。从图8的混淆矩阵可以看出,滚动体故障的分类精度相对于其他故障类型有所下降,然而,总体精度水平仍然相对较高。表5给出了使用十倍交叉验证后每种故障类型的平均准确率、召回率和F1-score的细分。需要说明的是,“pre-c”是使用CELMD方法获得的准确率,“pre-I”是使用改进的CELMD方法获得的准确率。此外,表6描述了不同方法在该数据集上的准确性。
表5 精准度,召回率,以及不同类别的F1-score
表6 不同方法结果的比较
由表5可知,一般情况下,滚动体故障比内圈故障和外圈故障更难诊断;然而,采用本文方法后,滚动体故障的准确率、召回率和F1-score可高达96%,而大多数类别的准确率、召回率和F1分数可高达99%。总体平均分类准确率高达98.87%,说明本文方法的有效性。从表6可以看出,本文提出的方法相对于其他方法更具有优势和准确性。
本工作将比较不同分类器在不同筛选PF成分方法下的分类效果。假设将未经改进CELMD分解的轴承故障原始振动信号标记为Origin,将经过相关系数筛选的改进CELMD分解后的信号标记为Correlation,将K-L散度筛选的信号标记为K-L,将本文方法标记为MIS,将RandomForest、XgBoost和LightGBM分类器进行比较,分类结果如图9所示。LightGBM和RandomForest技术与MIS算法在选择PF成分分类中的比较表明,MIS算法优于其他两种方法。使用LightGBM和MIS方法比单独使用任何一种方法的准确率都高,综合准确率达到98.87%,表明该方法在本研究中的优势。
图9 不同分类器在不同条件下的分类结果
为了证明该方法对不同数据集的适应性,使用康涅狄格大学的齿轮数据进行了测试。实验平台主要由电机、可更换齿轮的二次减速器、电磁制动器、加速度传感器、转速表等组成。第二级减速器在第一级输入轴上有一个32齿的小齿轮和一个80齿的齿轮。第二阶段包括一个48齿的小齿轮和一个64齿的齿轮,有五个故障:健康,缺齿,裂纹,剥落和碎裂。采样频率为20khz,每个采样点为3600个,每种故障类型有104个采样点。由于该数据集的样本数量不多,因此将数据集分为训练集和测试集,分割比例为6:4。
采用本文提出的改进CELMD-MIS和LightGBM方法对振动信号进行故障诊断的结果如表7所示。分类结果如图10所示。从图10中可以看出,采用本文方法后的齿轮数据集分类效果明显,从表7中可以看出,各类别的分类准确率均高达98%以上,召回率均在97%以上,F1-score均在98%以上,总体准确率高达99.03%。这表明本文提出的改进的CELMD-MIS和LightGBM方法不仅在轴承上而且在不同的数据集(如齿轮)上仍然具有适应性和优越性。
表7 精准度,召回率,以及不同类别的f1分数
图10 不同分类器在不同条件下的分类结果
本文提出了一种基于多指标融合的滚动轴承故障特征选择与分类方法。该方法由两个模块组成:PF计算模块和多指标融合模块。在PF计算中,将原始信号分解为多个物理上有意义的PF和单个残差分量。在多指标融合模块中,结合峰度、相关系数、K-L散度三个指标,提取最适合的PF分量进行故障特征选择。之后,采用凯斯西储大学轴承数据集来验证所提出方法的有效性,并且该方法也已成功应用于齿轮数据。与其他方法相比,该方法在故障诊断方面具有显著的优势。然而,未来仍有改进的空间。在本研究中,信号分解方法添加的白噪声是单一类型的,对于不同的样本可能难以完全中和噪声,考虑到噪声的奇异性,需要添加不同类型的白噪声。此外,实验中分类方法的训练模型使用默认参数,如何针对不同的数据集定制最佳参数是新的研究课题。