论文题目:Maximum subspace transferability discriminant analysis: A new cross-domain similarity measure for wind-turbine fault transfer diagnosis
论文期刊:Computers in Industry
论文日期:2024年
论文链接:https://doi.org/10.1016/j.compind.2024.104194
作者:Quan Qian (a,b) Fei Wu (a,b) Yi Wang (a,b) Yi Qin (a,b,*)
机构:
a: State Key Laboratory of Mechanical Transmission for Advanced Equipment, Chongqing University, Chongqing 400044, PR China
b: College of Mechanical and Vehicle Engineering, Chongqing University, Chongqing 400044, PR China
作者简介:钱泉,中共党员,重庆大学在校生最高个人荣誉“学生年度人物”和在校研究生最高学术荣誉“十佳学术之星”获得者,长期从事于高端装备故障诊断与预测性维护研究。主持国家自然科学基金博士生项目1项(30万经费资助)和重庆市研究生科研创新项目1项;以第一作者在IEEE trans、MSSP等领域权威SCI期刊上发表中科院一区TOP论文12篇和中科院二区TOP论文3篇(含导师一作&学生二作2篇),其中入选ESI热点论文3篇和高被引论文5篇,谷歌学术累计引用900余次(h指数15、i10指数16);以导师第一&学生第二发明人授权中国专利4项和英国专利1项;累计获3次国家奖学金、中国研究生人工智能竞赛一等奖、重庆市三好学生等国家级奖励11项、省市级奖励14项、校级奖励30余项。
由于深度学习技术的快速发展,人们非常关注数据驱动的机械设备智能故障诊断。然而,训练数据集和测试数据集需要独立且一致分布的假设阻碍了其实际应用。为此,基于迁移学习的诊断方法提供了一种可行解。这些方法可以利用源域的诊断知识来解决目标域中的分布相关但不同的迁移诊断任务。因此,仅包含源域样本的先验标签知识的诊断模型可以直接应用于未标记的目标域。
迁移学习技术在近年来,其分布差异的诊断能力,包括跨负载迁移诊断的任务,得到了认可。此外,强大的诊断性能也证明了迁移学习的优势。深度迁移学习的关键在于解决两个领域之间的分布差异,以提取域不变和有区分性的故障特征。
分布对齐方法可以归类为基于对抗机制的方法和基于分布距离的方法。在实践中,由于以下三个原因,收集的历史数据库中的标记故障样本非常罕见:第一,实际机械设备不允许在故障状态下运行以确保安全。第二,许多工业企业数字化转型缓慢,使得跟踪历史故障样本的标签信息具有挑战性。第三,由于需要拆卸检查和专业知识的参与,打标过程需要大量的时间和财力资源。为了解决这一困境,迁移学习直接利用来自不同工况或机械设备的整个历史数据集作为源域来构建诊断模型。这包括多源迁移学习、部分集迁移学习和开放集迁移学习。然而,大多数现有的迁移诊断方法没有考虑迁移任务的可迁移性,即没有进行可迁移性分析。如果所选的源域在分布上与测试目标域有显著差异,可能会导致负迁移现象,导致诊断准确性差。因此,拥有一个相似性度量,可以评估源域和目标域之间诊断知识的可迁移性,是至关重要的。这个度量还可以帮助在给定的目标域中选择最优的源域,确保迁移诊断任务的可行性。
与分布对齐相比,关于可迁移性的研究相对有限。现有的跨域可迁移性判别相似性度量可以归纳为三种类型:特征可视化分析、事后诊断性能分析和距离度量分析。
基于之前的讨论和分析,很明显,获得内在差异表征的关键因素是提高类别之间的可分离性,并建立不依赖于特征尺度的可迁移性标准。为了解决这些问题,本研究提出了一种新的相似性度量方法,称为最大子空间可迁移判别分析(MSTDA)。值得一提的是,MSTDA不需要任何关于目标域标签的先验知识,也不需要关于源域标签的知识。MSTDA包括两个阶段:最大子空间表征和相似性测量方法。在第一阶段,开发了一种新颖的核引导希尔伯特空间,将低维原始样本映射到高维空间,以最大化不同故障之间的可分离性。然后,从高维特征中找到内在的低维嵌入,以实现最有效的子空间表征。接下来,受到参考文献中Grassmann流形启发的启发。Gopalan等人使用奇异值分解(SVD)获得源域和目标域内在特征子空间的正交基。最终,开发了一种新的相似性度量方法,该方法能够不受特征尺度变化影响。此外,采用小批量采样策略来优化计算效率。所提出的MSTDA已成功应用于实际风力涡轮机。主要贡献和创新概述如下:
如图2所示,所提的MSTDA相似度测量包括最大子空间表征和相似性度量方法。前者用于提取可分离的内在故障特征,后者是实现可迁移性判别的最终步骤,后者对特征尺度具有鲁棒性。在以下小节中,我们将对这些点进行详细介绍。
图2 所提的MSTDA相似性度量原理图
2.1 最大子空间表征
振动监测信号作为最常用的信息载体,被广泛应用于机械故障迁移诊断中。信号中的噪声往往阻碍了故障特征的挖掘导致对不同故障类型的区分能力显著下降。因此,诊断性能和迁移性判别的有效性始终依赖于提取可分离的内在故障特征。为解决上述问题,一个可能的解决方案是考虑非线性空间映射的概念。这种方法得到了模式识别理论的支持,该理论认为增加空间的维数可以提高特征的可分性。由于直接进行非线性高维空间映射会带来计算复杂性的爆炸式增长,因此基于内核的映射的方法很受关注。
首先,介绍了核的空间映射原理。设
Hilbert空间中的有界线性函数可以表示为两个向量的数量积。将作为希尔伯特空间的正交基,空间中的任何函数都可以视为基上的投影。现在,如何找到这样一组正交基就成了关键。幸运的是,Mercer定理提供了一个可行解,其公式如下:
其中
根据机械振动特性,振动信号在x轴上几乎是对称的,因此,基于能量指数(均方值)设计了一个新的核,即
其中
其中,
其中,
从式(7)可以看出,优化目标仅与包含
此外,最终优化目标的拉格朗日函数可以表示为:
上述参数
当
从式(13)中可以明显看出,
可以看出,得到的子空间的维数
2.2 相似度测量准则
目标域的维数计算与上述方程(19)相同。使用Frobenius范数来表示特征矩阵的大小。以源域为例,可以得到以下方程,其中
可以从式(20)中观察到特征尺度只受一个奇异值的影响。因此,设计了一种直观相似度测量准则,旨在衡量两个域的正交基之间的差异,即角度测量。以
同样,在
为了保证可迁移性判别的实时性,采用了小批量采样策略。所提出的MSTDA算法流程见表1。
表1 所提MSTDA算法流程
在这一部分中,进行了三个可迁移性判别实验案例,以测试所提出的MSTDA的普遍性。这些案例包括模拟迁移任务、实验台迁移任务和实际风力涡轮机迁移任务。此外,MSTDA还针对各种距离度量标准进行了评估,例如MMD、CORAL、A-距离、AHMM和余弦距离,以评估其有效性。由于某些距离(MMD、CORAL、A-距离和AHMM)在相似性测量上与MSTDA具有相反的趋势,即较大的值意味着较小的可迁移性,因此我们使用它们的倒数作为测量标准。所有相似度测量方法都归一化为[0,1]的范围,以确保多个源域-目标域对之间的尺度一致。
此外,还有三个指标,包括相关性(CORR)、一致性(CONS)和单调性(MONO)被用来评估每种相似性测量方法的综合性能,这些指标值越大表示可迁移性判别结果越好。给定所有源域-目标域迁移任务(
其中
图3 三种源域模拟方案: (a)簇尺度变化; (b)簇方差变化;(c)簇中心偏移
三种模拟方案的实验结果列在表2-表4中,包括平均值和标准差。可以清楚地观察到,我们提出的MSTDA相似度测量方法在总体上优于其他方法。在簇尺度变化和簇中心偏移方案方面,MSTDA在三个评价指标中表现出最佳的性能。这些对比方法(MMD、CORAL、A-距离和AHMM)对特征尺度敏感,缺乏提取可分离的内在故障特征能力。因此,它们的可迁移性结果不如MSTDA的结果。考虑到余弦距离容易受矢量方向的影响并且所使用的数据样本是随机生成的,因此其稳定性明显弱于其他测量方法。如表3所示,虽然MSTDA的一致性略低于余弦距离,但其标准差明显较高。这表明MSTDA具有更好的稳定性。
表2 簇尺度变化的可迁移性结果
表3 簇方差变化的可迁移性结果
表4 簇中心偏移的可迁移性结果
使用上述收集的数据样本,六个迁移任务如下表5所示(1↔2、2↔3、1↔3、3↔4、2↔4和1↔4)。前面提到的模拟迁移任务,实验台迁移任务的可迁移性判别难度较大,因为各种因素,如噪声环境、传递路径、加工误差,以及装配误差。由于绝大多数故障迁移诊断方法采用卷积神经网络(CNN)作为当前故障诊断的基本分类器,我们也采用了CNN以获得表5和表7中的基准精度,其中原始振动信号直接喂入网络,不进行特征预处理。为了更好地反映迁移性,CNN仅使用源域数据样本进行训练,不采用任何迁移学习技术,然后将目标域数据样本输入到训练好的CNN中进行测试,以评估诊断准确性。此外,由于不同诊断任务的准确性不同,使用“1→2”和“2→1”诊断任务的平均诊断准确性作为最终的基准准确率。以“1↔2”为例,前一个“1”和后一个“2”分别表示“1→2”中的标记源域和未标记目标域,同样适用于“2→1”。考虑到深度神经网络的随机波动性,每个迁移任务执行了10次。从图4(b)中可以看出,负载4的数据分布与其他三种负载明显不同。这表明涉及负载4的迁移任务的迁移能力低于其他迁移任务。这一点通过表5中列出的准确性率得到验证。所有相似性度量方法的实验设置与4.1节一致。最后,表5通过三个评价指标清楚地表明,MSTDA在可迁移性能方面优于其他方法。
表5 行星齿轮箱试验台迁移任务的可迁移性结果
实际数据集是从风电场的几个风力发电机齿轮箱中收集的。齿轮箱结构如图5所示,由两级行星传动和一级平行轴传动组成。两个齿轮故障位于第二级齿轮环(second gear ring,SGR)和高速轴齿轮(high-speed shaft gear,HSG)。SGR来自两个风力发电机,F34和F47,而HSG来自另外两个风力发电机,F14和F38。从第二级齿轮环和高速轴壳体上放置的两个加速度传感器中提取的监测振动信号用于进行可迁移性判别。两个传感器的采样频率分别为12.8 kHz和25.6kHz。由于低速端的覆盖故障周期所需的最小数据点高于高速端,因此选择第二齿轮环的最小数据点作为所有故障类型的样本维度。这有助于显著减少计算时间,设定样本数据点为20000,每个故障类型的样本数为200。
图5 实际风力发电机齿轮箱传动结构
表6显示了使用实际风力涡轮发电机数据集构建八个域的过程。在本小节中选择A作为目标域,而其他七个域被视为源域。表7阐述了7个迁移任务的设置。组中迁移任务的分布差异(A,B,C和D)是由于速度变化导致的,而其余的迁移任务受到不同速度和风力涡轮发电机组合的影响。准确率基准设置与4.1节相似。综合实验结果如表7所示。很明显,我们提出的MSTDA在实际风力涡轮发电机场景中的可迁移性判别性能优于其他方法,具体来说,MSTDA在相关性和一致性方面具有独特优势。与测试集相比,实际风力涡轮发电机数据集的工况在实时工况中呈非线性变化。这使得实际风力涡轮发电机数据集比实验台数据集更具挑战性。
表6 实际风力发电机组数据集的详细信息
表7 实际风电机组迁移任务的可迁移性结果
从表7可以看出,在三个评价指标中,几乎所有方法的性能都不如表5。在大多数迁移任务中,由分类器得到的A-距离往往比其他相似性度量方法具有更高的标准差。鉴于MMD已成为故障迁移诊断领域最主流的分布差异指标,因此,提供了三个基于MMD的相似性指标(AHMM、DDN和KMMD)作对比方法,以进一步证明所提 MSTDA的优势。实验结果如图6所示,可以明显看出,所提MSTDA仍具有最佳的迁移判别能力。最后,实际风力涡轮发电机数据集的综合实验结果进一步证明了MSTDA的优越性和普遍性。
图6 MSTDA与三个基于MMD指标的实验结果对比
为了直观评估MSTDA在提取可分离故障特征方面的有效性,我们使用t分布随机邻域嵌入(t-SNE)将原始样本和通过MSTDA获得的特征投影到三维空间中。得到的t-SNE映射如图7所示。很明显,在图7(a)中,SGR和HSG之间的重叠数据点比图7(b)中多。这表明MSTDA在利用零标签先验知识提取可分离特征方面是有效的。提取的可分离的内在故障特征将有助于在构建相似性测量准则阶段挖掘跨域的内在差异,从而提高MSTDA的可迁移性判别性能。
此外,为了展示不同可迁移性判别方法的尺度鲁棒性,我们以从跨域任务“A↔C1”中提取的故障特征和最大子空间表征为研究对象。通过改变源域“C1”中 特征值的倍数,模拟了不同的特征尺度。所有可迁移性判别方法的相对可迁移性值如图8所示。从图中可以清楚地观察到:除了MSTDA和余弦外,其他四种方法的结果随着预设倍数的改变而波动,它们的波动程度不同,其中A-距离的波动尤为严重。这表明MMD、CORAL、A-距离和L2-距离对特征尺度变化敏感,不能准确反映不同跨域任务之间的相似性。尽管余弦距离表现出很强的特征尺度鲁棒性,但其对可迁移性判别实验的较差表现仍然限制了其在实践中的应用价值。相比之下,MSTDA在保证良好的可迁移性判别性能的同时,保持了良好的特征尺度鲁棒性。
图8 不同可迁移性判别方法对特征尺度变化的敏感性