综述：旋转机械智能故障诊断中的深度迁移学习策略(上）

4月前浏览2702

核心本期给大家推荐一篇的关于智能故障诊断中的深度迁移学习策略的综述文章，该综述重点介绍了旋转机械的智能故障诊断，从不同维度输入的特殊角度进行了较为全面的分析，指出了现有的挑战，并展望了潜在的未来趋势，该综述有助于对基于深度迁移学习的故障诊断进行创新探索。

由于文章篇幅过长，小编将分两次为大家翻译介绍这篇综述，本节推文是这篇文章的上半部分。

论文基本信息

论文题目：Deep transfer learning strategy in intelligent fault diagnosis of rotating machinery

论文期刊：Engineering Applications of Artificial Intelligence

论文日期：2024.03

论文链接: 10.1016/j.engappai.2024.108678

作者：Shengnan Tang , Jingtao Ma , Zhengqi Yan , Yong Zhu , Boo Cheong Khoo

机构：National Research Center of Pumps, Jiangsu University, Zhenjiang 212013, China

通讯作者邮箱：zhuyong@ujs.edu.cn

0 摘要

旋转机械在许多工程领域中发挥着重要作用。需要及时解决预测和健康管理问题，以保证系统的可靠性。在大数据和人工智能的推动下，智能故障诊断提供了新的途径。针对故障数据不足、情况复杂的情况，深度迁移学习（Deep transfer learning，DTL）为跨领域、跨机器诊断提供了一种可能的方法。迄今为止发表的综述主要侧重于基于DTL的常见类别或工业应用场景的故障诊断分析。本综述重点关注 DTL 在旋转机械中的应用。而且，目前的相关综述主要截止到2021年底。分析的是从那时到现在的最新研究。根据输入类型选择一条特殊的主线，以区别于其他综述。从这个角度来看，全面研究旋转机械的故障诊断是有价值的。本综述首先概述了DTL的基本原理和常规类别。总结了DTL在旋转机械故障诊断中的主要应用，并对100多项相关研究进行了分析。在应用于所讨论的旋转机器的 DTL 框架上选择和评估输入类型的特殊视角，包括一维和二维。最后，指出了DTL存在的挑战并展望了DTL未来的潜在趋势。

关键词：故障诊断，迁移学习，深度迁移学习，域自适应，旋转机械

1 引言

旋转机械是工业领域中至关重要的动力传动设备，已广泛应用于工业机械、航空航天、导航、能源设备等领域（Zhang et al.，2023a；梁等，2022；刘等，2024）。旋转机械的安全健康运行对整个机械系统的可靠性有着至关重要的影响。为了保证机械系统的安全性和可靠性，研究和实施旋转机械的故障诊断和健康维护具有重要意义。然而，由于旋转机械故障具有耦合性、随机性和复杂性，故障特征的提取和诊断具有一定的挑战性。

随着人工智能的发展，智能算法为故障自动检测和识别提供了一种新的方法（Cha et al.，2024；Zhu et al.，2023）。卷积神经网络（CNN）是智能算法的一个关键发展。第一个CNN是Waibel等人在1987年提出的时延神经网络，它是用于语音识别的一维（one-dimensional,1D）CNN（Waibel，1987；Waibel et al.，1989）。对于1DCNN，模型的输入、卷积核的矢量和特征图都是1D，输出也是1D。基于CNN的深层架构，使用了一种基于视觉的方法来检测混凝土裂缝（Cha et al.，2017）。为了实现对多种类型损伤的准实时同时检测，构建了一种更快的基于区域的CNN用于结构视觉检测（Cha et al.，2018）。智能方法已进一步应用于旋转机械的故障诊断（Tang et al.，2024；Zhang et al.，2023b；Chao et al.，2021）。冯等人使用一种新的振动信号研究了齿轮磨损，并进行了齿轮健康评估的数字双驱动方法（冯 et al.，2023a 2023b）。考虑到故障训练样本的短缺，Handikherkar等人总结了齿轮故障建模和动态仿真的研究，并介绍了仿真驱动的方法和机器学习模型（Handikherka和Phalle，2021）。王等人通过应用集合参数模型获得足够的训练样本，实现了齿轮运行状态的检测（王 et al.，2022a）。由于在实践中，故障数据总是远小于正常数据，因此提出了一种两阶段诊断方法，用于轴承和齿轮箱的小样本故障识别（Zhang et al.，2022）。Koutsoupakis等人使用CNN通过模拟和实验来识别轴承损伤（Koutsouppis et al.，2023）。针对传统CNN和递归神经网络的局限性，采用蝗虫优化方法对支持向量数据描述和支持向量机（SVM）进行了优化。Wei等人将自注意机制与CNN相结合，提出了一种用于齿轮箱和轴承智能故障诊断的特征融合结构（Wei et al.，2023）。Zhou 等人通过将基于权重的选择策略和灰狼优化器引入CNN，构建了滚齿和齿轮箱故障诊断的集成模型（Zhou et al.2023）。Tang等人利用了同步压缩小波变换的特点，引入了贝叶斯算法，建立了一个用于液压活塞泵故障分类的深度归一化CNN模型（Tang et al.，2022）。Yin等人提出了一种基于深度残差网络的核电站旋转机械融合诊断方法。通过快速傅立叶变换（FFT）将振动信号转换为频域。多传感器融合是通过将重建的2D特征图集成到3D图中来实现的（Yin et al.，2023）。

作为机器学习的重要组成部分，迁移学习（TL）备受从事智能故障诊断的学者的关注（Chakrapani和Sugumaran，2023；Ren等人，2023年；Zhong等人，2022）。深度迁移学习（DTL）与深度学习（Deep learning，DL）相结合在机械故障诊断方面取得了一些重大成果（Yang et al.，2023a；雷 et al.，2019；李 et al.，2020）。刘等人提出了一种基于inception-ResNet-V2的基于导波结构测试的尖轨缺陷检测迁移方法（Liu et al.，2023a）。Dong等人开发了一种基于细粒度TL的方法来解决不平衡域数据，并实现了基于CNN和相关对准（CORAL）的轴承和齿轮箱跨域故障诊断（Dong et al.，2023）。Wang等人开发了一种特征相关性匹配DTL模型，以解决领域差异并识别轴承缺陷（Wang et al.，2022b）。Yang等人基于生成对抗性网络（GAN）和小波包变换实现了风机的不平衡故障诊断（Yang et al.，2023b）。由于域分布差异和交叉操作条件，提出了一种基于循环GAN的迁移诊断结构（Zhao and Huang，2022）。李等通过结合Time-GAN和Efficient-Net，实现了极端不平衡情况下的轴承诊断（李等，2022a）。由于TL对稀疏数据的泛化能力较弱，Wang等人提出了一种结合图标签和流形连接的无监督TL轴承缺陷诊断方法（Wang等人，2023a）。基于类别间排斥力迁移学习，提出了一种新工况下轴承故障诊断的无监督方法（Wang et al.，2022c）。霍等人通过无监督学习模型和领域与类别的二级匹配实现了轴承故障的迁移故障诊断（霍等人，2023a）。Chen等人提出了一种用于变载荷下轴承缺陷诊断的轻量级无监督对抗性模型，引入了信息融合策略和信道残差方法（Chen et al.，2022）。张等人提出了一种联合学习方法，用于轴承和齿轮箱的小样本故障分类，并确保数据隐私（Zhang et al.，2023c）。Xu et al.提出了一种联合学习和对抗性域自适应的齿轮箱未知故障识别的开集跨域诊断方法（Xu et al.，2023）。Han et al.构建了一种基于自适应对抗性网络和特征融合的多通道TL轴承故障诊断方法（Han et al.，2023）。通过将振动信号转换为三通道灰度图像，提出了一种基于TL和多通道CNN的轴承在线诊断方法（Meng et al.，2022）。Ma et al.基于CNN提出了一种集成TL框架，并在有限样本的情况下实现了97.51%的轴承缺陷识别准确率（Ma et al.，2023a）。王等结合元学习和TL的优势，完成了轴承的少样本故障诊断（王等，2023b）。TL和多尺度自适应1D CNN用于轴承的少样本故障识别（Li et al.，2023a）。开发了一种用于复杂工作条件下轴承和齿轮缺陷识别的深度卷积TL方法（Li et al.，2022b）。为了克服齿轮箱和轴承故障诊断中的域偏移和特征差异，提出了一种具有注意力机制的自适应多尺度CNN（Shao和Kim，2024）。基于多路径合并模型和动态多尺度表示，构建了一种新的旋转机械故障识别迁移框架（Sun et al.，2023）。已发表的文献综述的主线主要基于DTL方法或工业应用的类别。他们只到2021年底。这篇综述的动机是为输入类型提供一个新的视角，并关注当前基于DTL的旋转机械故障诊断。

本研究的其余部分组织如下。第二节介绍迁移学习的基本原理和常见类别。第3节从1D和2D输入方面讨论了深度迁移学习在旋转机械故障诊断中的典型应用。第4节对结论进行了总结，并对未来进行了展望。

2 迁移学习的基本理论

2.1 迁移学习原理

作为机器学习方法的一个重要进展，TL在跨领域和跨任务学习方面取得了突破。迁移学习的面纱将从以下角度揭开：发展、原理、优势和应用范围，如图1所示。

图1 迁移学习理论架构

Lorien Pratt将术语迁移引入机器学习，他开发了有辨别性的迁移算法（Pratt，1993）。迁移学习被用在元学习、知识迁移、多任务学习和归纳迁移中的相关研究中。逐渐地，它已经成为一个完整的学习领域，并进一步应用于文本分类、马尔可夫逻辑网络和贝叶斯网络（Do和Andrew，2005；Mihalkova等人，2007 Niculescu-Mizil和Caruana，2007）。历史演变如图2所示。

图2 迁移学习的历史演变

迁移学习（TL）被认为是机器学习取得成就的下一个驱动因素。TL是一种将知识从学习任务迁移到辅助目标任务学习的方法（Pan和Yang，2010）。其核心是寻找现有知识和新知识之间的相似之处。强调不同领域或不断变化的任务之间的知识迁移和转化能力。领域和任务是TL中的两个基本术语，通常指的是源领域（ target domain，SD）和目标领域（source domain ，TD）、源任务和目标任务。从这个角度来看，TL的目标是如何将知识从SD迁移到TD。现有的知识称为源领域，要学习的新知识称为目标领域。

在一些重要任务中使用TL的主要动机可以归结为三点。第一，带有标签的数据不足使模型训练变得困难。手动标记数据非常耗时且不切实际。使用与目标域（TD）相似的源域（SD）数据来构建目标模型，提高泛化能力是有效的。第二，它需要拥有大量的数据和计算资源。在现有模型迁移的帮助下，可以通过使用当前已知信息来学习新的特征。然后，它缩短了新模型的开发周期，降低了学习成本。第三，解决如何使用通用模型来满足特殊要求是一个挑战。TL可以提供一种考虑特征分布的相似性和差异性来调整模型的想法。TL涉及以下场景，单个SD对应于单个TD，多个SD对应于单一TD。当SD中的样本数量大于TD的样本数量时，传输被认为是可用和有效的。当两个域的数量几乎相等时，它用于增强TD模型的性能。TL不适合SD和TD完全无关的情况。当迁移方法不适用时，也会发生负迁移，尽管域之间存在相关性。

2.2. 迁移学习的分类

TL根据不同的维度和标准被划分为不同的类别。包括特征空间和学习方式（Tan et al.，2018；李等人，2022c；郑等人，2024）。深度迁移学习可以理解为深度神经网络模型和TL的集成。DTL充分利用了特征提取能力和知识迁移策略的优势。根据要学习的知识类型，DTL方法分为基于实例的方法、基于特征的方法、基于网络的方法和基于对抗性的方法（Qian et al.，2022a）。这些类别有时是交叉的，而不是绝对的。TL方法概述如表1所示。

表1 DTL方法优缺点

3 用于旋转机械故障诊断的深度迁移学习策略

DTL由于具有应对跨领域、跨机器任务的潜在能力，引起了机械故障诊断研究的高度重视（Shakiba et al.，2022；邓等人，2021；姜等人，2022；安等人，2021）。它已被引入许多旋转机械的故障分类中，包括轴承、齿轮、变速箱、转子、航空发动机、三缸泵、燃气轮机和轴向柱塞泵。常见迁移模型的构建主要集中在以下基础上：CNN、ResNet、DenseNet、稀疏自动编码器、堆叠自动编码器、LSTM、极限学习机、强化学习模型和自适应对抗性模型。DTL方法分为四类，基于实例的、基于特征的、基于网络的和基于对抗性的方法。考虑到输入数据的类别，将从1D和2D输入样本的角度对基于DTL的故障诊断进行分析和讨论。

3.1 基于1D输入的迁移诊断应用

3.1.1基于实例的深度迁移学习

基于实例的DTL主要是指使用特定的权重调整策略，在源域（SD）中选择一些实例并分配适当的权重来扩展目标域（TD）中的训练数据集。作为典型代表，TrAdaBoost基于权重的自动更新机制。保留重要的辅助样本，并消除与目标域样本不相似的样本（Dai et al.，2007）。Shen等人将奇异值分解与TrAdaBoost相结合，基于辅助振动数据的权值调整，进行了高精度的电机故障诊断（Sugiyama et al.，2012）。开发了一种名为TaskTrAdaBoost的快速算法，以改进对新目标域的再训练（Yao和Doretto，2010）。密度比估计也是一种基于实例的方法，用于通过计算源域和目标域的边际密度比来解决源域和目标域之间的协变量偏移问题（Shen et al.，2017）。Asgarian等人提出了一种基于概率加权策略的基于复合实例的TL（Asgarian et al.，2018）。

针对深度模型的数据保存和泛化能力，李等人利用联合迁移学习策略实现了模型共享情况下的轴承故障诊断（李等人，2023b）。时间拉伸用于基于局部振动数据生成假样本。通过考虑优化随机性和目标样本噪声的增加，构建了模型级和实例级的一致性。输入是来自FFT的频域信息。主要模型是具有两个卷积层的CNN。对四种不同的迁移方法进行了比较，所提出的方法的准确率达到了100%左右。针对在常见的迁移学习中存在大量参数和输入长度的差异问题，提出了一种用于轴承故障诊断的轻量级迁移框架（Tang et al.，2023）。如图3所示，基于包络解调，开发了一种选择输入长度的自适应方法。综合考虑了采样频率和轴承参数等因素。将组卷积和实例归一化相结合，减少了参数，使模型更轻。在两个实验中，一个是使用相同的数据集和不同的迁移任务，另一个是不同的数据集，大多数任务的诊断准确率达到99%以上。

图3 一种选择输入长度的自适应方法

Li等人对于多域诊断的情况，构建了一个新的迁移网络用于轴承故障识别（Li et al.，2022d）。采用最大均值差异（MMD）进行域自适应，引入了一种用于无监督集成学习的统一度量。强化学习用于多个模型和多个领域的融合。强化模型产生的搜索结果如图4所示。主要模型的构建基于具有3个卷积层的1D CNN。所提出的诊断方法在三个轴承数据集上的准确率分别为99.70%、83.63%和93.98%。与其他集成方法相比，平均精度提高了16.61%。

图4 强化模型产生的搜索结果

常见的闭集域自适应标志着测试和训练样本具有相同的健康状况，这可能导致未知故障类别中的类缺失。针对这一问题以及样本分布不一致带来的域迁移，Tian等人提出了一种适用于旋转机械开集故障识别的多源域方法（Tian et al.，2023）。输入为1D振动信号，模型的基本结构是具有批量归一化的CNN，使用了两种类型的特征提取器，一种用于共享，另一种用于源域（SD）。设计了一种互补的可迁移性度量来区分未知故障类型，用于指导迁移诊断。凯斯西储大学（CWRU）轴承、轧机和齿轮箱数据集用于演示。它对已知缺陷的分类和未知缺陷的检测是准确有效的。

Miao等人通过使用有限元模拟减少了TL对测试数据的依赖（Miao等人，2023）。对不同工况下不同故障类型的振动信号进行了数值计算。TD中的数据集是通过滑动窗口分割和与仿真数据的融合来建立的。使用了三种不同的深度模型，1D宽核CNN、1D ResNet和1D DenseNet。在测试台和CWRU数据集上进行的实验实现了95%以上的准确性。对于TD中没有故障样本的情况，Hou等人提出了一种用于轴承故障识别的模拟驱动迁移框架（Hou等人，2023）。模拟故障样本是基于构建的故障脉冲和测量的正常振动信号获得的，如图5所示。根据模拟数据计算出的包络谱作为迁移模型的输入，如图6所示，模型基础是一个具有多个头部注意力的CNN，用于学习更多样化的信息。在三个实验中，14个磁头的故障诊断准确率达到93%，12个磁头的准确率达到95.3%，13个磁头的正确率达到92.75%。

图5 基于正常振动信号和故障脉冲的故障数据模拟过程

图6 采用多头注意力机制的 CNN 结构

对于标记不足的目标样本，Li等人构建了一个基于预先训练的CNN的迁移诊断模型，用于NPP中的故障分类（Li等人，2022e）。从模拟器中获得训练数据，并将其预处理为3D数据作为输入。生成3D数据的方法如图7所示。主要模型是具有3个卷积层的CNN。实验采用5种不同的功率电平和3种传输方法进行。在相同的训练和测试水平下，诊断准确率最高，达到99%以上。精度在很大程度上受到由不同功率水平引起的域差异的影响。

图7 生成三维数据的方法

3.1.2 基于特征的深度迁移学习

基于特征的DTL旨在通过特征变换将两个领域的特征向量映射到相同的共享特征空间。有效地减少了数据分布不匹配的负面影响。基于特征选择的方法是指识别SD和TD中的相互特征表示并完成知识迁移。基于特征映射的方法是将域中的数据从原始的高维特征空间映射到低维空间，低维空间中标记的SD数据可以用于训练，并实现对目标数据的预测。

迁移成分分析（TCA）是Pan等人提出的一种经典的基于特征的TL方法（Pan et al. 2011）。SD和TD数据一起映射到高维希尔伯特空间中，以最小化两个域之间的数据距离，同时保持它们各自的内部特性。Tzeng等人将TCA扩展到深度神经网络。并通过引入域混淆损失来充分分析数据差异（Tzeng et al.，2014）。提出了一种基于TCA的几何和统计联合对齐方法用于视域自适应（Zhang et al.，2017）。

考虑到SD中的数据差异和分布不平衡，开发了一个多源域深度迁移模型，用于对四种轴承故障类型进行分类（Huang et al.，2023）。SD是从多种工作条件下的原始振动信号中获得的。四种不同的状态包含不同的转速、负载转矩和径向力。采用MMD方法进行数据选择以获得新的SD。采用整合对齐方法来解决分布失准问题。在训练阶段完成了领域和类别的调整。所提出的深度模型基于具有四个卷积层的CNN模型。通过与传统CNN、单源模型和其他多源模型的比较，验证了其有效性。它对目标工作状态的准确率达到95.08%以上。

Shi等人提出了一种将1D CNN和TL相结合的智能轴承故障诊断方法，其过程如图8所示（Shi和Hou，2023）。包括门控递归单元（GRU），以更好地捕捉时间序列数据中的长期相关性。在GRU之后排列的注意力层用于自动选择最相关的特征。该方法在小样本和不同载荷下进行了验证。与无TL的方法相比，该方法具有泛化优势。当目标样本比例较大时，准确率可达99%以上。当目标数据较小时，准确度可达97%以上。

图8 一种将1D CNN和TL相结合的智能轴承故障诊断方法

王等人使用1D CNN和TL完成了在改变转速时带有小标签的滚动轴承的故障分类（王等人，2023c）。图9描述了所提出的诊断方法的过程。MMD用于测量SD和TD之间的特征分布距离。同时，它用于确定卷积层和完全连接层是否可以迁移。进行了五种迁移策略来比较分类性能。结果表明，尽管数据分布不同，标记数据较少，但该方法的准确率高达99.72%。

图9 基于1DCNN和TL的故障诊断流程

由于在多种运行条件下可能存在域变化，提出了一种用于轴承故障分类的深度不平衡域自适应方法，如图10所示（Ding et al.，2023）。考虑了特征分布和故障类别的差异。成本敏感学习被用于缓解不平衡的分布。为了进一步应对阶级失衡，引入了分类调整。在多类任务中，使用边际损失正则化来增强少数类的泛化能力。基于1D振动信号和1D ResNet-18模型主干进行故障诊断。在自数据集上的实验表明，平均诊断准确率为96.55%，在任务极具挑战性的情况下，诊断准确率达到90%以上。

图10 一种用于轴承故障分类的深度不平衡域自适应方法

为了弥补传统TL中边际分布对齐的局限性，通过构建分布差异度量构建了一个判别特征学习框架（Qian et al.，2023）。方法验证使用了三个数据集，即西南交通大学轴承、CWRU轴承和RTS转子轴承。辛辛那提大学的IMS数据集因数据差异较大而用于进一步探索其有效性。不同载荷下的振动信号是诊断模型的输入。选择1D CNN作为整个模型框架的基石。如图11所示，改进的Softmax损失在调节决策边界方面表现出良好的性能，并带来了具有显著区别的特征分布。与其他领域自适应方法相比，该方法在未标记目标数据的情况下实现了90%以上的跨机器故障识别精度。

图11 从最后一个全连接层学习到的特征分布

在“靶向治疗”的启发下，提出了一种用于跨领域诊断的目标迁移方法（Lei et al.，2022）。其原理如图12所示。特征自适应使诊断知识迁移到不同的机器上。本研究在进行特征自适应时，考虑了跨域数据标签空间偏移引起的条件分布差异，以及相同故障类型下的局部数据分布差异。焦点模型是具有4个卷积层的深度CNN。机器间迁移诊断的平均诊断准确率达到98.31%，明显高于对照方法。深度CNN和深度域混淆的准确率分别为69.88%和54.48%。该方法完成了SD中局部故障诊断知识的选择性迁移，抑制了跨域诊断任务中的负迁移。

图12 跨机器故障诊断的目标迁移原理

针对SD和TD之间的分布差异，李提出了一种将TL和CNN相结合的新型智能NPP诊断方法（Li et al.，2022f）。MMD用于减少特征分布差异，并采用四核方法计算特征分布距离。采用RELAP5和SIMULINK仿真软件对高维非线性故障数据进行采集。在5个变化的功率水平下模拟了10种不同的健康状况。该模型的输入是29个由模拟参数转换而来的矩阵。在80%功率水平的TD下，高斯核的精度提高了28.72%。核函数对诊断准确性的影响如图13的方框图所示，其中源域来自100%功率水平。通过对特征可视化和收敛性的分析，进一步证明了高斯核在减少分布差异方面的有效性和优势。为了解决迁移学习中的样本分布差异，霍等人提出了一种用于轴承故障诊断的线性叠加（LS）模型（霍等人，2023b）。以1D CNN为基础模型。增强迁移学习（ETL）增强了目标域中的损失函数。在江南大学数据集上的实验表明，该方法的准确率达到99.80%以上，最高准确率达到100%。不同模型的可视化显示在图14中。

图13 不同核函数的诊断精度

图14 Tsne可视化结果
(a) deep adaptation network; (b) joint MMD; (c) improved joint MMD; (d) LS-CNN; (e) 1D-CNN + ETL; (f) LS-CNN + ETL

Su 等人通过最小化两个领域之间的决策结果差异来减少数据分布差异。采用领域指标来防止同一类别可能出现的错位。设计核范数是为了缓解批内数据的不平衡，提高决策差异的鲁棒性。中心模型为1D CNN，输入为1D振动信号。实验在三个条件下设计，即不同速度下的大数据和小数据，以及变化电流下的大值数据。平均诊断准确率分别达到99.96%、80.27%和97.59%。通过网格搜索选择了核范数中的两个关键参数，每个数据集的精度如图15所示。

图15 在每个数据集上的平均准确率

针对实际领域分布差异，提出了一种基于迁移策略和极限学习机的航空发动机故障识别新方法（Li et al.，2022g）。MMD用于从边际和条件角度减少分布差异。数据集是从涡扇发动机的仿真平台上获得的。基于不同迁移策略的两个实验的平均准确率分别达到89.72%和90.03%。该方法能够准确地完成发动机的跨领域故障诊断。由于MMD在DTL中的局限性，开发了一种新的迁移诊断方法，该方法涉及改进的具有度量结构和MMD的域自适应（Xiao et al.，2022）。设计了一种软伪标签策略，根据相似性对样本进行区分。在同一台机器、不同的机器和不断变化的工作条件下进行了不同的迁移任务。选择ResNet作为基本模型，输入为一维振动信号。通过分析两个域之间的类内和类间距离来评估其可分性和可迁移性。该方法在大数据集的情况下表现出更好的性能。通过多次迁移诊断任务，实现了99.55%的高准确率。所构建的方法需要从算法优化和方法应用两个方面进行改进。

由于常见的联合学习在数据质量和分布方面的局限性，提出了一种用于轴承故障识别的联合迁移学习方法（Wang et al.，2023d）。使用动态过滤器来消除低质量的样品（图16）。采用批量归一化MMD来减少数据分布差异。为了获得最优诊断模型，提高模型的泛化能力，提出了一种动态模型聚合算法。以一维CNN为核心模型，输入原始振动数据。使用三个轴承数据集验证了考虑实际载荷和变化速度的诊断方法的优势。苏州大学的数据集包含不同的负载。CWRU数据集由不断变化的电机速度组成。JNU数据集包含具有明显差异的不同速度。实验涉及实际工业中可能出现的两种情况，即缺乏健康状况和标签错误。在15%标签错误的挑战下，诊断准确率仍达到96%。

图16 联合迁移学习方法

由于协同建模对数据隐私的挑战，构建了一种基于联合迁移学习的机器协同诊断方法（Li et al.，2023c）。该方法克服了传统联合学习在不同客户端、单一工作条件下数据分布相同的局限性。选择不同的细胞神经网络作为基本迁移模型。对于源域用户，使用标记的私有数据和共享数据来训练深度模型。软标签信息传输用于多个用户之间的信息传输。熵最小化函数用于选择诊断决策边界，并在不同时分析源域数据的情况下实现模型自适应迁移诊断（图17）。与集中式模型训练方法、联合平均学习方法和局部训练方法相比，该模型的准确率超过90%，表现出更好的性能。该方法可以从对不同用户之间迁移的数据量的要求进行改进。它将扩展到不同的机器和信号源。考虑到对数据隐私的关注和协同学习的优势，Zhang et al提出了一种基于区块链的联合迁移诊断方法（Zhang et al.，2023d）。此框架不需要源域示例。采用双层一维CNN作为基本模型，输入一维振动数据。高速列车转向架轴承和转子试验台轴裂纹的故障诊断试验准确率达到90%以上。学习到的特征分布如图18所示。状态标签由不同的数字表示。红色和蓝色分别表示测试和训练数据。

图17 基于联合迁移学习的协同故障诊断流程

图18 不同方法学习到的特征分布可视化

针对数据隐私和动态域迁移的问题，刘等人提出了一种结合联邦学习和宽度学习的主动迁移诊断方法（Liu et al.，2023b）。使用FFT将原始振动信号转换为频域信息，并将均方根特征输入到模型中。诊断框架的主要基石是稀疏自动编码器。引入了具有双向GRU的注意力机制来从原始数据中挖掘显著性。实验使用了三个数据集，轴承、齿轮和转子。在集中学习中，三个数据集的准确率分别为99.97%、99.93%和93.04%。在联合学习中，与其他比较方法相比，所提出的方法具有更高的准确性，分别为99.82%、99.94%和99.85%。

传统迁移诊断方法的一个前提是基于特定的数据集和领域。刘等人通过引入宽度分类器和超参数优化器，开发了一种用于旋转机械故障诊断的自动迁移方法（刘等人，2023c）。利用FFT获得振动信号的频率特征，用于故障诊断。使用GRU单元和稀疏自动编码器作为传输框架的结构，使用PyTorch、DeepDA、Optuna和Scikit Optimize 4种Python库进行了实验。采用了20多种智能算法进行性能分析。使用三个数据集进行验证，即单轴承、单齿轮箱和带有轴承和齿轮的混合数据集。一个有趣的点是，小提琴图被用于预测数据分布的可视化，如图19所示。超参数优化的可视化如图20所示。具有主动迁移和联合验证的宽度模型在三个数据集上的准确率分别超过98%、95%和84%，跨领域诊断的准确率显著提高。

图19 不同方法下的预测数据分布可视化

图20 超参数优化的可视化

Wang et.al开发了一种由振动信号特征向量驱动的转子系统在线迁移诊断方法（Wang et.al，2022d）。采用统计方法和小波包分解方法提取故障特征。通过ReliefF方法实现了对敏感特征的进一步选择。考虑到域数据自适应，引入迁移成分分析来完成特征迁移。不同方法的结果如图21所示。该方法在输入6D敏感特征的情况下，具有89.68%的高精度，分别优于具有时域和时频特征的方法。通过交叉操作和跨机器实验证明了它的有效性，并优于其他比较诊断方法。

图21 不同诊断方法的分类准确率

针对传统轴承诊断方法在复杂工作操作中的局限性，Qian等人提出了一种通过集成轻量化1D DenseNet和联合分布自适应的迁移方法（Qian et al.，2022b）。迁移结构如图22所示。将改进的DenseNet用于一维振动信号的特征提取。采用域自适应的方法来解决特征分布的差异。在两个轴承数据集上的实验表明，诊断准确率分别达到98.50%和88.56%。所有测试迁移任务的平均准确率达到93.53%，在不断变化的工作条件下呈现出较好的聚类性能。针对源域中未知故障和目标域中不平衡的健康状况不包括在当前的迁移诊断方法中，Yang等人开发了一种用于齿轮箱和轴承故障诊断的多源迁移方法（Yang et al.，2022）。设计了一个具有部分分布自适应的子网络来处理未知故障。构建了融合模块，用于整合来自不同子网络的决策结果。可视化的相似矩阵表明了对已知和未知故障的识别正确性。该方法对跨机械的故障分类是有效的。对于不平衡的诊断情况，它仍然具有很强的鲁棒性。

图22 一种用于齿轮箱和轴承故障诊断的多源迁移方法架构

为了提高迁移模型提取可微特征的能力，李等人开发了一种用于轴承跨域缺陷识别的多视角迁移体系结构（李等人，2022h）。从空间、通道和序列三个方面实现了更有效的特征提取。在图23中，引入注意力机制来构建考虑空间和通道的特征增强网络。设计了一种基于序列知识的双向长短期记忆（BiLSTM）来提取特征。所构建的方法在三个轴承数据集上的诊断准确率分别为98.558%、99.465%和98.367%。

图23 多视角迁移学习框架

针对故障数据稀少、识别精度低的问题，提出了一种将层次极值学习机与TL相结合的飞机发动机故障诊断复合方法（Liu，2022）。基于RMSProp算法引入注意力机制用于筛选敏感特征。构造了一种新的学习率自适应优化方法。该方法的诊断性能优于其他深度模型方法，准确率达到97.9%。此外，从灵敏度结果来看，它具有更好的迁移效率和更少的计算时间。

为了解决变化运行条件下的轴承故障识别问题，Su et al.提出了一种新的基于DBN的扩展卷积和动态多层感知器的迁移模型（Su et al.，2022）。DBN用于挖掘所迁移的特征。采用域自适应和伪标签的方法来减少数据分布的差异。通过不平衡的情况和不同的运行状态证明了该方法的有效性。两个实验的平均识别准确率分别达到99.05%和96.55%，分别比普通DBN提高了17.37%和14.65%。

针对堆叠式自动编码器（stacked autoencoder，SAE）的梯度消失和跨域诊断准确率低问题，Luo等人提出了一种新的滚动轴承故障识别方法（Luo等人，2022）。改进后的模型结合了卷积捷径和域融合的方法，考虑到原始振动信号中的噪声影响，将FFT的频域数据作为输入。三个轴承数据集用于实验验证。在同一数据集之间的迁移任务中，该方法的诊断准确率达到99.4%。跨机器诊断的准确率达到99.95%。该方法对不同机器在不同运行条件下的轴承诊断具有良好的性能。将进一步探索所提出的迁移诊断方法对未知缺陷的扩展。针对工业上严重缺乏轴承标记数据问题，Shao et al建立了一种改进的深度迁移自动编码器，用于不同机器的轴承故障识别，如图24所示（Shao et al.，2020），进行了两项改进，使深度模型学习到更具代表性的诊断信息，一种是激活函数是基于可伸缩指数线性单元设计的，另一种是基于非负约束对成本函数进行修正。基于模拟数据和实验数据，诊断准确率分别达到98.50%和89.48%。

图24 基于 SAE 的传输网络

为了改进跨域故障诊断，提出了一种多源迁移与子域自适应相结合的旋转机械故障识别方法（Tian et al.，2022）。采用多分支网络和本地MMD的设计来减少域分布的差异。网络结构基于1D CNN。在轴承和齿轮箱三个数据集上验证了该方法的有效性。它呈现出比其他智能方法更有利的性能。此外，它对小样本和不平衡样本的问题表现出强大的鲁棒性。平均准确率分别为99.87%、99.60%和99.67%，与传统CNN模型相比分别提高了12.21%、18.36%和22.95%。在只有1%目标数据的多个来源的情况下，它实现了98.30%。在不平衡状态下，平均诊断准确率达到97.35%。

编辑：董浩杰

校核：李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、陈少华

该文资料搜集自网络

来源：故障诊断与python学习

振动非线性化学旋转机械通用航空航天 UG python UM Simulink 声学裂纹参数优化理论电机传动数字孪生

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2024-07-14