综述：旋转机械智能故障诊断中的深度迁移学习策略(下）

3月前浏览5253

本期给大家推荐一篇的关于智能故障诊断中的深度迁移学习策略的综述文章，该综述重点介绍了旋转机械的智能故障诊断，从不同维度输入的特殊角度进行了较为全面的分析，指出了现有的挑战，并展望了潜在的未来趋势，该综述有助于对基于深度迁移学习的故障诊断进行创新探索。

本节推文是这篇文章的下半部分，上半部分已发布：综述：旋转机械智能故障诊断中的深度迁移学习策略(上）。

论文基本信息

论文题目：Deep transfer learning strategy in intelligent fault diagnosis of rotating machinery

论文期刊：Engineering Applications of Artificial Intelligence

论文日期：2024.03

论文链接: 10.1016/j.engappai.2024.108678

作者：Shengnan Tang , Jingtao Ma , Zhengqi Yan , Yong Zhu , Boo Cheong Khoo

机构：National Research Center of Pumps, Jiangsu University, Zhenjiang 212013, China

通讯作者邮箱：zhuyong@ujs.edu.cn

3 用于旋转机械故障诊断的深度迁移学习策略

3.1.3 基于网络的深度迁移学习

基于网络的方法在图像处理中应用最为广泛，包括部分冻结和整体模糊神经网络调整。它是通过将源域中预先训练的网络的一部分迁移到目标域来实现的，包括原始的网络结构和参数。Yosinski等人讨论了深度神经网络中特征迁移的本质（Yosinski et al.，2014）。Oquab等人用大量标记数据训练CNN，并将其迁移到视觉识别中（Oquab et al.，2014）。对于有限的数据和标签，探索了一种基于残差迁移网络的无监督TL模型用于图像识别（Long et al.，2016）。构建了另一个基于多尺度卷积稀疏编码的无监督TL模型来学习可迁移的基础知识，并将其应用于生物医学felds（Chang et al.，2018）。基于用于变速箱故障诊断的CNN的预训练和fne调谐，构建了TL框架（Han et al.，2019）。钱等人使用预训练的卷积自动编码器和跨域自适应以迁移到目标域，用于行星齿轮箱的故障诊断（Qian et al.，2021）。

考虑到不同的特征分布和模型对大训练数据的要求，赵等人提出了一种混合迁移诊断方法，引入了逻辑麻雀搜索算法进行结构优化，并使用DBN进行故障识别（赵等人，2023a）。该模型的输入是通过FFT从振动信号转换而来的频域数据。通过使用少量辅助样本的微调，减少了对训练数据量的依赖性。当提供每种类型的50个训练样本时，该模型实现了100%的诊断准确性。所提出的方法显示了对改变工作状态和操作条件的鲁棒性。然而，该模型在区分缺齿和断齿、正常和偏心齿轮健康状态方面的能力较差。

由于预训练模型在复杂的工业条件下可能无法保持良好的有效性，因此融合TinyML和TL技术构建了一种新的故障诊断方法（Asutkar et al.，2023）。该模型的输入是从振动信号中提取的十个特征。主要模型是具有两个卷积层的简单1D CNN。使用随机搜索和5倍交叉验证对模型超参数进行优化。该模型使用来自CWRU轴承数据集的源域进行训练，并使用TD（包括实验室中的电机数据集和智能维护系统（IMS）轴承数据集）进行微调。该模型在微控制器板上进行推理，计算时间短，内存小，精度高。将从进一步简化的模型、信号处理和应用于微控制器的方法进行探索。

由于获取和标记故障数据的困难以及黑匣子模型的可解释性，提出了一种新的迁移诊断方法用于轴承和齿轮箱的故障分类（Brito et al.，2023）。如图25所示，使用具有正弦函数的波形方程，根据振动信号获得合成故障信号。随后对信号进行数据增强和Z评分归一化处理。将频域数据作为输入。采用早期停止方法对1D CNN进行训练，并选择其作为故障分类模型。使用梯度加权类激活映射来分析特征频率与分类结果之间的相关性。三个实验的准确率分别达到98.1%、92.5%和95.5%。

图25 所提利用合成数据的可解释迁移诊断方法流程

由于NPP中的故障数据极难获得，Qian和Liu结合GRU和注意力机制，建立了图26中基于参数的迁移诊断方法（Qian和Liu，2023）。使用来自FFT的频域频谱作为输入。使用三个数据集进行分析，CWRU、康涅狄格大学齿轮箱数据集和通过个人计算机瞬态分析仪（PCTRAN）软件模拟的NPP系统故障数据。考虑到不同的工作条件、旋转机械的变化和故障水平，进行了三个实验。将该方法与SVM、CNN和随机森林进行了比较。它实现了高达100%的准确率，并比其他故障数据较少的方法具有更有利的诊断性能。

图26 基于 GRU 和注意力机制的迁移诊断方法

由于常见的智能诊断方法不同于人类的知识学习方式，Yang等人开发了一种结合深度强化学习和迁移学习的端到端诊断方法（Yang et al.，2023c）。旋转机械的故障诊断在未知故障下变成了一个离散的问题。将原始振动信号作为诊断分析的输入。将深度Q网络的参数从卷积残差自动编码器迁移到CNN。除了更新频率外，其他三个超参数对方法的性能、批量大小、信号量和实验缓冲区都有很大影响。与其他智能诊断方法相比，该方法的准确率达到99%以上，具有明显的优势。

为了在列车数据不足的情况下构建精确优化的轴承诊断模型，Wang等人开发了一种基于强化迁移学习的自适应优化算法（Wang et al.，2022e）。强化学习模型由LSTM作为控制器和具有四个卷积层的CNN作为子模型组成。采用源域策略梯度的方法更新参数，选择最优子模型。从源域到目标域执行了参数迁移。仅使用1个标记的列车数据，最高测试准确率达到95.20%，比CNN提高了28.8%。使用10个标记的列车样本，准确率达到99.60%，与CNN相比提高了20.8%。它需要在所选子模型的局部优化和高精度的折衷计算成本上进行改进。针对目前智能诊断方法依赖人工建模和参数调整，对不同诊断情况的泛化能力较弱的问题，通过自动搜索具有异构迁移性能的高精度模型，提出了一种分层并行诊断框架（Zhou et al.，2022）。引入了神经结构搜索和模块化设计，以实现异构迁移的性能（图27）。采用权重共享机制来解决耗时的搜索问题，提高自动建模的效率。由于LSTM可以抑制梯度消失和梯度爆炸，因此选择它作为控制器。输入为1D振动信号。在齿轮箱和轴承数据集上的实验表明，在低时间消耗的情况下，准确率高达100%，优于其他基于强化神经结构搜索的诊断方法。

图27 分层并行网络诊断流程图

针对实际故障诊断场景中的小样本，Dong等人提出了一种新的结合动态模型的轴承迁移诊断方法（Dong et al.，2022）。利用轴承的动力学模型生成了足够的仿真样本。利用1D模拟信号获得预训练的1D CNN。采用积分参数迁移方法实现了模糊故障诊断。使用了八种不同的迁移策略，包括微调、随机初始化训练、冻结和混合方法。与其他方法相比，所提出的方法具有较高的迁移效率，如图28所示。此外，基于CNN的模型进行了更有效的参数迁移，减少了两个领域之间的分布差异。

图28 不同参数迁移方法的迁移效率

由于航空发动机故障状态数据较少，Zhao等人提出了一种基于极限学习机和迁移策略的跨域诊断方法（Zhao和Chen，2022）。构建了两种迁移方法，一阶段和两阶段方法，如图29所示。与其他方法相比，所提出的两阶段方法实现了最高的诊断精度。在四种工作条件下，准确率达到96.40%，比基准方法提高了17.63%。在不同噪声程度的干扰下，该方法对航空发动机故障诊断仍具有良好的鲁棒性。提出了一种具有类级匹配函数的三阶段TL模型用于滚动轴承故障诊断，使用不同的迁移任务，诊断准确率提高了12.95%（Huo et al.，2023c）。

图29 基于极限学习机的两阶段迁移方法

3.1.4 基于对抗的深度迁移学习

基于对抗的DTL是一种使用GAN或其他对抗性技术来缩小领域之间的差异，从而提高目标域的学习效率的方法。GAN由Goodfellow等人提出。旨在通过同时训练两个合作和竞争的深度神经网络来解决无监督学习问题（Goodfellow et al.，2014）。Radford等人将CNN与GAN相结合，以提高训练稳定性和生成样本的质量（Radford等人，2016）。结合深度自动编码器和可迁移GAN，Kim等人实现了高精度的恶意软件检测（Kim等人，2018）。可迁移GAN也用于变化条件下的轴承故障识别（Jin et al.，2019）。通过引入联合MMD和对抗性自适应鉴别器，构建了基于一维残差网络的变速箱和轴承故障识别迁移诊断模型（Jiao et al.，2020）。张等人提出了一种联合迁移诊断方案，以克服域迁移和数据隐私带来的挑战（张和李，2022）。通过对不断变化的用户使用不同的深度模型来改善信息隐私。初始化和通信程序旨在减少领域差异对诊断性能的影响。通过构造预测一致性技术，增强了该方法的鲁棒性。该模型的框架基于CNN，输入是通过FFT获得的振动数据的频谱。不同的迁移任务表明，该方法在测试实验中的诊断准确率达到了90%左右，高于其他智能故障诊断方法。

DT可以被认为是连接虚拟模型和机械的一座奇妙的桥梁。它可以用于解决实践中故障数据的稀缺性和来自不同工作状态的诊断挑战。王等人在MATLAB中使用Simscape建立了DT模型，将故障数据生成为SD（图30），并采用对抗性迁移策略对三缸泵进行故障分类（王等人，2023e）。模拟了四种常见故障：入口堵塞、轴承磨损、密封泄漏和绕组断裂。诊断方法基于原始压力信号。理论模型是一个深度自适应对抗模型。当模型由电动机和测功机驱动时，诊断准确率分别达到99.50%和98.78%。

图30 三联泵 DT 辅助迁移诊断流程图

为了解决可能同时存在的知识遗忘和数据分布差异，构建了一个连续迁移诊断框架，用于汽车变速器轴承和齿轮的故障分类（Li et al.，2023d）。两个领域的样本选择都采用了羊群算法。将动态权重聚合引入诊断知识的学习和保留中。采用对抗性技术来解决SD和TD之间的分布差异。以ResNet模型为特征提取器，输入不同状态下采集的振动信号。经过多个阶段，平均识别准确率超过90%。该方法在精度和鲁棒性方面具有明显的优势。

与同一台机器中的常见迁移诊断不同，Wu等人开发了一种新的对抗性迁移模型，通过不同机器之间的知识迁移实现跨机器诊断（Wu et al.，2023）。通过将来自不同机器的轴承数据作为多个SD来实现迁移。使用一种新的条件分布辅助对齐方法来减少数据分布的差异。介绍了一种用于SD数据控制的单调重要性规范，该规范基于FFT从振动信号转换而来的频率信号进行诊断。使用两层神经网络作为特征提取器。实验使用了来自更换机器的三个轴承数据集。随着标记目标样本的增加，该诊断方法达到了更高的准确性。当每种故障类型的标记目标样本增加到3个时，它在一项任务中实现了100%的最高精度。

对于没有故障数据的情况，开发了一种基于一维CycleGAN的轴承故障诊断数值模拟驱动迁移方法（Liu et al.，2023d）。通过建立轴承的动力学模型，获得了正常和失效条件下的模拟信号。一维CycleGAN由两个镜像对称结构组成（图31）。它是为模拟信号的转换和实际故障的识别而设计的。与SVM、ELM和CNN进行比较，验证了翻译后的信号可用于故障诊断。基于翻译信号，测试准确率达到80%以上。该方法对正常状态和故障状态的识别精度达到91%以上。对于多个故障，平均精度超过85%，高于最先进的迁移方法。

图31 1D Cycle-GAN的架构

针对SD中类别决策边界对TD特征匹配的影响，提出了一种基于域自适应的增强迁移CNN用于轴承故障诊断（Chen et al.，2021）。引入对抗性训练来最大化两个分类器之间的分类差异，并最小化两个领域之间的特征分布差异。特征提取器是具有4个卷积层的CNN，并且1D振动信号是输入。该方法在不同诊断任务中的平均准确率达到94.29%。在附加噪声的情况下，其诊断结果仍达到82.51%，并具有较好的分类和泛化性能。由于公共子空间不切实际，基于不同子空间学习和动态分布自适应，提出了一种新的领域自适应方法（Xu et al.，2022）。在两个轴承数据集上，平均诊断准确率分别达到99.01%和98.81%。

由于很难从新的运行状态或未知的燃气轮机中获得足够的带有标签的故障数据，刘等人提出了一种基于对抗性判别域自适应策略的迁移诊断方法（Liu et al.，2022）。如图32所示。使用2层CNN完成特征提取。模型的输入是振动信号。要迁移的模型是从具有源域的监督训练中获得的。模型迁移降低了列车成本，提高了列车性能。对抗性训练采用目标域进行，以减少分布差异。在交叉条件实验中，诊断准确率达到96.45%，不同诊断方法的分类可视化如图33所示。在跨机诊断病例中，平均准确率达到95.13%。

图32 基于对抗性判别域适应的燃气轮机转子系统迁移移诊断方法

图33 通过 t-SNE 降低不同诊断方法的维数

针对工程实践中列车数据不足的问题，提出了一种基于实例的迁移方法进行元建模和轴承故障识别。引入了一种具有域自适应的域对抗性网络来获取辅助目标域（Kim和Lee，2022）。使用影响函数选择有用的辅助数据以获得更好的数据集。基本模型是1D CNN，输入是来自FFT的振动信号的频域。诊断准确率达到98.250%，与传统的领域对抗性网络相比提高了1.222%。对于当前深度模型在交叉条件和数据分布变化的限制下，提出了一种融合迁移诊断方法用于轴向柱塞泵的缺陷识别（He et al.，2022）。该方法基于具有注意力机制的多信号集成和深度对抗性网络，构建残差模块进行特征提取。研究了四种常见的故障类型，即活塞故障、滑块故障、阀板故障和返回盘故障。采集振动信号和声学信号进行实验分析。在许多跨域迁移任务中，平均诊断准确率达到98.5%。基于一维振动信号，建立了可变运行载荷下风机和轴承故障诊断的动态迁移对抗模型（Wei et al.，2021）。涉及全局域和局部域的分布，前者使用动态对抗因子来完成。

3.2 基于二维输入的迁移诊断应用

考虑到二维输入可以充分发挥DNN在特征提取中的优势，已经构建了基于二维图像或矩阵的故障诊断迁移模型（Li et al.，2023e；Gao et al.，2021；Liu et al.，2020 3e）。一般方案是通过使用不同的数据预处理方法将原始信号参数转换为灰色或彩色图像来设计的。

基于声音信号，构建了基于ResNet-50的液压泵故障诊断迁移模型（Zhang et al.，2023e）。通过使用具有Z加权的声级计来收集原始声音信号。使用改进的集成经验模式分解和最小冗余最大相关方法对声音信号进行预处理，以进行信号分解和降噪。输入是通过短时傅立叶变换（STFT）来自窄带光谱图的灰度图像。通过对6台液压泵的实验验证了该方法的有效性。研究了七种故障模式和一种正常状态，包括泵的部件和滚动轴承。迁移诊断准确率分别达到86.1%和90.8%。基于多信号融合和集成学习的智能诊断可以进一步研究，进行新的探索。针对单通道信号中信息不足的问题，张等提出了一种结合多通道信息融合的DTL方法，用于轴承和齿轮箱故障诊断（Zhang et al.，2023f）。基本的深度模型是以多通道图像为输入的ResNet。通过使用三个振动传感器来获取原始信号。通过连续小波变换（CWT）对振动信号的时频特征进行积分，获得多通道图像。在三个数据集上测试的识别准确率超过99%，包括滚动轴承故障和齿轮箱故障。在负载变化的情况下，CWRU数据集的迁移诊断准确率达到93.12%。

为了解决故障样本不足的问题，构建了一种新的TL框架，称为分类器约束域自适应网络，用于转子的裂纹故障诊断（Xiang et al.，2023）。网络结构如图34所示。从动态模型中获得的生成样本被作为源域（SD）数据，对不同的转子裂纹水平进行了分析，改变工作状态包括三种操作速度。使用二维多层卷积网络进行特征提取，并使用多核MMD来减少特征的分布差异。配置了两个分类器以减少错误分类。在相同速度的情况下，从模拟到实验的平均精度达到了99.78%。在不同速度下进行迁移时，诊断准确率为92.67%。

图34 一种基于迁移学习构建的网络模型

赵等人通过将注意力机制引入CNN模型，构建了一种新的轴承故障识别迁移学习方法（赵等人，2023b）。模型的输入是由振动信号转换而来的2D灰度图像。使用了四种策略来评估所提出方法的诊断性能，即深度自适应网络、相关性比对、联合自适应网络和DAN。迁移学习的目的如下，源域的特征空间和类别空间与目标域的特征和类别空间相同，但概率分布不同。源域由标记样本组成，而目标域由未标记样本组成。利用输电故障诊断试验台和高速列车试验台对该方法进行了验证。结果表明，迁移学习是在变速以及变速和负载变化的情况下实现的。此外，当仅速度变化时，精度更高。该方法的性能优于普通CNN，前者的最高精度达到95%以上，而后者的最高精度低于90%。

由于环境噪声和负载变化的影响，Lv等人提出了一种用于轴承故障识别的迁移诊断方法（Lv等人，2023）。主要模型是对DenseNet的改进，ReLU激活函数被LeakyReLU取代。该方法通过使用加噪声处理的CWRU数据集进行验证。基于振动信号的二维灰度图像，实现了小数据、变载荷情况下轴承故障的跨域诊断。诊断准确率达到90%以上。实验证明，它更适用于低噪声的故障数据。

雷等人构建了一种新的元迁移学习方法，用于轴承的自适应故障诊断（Lei et al.，2023）。嵌入先验知识以改进在不断变化的工作条件下的特征学习。在图35中，该方法使用计算阶次跟踪（computed order tracking）进行数据扩充。基于多尺度卷积核、注意力模块和残差块，采用多尺度特征编码进行特征提取。在极为稀缺的情况下，一次故障诊断实验的最高平均准确率分别为83.04%和95.89%，在五次故障诊断试验中的最高平均正确率分别为87.74%和98.57%。在不同的伪速度下进行了跨域故障诊断。该方法通过信息融合提高了诊断的准确性。

图35 基于元迁移学习的自适应轴承故障诊断方法

为了增强少样本迁移诊断的通用性，图36中提出了一种用于轴承小样本故障诊断的深度元迁移学习方法（Li et al.，2023f）。采用参数调制方法对模型参数进行自适应调整。具有注意力机制的ResNet 12是模型结构的主干，输入是通过CWT的振动信号的时频图像。在三个轴承数据集上进行了一次和五次实验，平均诊断准确率分别达到99.08%、95.86%和77.74%。

图36 基于元迁移学习和注意力机制的故障诊断方法

针对训练样本不足的问题，结合卷积生成对抗模型和频谱归一化，提出了一种新的迁移诊断方法（Zhong et al.，2023）。输入是使用CWT的振动信号的2D图像。基础深部模型为VGG-16。使用自我注意来获得用于模型训练的合成数据。该方法在CWRU和自建测试数据集上进行了验证。结果表明，复合数据集的准确率达到99.72%，引入数据扩充时的准确率达99.84%。相比之下，该方法的识别精度为95%，而原始样本的识别精度仅为2.9%。

在跨机器诊断方面，开发了一种新的基于多级域自适应的轴承缺陷识别迁移网络（Wan et al.，2022），将分层解码操作引入到共享特征提取中以提高性能，在域适应中设计了注意机制来抑制负迁移。ResNet用于特征提取，通过STFT输入2D时频图像。实验在三个轴承数据集上进行，包括6个不同的迁移识别任务。该方法的平均诊断准确率为91.05%，具有更好的知识学习和迁移能力。由于基于1D振动信号的诊断可能无法证明CNN的强大学习能力，而基于2D图像的诊断依赖于信号分析方法，Hou等人提出了一种新的信号到图像自适应转换的迁移诊断方法（Hoo et al.，2022）。从图37中可以看出，主要的深层模型是1D和2D CNN。模型的输入是1D振动信号。在卷积层和全连接层中分别使用了两种不同的损失函数，即CORAL和具有多核MMD（MK-MMD）和交叉熵的联合函数。在两个方位数据集上，5个任务的平均诊断准确率分别达到99.98%和99.63%。在跨领域的情况下，它优于其他基于深度模型的故障诊断方法。所提方法的扩展将在跨设备和不平衡条件下进行研究。

图37 基于自适应维度转换 CNN 的迁移模型

Yu等人构建了一种基于特征的迁移诊断方法，以解决当前基于深度模型的方法在应对交叉条件、噪声效应和数据不足方面的局限性（Yu et al.，2022）。小波包变换由于具有多尺度时频分析的能力，被用于建立有效的二维输入。使用MK-MMD来减少域分布差异。2D ResNet用于特征提取。在噪声干扰下，一个数据集的平均准确率为98.59%，比不使用WPT的方法高出3.34%。在另一个不同噪声水平的实验中，它达到了97.14%，与无WPT方法相比提高了3.83%。由于不同功率水平的核电站数据分布较大，Wang等人提出了一种基于ResNet-18的新的系统故障诊断迁移方法（Wang et al.，2022f）。原始数据是通过PCTRAN从模拟中收集的。输入是使用数据流从数据序列转换而来的2D图像。该方法的准确率达到97.51%，比传统CNN的准确率高出25.95%。

由于可变工况和故障变化带来的困难，Ma等人建立了DT模型，并使用增强的元迁移学习方法进行复杂轴承故障诊断（Ma et al.，2023b）。采用完全模态分解法对DT进行模态参数识别。元迁移学习的流程如图38所示。建立的DT如图39所示。虚拟DT模型用于获取缺陷模拟样本，准确率达到95.685%。将STFT的时频图像作为输入。主要模型是深度神经网络和名为ResNet的深度残差网络。通过包括领域自适应和注意机制，迁移模型的准确率达到95.18%。

图38 元迁移学习框架

图39 轴承试验台的 DT 模型

4 总结与展望

这项综述介绍了迁移学习的基本原理和不同类别。重点介绍了迁移学习在旋转机械故障诊断中的重要应用。从输入类型和迁移分类的角度讨论了相关的诊断案例。机械故障诊断是基于1D原始样本和2D图像，通过不同的转换方法实现的，包括轴承、齿轮、齿轮箱、转子、航空发动机、涡轮机和泵机械。深度迁移学习策略结合了深度模型强大的特征挖掘能力和迁移学习较弱的训练数据需求。这导致了跨领域、变工况、跨设备、样本少、标记样本少和数据分布不平衡的诊断任务的进展和成就。

迁移学习克服了传统深度模型在海量数据和计算能力方面的局限性，表现出较强的训练模型泛化能力和训练过程的鲁棒性。对于更复杂的诊断任务以及可变甚至极端的运行条件，探索更有效的旋转机械故障诊断方法具有挑战性和意义。这些内容如下。

（1）对于不可预见的和未知故障的诊断，基于自适应多源域的开集故障诊断方法的泛化将是未来对多源不一致标签空间的探索方向。寻求一个具有有效度量的最优强化学习模型来组合多个模型和多个领域是有价值的。新的基于实例的迁移方法和模型的自学习能力也是一个潜在的方向。

（2）从跨领域、跨设备诊断和多种动态模型的角度，尝试使用动态仿真模型来应对小样本问题。需要减少生成假数据所需的计算资源。为了追求计算费用和诊断准确性之间的平衡，输入类型、迁移模型的简化和数据预处理方法的选择等许多关键因素值得进一步综合考虑。

（3）为了提取有区别的和全面的特征，可以从多个角度和多信息融合进行跨领域诊断。此外，迁移模型的超参数优化可以进一步研究。需要增强迁移诊断的可扩展性和通用性。

（4）在实际工程中，多故障耦合条件是一个常见的问题，但很难检测和识别。因此，将迁移学习扩展到更复杂的工作环境下的复合故障是值得深入思考的。

编辑：董浩杰

校核：李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、陈少华

该文资料搜集自网络

来源：故障诊断与python学习

振动断裂化学旋转机械通用航空汽车 MATLAB python 通信 UM 声学裂纹参数优化理论电机数字孪生

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2024-07-14

综述：旋转机械智能故障诊断中的深度迁移学习策略(下）

论文基本信息

目录

3 用于旋转机械故障诊断的深度迁移学习策略

4 总结与展望