本期给大家推荐一篇的关于智能故障诊断中的深度迁移学习策略的综述文章,该综述重点介绍了旋转机械的智能故障诊断,从不同维度输入的特殊角度进行了较为全面的分析,指出了现有的挑战,并展望了潜在的未来趋势,该综述有助于对基于深度迁移学习的故障诊断进行创新探索。
本节推文是这篇文章的下半部分,上半部分已发布:综述:旋转机械智能故障诊断中的深度迁移学习策略(上)。
2.1 迁移学习的基本原理
2.2 迁移学习的分类
3.1 基于一维(1D)输入的迁移诊断应用
3.1.1 基于实例的深度迁移学习
3.1.2 基于特征的深度迁移学习
(注:上述部分已经发布:综述:旋转机械智能故障诊断中的深度迁移学习策略(上),本篇将介绍下面四个部分的内容)
3.1.3 基于网络的深度迁移学习
3.1.4 基于对抗的深度迁移学习
3.2 基于二维(2D)输入的迁移诊断应用
基于网络的方法在图像处理中应用最为广泛,包括部分冻结和整体模糊神经网络调整。它是通过将源域中预先训练的网络的一部分迁移到目标域来实现的,包括原始的网络结构和参数。Yosinski等人讨论了深度神经网络中 特征迁移的本质(Yosinski et al.,2014)。Oquab等人用大量标记数据训练CNN,并将其迁移到视觉识别中(Oquab et al.,2014)。对于有限的数据和标签,探索了一种基于残差迁移网络的无监督TL模型用于图像识别(Long et al.,2016)。构建了另一个基于多尺度卷积稀疏编码的无监督TL模型来学习可迁移的基础知识,并将其应用于生物医学felds(Chang et al.,2018)。基于用于变速箱故障诊断的CNN的预训练和fne调谐,构建了TL框架(Han et al.,2019)。钱等人使用预训练的卷积自动编码器和跨域自适应以迁移到目标域,用于行星齿轮箱的故障诊断(Qian et al.,2021)。
考虑到不同的特征分布和模型对大训练数据的要求,赵等人提出了一种混合迁移诊断方法,引入了逻辑麻雀搜索算法进行结构优化,并使用DBN进行故障识别(赵等人,2023a)。该模型的输入是通过FFT从振动信号转换而来的频域数据。通过使用少量辅助样本的微调,减少了对训练数据量的依赖性。当提供每种类型的50个训练样本时,该模型实现了100%的诊断准确性。所提出的方法显示了对改变工作状态和操作条件的鲁棒性。然而,该模型在区分缺齿和断齿、正常和偏心齿轮健康状态方面的能力较差。
由于预训练模型在复杂的工业条件下可能无法保持良好的有效性,因此融合TinyML和TL技术构建了一种新的故障诊断方法(Asutkar et al.,2023)。该模型的输入是从振动信号中提取的十个特征。主要模型是具有两个卷积层的简单1D CNN。使用随机搜索和5倍交叉验证对模型超参数进行优化。该模型使用来自CWRU轴承数据集的源域进行训练,并使用TD(包括实验室中的电机数据集和智能维护系统(IMS)轴承数据集)进行微调。该模型在微控制器板上进行推理,计算时间短,内存小,精度高。将从进一步简化的模型、信号处理和应用于微控制器的方法进行探索。
由于获取和标记故障数据的困难以及黑匣子模型的可解释性,提出了一种新的迁移诊断方法用于轴承和齿轮箱的故障分类(Brito et al.,2023)。如图25所示,使用具有正弦函数的波形方程,根据振动信号获得合成故障信号。随后对信号进行数据增强和Z评分归一化处理。将频域数据作为输入。采用早期停止方法对1D CNN进行训练,并选择其作为故障分类模型。使用梯度加权类激活映射来分析特征频率与分类结果之间的相关性。三个实验的准确率分别达到98.1%、92.5%和95.5%。
图25 所提利用合成数据的可解释迁移诊断方法流程
由于NPP中的故障数据极难获得,Qian和Liu结合GRU和注意力机制,建立了图26中基于参数的迁移诊断方法(Qian和Liu,2023)。使用来自FFT的频域频谱作为输入。使用三个数据集进行分析,CWRU、康涅狄格大学齿轮箱数据集和通过个人计算机瞬态分析仪(PCTRAN)软件模拟的NPP系统故障数据。考虑到不同的工作条件、旋转机械的变化和故障水平,进行了三个实验。将该方法与SVM、CNN和随机森林进行了比较。它实现了高达100%的准确率,并比其他故障数据较少的方法具有更有利的诊断性能。
图26 基于 GRU 和注意力机制的迁移诊断方法
由于常见的智能诊断方法不同于人类的知识学习方式,Yang等人开发了一种结合深度强化学习和迁移学习的端到端诊断方法(Yang et al.,2023c)。旋转机械的故障诊断在未知故障下变成了一个离散的问题。将原始振动信号作为诊断分析的输入。将深度Q网络的参数从卷积残差自动编码器迁移到CNN。除了更新频率外,其他三个超参数对方法的性能、批量大小、信号量和实验缓冲区都有很大影响。与其他智能诊断方法相比,该方法的准确率达到99%以上,具有明显的优势。
为了在列车数据不足的情况下构建精确优化的轴承诊断模型,Wang等人开发了一种基于强化迁移学习的自适应优化算法(Wang et al.,2022e)。强化学习模型由LSTM作为控制器和具有四个卷积层的CNN作为子模型组成。采用源域策略梯度的方法更新参数,选择最优子模型。从源域到目标域执行了参数迁移。仅使用1个标记的列车数据,最高测试准确率达到95.20%,比CNN提高了28.8%。使用10个标记的列车样本,准确率达到99.60%,与CNN相比提高了20.8%。它需要在所选子模型的局部优化和高精度的折衷计算成本上进行改进。针对目前智能诊断方法依赖人工建模和参数调整,对不同诊断情况的泛化能力较弱的问题,通过自动搜索具有异构迁移性能的高精度模型,提出了一种分层并行诊断框架(Zhou et al.,2022)。引入了神经结构搜索和模块化设计,以实现异构迁移的性能(图27)。采用权重共享机制来解决耗时的搜索问题,提高自动建模的效率。由于LSTM可以抑制梯度消失和梯度爆炸,因此选择它作为控制器。输入为1D振动信号。在齿轮箱和轴承数据集上的实验表明,在低时间消耗的情况下,准确率高达100%,优于其他基于强化神经结构搜索的诊断方法。
图27 分层并行网络诊断流程图
针对实际故障诊断场景中的小样本,Dong等人提出了一种新的结合动态模型的轴承迁移诊断方法(Dong et al.,2022)。利用轴承的动力学模型生成了足够的仿真样本。利用1D模拟信号获得预训练的1D CNN。采用积分参数迁移方法实现了模糊故障诊断。使用了八种不同的迁移策略,包括微调、随机初始化训练、冻结和混合方法。与其他方法相比,所提出的方法具有较高的迁移效率,如图28所示。此外,基于CNN的模型进行了更有效的参数迁移,减少了两个领域之间的分布差异。
图28 不同参数迁移方法的迁移效率
由于航空发动机故障状态数据较少,Zhao等人提出了一种基于极限学习机和迁移策略的跨域诊断方法(Zhao和Chen,2022)。构建了两种迁移方法,一阶段和两阶段方法,如图29所示。与其他方法相比,所提出的两阶段方法实现了最高的诊断精度。在四种工作条件下,准确率达到96.40%,比基准方法提高了17.63%。在不同噪声程度的干扰下,该方法对航空发动机故障诊断仍具有良好的鲁棒性。提出了一种具有类级匹配函数的三阶段TL模型用于滚动轴承故障诊断,使用不同的迁移任务,诊断准确率提高了12.95%(Huo et al.,2023c)。
图29 基于极限学习机的两阶段迁移方法
图30 三联泵 DT 辅助迁移诊断流程图
图31 1D Cycle-GAN的架构
图32 基于对抗性判别域适应的燃气轮机转子系统迁移移诊断方法
图33 通过 t-SNE 降低不同诊断方法的维数
考虑到二维输入可以充分发挥DNN在特征提取中的优势,已经构建了基于二维图像或矩阵的故障诊断迁移模型(Li et al.,2023e;Gao et al.,2021;Liu et al.,2020 3e)。一般方案是通过使用不同的数据预处理方法将原始信号参数转换为灰色或彩色图像来设计的。
基于声音信号,构建了基于ResNet-50的液压泵故障诊断迁移模型(Zhang et al.,2023e)。通过使用具有Z加权的声级计来收集原始声音信号。使用改进的集成经验模式分解和最小冗余最大相关方法对声音信号进行预处理,以进行信号分解和降噪。输入是通过短时傅立叶变换(STFT)来自窄带光谱图的灰度图像。通过对6台液压泵的实验验证了该方法的有效性。研究了七种故障模式和一种正常状态,包括泵的部件和滚动轴承。迁移诊断准确率分别达到86.1%和90.8%。基于多信号融合和集成学习的智能诊断可以进一步研究,进行新的探索。针对单通道信号中信息不足的问题,张等提出了一种结合多通道信息融合的DTL方法,用于轴承和齿轮箱故障诊断(Zhang et al.,2023f)。基本的深度模型是以多通道图像为输入的ResNet。通过使用三个振动传感器来获取原始信号。通过连续小波变换(CWT)对振动信号的时频特征进行积分,获得多通道图像。在三个数据集上测试的识别准确率超过99%,包括滚动轴承故障和齿轮箱故障。在负载变化的情况下,CWRU数据集的迁移诊断准确率达到93.12%。
为了解决故障样本不足的问题,构建了一种新的TL框架,称为分类器约束域自适应网络,用于转子的裂纹故障诊断(Xiang et al.,2023)。网络结构如图34所示。从动态模型中获得的生成样本被作为源域(SD)数据,对不同的转子裂纹水平进行了分析,改变工作状态包括三种操作速度。使用二维多层卷积网络进行特征提取,并使用多核MMD来减少特征的分布差异。配置了两个分类器以减少错误分类。在相同速度的情况下,从模拟到实验的平均精度达到了99.78%。在不同速度下进行迁移时,诊断准确率为92.67%。
图34 一种基于迁移学习构建的网络模型
赵等人通过将注意力机制引入CNN模型,构建了一种新的轴承故障识别迁移学习方法(赵等人,2023b)。模型的输入是由振动信号转换而来的2D灰度图像。使用了四种策略来评估所提出方法的诊断性能,即深度自适应网络、相关性比对、联合自适应网络和DAN。迁移学习的目的如下,源域的特征空间和类别空间与目标域的特征和类别空间相同,但概率分布不同。源域由标记样本组成,而目标域由未标记样本组成。利用输电故障诊断试验台和高速列车试验台对该方法进行了验证。结果表明,迁移学习是在变速以及变速和负载变化的情况下实现的。此外,当仅速度变化时,精度更高。该方法的性能优于普通CNN,前者的最高精度达到95%以上,而后者的最高精度低于90%。
由于环境噪声和负载变化的影响,Lv等人提出了一种用于轴承故障识别的迁移诊断方法(Lv等人,2023)。主要模型是对DenseNet的改进,ReLU激活函数被LeakyReLU取代。该方法通过使用加噪声处理的CWRU数据集进行验证。基于振动信号的二维灰度图像,实现了小数据、变载荷情况下轴承故障的跨域诊断。诊断准确率达到90%以上。实验证明,它更适用于低噪声的故障数据。
雷等人构建了一种新的元迁移学习方法,用于轴承的自适应故障诊断(Lei et al.,2023)。嵌入先验知识以改进在不断变化的工作条件下的特征学习。在图35中,该方法使用计算阶次跟踪(computed order tracking)进行数据扩充。基于多尺度卷积核、注意力模块和残差块,采用多尺度特征编码进行特征提取。在极为稀缺的情况下,一次故障诊断实验的最高平均准确率分别为83.04%和95.89%,在五次故障诊断试验中的最高平均正确率分别为87.74%和98.57%。在不同的伪速度下进行了跨域故障诊断。该方法通过信息融合提高了诊断的准确性。
图35 基于元迁移学习的自适应轴承故障诊断方法
为了增强少样本迁移诊断的通用性,图36中提出了一种用于轴承小样本故障诊断的深度元迁移学习方法(Li et al.,2023f)。采用参数调制方法对模型参数进行自适应调整。具有注意力机制的ResNet 12是模型结构的主干,输入是通过CWT的振动信号的时频图像。在三个轴承数据集上进行了一次和五次实验,平均诊断准确率分别达到99.08%、95.86%和77.74%。
图36 基于元迁移学习和注意力机制的故障诊断方法
针对训练样本不足的问题,结合卷积生成对抗模型和频谱归一化,提出了一种新的迁移诊断方法(Zhong et al.,2023)。输入是使用CWT的振动信号的2D图像。基础深部模型为VGG-16。使用自我注意来获得用于模型训练的合成数据。该方法在CWRU和自建测试数据集上进行了验证。结果表明,复合数据集的准确率达到99.72%,引入数据扩充时的准确率达99.84%。相比之下,该方法的识别精度为95%,而原始样本的识别精度仅为2.9%。
在跨机器诊断方面,开发了一种新的基于多级域自适应的轴承缺陷识别迁移网络(Wan et al.,2022),将分层解码操作引入到共享特征提取中以提高性能,在域适应中设计了注意机制来抑制负迁移。ResNet用于特征提取,通过STFT输入2D时频图像。实验在三个轴承数据集上进行,包括6个不同的迁移识别任务。该方法的平均诊断准确率为91.05%,具有更好的知识学习和迁移能力。由于基于1D振动信号的诊断可能无法证明CNN的强大学习能力,而基于2D图像的诊断依赖于信号分析方法,Hou等人提出了一种新的信号到图像自适应转换的迁移诊断方法(Hoo et al.,2022)。从图37中可以看出,主要的深层模型是1D和2D CNN。模型的输入是1D振动信号。在卷积层和全连接层中分别使用了两种不同的损失函数,即CORAL和具有多核MMD(MK-MMD)和交叉熵的联合函数。在两个方位数据集上,5个任务的平均诊断准确率分别达到99.98%和99.63%。在跨领域的情况下,它优于其他基于深度模型的故障诊断方法。所提方法的扩展将在跨设备和不平衡条件下进行研究。
图37 基于自适应维度转换 CNN 的迁移模型
Yu等人构建了一种基于特征的迁移诊断方法,以解决当前基于深度模型的方法在应对交叉条件、噪声效应和数据不足方面的局限性(Yu et al.,2022)。小波包变换由于具有多尺度时频分析的能力,被用于建立有效的二维输入。使用MK-MMD来减少域分布差异。2D ResNet用于特征提取。在噪声干扰下,一个数据集的平均准确率为98.59%,比不使用WPT的方法高出3.34%。在另一个不同噪声水平的实验中,它达到了97.14%,与无WPT方法相比提高了3.83%。由于不同功率水平的核电站数据分布较大,Wang等人提出了一种基于ResNet-18的新的系统故障诊断迁移方法(Wang et al.,2022f)。原始数据是通过PCTRAN从模拟中收集的。输入是使用数据流从数据序列转换而来的2D图像。该方法的准确率达到97.51%,比传统CNN的准确率高出25.95%。
由于可变工况和故障变化带来的困难,Ma等人建立了DT模型,并使用增强的元迁移学习方法进行复杂轴承故障诊断(Ma et al.,2023b)。采用完全模态分解法对DT进行模态参数识别。元迁移学习的流程如图38所示。建立的DT如图39所示。虚拟DT模型用于获取缺陷模拟样本,准确率达到95.685%。将STFT的时频图像作为输入。主要模型是深度神经网络和名为ResNet的深度残差网络。通过包括领域自适应和注意机制,迁移模型的准确率达到95.18%。
图38 元迁移学习框架
图39 轴承试验台的 DT 模型
编辑:董浩杰
校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、陈少华
该文资料搜集自网络