首页/文章/ 详情

综述 | 旋转机械复合故障诊断的现状、挑战与机遇(下)

2月前浏览2336

    本期继续给大家推荐旋转机械复合故障诊断综述文章的下半部分内容,该综述详细介绍了复合故障诊断方法的相关背景,包括相关定义和一种新的分类方法。然后,作者基于过去几十年的相关出版物,对复合故障诊断的最新应用进行了综述。最后,总结了实现复合故障诊断在故障诊断领域中的挑战和机遇,并给出了本综述的结论。

    论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

    论文基本信息

    论文题目:Compound Fault Diagnosis for Rotating Machinery: State-of-the-Art, Challenges, and Opportunities

    论文期刊:Journal of Dynamics, Monitoring and Diagnostics

    论文日期:2023

    论文链接:

    https://doi.org/10.37965/jdmd.2023.152

    作者:Ruyi Huang1,2;Jingyan Xia2,3;Bin Zhang3;Zhuyun Chen2,3;Weihua Li2,3

    机构:

    1. Shien-Ming Wu School of Intelligent Engineering, South China University of Technology;

    2. PazhouLab;

    3. School of Mechanical and Automotive Engineering, South China University of Technology

    通讯作者邮箱:

    Weihua Li (e-mail:whlee@scut.edu.cn)

    目录

    1 摘要
    2 引言
    3 CFD的背景

    3.1 与CFD相关的定义

    3.2 CFD方法的分类

    4 CFD在旋转机械中的应用

    4.1 基于失效机理的CFD方法的应用

    4.2 基于信号处理的CFD方法的应用

    4.3 基于人工智能的CFD方法的应用

    5 未来的挑战与机遇

    5.1 复杂机械系统复合故障失效机理建模
    5.2 信号处理算法的改进
    5.3 智能CFD模型的可解释性
    5.4 更加智能的CFD方法

    6 结论

    7 致谢

    4 CFD在旋转机械中的应用

    4.2 基于信号处理的CFD方法的应用

    1) 基于信号分解的方法

    基于信号分解的方法本质是从复合故障信号中提取并分离出信号。基于信号分解的方法类似于依赖特征工程的模式识别,期望将不同的成分分离开来。研究人员提出了许多成功的CFD方法,例如小波变换(WT) [20-28]、变分模态分解(VMD) [29-34]、局部均值分解(LMD) [35]、奇异谱分解(SSD) [36、37]、辛几何模态分解(SGMD) [38、39]等方法[40-48]。上述方法在旋转机械CFD中得到了广泛的应用。

    小波变换( Wavelet Analysis,WT )可以看作是用一组基函数(小波)对信号的表示或投影,在故障诊断领域带来了包括滤波、降噪和特征提取在内的巨大应用。Peng等人[49]和Yan等人[50]分别在2004年和2014年系统地回顾了WT及其变体算法在健康状态监测和故障诊断中的应用。对于CFD,Jiang等发展了一种经验小波变换与混沌振子相结合的方法(命名为EWTDO ),该方法通过以下步骤实现CFD,首先,通过经验小波变换将复合故障信号分离为不同的经验模型。其次,采用包含所有单一故障频率的振子建立故障隔离器。最后,通过观察故障隔离器输出的映射产生的不规则运动,可以逐一识别出所有的单故障[20]。Ding利用双脉冲性测量指标确定了经验WT的上下段边界,可以进一步解调以检测不同的单一故障[21]。与使用固定基函数的经验WT不同,He等人结合了能够自动选择敏感频带的自适应冗余多小波包和Hilbert变换解调分析来解耦两个齿轮箱的复合故障[24]。Hu等提出了一种改进的可调Q因子小波变换( TQWT )对振动信号进行分解,通过对比实验结果与理论值的故障特征频率即可识别复合故障[27]。尽管WT方法具有许多良好的性质,确保了其在CFD中的有效性,但其对复合故障信号的分解性能取决于所选择的小波基函数。

    VMD也是一种将复合故障信号分解为多个带限本征模态函数的流行算法。例如,Yan等人将VMD与1.5维包络谱相结合来检测旋转机械的复合故障,其中利用VMD将复合故障信号分解为若干个本征模态分量[29]。Wan等人将快速谱峭度与VMD相结合,用于处理含有微弱单分量的复合故障信号[30]。VMD的参数,如惩罚项和子成分个数,对分解结果有重要影响。因此,参数优化的VMD在旋转机械CFD中也得到了研究和应用[32-34]。然而,确定这些参数以确保诊断性能仍然缺乏有效的解决方案。

    LMD、SSD和SGMD是针对非平稳信号的模态分解算法。具体来说,LMD是一种自适应模态分解算法,可以将复合故障信号分解为一组单分量即乘积函数。Jay Lee等人提出了一种基于LMD的复合包络构造方法用于往复压缩机的故障诊断[35]。LMD对调幅和调频信号具有良好的解调性能,但存在端点效应和模态混叠现象等局限性。SSD也是一种自适应算法,可以将非线性、非平稳的时间信号分解在窄带分量中。Wang等人提出了几种基于SSD的齿轮箱复合故障诊断方法,取得了较高的分解精度,并能在一定程度上克服模态混叠[36、37]。SGMD是一种利用辛几何相似变换将单分量与其对应的特征向量进行重构的分解方法。Pan等人提出了一种基于SGMD的CFD方法,对轴承故障和齿轮故障耦合而成的复合故障进行分离和识别[38]。以上讨论表明SSD和SGMD在CFD中得到了成功的应用。然而,由于SSD和SGMD具有很强的降噪能力,可以将微弱的故障信息当作噪声去除,因此很难提取复合故障信号中耦合的微弱单一故障的特征。此外,伪分量在强噪声环境下容易被分解。

    除了上述方法外,还有许多其他方法将信号分解算法与其他技术相结合来制作CFD。例如,Tang等人提出了一种角度域虚拟多通道信号的复合故障检测方法,并将其应用于监测变工况下的滚动轴承[43]。更多的细节可以在[40-48]中找到,这里没有列举。

    2)基于信号反卷积的方法

    基于信号反卷积的方法的本质是将复合信号反卷积为未耦合在一起的单一信号。基于信号反卷积的方法,如最小熵反卷积( MED ) [51-55]、最大相关峭度反卷积( MCKD ) [56-62]和周期平稳过程理论盲反卷积(CYCBD) [63]等,通过构造梳状滤波器来增强微弱周期特征和抑制信号噪声,已被证明是分离含微弱成分复合故障的有效工具。

    MED是为解决信号服从卷积形式时的反卷积问题而发展起来的一种技术。许多实例表明,MED赋予故障诊断方法对复合故障解耦的能力。例如,Fan等人提出了一种基于改进的MED调整和自适应信号稀疏分解的滚动轴承CFD方法,该方法通过轴承复合故障的产生和实验振动信号验证了所提出的复合故障特征提取的有效性[52]。在Feng等人[54]所做的工作中,也可以找到对风力发电机齿轮箱CFD的类似研究。基于MED的CFD方法的优点是它消除了对部件的强假设,只要求输出的简单性。

    与仅增强单脉冲成分的MED相比,基于MCKD的方法在CFD中表现出更强大的性能,因为MCKD可以提取连续的周期脉冲。例如,Lyu等人结合量子遗传算法( quantum genetic algorithm,QGA )提出了一种用于行星齿轮CFD的改进MCKD方法,其中单个故障相关特征由所提方法提取[58]。为了解决周期脉冲可能被强噪声污染的问题,Hong等提出了一种新的噪声抑制方法。通过结合开发了定制的自适应MCKD平衡多小波的CFD方法,其有效性在从航空发动机转子采集的仿真和实验数据上得到了验证[59]。MCKD已经与其他算法,如稀疏表示和卷积神经网络( CNNs )相结合,用于实现滚动轴承的CFD,相应的实验也表明这些方法可以有效地分离故障特征分量,并在CFD上取得良好的性能。虽然基于MCKD的方法在提取连续周期脉冲方面有一些指标,但其特征提取性能很大程度上依赖于它们的参数,例如滤波器长度和反卷积周期。

    CYCBD是一种盲解卷积算法,已被证明是CFD的有效工具,因为它可以从耦合的故障信号中重建周期性脉冲。在[63]中,Sun等人提出了一种改进的自适应CYCBD方法,并将其应用于强噪声背景下的齿轮箱CFD。基于CYCBD的方法为从复合故障信号中提取微弱冲击故障提供了另一种途径。值得注意的是,基于信号反卷积的CFD方法对关键参数的选取缺乏有效的评价标准,提取的特征容易受到信号噪声的影响。

    3 )基于BSP的方法

    基于BSP的方法本质是从混合或复合信号中分离出未知且独立的源信号。盲源分离( BSP ),又称盲信号分离( BSS ),是解决CFD问题而得到广泛发展的一种方法。各种有效的算法被提出,如独立成分分析( ICA ) [64-67]、稀疏成分分析( SCA ) [68、71]、形态成分分析( MCA ) [72]等方法[73、74]。这些算法能够从复杂的监测信号中分离出各单一故障源的识别特征,从而准确评估旋转机械的健康状态。

    ICA是一种常用的从混合信号中分离独立子成分的BSS算法,也适用于处理CFD中遇到的问题。Wang等[64]和Tang等[65]将CFD视为欠定BSS的振源估计问题,分别将ICA与其他模态分解算法相结合,提出了几种滚动轴承CFD方法。实验结果表明,这些方法对复合故障分离是有效的,并且在分离强噪声信号方面比信号分解方法[66、67]具有更好的性能。

    为了克服ICA必须在ICA之前进行信源数估计的局限性,显著增加了算法的复杂度,SCA可以避免这种估计,并通过对比解决欠定问题,在CFD中得到了广泛的应用。例如,Hao等人开发了几种基于SCA及其变体算法的CFD方法[68-70]。这些方法的核心步骤是首先使用信号处理算法提取振动信号的稀疏表示,然后将这些表示放入SCA中得到精确的源信号。结合SCA和其他技术,如sin C函数的形态学滤波和密度峰值聚类,Xie等人开发了一种有效分离轴承复合故障的方法[71]。除了轴承复合故障,Yu等人提出了一种改进的MCA方法,用于齿轮故障和轴承故障同时发生的情况下齿轮箱的CFD [72],其中复合故障信号中耦合了两个不同的分量(一个是齿轮故障引起的啮合分量,另一个是轴承故障引起的周期冲击分量)。此外,零空间追踪[73]和典型相关分析[74]等方法也被学者应用于航空发动机滚动轴承的CFD中。

    虽然BSP技术能够在一定程度上处理机械设备复合故障解耦中遇到的困难,但由于复杂故障监测信号具有非线性、高噪声、强耦合等特点,在提取或分离多个故障源时,仍存在性能不理想、结果可靠性不高等问题。此外,基于BSP的复合故障方法对观测信号的通道数要求较高;即传感器的数量要满足算法的要求,这可能会增加故障诊断的成本。

    4 )基于稀疏表示的方法

    稀疏表示方法的本质是通过使用给定的过完备字典将信号表示为少量原子的线性组合,从而实现对复合故障的分离。基于稀疏表示的方法已被证明是CFD中的一个流行工具,因为它具有许多优点,包括不同成分匹配、信号去噪和信号分离而不需要模式混合。一般来说,稀疏表示理论主要包含两个方面:过完备字典的构造[74-80]和稀疏系数的求解[81-85]。

    过完备字典的构造是发展CFD方法的关键问题之一。构造过完备字典的方法有两种。第一种是预定义的分析或静态字典。例如,Li等人提出了一种基于多重增强稀疏分解算法的齿轮箱CFD方法,其中通过考虑齿轮箱故障机制手动设计了三个子字典[78]。Meng等人提出了一种基于周期加权峭度稀疏去噪和周期滤波的CFD方法,相应的流程图如图5所示[79]。可以发现,构建脉冲字典是为了获得稀疏系数和故障类型。所设计的字典通常具有更明确的物理意义和良好的适应性,但其局限性在于处理未知信号时可能会失效。第二种是学习字典,由于它可以自适应地学习原子库以匹配目标信号,因此在复合故障信号的特征提取中表现出更大的优势;因此,它能更有效地捕捉故障相关特征,在故障诊断领域得到了广泛的应用。Lin等人提出了一种基于改进的双字典K -奇异值分解( K-SVD )的有效CFD方法,并将其应用于含有内外圈缺陷的滚动轴承[86]。尽管这些基于字典的稀疏表示方法已成功应用于旋转机械的复合故障分离,但在实际工业应用中,为CFD构建精确的字典仍然是一个具有挑战性的问题。

    图5 [79]中提出的CFD方法的流程图

    对于基于稀疏表示的方法,稀疏系数的求解是关键,对复合故障信号分解的性能有重要影响。许多近似方法被提出用于处理稀疏系数解,其中凸松弛优化[81-83]和正交匹配追踪(OMP) [84、85]是CFD中最受关注的方法。例如,Huang等人提出了齿轮箱的CFD方法,其中开发了多源保真稀疏表示算法,将信号重构问题转化为多元稀疏凸优化问题[82]。Zhang等人结合OMP算法,提出了一种多重增强稀疏表示方法,用于重构和识别每类故障诱导特征,以制作轴承的CFD [85]。

    尽管基于稀疏表示的方法为CFD带来了一些成功的突破,但距离在更复杂的工业场景中得到广泛应用还有很长的路要走。如何有效利用稀疏理论挖掘复合故障信号的内在特征,实现更复杂复合故障的分离,需要在未来投入更多的精力。

    值得注意的是,还有许多其他基于信号处理算法开发的CFD方法不包含在上述四个子类中,这将在此不予讨论[87-90]。

    通过以上概述和讨论可以发现,基于信号处理的CFD方法通常从采集到的复合故障信号中提取各个独立故障分量的特征;从而达到解耦和诊断复合故障的目的。然而,由于它们严重依赖于先进的信号处理方法和专家的经验知识,且无法揭示复合故障信号的耦合规律,因此对由三种或三种以上故障耦合而成的复杂复合故障的区分和解耦极为困难,限制了它们在复杂机械设备实际维修中的应用。  

    4.3 基于人工智能的CFD方法的应用

    基于人工智能的CFD方法旨在利用机器学习算法建立智能诊断模型,可以使CFD以模式识别的方式,将复合故障视为独立的模式进行分类或通过输出多个相应的单故障标签将其解耦为多个单一故障。基于人工智能的CFD方法的一般流程如图6所示。具体来说,首先收集监测数据/信号,从目标旋转机械来看,这是训练智能CFD模型的基础,因为这些方法通常通过观察给定的数据来识别复合故障。在监测数据采集完成后,选择合适的机器学习算法构建复合故障的IFD模型是关键的一步。一旦训练好IFD模型,就可以用端到端的方式对复合故障进行诊断,并从IFD模型的输出中得到相应的结果。众所周知,采集数据的数量和质量显著影响故障诊断的性能。因此,根据模型训练过程中是否有标注的复合故障数据,基于人工智能的方法可以分为两类:基于监督学习的CFD方法和基于无监督学习的CFD方法。

    图6 基于人工智能的CFD方法的一般流程

    1) 基于监督学习的方法

    基于监督学习的方法的本质是将CFD作为一个模式识别问题进行分类,简单地用另一个独立的标签对复合故障信号进行标注来训练CFD模型。也就是说,基于监督学习的方法与IFD方法一样,在过去十年中得到了广泛的研究。例如,Li等人详细介绍了IFD方法的一般过程,如图7 [3]所示,其中关键步骤是模型的构造。根据用于构建诊断模型的人工智能算法,基于监督学习的方法可以进一步划分:基于浅层学习的方法、基于深度学习的方法和基于多标记学习的方法。  

    图7智能故障诊断的一般流程[3]  


    基于浅层学习的方法通常使用传统的机器学习算法,如k最近邻( k-NN ) [91-94],概率图模型( PGM ) [95、96],支持向量机( SVM ) [97-102]和人工神经网络[103-107],来构建CFD模型。例如,Li和Yan等人利用小波变换( Wavelet Transform,WT )和经验模态分解( Empirical Mode Decomposition,EMD )等信号处理算法从非平稳振动信号中提取故障特征,并将其输入到模糊k - NN中对齿轮箱的多故障进行识别[91]。Li等人基于k - NN的核心思想提出了一种降维算法—最近最远距离保持投影( Nearest and Farthest Distance Preserving Projection,NFDPP ),并通过一个复合故障的汽车轴承数据集验证了该算法的有效性[92]。以非朴素贝叶斯模型( PGM的一个范例)为分类器,Asr等人提出了针对汽车变速箱的CFD方法[96]。作为一种流行的模式识别算法,Chen等人提出了一系列基于SVM的IFD方法,并将其应用于机车滚动轴承复合故障诊断中,实验结果表明这些方法更有效,优于其他对比方法[100、101]。同样,Lei等人提出了许多基于自适应神经模糊推理系统( ANFIS )和小波神经网络的混合IFD方法,提高了故障诊断[103、104]的准确性和可靠性。Wu等人将集成极限学习机( ELM )网络与二元分类器相结合,开发了两级齿轮箱的CFD方法。通过以上讨论可以发现,与基于故障机理的CFD方法和基于信号处理的CFD方法相比,基于浅层学习的CFD方法能够减少对专家经验和知识的依赖,在复合故障分类中表现出优势。然而,这些基于浅层学习算法的方法存在特征学习和提取能力差的局限性。

    与基于浅层学习的方法相比,其主要区别在于基于深度学习的方法旨在通过利用分层架构从原始振动信号中学习判别性和故障相关的表示,以端到端的方式弥合健康状况和监测数据之间的关系。学者们针对智能CFD开发了多种深度学习算法及其变体,如深度信念网络( DBNs ) [108-112]、稀疏自动编码器( SAE ) [113-117]、卷积神经网络( CNNs ) [118-126]、长短期记忆( LSTM )神经网络[127]、胶囊网络(CapsNet) [128]等[129]。例如,Shao等人提出了多种针对滚动轴承复合故障的IFD方法,其中DBNs算法与其他技术(如双树复小波包和压缩感知)相结合,以增强所提出的诊断模型[108、109]的性能;Xiang等提出了一种基于DBNs和将其应用于轴向柱塞泵[110]的多故障检测方法;Wang等人提出了一种模拟电路系统的CFD方法,在该方法中,带有AE的多个ELM被用于从原始信号中自动提取故障相关的表示[117];结合其他算法,如快速谱峭度(Fast Spectral Kurtosis,FSK)、支持向量机(Support Vector Machines,SVMs)和数据融合技术,CNNs也被许多学者开发并应用于旋转机械的CFD [118-126];Ma和Wang利用自适应chirp模型分解、Gini指数融合和LSTM等技术发展了一种CFD方法,获得了在轴承CFD上具有更好性能的故障诊断模型[127];Chen等人提出了一种快速鲁棒的CapsNet来检测通风机和水泵的复合故障[128]。尽管上述方法为旋转机械带来了许多成功的应用,但其明显的局限性在于这些方法只是简单地将复合故障视为与其对应的单一故障无关的独特故障进行故障分类。也就是说,这些方法忽略了复合故障与其对应的单一故障之间的关系。

    为了解决这个问题,引入了基于多标记学习的方法,使CFD具有多标记输出机制。与基于浅层学习和基于深度学习的方法仅用一个标签标注复合故障样本不同,基于多标签学习的方法通常用两个或多个标签标注复合故障样本进行监督学习。因此,通过输出多个标签,诊断模型可以将复合故障解耦为多个单一故障。近年来,基于多标记学习的方法引起了相关学者越来越多的关注,并基于这种思想提出了各种方法[130-135]。例如,Huang等人将深度卷积神经网络与多标签分类器相结合,开发了一个CFD框架,该分类器可以为测试样本输出单个或多个标签[130]。多标签分类器的本质是使用Sigmoid函数代替Softmax函数作为最后一个分类层的激活函数,使得每个分类神经元的输出概率是独立的,并且输出标签的数量可以通过定制的原则来确定。根据这些见解,有许多类似的方法已经被开发和研究用于旋转机械CFD[131-135]。从文献中可以得出结论,基于多标记学习的CFD方法的有效性已经得到了验证。然而,这些方法存在一个明显的局限性:这些模型的训练过程仍然依赖于带标签的复合故障数据,这对于在实际应用中开发有效的解决方案是一个困难的要求。还需要强调的是,如果复合故障数据不可得或无法标注,基于监督学习的CFD方法将失效,失去CFD的能力。

    2) 基于无监督学习的方法
    基于无监督学习的方法的本质是在没有复合故障数据的情况下将复合故障解耦为多个单一故障,这意味着CFD模型具有利用从单一故障数据中学习到的知识来诊断复合故障的能力。如图8所示,基于无监督学习的方法旨在模仿人类的现象,即通过捕获每个个体实体的关键特征,重叠的实体可以很容易地分离成相应的实体[3]。然而,对于基于人工智能的CFD方法来说,实现这样一个“简单”的任务仍然是一项具有挑战性的任务。幸运的是,在模型训练过程中复合故障数据不可用的场景下实现CFD已经进行了一些尝试,这一研究方向已经引起了学术界和工业界学者越来越多的关注[136-145]。  

    图8 图解复合故障解耦背后的动因[3]  

    第一个仅利用单故障数据对复合故障进行解耦的成功尝试是由Huang等人于2018年提出的深度解耦卷积神经网络( Deep Decoupling Convolutional Neural Network,DDCNN ) [136]。在DDCNN中,使用多个胶囊层构建解耦分类器作为传统Softmax分类器的替代者,其中复合故障样本可以解耦成具有多个标签的多个单一故障。在汽车变速器上进行的实验以无监督的方式证明了CFD的有效性。基于同样的目标,Dibaj等人提出了一种基于混合微调VMD和CNN的CFD方法,并将其应用于监测具有复合故障的齿轮箱[138]。在没有复合故障样本作为训练数据的情况下,Xing等人提出了一种基于零样本学习的智能CFD方法,并将其应用于旋转机械未知复合故障的检测[139]。从以上讨论可以得出结论,这些方法由于消除了对复合故障数据完备性的依赖,在CFD中取得了很大的进步。然而,上述方法的诊断性能仍受旋转机械工况变化的影响,阻碍了其在实际工业中的广泛应用。

    受迁移学习的核心思想启发,即通过学习来自不同但相关领域的通用知识来增强AI模型的泛化性能,Huang等人进一步提出了几种基于DTL算法的无监督智能CFD方法,如可迁移胶囊网络( Transferable CapsNet,TCN )和深度对抗胶囊网络( Deep Adversarial Capsule Network,DACN ),其中CFD模型的泛化性能在变化或未知工况[140、141]下得到了显著提升。具体来说,TCN的核心思想是将迁移学习技术嵌入到CFD模型(如DDCNN)中,该模型在变工况下具有比DDCNN更好的泛化性能[140]。引入对抗学习技术训练CFD模型,DACN进一步赋予CFD模型跨越未知工况智能解耦复合故障的能力[141]。基于DTL算法的CFD的更多细节可以在[3]中找到。除了基于DTL的算法,其他算法的变体,如零样本学习[142]和Caps Net [143],也被开发用于包括轴承和RV减速器在内的旋转机械CFD。

    通过以上讨论,近年来,工程师和学者们基于人工智能算法对旋转机械CFD进行了各种成功的尝试和应用。在他们的努力下,CFD模型的泛化性能得到了显著增强,并且通过引入无监督学习算法消除了对复合故障数据完整性的依赖。然而,从历史文献中不难发现,很少有工作关注3.1节中介绍的第三种复合故障,即发生在具有三个或三个以上单一故障的复杂机械系统中的复合故障。这些方面需要学者们在今后的研究中付出更多的努力。  

    5 未来的挑战与机遇


    尽管在过去的几十年里,来自学术界和工业界的学者和工程师为旋转机械的CFD带来了巨大的成功尝试,但在故障诊断领域,特别是在实际工业应用中,如何做出准确可靠的CFD仍然是一项重要而具有挑战性的任务[144]。这主要是由于历史的CFD方法远远落后于现代制造业对复杂机械智能维护的需求,而现代制造业更加强调诊断模型的可靠性和可解释性。因此,在概述了旋转机械CFD应用现状的基础上,对CFD中需要解决的挑战和有前途的机遇进行了讨论。

    5.1 复杂机械系统复合故障失效机理建模

    理解复合故障发生的物理失效机理是开发有效、准确的旋转机械故障诊断解决方案的基石。不可否认,4.1节中概述的基于失效机理的CFD方法旨在实现这一基本目标,并提供了许多揭示复合故障发生和演化根本原因的基本规律。然而,由于机械设备在结构、材料、功能、环境等方面的复杂性,对于复杂的机械系统,很难建立精确可靠的故障模型,更不用说复合故障了。因此,基于故障机理的CFD方法较少关注复杂机械系统的复合故障研究。因此,对于复杂机械系统复合故障的失效机理建模,应投入更多的精力。幸运的是,近年来,旨在构建与真实世界相同的物理系统、过程或环境的数字孪生技术引起了相关领域研究人员的日益关注[145]。我们相信,在不久的将来,它将是解决上述问题的一个很有前途的工具。

    5.2 信号处理算法的改进

    基于信号处理的CFD方法已经在许多实际工业应用中被证明可以有效地从复合故障信号中分离和提取每个独立故障分量的判别特征。然而,需要强调的是,没有一种通用的信号处理算法可以适用于CFD的所有场景,因为上述所有的信号处理方法都有各自的优缺点。此外,基于信号处理的CFD方法的诊断结果通常需要专家或工程师基于案例相关知识进行事后决策。因此,研究更强大的信号处理算法,提高其在实现CFD所需的各个方面的能力,如信号去噪性能、微弱故障的检测精度以及对更复杂的复合故障信号的解耦能力,是非常重要和必要的。随着传感技术的进步,在测量和失效机理技术中,基于信号处理的方法仍将是未来几十年的研究热点之一。  

    5.3 智能CFD模型的可解释性

    学者们基于人工智能算法为CFD的各个方面带来了巨大的、惊人的突破,这是公认的事实。然而,基于人工智能的CFD方法的瓶颈在于,这些算法被认为是一种不可解释的技术,缺乏说服机器操作者的理论依据,并且在长期的制造生产中无法重复和一致地工作。仍然很难理解或解释这些智能模型是如何以及为何做出最终决策的[146]。重要的是,在基于无监督学习的CFD方法中,很少有研究关注如何通过仅使用单一故障数据来训练CFD模型,将复合故障解耦为多个单一故障的可解释性。因此,缺乏清晰的可解释性成为开发面向实际应用的CFD解决方案的最大障碍。幸运的是,来自计算机科学领域和故障诊断领域的研究人员都投入了更多的精力来应对这些挑战。如何设计具有可解释性的CFD方法,增加其决策过程的透明性,也是故障诊断领域未来的发展趋势之一。

    5.4 更加智能的CFD方法

    尽管目前的IFD模型可以执行许多具有挑战性的任务,例如复合故障解耦和新兴故障检测,并且在某些方面的性能超过了人类水平[147、148],但仍然有许多能力是IFD模型无法执行的。大多数现有的人工智能算法很难完成一些人类容易完成的任务,例如从小的实例集 合中学习,对某事进行推断或猜测,以及实现多任务。与算法智能相比,人类智能在遇到高不确定性和低可预测性的情况时更加可靠。沿着这样的思路,我们相信,开发适应性更强、智能化程度更高的CFD方法将是未来不可阻挡的趋势,这将赋予智能模型模仿人类行为的能力。  

    6 结论

    在这篇综述文章中,对旋转机械的CFD进行了全面的调查,为潜在的读者和经验丰富的研究人员提供了一个系统的指南。在这项调查的开始,首先强调了对旋转机械实施CFD的重要性。介绍了CFD产生的背景,包括CFD的相关定义和分类,以便于下文讨论CFD的最新应用。从复合故障如何分离或解耦的角度,对3组CFD应用及其相应的子类进行了充分的探索和讨论,并总结了各自的优缺点。最后,概述了实施CFD的挑战和机遇,特别是针对复杂机械系统复合故障的失效机理建模、信号处理算法的能力提升、智能CFD模型的可解释性以及更智能的CFD方法,为故障诊断领域的研究人员开辟了一些未来的研究方向。  

    7 致谢

    本论文的研究工作得到了国家自然科学基金(52205100、52275111和52205101)、广东省自然科学基金(2023A1515012856)和中国博士后科学基金(2022M711197)的资助。

    欢迎大家留言交流~

    同时也欢迎大家投稿:woxuegongzhao@163.com


     

    编辑:赵学功

    校核:李正平、陈凯歌、赵栓栓、曹希铭、白亮、陈少华

    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

    点击左下角阅读原文,即可在线阅读论文。


    来源:故障诊断与python学习
    Mechanical振动非线性旋转机械电路通用航空汽车pythonUM声学参数优化理论电机材料数字孪生FAST
    著作权归作者所有,欢迎分享,未经许可,不得转载
    首次发布时间:2024-09-15
    最近编辑:2月前
    故障诊断与python学习
    硕士 签名征集中
    获赞 70粉丝 66文章 143课程 0
    点赞
    收藏
    作者推荐

    综述 | 智能故障预测和健康管理的小样本数据挑战(中)

    本期受文章作者投稿给大家分享一篇SCI二区的小样本数据综述文章。如果有故障诊断相关方向研究人员希望宣传自己研究成果,欢迎大家在公众 号后台与小编联系投稿,大家一起交流学习。本期给大家推荐一篇的关于小样本数据的综述文章,该综述阐明了小样本数据的定义、成因和对PHM任务的影响,分析了当前解决小样本数据问题的主流方法及其优缺点,指出一些有前景的方向以启发未来研究。本综述分3次推送,第1部分为综述 | 智能故障预测和健康管理的小样本数据挑战(上),本节推文是这篇文章的第2部分,希望对大家的学习有所帮助,也同时希望大家可以多多引用。论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Small data challenges for intelligent prognostics and health management: a review论文期刊:Artificial Intelligence Review(SCI二区Top)论文日期:2024.07论文链接: https://doi.org/10.1007/s10462-024-10820-4 作者:Chuanjiang Li(1), Shaobo Li(1), Yixiong Feng(1), Konstantinos Gryllias(2), Fengshou Gu(3), Michael Pecht(4)机构:1 State Key Laboratory of Public Big Data, Guizhou University, Guiyang 550025, Guizhou, China 2 Department of Mechanical Engineering, Flanders Make, KU Leuven, 3000 Louvain, Belgium 3 School of Computing and Engineering, University of Huddersfield, Huddersfield HD1 3DH, UK 4 Advanced Life Cycle Engineering, University of Maryland, College Park, MD 20742, USA通讯作者邮箱:licj@gzu.edu.cn作者简介:李传江,工学博士,贵州大学公共大数据国家重点实验室专任教师、特聘教授C岗、硕士生导师。2021-2024年在比利时鲁汶大学(KU Leuven)联合培养,合作导师为Konstantinos Grylias教授。主要开展无人机大数据融合分析、通用人工智能算法、数字孪生与智能运维等研究,主持国家重点研发计划子课题1项,留学基金委联合培养博士项目1项、贵州大学特岗基金1项,主研国家重点研发计划、国家自然科学基金、集成公关大平台等项目6项,参编专著2部已发表SCI/EI检索论文20余篇,入选ESI全球Top1%高被引论文2篇。参加国际国内学术会议10余次并作学术报告,担任《Smart Construction》、《中国测试》、《无人系统技术》等国际国内著名学术期刊的青年编委,担任Transactions on Pattern Analysis and Machine Intelligence、 Knowledge Based Systems, ArtificialIntelligence Review等多个国际SC|期刊审稿人,指导学生参加互联网+、挑战杯等多项国际国内竞赛并获奖。个人主页:http://pbd.gzu.edu.cn/2024/0105/c17349a211760/page.htm目录1 摘要2 引言3 小样本数据在PHM中挑战分析 3.1 什么是小样本数据 3.2 PHM中小样本问题的原因 3.3 PHM任务中小样本数据的影响4 PHM中应对小样本数据挑战的方法综述 4.1 数据增强方法 4.2 迁移学习方法 4.3 小样本学习方法5 PHM应用中问题讨论 5.1 AD任务的小样本数据问题 5.2 FD任务的小样本数据问题 5.3 RUL任务的小样本数据问题6 数据集和实验设置 6.1 数据集 6.2 实验设置7 未来研究方向 7.1 数据治理 7.2 多模态学习 7.3 基于物理信息数据驱动的方法 7.4 弱监督学习 7.5 联邦学习 7.6 大模型8 总结4 PHM中应对小样本数据挑战的方法概述本节概述了在处理PHM典型任务(如AD、FD和RUL预测)中的小样本数据挑战方面的最新进展。如图5右侧所示,从当前文献中提炼了三种主要策略:数据增强(DA)、迁移学习(TL)和小样本学习(FSL)。接下来将深入探讨每一类相关理论和提出的方法,并进行简要总结。4.1 数据增强方法数据增强方法为处理小样本数据问题提供了数据层面的解决方案,其有效性已在许多研究中得到验证。基本原理是通过创建现有数据的副本或新的合成样本来提高训练数据集的数量或质量(Gay等人,2023)。根据辅助数据的生成方式,分析了基于变换、基于采样和基于深度生成模型的数据增强方法。4.1.1 基于变换的数据增强 ‍‍‍‍基于变换的方法是数据增强中最早的一类,通过对现有样本进行几何变换而不改变标签来增加小样本数据集的大小。这些变换非常多样化和灵活,包括随机裁剪、垂直和水平翻转以及噪声注入。然而,大多数方法最初是为二维图像增强而设计的,难以直接应用于设备的一维信号(Iglesias等人,2023)。考虑到监测数据的时序特性,学者们已经设计出适用于增加一维数据的变换方法(Meng等人,2019;Li等人,2020a;Zhao等人,2020a;Fu等人,2020;Sadoughi等人,2019;Gay等人,2022)。例如,Meng等人(2019)提出了一种用于旋转机械故障诊断的数据增强方法,该方法将原始样本均等分割,然后随机重组片段以形成新的故障样本。在Li等人(2020a)和Zhao等人(2020a)的研究中,同时应用了多种变换技术,如高斯噪声、随机缩放、时间拉伸和信号平移,如图6所示。值得注意的是,所有上述技术都是对整个信号施加的全局变换,可能会忽视局部故障特性。因此,一些研究结合了局部和全局变换(Zhang等人,2020a;Yu等人,2020,2021a),以改变原始信号的局部和整体部分,从而获得更真实的样本。例如,Yu等人(2020)同时使用了局部和全局信号放大、噪声添加和数据交换的策略,以提高故障样本的多样性。图6 Li等人提出的变换方法示意图(2020a),高斯噪声被随机添加到原始样本中,通过将原始信号乘以随机因子来实现随机缩放,通过沿时间轴水平拉伸信号来实现时间拉伸,通过向前或向后移动信号来完成信号转换。4.1.2 基于采样的数据增强基于采样的数据增强方法通常用于解决小样本下数据不平衡问题。其中,欠采样技术通过减少多数类的样本大小来解决数据不平衡问题,而过采样方法则通过扩展少数类的样本来实现数据增强。过采样可以进一步分为随机过采样和合成少数类过采样技术(SMOTE)(Chawla等人,2002),取决于是否创建了新的类别。如图7所示,随机过采样将少数类的数据复 制次以增加数据量,而SMOTE通过计算少数类样本的个最近邻来创建合成样本,同时增强样本的数量和多样性。图7 随机过采样与SMOTE的比较为了解决监测数据中健康样本丰富而故障样本较少导致的数据不平衡问题,一些研究(Yang等人,2020a;Hu等人,2020)引入了增强的随机过采样方法。例如,Yang等人(2020a)针对故障诊断任务中的不平衡和不完整数据,通过引入一种变尺度采样策略增强了随机过采样效果;而Hu等人(2020)使用重采样方法来模拟不同工况下的数据,以降低领域偏差。相比之下,由于SMOTE技术具有固有优势,在PHM任务中得到了广泛应用(Hao和Liu,2020;Mahmoodian等人,2021)。Hao和Liu(2020)将SMOTE与欧几里得距离相结合,实现了对少数类样本更好的过采样。为了解决合成样本选择适当最近邻的困难,Zhu等人(2022)计算了最近邻的欧几里得距离和马氏距离,而Wang等人(2023)则利用邻域分布的特征来平衡样本。此外,Liu和Zhu,Fan,Dou等人的研究通过采用加权分布来进一步提高了SMOTE的适应性,使分类边界的重要性更多地转向具有挑战性的少数类,从而有效解决了数据不平衡问题。4.1.3 基于深度生成模型的数据增强此外,自2017年以来,深度生成模型已成为解决小样本数据问题的极具前景的手段,其中自编码器(AE)和生成对抗网络(GAN)是两个典型代表(Moreno-Barea等人,2020)。AE是一种特殊类型的神经网络,其特点是以无监督的方式将输入编码到输出(Hinton和Zemel,1994),优化目标是学习输入数据的有效表示。AE的基本架构如图8a所示,包括两个对称部分,前半部分称为编码器,将输入数据转换为潜在空间,而后半部分(解码器)则将这种潜在表示解码以重建数据。同样,GAN也由两个基本组件组成,如图8b所示。第一个是生成器,负责根据输入的随机噪声获取假样本,第二个是判别器,用于识别生成样本的真实性。这两个组件参与对抗性训练过程,逐步趋向于纳什均衡状态。图8 AE和GAN的基本结构GAN在生成多样样本方面的独特优势,使其相较于传统的过采样数据增强方法更具优势,特别是在处理PHM任务中的数据不平衡问题时(Behera等人,2023)。目前已涌现出多种变体模型,包括变分自编码器(VAE)(Qi等人,2023)、深度卷积生成对抗网络(DCGAN)(Zheng等人,2019)、Wasserstein GAN(Yu等人,2019)等,根据其输入类型分为两类。第一类方法通常从一维输入(如原始信号)(Zheng等人,2019;Yu等人,2019;Dixit和Verma,2020;Ma等人,2021;Zhao等人,2021a,2020b;Liu等人,2022;Guo等人,2020;Wan等人,2021;Huang等人,2020,2022;Zhang等人,2020b;Behera和Misra,2021;Wenbai等人,2021;Jiang等人,2023)和频率特征(Ding等人,2019;Miao等人,2021;Mao等人,2019)生成数据,能够捕获信号中的固有时间信息,而无需复杂的预处理。例如,Dixit和Verma(2020)提出了一种改进的条件VAE,利用原始振动信号生成合成样本,即使在数据有限的情况下也能获得显著的故障诊断性能。在Mao等人(2019)的工作中,应用了快速傅里叶变换(FFT)将原始信号转换为频域输入给GAN,从而获得了更高质量的生成样本。另一方面,一些研究(Du等人,2019;Yan等人,2022;Liang等人,2020;Zhao和Yuan,2021;Zhao等人,2022;Sun等人,2021;Zhang等人,2022b;Bai等人,2023)结合了AEs和GAN在图像领域的优势,旨在利用二维时频表示生成相应的图像。例如,Bai等人(2023)采用跨时间返回图将时间序列数据转换为二维图像,作为Wasserstein GAN的输入,该方法减少了数据不平衡并提高了轴承故障的诊断准确性。4.1.4 小结表4总结了基于数据增强方法的各种解决方案,用于解决PHM中的小样本数据问题,包括每种技术所解决的具体问题以及每种方法的优缺点。显然,数据增强方法侧重于在数据层面缓解小样本数据挑战,包括标签训练数据不足、类别不平衡、数据不完整以及样本受到噪声污染等问题。其中,基于变换的方法主要通过在信号上施加变换来增加训练数据集的大小,但其有效性取决于原始信号的质量;而基于采样的方法在处理PHM任务中的不平衡问题上表现出色,SMOTE方法不仅擅长增加少数类样本的数量,还能使其组成更加多样化,但完善最近邻选择和加强对高度类别不平衡的适应性仍是开放的研究领域;虽然基于深度生成模型的数据增强方法灵活且有前景,能够生成不同工况下设备的样本,但还需要更深入的研究以结合PHM具体任务特性、评估生成数据的质量以及高效地训练生成模型。4.2 迁移学习方法传统深度学习模型假设训练数据和测试数据来自相同的域,然而,工况变化不可避免地导致数据分布差异。迁移学习(TL)是一种新兴技术,通过从相关域转移和重用数据或知识,降低对数据分布一致性的要求,从而解决目标域中小样本数据问题。迁移学习根据域和任务来定义,每个域 由一个特征空间和一个对应的边缘分布组成,而与每个域相关联的任务 包含一个标签空间和一个学习函数(Yao等人,2023)。在PHM背景下,迁移学习可以简洁地定义为:给定一个源域 和及任务 ,以及一个目标域 及任务 ,目标是在 或 的设置下,利用从 和 中学习到的某些设备的知识来增强 中 的学习过程,并且源域的数据量远大于目标域。在现有文献中,迁移学习方法有多种分类标准。从实施阶段“迁移什么”划分,迁移学习可以分为三类:基于实例的迁移学习、基于特征的迁移学习和基于参数的迁移学习。其中,前两种属于数据层面,而后者则属于模型层面方法。这些分类在图9中得到了直观的展示。图9 迁移学习方法分类4.2.1 基于实例的迁移学习应用迁移学习的前提是源域包含足够的标签数据,而目标域要么缺乏足够的标签数据,要么主要由未标注数据组成。虽然最直接的方法是利用源域的样本为目标域训练模型,但由于两域之间固有的分布差异,该方法被证明是不切实际的。因此,在源域中找到并应用与目标域具有相似数据分布的标记实例是关键。为此,提出了各种方法来最小化分布差异,其中加权策略是最广泛使用的。动态权重调整(DWA)是一种有效策略,其新颖之处在于根据源域和目标域样本对目标模型学习的贡献来重新加权。以著名的TrAdaBoost算法(Dai等人,2007)为例,该算法增加了与目标域相似的样本的权重,并降低了不相关源域实例的权重。TrAdaBoost在风力涡轮机(Chen等人,2021)、轴承(Miao等人,2020)和感应电机(Xiao等人,2019)的故障诊断中的有效性已得到验证。进一步地,学者们还将多目标优化(Lee等人,2021)和深度学习理论(Jamil等人,2022;Zhang等人,2020c)引入TrAdaBoost,以提高模型训练效率。然而,DWA需要目标样本的标签,否则,需要基于核映射技术的权重调整方法来估计关键权重参数,例如在再生核希尔伯特空间(RKHS)中匹配源域和目标域样本的均值(Tang等人,2023a)。Chen等人(2020)设计了一种基于核主成分分析的白余弦相似度准则,以确定源域和目标域中数据的权重参数,从而在有限数据和不同工作条件下提高了齿轮的诊断性能。更多研究可参见Liu和Ren(2020)、Xing等人(2021)、Ruan等人(2022)的研究。4.2.2 基于特征的迁移学习与在原始样本空间中寻找不同域之间相似性的基于实例迁移学习不同,基于特征的方法在源域和目标域之间的共享特征空间内进行知识迁移。如图10所示,基于特征的迁移学习在域适应和域泛化场景中得到了广泛应用,前者关注如何将知识从源域迁移到目标域,而域泛化旨在开发一个跨多源域的鲁棒模型,以能够泛化到任何新领域。基于特征迁移学习的关键在于通过操作(如基于差异的方法和特征约简方法)来减少不同域之间的边缘分布和条件分布差异,使模型能够在目标任务上实现优异的适应性和泛化能力(Qin等人,2023)。图10 基于特征的迁移学习应用场景基于差异方法的主要挑战在于如何准确地量化不同域之间的分布相似性,这依赖于特定的距离度量标准。表5列出了常用的度量标准(Borgwardt等人,2006;Kullback和Leibler,1951;Gretton等人,2012;Sun和Saenko,2016;Arjovsky等人,2017)以及应用于PHM任务(故障预测与健康管理)的算法(Yang等人,2018,2019a;Cheng等人,2020;Zhao等人,2020c;Xia等人,2021;Zhu等人,2023a;Li等人,2020b,c,2021a;He等人,2021)。其中,最大均值差异(MMD)计算再生核希尔伯特空间(RKHS)中实例均值之间的距离,而Wasserstein距离则通过考虑几何属性来评估概率分布的相似性,这两者都得到了广泛应用。例如,Yang等人(2018)设计了一个具有多核MMD的卷积适应网络,以最小化从实验室和真实机器故障数据中提取的特征分布之间的差异。Cheng等人(2020)引入的Wasserstein距离极大地增强了所提出模型的域适应能力。此外,Fan等人(2023a)提出了一种基于域的差异度量方法,用于在未见条件下的领域泛化故障诊断,这有助于模型平衡多个源域之间的域内和域间距离。另一方面,特征约简方法旨在自动捕获不同域之间的一般表示,主要使用无监督方法,如聚类(Michau和Fink,2021;He等人,2020a;Mao等人,2021)和自编码器(AE)模型(Tian等人,2020;Lu和Yin,2021;Hu等人,2021a;Mao等人,2020)。例如,Mao等人(2021)将时间序列聚类整合到迁移学习中,并利用从每个聚类获得的元退化信息进行轴承剩余使用寿命预测的时域适应。为了提高模型在不平衡和可迁移故障诊断中的性能,Lu和Yin(2021)设计了一种弱监督卷积自编码器(CAE)模型,以从多域数据中学习表示。Liao等人(2020)提出了一种深度半监督领域泛化网络,在未见速度工况下进行旋转机械故障诊断时表现出了优异的泛化性能。表5 PHM任务中度量方法4.2.3 基于参数的迁移学习第三类方法是基于参数的迁移学习,假设源域任务和目标任务在模型层面上共享一定知识,这些知识被编码在源域上预训练的模型架构和参数中。这一方法的动机在于,从头训练一个模型需要大量数据和时间,而直接在目标域中迁移预训练的参数并进行微调则更为高效。因此,根据迁移参数在目标模型训练中的利用方式,主要有两种实现方式:全局微调(或冻结)和部分微调(或冻结),如图11所示。图11 基于参数的迁移学习. a 全局微调(或冻结),b部分微调(或冻结)全局微调(或冻结)意味着从源域迁移过来的所有参数使用目标域中有限的标记数据进行微调,或者在目标模型训练过程中这些参数会被冻结而不进行更新。相反,部分微调(或冻结)是选择性地对特定的高层或参数进行微调,同时保持低层参数与预训练模型一致。在这两种情况下,目标模型的分类器或预测器都需要使用随机初始化的参数进行重新训练,以与目标任务中的类别数量或数据分布相匹配。全局微调(或冻结)方法适用于源域和目标域样本具有高度相似性的情况,这样可以使用预训练参数从目标域中提取通用特征(Cho等人,2020;He等人,2019,2020b;Zhiyi等人,2020;Wu和Zhao,2020;Peng等人,2021;Zhang等人,2018;Che等人,2020;Cao等人,2018;Wen等人,2020,2019)。从预训练模型的大小和微调时间来看,全局微调和全局冻结策略分别适用于小型和大型模型。例如,He等人(Zhiyi等人,2020)提出,通过用少量目标训练样本对预训练参数进行全局微调,实现不同机器上轴承之间的知识迁移。在Wen等人(2020,2019)的研究中,研究人员应用了深度卷积神经网络(CNN)——ResNet-50(一个50层的CNN)和VGG-19(一个19层的CNN),这两个网络在ImageNet上进行了预训练并用作特征提取器,然后使用全局冻结方法训练目标故障诊断(FD)模型。相比之下,部分微调(或冻结)策略更适合处理域差异显著的情况(Wu等人,2020;Zhang等人,2020d;Yang等人,2021;Brusa等人,2021;Li等人,2021b),如复杂工况间的迁移(Wu等人,2020)和多模态数据间的迁移(Brusa等人,2021)。此外,Kim和Youn(2019)介绍了一种称为选择性参数冻结(SPF)的创新方法,其中只有每层的部分参数被冻结,从源域模型中显式选择对输出敏感的参数,从而在数据有限的情况下降低目标模型过拟合的风险。4.2.4 小结迁移学习框架打破了传统深度学习对训练和测试数据同分布的假设,通过从大量易于收集的数据中获取和迁移知识来弥补目标域中数据标记不足的问题。如表6所示,基于实例的迁移学习可以视为一种借用式增强,其中利用具有相似分布的其他数据集来丰富目标域中的样本。其中,数据加权策略在解决目标数据标记不足和数据不平衡问题上表现优越,但其高计算成本和对相似分布的高依赖性需要进一步优化。相比之下,基于特征的迁移学习通过学习通用故障表征来进行知识迁移,并有能力处理具有大分布差异的领域适应和领域泛化任务,如不同工况间的迁移(He等人,2020a)、不同部件间的迁移(Yang等人,2019a),甚至从模拟到物理过程的迁移(Li等人,2020b)。而且,基于弱监督的特征降维技术能够自适应地发现更好的特征表示,并在开放域泛化问题中展现出巨大潜力。最后,基于参数的迁移学习避免了目标模型从头开始训练,但这些参数的有效性取决于源域样本的数量和质量,可以考虑在多源域数据上进行模型预训练(Li等人,2023b;Tang等人,2021)。4.3 小样本学习方法数据增强和迁移学习方法都要求训练数据集包含一定数量的(从几十个到几百个不等)标记样本。然而,在某些工业场景下,特定类别(如早期故障或复合故障)的样本可能极其罕见且难以获取,每类只有少数几个样本(例如5-10个)用于深度学习模型训练,导致模型在这种“小样本”问题上的性能较差(Song等人,2022)。受人类从以前任务中学习和重用先验知识能力的启发,Jürgen Schmidhuber将这种能力命名为元学习(Schmidhuber 1987),提出了小样本学习(FSL)方法,旨在学习一个模型可以在仅有少量示例的情况下进行训练和快速适应任务。如图12所示,传统深度学习模型、迁移学习和小样本学习方法之间存在一些差异:1)传统深度学习和迁移学习是在单一任务数据点上进行训练和测试,而小样本学习方法则在任务层面进行学习;2)传统深度学习模型需要大量标记的训练和测试样本,迁移学习需要源域中大量的标记训练数据,而小样本学习方法则使用有限的数据进行元训练和元测试。小样本学习任务遵循“N-way K-shot Q-query”协议(Thrun和Pratt 2012),随机选择N个类别,并从每个类别的每个任务中随机抽取K个支持样本和Q个查询样本。小样本学习的目标是在元训练期间将先前从多个任务中获得的知识与少量支持样本相结合,以预测元测试期间查询样本的类别。根据先验知识的学习方式,本文主要讨论基于度量、优化和属性的小样本学习方法。图12 传统深度学习模型、迁移学习和小样本学习的对比4.3.1 基于度量的小样本学习方法基于度量的小样本学习通过测量样本相似性来学习先验知识,包含两个组成部分:特征嵌入模块负责将样本映射为特征向量;度量模块,用于计算相似性(Li等人,2021)。孪生神经网络是这一领域的先驱之一,最初由Koch等人在2015年提出,用于单样本图像识别(Koch等人,2015),使用两个并行的卷积神经网络(CNN)和L1距离来确定成对的输入是否相同。随后,Vinyals等人(2016)引入了带有注意力机制的长短期记忆(LSTM)网络,以有效评估多类相似性;Snell等人(2017)开发了原型网络来计算原型表示之间的距离;而关系网络(Sung等人,2018)则使用了自适应神经网络而不是传统函数。表7列出了这些代表性方法在嵌入模块和度量函数方面的差异。表7 基于度量的FSL经典方法之间的差异根据目前研究,基于度量的小样本学习方法在PHM任务执行中主要有两种形式。第一种是利用固定度量(如余弦距离)来测量相似性,第二种是利用可学习的度量,如关系网络中的神经网络。例如,Zhang等人(2019)首次将基于宽核深度卷积神经网络的孪生网络引入滚动轴承的故障诊断中,该网络在不同工况下利用有限数据实现了优异的诊断性能。随后,基于孪生网络(Li等人,2022c;Zhao等人,2023;Wang和Xu,2021)、匹配网络(Xu等人,2020;Wu等人,2023;Zhang等人,2020e)和原型网络(Lao等人,2023;Jiang等人,2022;Long等人,2023;Zhang等人,2022c)的各种小样本学习算法被开发出来。Zhang等人(2020e)设计了一种结合选择性信号重用策略的迭代匹配网络,用于风力发电机的小样本故障诊断。Jiang等人(2022)开发了一种双分支原型网络(TBPN)模型,集成了时域和频域信号以提高故障分类的准确性。当测量来自不同领域的样本时,关系网络显示出比基于固定度量的FSL方法更优的性能,因此被广泛用于跨域小样本任务(Lu等人,2021;Wang等人,2020b;Luo等人,2022;Yang等人,2023a;Tang等人,2023b)。例如,Lu等人(2021)将旋转机械在有限数据下的故障诊断视为一个相似性度量问题,并将关系网络引入迁移学习框架作为解决方案。Luo等人(2022)提出了一种三重关系网络方法,用于执行跨部件的小样本故障诊断任务。Tang等人(2023b)设计了一种新颖的轻量化关系网络,用于高效执行跨域的小样本故障诊断任务。此外,为了解决由不同工况引起的领域偏移问题,Feng等人(2021)将基于相似性的元学习网络与领域对抗相结合,用于跨域的故障识别。4.3.2 基于优化的小样本学习基于优化的FSL方法遵循“学会优化”的原则,以解决小样本带来的过拟合问题。具体来说,这些方法学习跨多个任务的全局初始化参数,使模型在元测试阶段能够迅速适应新的小样本任务(Parnami和Lee,2022)。以最知名的模型无关元学习(MAML)(Finn等人,2017)算法为例,基于优化的FSL通常遵循双循环学习过程,首先在内部循环中针对给定任务学习一个特定于任务的模型(基础学习器),然后在外部循环中跨任务分布学习一个元学习器,其中元知识嵌入在模型参数中,用作元测试任务中模型的初始化参数。MAML与多种使用梯度下降训练的模型兼容,使模型能够很好地泛化到新的小样本任务上,而不会过拟合。最近的研究文献证明了MAML在PHM中的潜力,主要集中在元分类和元回归方法。对于元分类方法,目标是基于多个元训练任务学习一个优化的分类模型,该模型能够在元测试阶段以少量样本作为支持,准确地对新类别进行分类,通常用于异常检测(Chen等人,2022)和故障诊断任务(Li等人,2021c,2023c;Hu等人,2021b;Lin等人,2023;Yu等人,2021b;Chen等人,2023b;Zhang等人,2021;Ren等人,2024)。例如,Li等人(2021c)提出了一种基于MAML的元学习故障诊断技术,该技术利用已知工作条件的先验知识,对新工况下的轴承进行故障诊断。为了进一步提高元学习能力,设计了诸如任务序列MAML(Hu等人,2021b)和元迁移MAML(Li等人,2023c)等先进模型,用于少量样本的故障诊断任务,并提出了一种基于元学习的领域泛化框架,以解决资源不足和领域偏移问题(Ren等人,2024)。另一方面,元回归方法针对PHM中的预测任务,旨在从类似回归任务中获得元优化模型,使用有限的输入样本来预测连续变量(Li等人,2019,2022d;Ding等人,2021,2022a;Mo等人,2022;Ding和Jia,2021)。在2019年,Li等人首次探索了MAML在小型数据集剩余使用寿命(RUL)预测中的应用,设计了一个基于全连接神经网络(FCNN)的元回归模型,用于预测在不同切削条件下工具的磨损情况。此外,MAML还已被整合到强化学习中,用于退化条件下的故障控制,更多见解可参见Dai等人(2022)和Yu等人(2023)的研究。4.3.3 基于属性的小样本学习方法还有一种独特的小样本学习范式,被称为“零样本学习”(Yang等人,2022),模型需要预测在元训练过程中未见过的类别。在这种设置中,由于缺少训练数据,需要辅助信息来弥补未见类别之间的信息差距,补充信息必须是有效、独特且具有代表性的,以便有效地区分不同类别,例如计算机视觉中图像的属性信息。如图13所示,未见动物的类别是通过迁移类间属性来推断的,如动物的形状、声音或栖息地的语义描述,这些属性的有效性已在许多零样本任务中得到了验证(Zhou等人,2023b)。图13 基于属性的零样本图像识别基于属性的小样本学习方法为PHM任务中的零样本问题提供了潜在解决方案。然而,由于视觉属性与传感器信号的物理意义不匹配,因此无法直接使用。为此,学者们一直在研究有效的故障属性。鉴于可以从维护记录中轻松获得与故障相关的语义描述,并且可以在实践中为特定故障进行定义,因此语义属性在当前研究中得到了广泛应用(Zhuo和Ge,2021;Feng和Zhao,2020;Xu等人,2022;Chen等人,2023c;Xing等人,2022)。例如,Feng和Zhao(2020)率先实现了基于故障描述属性转移的零样本故障诊断,这些属性包括故障位置、故障原因和后果,为目标故障提供了辅助知识。Xu等人(2022)设计了复合故障诊断的零样本学习框架,该框架的语义描述符可以为单一和复合故障定义不同的故障语义。Fan等人(2023b)提出了一种针对具有新故障模式的零样本故障诊断的属性融合迁移方法。尽管在描述驱动的语义属性方面取得了长足进步,但仍存在一些局限性,包括依赖专家见解和信息来源不准确。最近,在没有语义信息的情况下(称为非语义属性),Lu等人(2022)和Lv等人(2020)也进行了探索。Lu等人(2022)开发了零样本智能故障诊断系统,采用了从信号的时域和频域中提取的统计属性。4.3.4 小结小样本学习方法在解决样本数量极其有限的PHM任务方面具有优势,例如每个任务中每类仅有出五个、一个甚至零个样本。如表8所示,基于度量的FSL方法在原理和计算上都很简洁,将重点从样本数量转移到内在相似性上,但在特征嵌入训练过程中对标记数据的依赖限制了在监督环境中的适用性;基于优化的FSL,特别是以MAML为基础的FSL,具有更广泛的应用场景,包括故障分类、剩余使用寿命预测和故障控制,但这些技术需要大量的计算资源来进行深度神经网络的梯度优化,而优化参数与模型训练速度之间的平衡是关键(Hu等人,2023);基于属性的FSL是一个新兴但具有前景的研究课题,有可能大幅降低工业中数据收集的成本,零样本学习则使模型能够推广到新的故障模式或工况下无需重新训练,即使在“零”异常或故障样本的情况下,也能实现复杂系统的智能预测。在工业中,小样本学习往往伴随着由不同速度和负载条件引起的领域偏移问题,这是一个更为困难的问题,对传统FSL方法提出了挑战,要求学习足够的代表性故障特征,以适应和推广到未见过的数据分布,而该领域的研究最近才刚刚开始(Liu等人,2023)。 客官,球球再点个广告,再走吧~ 点击左下角阅读原文,即可在线阅读论文。来源:故障诊断与python学习

    未登录
    还没有评论
    课程
    培训
    服务
    行家
    VIP会员 学习 福利任务 兑换礼品
    下载APP
    联系我们
    帮助与反馈