首页/文章/ 详情

综述 | 设备状态监测中处理工业数据分部不平衡的重采样技术(上)

1月前浏览1818

    本期给大家推荐魏建安教授的设备状态监测中处理工业数据分部不平衡的重采样技术综述。在工业生产中,机器设备大部分时间处于正常运行状态,故障发生的时间极为短暂,导致故障数据稀缺,数据集普遍存在不平衡问题。随着制造业的快速发展,复杂设备的故障数据往往伴随噪声和多重不平衡现象,给故障诊断带来巨大挑战。本文将从数据预处理、特征提取和分类器改进三个方面,系统分析当前不平衡数据分类的主要方法,并探讨这些方法在工业场景中的应用及未来研究方向。

    论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

    论文基本信息

    论文题目:

    Review of resampling techniques for the treatment of imbalanced industrial data classification in equipment condition monitoring

    论文期刊:Engineering Applications of Artificial Intelligence

    论文日期:2023年8月

    论文链接:

    https://doi.org/10.1016/j.engappai.2023.106911

    作者:Yage Yuan , Jianan Wei , Haisong Huang

    机构:

    Key Laboratory of Advanced Manufacturing Technology, Ministry of Education, Guizhou University, Guiyang, Guizhou 550025, China

    作者邮箱:

    gs.ygyuan22@gzu.edu.cn
    jawei@gau.edu.cn
    hshuang@gzu.edu.cn
    作者简介:

    魏建安,工学博士,贵州大学特聘教授,硕导,贵州省“产业技术创新副总”,研究方向为制造大数据与制造信息系统、航空航天领域关键零部件智能制造与运维、医工领域数据与图像处理等。主持国家级、省部级课题4项;发表相关领域论文近30篇,其中一作或通信发表SCI 1区Top论文8篇、2区论文1篇(综述),单篇最高被引150余次;科学出版社出版工业大数据与智能运维领域学术专著1部;授权国家发明专利3项;担任《航空动力学报》(EI)、《工业工程》、《数据采集与处理》、《中国测试》等领域知名期刊的青年编委;担任中国图学学会(CGS)可视化与认知计算专委会委员、中国图学学会(CGS)青年工作委员会委员、中国机械工程学会(CMES)工业大数据与智能系统分会专委会委员、中国图形图像学会(CSIG)遥感图像专委会委员、中国自动化学会(CAA)动态学习与智能医学专委会(筹)专委会委员、全国材料与器件科学家智库-电子信息材料与器件专家委员会常务委员等学术兼 职。

    黄海松,工学博士、教授,博士生导师,贵州大学现代制造技术教育部重点实验室常务副主任、贵州省百层次创新人才,贵州省省管专家,贵州省科技拔尖人才、重庆市“巴渝学者讲座教授”,中国机械工程学会工业大数据与智能系统分会专委会委员、中国计算机学会工业控制专委会委员、《计算机集成制造系统》理事会理事、中国图学学会数字孪生专委会委员,以第一完成人或者主要完成人获得省部级科技进步奖一、二、三等奖励5项。

    目录

    1 摘要
    2 引言
    复杂不平衡数据的特性分析

    3.1 小样本不平衡下的噪声

    3.2 小样本下的类内类间不平衡

    3.3 小样本下的多类不平衡

    3.4 时间序列下的小样本

    不平衡数据分类方法及其在工业不平衡数据处理中的应用

    4.1 重采样技术

        4.1.1 欠采样技术

    (以上为文章上篇内容)

        4.1.2 过采样技术

        4.1.3 混合采样技术

    4.2 生成对抗网络

    4.3 特征选取
    4.4 分类器改进
        4.4.1 代价敏感法
        4.4.2 单类学习法
        4.4.3 集成学习法

    重采样技术在工业不平衡数据处理中的应用

    工业不平衡异常监测中的困难和挑战问题

    7 总结

    1 摘要

    在实际工业场景中,机器大多数时间都处于正常工作状态,而故障状态下的时间则非常短。因此,收集到的故障数据非常有限,这导致了故障诊断数据集的不平衡,故障样本的数量远少于正常样本。此外,随着制造业的快速发展,机器设备变得越来越复杂,这使得收集的故障数据中存在噪声、类重叠、类内和类间不平衡、多类不平衡以及时间序列不平衡等问题。因此,解决这些问题已成为故障诊断领域的研究热点和难点,并出现了许多解决方法。本文将从数据预处理、特征提取以及分类器改进三个方面进行全面梳理。同时,还描述了不平衡数据分类方法在工业场景中的应用。最后,总结了不平衡数据分类研究领域面临的挑战,并提出了未来可能的研究方向。  

    关键词:故障诊断不平衡分类问题小样本问题重采样技术

    2 引言

    制造业在国家经济中占据着举足轻重的位置,是国家立基之本、兴国之器、强国之基[1]。近年来,中国已将“智能制造工程”作为《中国制造2025》的五大重点工程之一,全力推动制造业的高速发展[2]。德国《国家工业战略2030》指出,德国在机械与设备制造、汽车及零部件制造等十个关键工业领域具有领先地位,并提出基于数据创新的一系列前沿技术将重塑各行各业,从根本上颠覆现有工业体系,彻底改变传统的工业活动和制造方法,重新定义制造业价值链[3]。《先进制造业美国领导力战略》设立了三大目标:开发和转化新制造技术、培养制造业劳动力、提升制造业供应链水平。其中之一就是大力发展未来智能制造系统[4]。机械设备作为制造业发展的核心基础,其在航天器、军工品、集成芯片等高精尖行业,以及汽车、火车、地铁等日常交通行业中具有广泛的应用[5]。随着智能制造技术的发展,机械设备正朝着高精度、高效率、自动化和复杂化的方向发展[6]。因此,各种机械设备的结构变得越来越复杂,且随着需求的增加,机械设备将长时间在恶劣工况下运行。这将导致其性能和健康状态逐渐退化,甚至最终完全失效。一旦机械设备发生故障,轻则降低生产效率、影响产品质量,重则可能造成人员伤亡等重大安全事故。因此,及时对机械设备进行状态监测和可靠的故障诊断是非常必要的[7]。

    从本质上讲,机械设备的状态监测和预测是一个数据采集、特征提取和模式识别的过程[8]。通过在机械设备上部署力学、温度、振动、加速度等传感器,可以采集关键零部件的状态信息,然后进行手动或自动的特征提取,最后将特征数据输入分类或回归模型,实现关键零部件的故障预测和寿命预测,为决策者制定维护策略提供重要支持。然而,在实际工业生产中,机械设备发生故障的频率远低于正常状态,并且不同类型的故障发生频率也有所不同[9]。因此,故障状态下收集的数据非常有限,而正常状态下可以获得大量数据,这就导致了数据不平衡的问题[10]–[12]。此外,系统本身也可能存在不平衡问题,这可能由外部扰动、故障或恶意攻击等多种因素引起。在网络控制系统中,这些因素可能导致系统性能下降、稳定性受到威胁,甚至引发系统崩溃。因此,为应对系统不平衡问题,研究人员开发了能够有效应对各种不良因素影响的滤波器设计方法[13]。目前,大多数故障诊断研究都基于数据平衡,并依赖大量的标记数据。针对这些问题,近年来出现了一种有希望的解决方案——无监督跨域诊断方法[14],它不再要求数据集具有平衡的标签分布,也不需要大量已标记的数据。相反,该方法通过在不同领域或来源之间进行知识迁移和特征学习,可以有效地进行跨域故障诊断[15]。这一方法为故障诊断研究开辟了新的途径,并有望在未来应用中发挥重要作用。

    然而,在工业场景中,收集的数据除了具有有限的不平衡特性外,还可能呈现以下特点:

    • 由于采集环境和工况的复杂性,采集的信号成分复杂且含有大量噪声[16];
    •  收集的故障(异常)数据形式不统一,同一阶段的故障数据可能分布在不同的集群中;
    • 在长期高负荷运行的状态下,机械系统可能出现单个零件多种故障或多个零部件同时发生故障的复杂情况;
    • 故障形式渐进,使得所收集的数据具有强的时间序列特性[17], [18]。
       
    这些复杂的不平衡数据给机械系统关键零部件的预测性维护中的分类和回归建模带来了巨大挑战。因此,研究如何处理轴承、刀具等机械系统关键零部件状态监测和预测中的复杂不平衡数据分类和回归问题,具有重要的理论和应用价值。

    近年来,针对不平衡问题的研究出现了许多方法,但针对特定领域中的挑战性问题,如噪声、类内类间不平衡、多类不平衡和时间序列不平衡,相关的综述文献相对较少[19]。这些问题在工业故障监测中具有重要的实际应用意义,因此,对重采样技术在智能故障诊断中的综述以及在解决不平衡问题方面的应用,具有重要的研究价值。我们的研究探讨了这些方法在不平衡工业故障监测中的应用。我们发现,应用重采样技术可以改善故障监测系统对少数类别的检测能力,减少误报率,并提高整体故障诊断的准确性。通过采用合适的特征提取和分类算法,结合重采样技术,可以有效解决工业场景中的不平衡问题,提高故障监测系统的性能和稳定性。通过对这些工作的总结和讨论,我们旨在促进对不平衡数据在工业故障监测中应用的深入理解,并为实际应用中的智能故障诊断提供有益的指导。我们的综述强调了重采样技术在工业故障诊断中的重要性,并对解决不平衡问题提供了详尽的文献回顾和分析。我们相信,这些工作将有助于推动该领域的进一步研究,并为实际应用中的智能故障诊断提供宝贵的参考和指导。

    本文的组织结构如下:第2节介绍了实际工业场景中更为复杂的不平衡分类问题,包括小样本含噪不平衡、小样本数据的类内类间不平衡、多类不平衡以及小样本时间序列不平衡;第3节详细介绍了不平衡数据的分类方法;第4节描述了重采样技术在处理工业不平衡数据中的应用;第5节总结了工业不平衡异常监测中的困难和挑战性问题;第6节展望了未来基于这些挑战的研究方向;第7节对全文进行了总结。  

    3 复杂不平衡数据的特征分析

    在机械故障诊断领域,模型训练过程中缺乏故障数据已经成为一个广泛关注的问题,这被称为小样本问题。小样本问题是指在有效数据不足的情况下,如何建立一个高精度的智能诊断模型[20]。因此,在小样本情况下进行故障检测和诊断对于智能故障诊断应用具有重要意义。然而,近年来的研究发现,不平衡数据分类问题不仅仅由样本数量的不平衡引起,解决不平衡数据分类问题不能仅仅依赖于类样本数量的差异[21]。随着工业需求的提升,机械设备变得越来越复杂,工作环境也日益恶劣。这导致所收集的数据中常常含有噪声,并且设备运行过程中故障形式可能发生变化,有时甚至会同时发生多个故障。这种情况导致数据存在类内类间不平衡和多类不平衡的问题。此外,机械设备的故障过程通常是渐进的,因此收集的数据具有显著的时间序列不平衡性[22]。本小节将对以上四个问题进行详细描述。

    3.1 小样本不平衡下的噪声

    如图1所示,噪声数据是指数据中存在错误或异常(即偏离期望值)的数据,这些数据会对原始的数据分析造成干扰[17]。在不平衡数据中,噪声特性会显著影响诊断算法的性能[23],而噪声的存在可能进一步加剧类别之间的不平衡程度。如图2(a)所示,在未处理噪声的情况下进行过采样,会导致分类超平面的偏移,从而影响分类器的分类精度。相比之下,图2(b)展示了在处理噪声后进行过采样,实际的决策边界变化不大,对分类器的精度影响较小。此外,噪声数据还可能干扰模型的学习过程,导致错误的决策和预测。因此,准确识别和处理噪声对于提高模型性能和减少误报率至关重要。

    图1 工业监测数据中可能存在的噪声问题

    然而,在实际工程环境中,通过机械设备收集的数据不可避免地会伴有噪声。噪声数据对机械设备的故障诊断产生了多方面的影响,例如:
    • 困扰特征提取:噪声可能掩盖或干扰与故障相关的信号或特征,使得从传感器数据中提取有用的故障特征变得更加困难。噪声会模糊信号,降低特征的清晰度和可辨识性,使得故障诊断算法难以准确识别故障模式。
    • 引入误判和虚假警报:噪声可能导致误判和虚假警报。当噪声与故障信号相似或混杂在信号中时,可能会被错误地识别为故障信号,从而导致虚假的故障诊断结果。这可能会导致不必要的维修或停机时间,增加成本和不便。
    • 降低故障检测的准确性[24], [25]:噪声对故障检测算法的准确性产生负面影响。噪声的存在使得故障信号难以准确检测和辨识,可能导致故障的延误或漏检,从而增加设备故障的风险和损失。
    因此,处理噪声至关重要。当前,通常采用以下三种策略来克服噪声对机械设备故障诊断的影响:
    • 噪声滤波:使用合适的滤波技术来减少噪声的影响,提高信号的清晰度和质量。常见的滤波方法包括均值滤波、中值滤波和小波滤波等。
    • 特征增强:采用信号处理和特征提取技术,增强故障信号的特征,使其在噪声环境下更容易被检测和识别。这可以包括时频分析、频谱分析和小波变换等方法。
    • 强化算法鲁棒性:设计更鲁棒的故障诊断算法,以便在噪声存在的情况下仍能准确可靠地进行故障检测和诊断。可以采用机器学习方法、统计模型或基于知识的推理方法来提高算法的鲁棒性。

    尽管目前有许多方法可以处理噪声问题,但在小样本不均衡条件下的噪声处理仍然鲜有涉及。

    图2 使用SMOTE技术处理不平衡工业数据时噪声的影响[26]

    3.2 小样本下的类内类间不平衡

    机械设备的故障形式通常是变化多端的,且不同类型的故障经常会发生耦合。在这种情况下,不仅正常状态与故障状态的数据量差异显著,而且故障状态下的数据往往会分布在多个子集群中,这导致了类内不平衡和类间不平衡的共同存在。如图3(a)所示,这是一个典型的类内不平衡示例,即同一类中的某些子集的样本数量远少于其他子集[21]。类间不平衡则表现为不同数据类之间的数据量差异,其中最常见的是故障数据与正常数据之间的失衡。然而,当前大多数针对类内不平衡的问题的方法并不能完全解决这一问题,实际上可能会进一步加剧不平衡情况。如图3(b)所示,当进行过采样时,可能会导致少数类样本远离边界被忽略,从而加重类内不平衡问题,并导致决策边界的偏移,进一步影响分类器的准确性[27]。  
    图3 使用MWMOTE技术处理不平衡工业数据时的类内不平衡和类间不平衡问题及其影响[28]  

    在机械设备的故障诊断中,数据的类内和类间不平衡问题对诊断结果有着深远的影响,具体表现如下:

    • 误判和漏检:类内不平衡会导致故障样本分布不均,某些故障类型或子集的样本数量较少。这可能导致故障诊断算法将少数类别的故障样本错误地识别为正常状态,进而引发误判。同时,由于少数类别的样本数量有限,算法可能漏检某些故障类型,从而使故障未能及时发现。
    • 虚假警报和不必要的维修:类内不平衡使得某些故障子集的样本数量较少,这可能导致正常状态下的数据被错误地识别为故障信号,产生虚假警报。虚假警报会增加设备维修的频率,导致不必要的维修和停机时间,从而增加成本和不便。
    • 故障检测的准确性下降:类内不平衡会影响故障检测算法的准确性。由于少数故障子集的样本数量较少,故障信号可能在噪声中被掩盖或混杂,导致故障检测变得更加困难。这可能导致故障的延误或漏检,从而增加设备故障的风险和损失。
    • 数据样本偏倚:类间不平衡会导致不同故障类型或子集之间的样本数量不均。这可能使得算法对少数类别的故障数据学习不充分,影响其识别和分类性能。较少的故障样本数量可能导致模型的泛化能力下降,使得在实际应用中无法准确识别和处理各种故障情况。

    因此,解决数据的类内和类间不平衡问题对于提高故障诊断算法的性能和可靠性具有重要意义。在小样本条件下,解决这些不平衡问题的策略通常包括以下几种:

    • 数据增强:通过对原始数据进行变换和扩充,如平移、旋转、缩放、翻转等,生成额外的样本。数据增强有助于平衡类内和类间分布,提高分类器的泛化能力。
    • 特征选择和降维:通过选择与故障诊断相关的有效特征或使用降维技术,减少特征空间的维度。这有助于提取最具代表性的特征,减少数据的冗余性,并提高分类器的性能。
    • 跨领域知识迁移:利用从其他领域或相关任务中学习到的知识,辅助解决小样本条件下的类内和类间不平衡问题。这包括使用预训练的模型或迁移学习方法来利用先验知识。
    • 基于生成模型的方法:使用生成模型模拟数据分布,并生成新的样本以增加少数类的数量。这包括使用生成对抗网络(GANs)或变分自编码器(VAEs)等生成模型来合成新样本。
    • 强化学习:使用强化学习算法优化决策过程,以解决小样本条件下的类内和类间不平衡问题。强化学习通过与环境的交互来学习最优的行动策略,从而减少错误分类和漏检。
    • 集成学习:将多个分类器集成在一起,通过集体决策来处理小样本条件下的类内和类间不平衡问题。集成学习可以提高分类器的稳定性和泛化能力,减少错误分类和漏检的风险。

    3.3 小样本下的多类不平衡

    由于工况的复杂性和环境的恶劣性,机械设备的多个部件可能会同时发生故障[29]。在实际的工业场景中,不平衡的多类数据问题尤为常见,如图4所示。在处理多类问题时,可能需要同时处理多个少数类或多个多数类,这些类中的样本在某些特征上的相似性可能较高,从而在特征空间中形成重叠区域。在小样本问题中,由于少数类样本相对于多数类样本非常稀疏,这进一步增加了类重叠的概率[30]。类重叠会导致分类决策边界的偏移,增加分类错误的可能性,降低分类器的准确性,并使边界更加模糊,增加分类结果的不确定性和不可靠性。在实际的设备故障诊断过程中,边界类的样本往往更加重要。边界类指的是那些位于不同类别之间或接近其他类别的样本。这些样本可能具有关键的特征或属性,对于故障诊断和预测提供了重要的信息。因此,解决多类不平衡问题成为了至关重要的任务。

    图4 工业监测数据中的多类不平衡问题及其对分类建模的影响

    与类内类间不平衡问题对故障诊断产生的影响类似,多类不平衡对故障诊断的影响也包括误判、漏检、虚假警报、不必要的维修、准确性下降和数据样本偏倚。解决多类不平衡问题的方法通常包括:

    • 数据增强:通过对原始数据进行变换和扩充来增加样本数量,以平衡不同类别之间的样本差异。常见的数据增强方法包括随机旋转、翻转、缩放、平移等操作,使得原始样本集更加丰富多样。
    • 类别平衡技术:针对多类不平衡数据集,可以采用类别平衡技术来调整不同类别之间的样本比例。常见的类别平衡技术包括欠采样和过采样。欠采样方法通过减少多数类样本数量来平衡类别之间的样本比例,而过采样方法则通过复 制或生成少数类样本来增加少数类的样本数量。
    • 集成学习:集成学习是一种通过组合多个分类器来提高分类性能的技术。在处理多类不平衡数据时,可以采用集成学习方法,如Bagging、Boosting和Stacking等,将多个分类器的预测结果进行集成,以改善对少数类的识别能力。
    • 基于代价敏感学习:在多类不平衡数据中,不同类别的错误分类可能具有不同的代价。通过引入代价矩阵或代价权重,可以将分类器训练过程中的错误分类代价考虑进去,使得分类器更加关注少数类别的识别和分类。

    3.4 时间序列下的小样本

    在工业场景中,时间序列分类是一个普遍存在且具有挑战性的问题。时间序列数据包含一组有序的实值变量,这些变量是从时域或空间域的连续信号中提取的。由于时间序列具有顺序特征,接近的变量通常是相关的[31]。此外,时间序列数据通常具有高维数据、多变量间强相关性以及噪声干扰等特点[32]。如图5和图6所示,分别展示了PHM2010铣刀磨损退化数据集中C1刀具的磨损值变化曲线和全生命周期振动信号退化趋势图,它们都是典型的时间序列数据。通常,刀具磨损阶段分为初期磨损阶段、正常磨损阶段和剧烈磨损阶段。然而,初期磨损阶段和剧烈磨损阶段的数据量通常远远小于正常磨损阶段的数据量,因此刀具全生命周期的退化数据呈现出时间序列不均衡的特点。此外,初期磨损阶段和剧烈磨损阶段的数据量也有所不同,这导致了非正常磨损阶段的数据在类内也呈现不均衡状态。另一方面,研究人员更关注剧烈磨损阶段的预测。如图5所示,刀具在进入剧烈磨损阶段时,其磨损量的扩展速率会有所不同,导致逐步增加。因此,在刀具故障预测中,如图6所示,初期剧烈磨损阶段的数据量较多,而临近刀具报废时的数据量较少(即,同一类别下来自不同时间序列样本之间可能存在许多内部变化)[32]。因此,剧烈磨损阶段磨损值的预测也面临着典型的类内不均衡问题。  

    图5 PHM2010 C1铣刀的生命周期磨损曲线

    图6 工业异常检测中的典型时间序列不平衡问题(以PHM2010 C1切削场景为例)

    因此,以刀具磨损阶段的识别或磨损值预测作为例子,展示了典型的时间序列和类内不均衡问题。然而,时间序列数据的特殊性使得传统的不平衡数据分类方法不完全适用,并且在序列数据中区分少数类和噪声变得更加困难,类别之间的重叠问题也更加复杂。因此,时间序列数据的不平衡性对故障诊断研究产生了巨大影响。

    目前,为了解决时间序列数据的不平衡问题,重采样技术被广泛应用。此外,还可以采用以下两种方法:

    • 特征选择和降维:对于高维度的时间序列数据,可以使用特征选择和降维技术来减少特征维度,同时保留最具区分性的特征。通过选择和提取最相关的特征,可以减少不平衡数据集中的噪声和冗余信息,从而提高分类器的性能。
    • 生成对抗网络(GANs):GANs是一种强大的生成模型,能够生成合成样本以增加少数类别的样本数量。通过训练生成器和判别器的对抗过程,GANs可以生成逼真的少数类别样本,从而平衡数据集。

    这两种方法可以有效地解决时间序列数据中的不平衡问题,从而提高故障诊断模型的准确性和可靠性。

    4 不平衡数据分类方法及其在工业不平衡数据处理中的应用

    现实中的数据通常具有不平衡特性,即某些类别的样本数量远远少于其他类别。因此,如何设计分类方法以同时保证多数类和少数类的分类精度,已成为数据挖掘、人工智能等领域的研究热点,并催生了大量解决不平衡分类的方法。如图7所示,这些方法主要集中在三个层面上:数据预处理[34]、特征提取[35]以及分类器改进[36]。本节将回顾并分析这些方法及其在工业不平衡分类中的应用。此外,还将简述一种新型的分类方法——生成对抗网络(GANs),并探讨其在解决数据不平衡问题中的潜力。  

    图7 不平衡分类的典型方法  

    4.1 重采样技术

    针对数据不平衡分类问题,数据预处理中的重采样技术是应用最广泛的方法之一[9]。重采样通过复 制或合成少数类样本,或删除多数类样本,来改善样本分布的平衡性。其主要优点是不会改变后续分类器的结构,且可在分类算法的学习训练之前独立进行[37]。重采样技术主要分为三类:欠采样技术、过采样技术以及混合采样技术。

    4.1.1欠采样技术  

    为了解决随机欠采样方法的不足[38],许多研究人员对删除条件进行了改进。例如,Edited Nearest Neighbor(ENN)[39]通过计算多数类样本的最近邻分布情况来决定哪些样本需要删除,即当某多数类样本的近邻域中其他类别的样本占多数时,便将其删除。然而,ENN能删除的多数类样本数量有限,可能无法从根本上解决数据的不平衡问题。Neighborhood Cleaning Rule(NCL)[40]在ENN的基础上,进一步考虑少数类样本的近邻分布,以删除更多的多数类样本。NCL不仅删除周围嘈杂的多数类样本,还删除少数类样本周围的嘈杂多数类样本。Tomek-Links欠采样法[41]通过构建不同类别样本的Tomek Links对(如果训练集中不同类别样本a和b之间的欧式距离小于任意其他样本之间的欧式距离,则称其为Tomek Links对)来删除多数类样本。但Tomek-Links算法仅考虑全局样本之间最近的边界实例,忽略了潜在的局部重叠实例。因此,Dai等人[42]提出了一种多粒度重标记欠采样算法,该算法在局部粒度空间中充分考虑数据集的局部信息,检测数据集中潜在的局部重叠实例,并通过全局重新标记的索引值删除这些重叠的多数类实例,从而有效扩大了Tomek-Links的检测范围。此外,Lin等人[43]提出了两种基于聚类算法的欠采样技术,这些方法依据k-近邻(K-NN)规则选择聚类中心或聚类中心的最近邻样本来代表多数类样本。尽管这些算法在一定程度上克服了随机欠采样技术容易删除重要信息的问题,但可能会破坏原始样本的分布。因此,Ng等人[44]提出了一种基于多样化敏感性的欠采样技术,该方法通过灵敏度测量合理选择可修剪的样本,最大限度保留原始数据集的分布信息。然而,在工业场景中,实际收集的数据往往不仅仅是简单的两类不平衡数据,还可能包含噪声、类内类间不平衡、多类不平衡等一系列复杂的不平衡问题。近年来,许多研究人员提出了针对这些复杂问题的欠采样方法,以更好地应对工业场景下的数据挑战。

    1)针对噪声问题

    Kang等人[45]首次将噪声滤波器与欠采样方法相结合。其特点是在训练分类器之前,先过滤掉少数类样本中的噪声实例。Ruisen等人[46]则提出了一种基于bagging的算法,该算法结合了Xgboost分类器和欠采样方法,用于解决二分类问题中的数据不平衡及噪声问题。为避免数据不平衡导致的模型误差,该方法通过带放回的随机抽样生成多个平衡的训练集;同时,为了减轻噪声对模型的误导,引入了Tomek Link方法,以消除作为噪声主要来源的跨类重叠实例。

    2)针对类内类间不平衡问题

    为了解决欠采样方法可能导致信息样本丢失的问题,NG等人[47]提出了基于散列的欠采样集成(HUE)方法。该方法通过散列技术将多数类样本划分为多个子空间,每个子空间对应一个训练子集,包含来自该子空间的多数 样本以及来自周围子空间的少数样本。这些训练子集用于训练一个包含所有少数类样本的分类与回归树分类器的集 合。针对大规模高度均衡数据集中欠采样技术易导致多数类有用信息丢失且模型难以泛化的问题,Ren等人[48]提出了一种具有两种新方案的均衡集成方法(EASE)。首先,该方法通过均衡欠采样方案为每个基分类器生成一个平衡的数据集,减少类不平衡对基分类器的影响;其次,设计了一个加权整合方案,以基分类器在原始不平衡数据集上获得的G-mean分数作为权重。这样,性能较好的基分类器能够主导最终分类决策,同时适应不同规模的不平衡数据集,并避免极端不良情况的发生。此外,Liu等人[49]提出了一种基于球形聚类划分和密度峰值优化的类不平衡数据分类算法(DPBCPUSBoost)。该方法首先利用密度峰值信息为多数类样本分配抽样权重,将具有“近邻簇”的多数类球簇划分为“易误分区域”和“难误分区域”,并提高“易误分区域”内样本的抽样权重。通过迭代欠采样,第一次迭代时按照抽样权重对多数类进行欠采样,而在后续迭代中根据样本分布权重进行欠采样,并将欠采样后的多数类样本与少数类样本组成临时训练集以训练弱分类器。最终,结合样本的密度峰值信息与类别分布,为所有样本定义不同的误分代价,并通过代价调整函数增加高误分代价样本的权重。现有的大多数欠采样方法主要关注数据整体结构特征的保留或通过势能估计来保留负类的整体结构特征,但未充分考虑梯度淹没和正样本经验表示不足的问题。为此,Huang等人[12]提出了一种解决数据不平衡问题的新范式。该方法通过信息丰富的欠采样策略应对梯度淹没问题,恢复神经网络在不平衡数据下的性能。此外,通过边界扩展策略,结合线性插值和预测一致性约束,缓解了正样本经验表示不足的问题。尽管许多欠采样方法已经被提出,但现有研究仍主要集中在类间不平衡问题,对于类内不平衡问题的研究相对较少。

    3)针对类重叠问题

    Vuttipittayamongkol等人[50]提出了一种基于近邻域的欠采样方法来处理类重叠数据。他们引入了四种不同的基于K-NN的方法,以探索单个实例的局部环境,并确定应消除的重叠实例。然而,基于最近邻的方法只关注局部域内实例的局部相似度,未能考虑全局相似度。为了解决这一问题,Dai等人[51]提出了一种新颖的Schur分解类重叠欠采样方法(SDCU)。SDCU试图通过全局相似性来识别潜在的重叠实例,并首次使用矩阵分解方法处理类不平衡数据中的类重叠问题。近年来,研究人员发现,将Tomek-Link算法与采样技术相结合,可以有效减少数据中的类重叠,消除大部分难以区分的实例,从而提高分类算法的精度。然而,Tomek-Links欠采样算法仅考虑全局范围内彼此最近的边界实例,忽略了潜在的局部重叠实例。当少数类样本数量较少时,欠采样效果不理想,分类模型的性能提升有限。为此,Dai等人[52]提出了一种多粒度重标记欠采样算法(MGRU)。该算法在局部粒度子空间中充分考虑数据集的局部信息,检测出潜在的局部重叠实例,然后根据全局重新标记的索引值消除重叠的多数类实例,从而有效扩大了Tomek-Links的检测范围。随着元启发式算法表现出强大的优化能力,一些研究人员将其与欠采样技术结合,来解决不平衡数据中的类重叠问题。Soltanzadeh等人[53]提出了一种基于元启发式方法的欠采样技术。不同于大多数现有的欠采样方法,该方法旨在选择多数类样本的最佳子集,以同时处理不平衡和类重叠问题,同时避免过度删除多数类样本,尤其是在重叠区域。生成的解决方案通过分类器进行评估,并在进化过程中不断优化。

    4)针对多类不均衡的问题

    Claudia等人[54]提出了一种定制化实例随机欠采样(CIRUS)方法,旨在解决多类不平衡问题。该方法通过计算每个多数类的紧凑集,以获得类的结构化表示。然后,利用迭代方式从紧凑集中随机选择一个实例并将其加入结果集中,直到结果集中多数类实例的数量与少数类实例的数量相同。

    虽然欠采样技术在缓解数据集不平衡性方面具有一定的效果,且算法复杂度较低,但在应对噪声、类内类间不平衡、多类不平衡及时间序列不平衡问题时仍存在以下几点局限性:

    • 噪声问题:欠采样方法在处理噪声时可能面临挑战。由于噪声实例通常是少数类样本中的异常值或错误标记,欠采样可能无法准确区分噪声和正常样本。在删除噪声实例的过程中,可能会损失正常样本中的有用信息,从而导致模型性能下降。
    • 类内类间不平衡问题:欠采样方法在解决类内类间不平衡问题时可能存在局限性。由于欠采样通常基于类别的样本数量进行操作,可能无法解决类别内部的样本分布不均或重叠问题。欠采样可能无法充分考虑这些特性,导致模型在处理类内不平衡问题时仍面临挑战。
    • 多类不平衡问题:欠采样方法在应对多类不平衡问题时也可能存在困难。多类不平衡涉及多个类别之间的不平衡,其中某些类别的样本数量可能较少。欠采样方法可能难以有效处理多个少数类或多数类,并且在删除多数类样本时,可能导致数据集进一步不平衡。
    • 时间序列不平衡问题:在处理时间序列不平衡问题时,欠采样方法可能受到限制。时间序列数据具有时间依赖性和连续性,因此在进行欠采样时需要考虑样本的时间顺序。传统欠采样方法可能无法有效保留时间序列中的重要信息和模式。


     

    编辑:赵学功

    校核:李正平、陈凯歌、赵栓栓、曹希铭、白亮、陈少华、任超

    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

    点击左下角阅读原文,即可在线阅读论文。


    来源:故障诊断与python学习
    ACT振动化学旋转机械航空航天汽车电子python芯片声学理论电机材料数字孪生控制人工智能
    著作权归作者所有,欢迎分享,未经许可,不得转载
    首次发布时间:2024-09-25
    最近编辑:1月前
    故障诊断与python学习
    硕士 签名征集中
    获赞 64粉丝 66文章 140课程 0
    点赞
    收藏
    作者推荐

    综述 | 旋转机械复合故障诊断的现状、挑战与机遇(下)

    本期继续给大家推荐旋转机械复合故障诊断综述文章的下半部分内容,该综述详细介绍了复合故障诊断方法的相关背景,包括相关定义和一种新的分类方法。然后,作者基于过去几十年的相关出版物,对复合故障诊断的最新应用进行了综述。最后,总结了实现复合故障诊断在故障诊断领域中的挑战和机遇,并给出了本综述的结论。论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Compound Fault Diagnosis for Rotating Machinery: State-of-the-Art, Challenges, and Opportunities论文期刊:Journal of Dynamics, Monitoring and Diagnostics论文日期:2023论文链接:https://doi.org/10.37965/jdmd.2023.152作者:Ruyi Huang1,2;Jingyan Xia2,3;Bin Zhang3;Zhuyun Chen2,3;Weihua Li2,3机构:1. Shien-Ming Wu School of Intelligent Engineering, South China University of Technology;2. PazhouLab;3. School of Mechanical and Automotive Engineering, South China University of Technology通讯作者邮箱:Weihua Li (e-mail:whlee@scut.edu.cn)目录1 摘要2 引言3 CFD的背景3.1 与CFD相关的定义3.2 CFD方法的分类4 CFD在旋转机械中的应用4.1 基于失效机理的CFD方法的应用4.2 基于信号处理的CFD方法的应用4.3 基于人工智能的CFD方法的应用5 未来的挑战与机遇5.1 复杂机械系统复合故障失效机理建模5.2 信号处理算法的改进5.3 智能CFD模型的可解释性5.4 更加智能的CFD方法6 结论7 致谢4 CFD在旋转机械中的应用4.2 基于信号处理的CFD方法的应用1) 基于信号分解的方法基于信号分解的方法本质是从复合故障信号中提取并分离出信号。基于信号分解的方法类似于依赖特征工程的模式识别,期望将不同的成分分离开来。研究人员提出了许多成功的CFD方法,例如小波变换(WT) [20-28]、变分模态分解(VMD) [29-34]、局部均值分解(LMD) [35]、奇异谱分解(SSD) [36、37]、辛几何模态分解(SGMD) [38、39]等方法[40-48]。上述方法在旋转机械CFD中得到了广泛的应用。小波变换( Wavelet Analysis,WT )可以看作是用一组基函数(小波)对信号的表示或投影,在故障诊断领域带来了包括滤波、降噪和特征提取在内的巨大应用。Peng等人[49]和Yan等人[50]分别在2004年和2014年系统地回顾了WT及其变体算法在健康状态监测和故障诊断中的应用。对于CFD,Jiang等发展了一种经验小波变换与混沌振子相结合的方法(命名为EWTDO ),该方法通过以下步骤实现CFD,首先,通过经验小波变换将复合故障信号分离为不同的经验模型。其次,采用包含所有单一故障频率的振子建立故障隔离器。最后,通过观察故障隔离器输出的映射产生的不规则运动,可以逐一识别出所有的单故障[20]。Ding利用双脉冲性测量指标确定了经验WT的上下段边界,可以进一步解调以检测不同的单一故障[21]。与使用固定基函数的经验WT不同,He等人结合了能够自动选择敏感频带的自适应冗余多小波包和Hilbert变换解调分析来解耦两个齿轮箱的复合故障[24]。Hu等提出了一种改进的可调Q因子小波变换( TQWT )对振动信号进行分解,通过对比实验结果与理论值的故障特征频率即可识别复合故障[27]。尽管WT方法具有许多良好的性质,确保了其在CFD中的有效性,但其对复合故障信号的分解性能取决于所选择的小波基函数。VMD也是一种将复合故障信号分解为多个带限本征模态函数的流行算法。例如,Yan等人将VMD与1.5维包络谱相结合来检测旋转机械的复合故障,其中利用VMD将复合故障信号分解为若干个本征模态分量[29]。Wan等人将快速谱峭度与VMD相结合,用于处理含有微弱单分量的复合故障信号[30]。VMD的参数,如惩罚项和子成分个数,对分解结果有重要影响。因此,参数优化的VMD在旋转机械CFD中也得到了研究和应用[32-34]。然而,确定这些参数以确保诊断性能仍然缺乏有效的解决方案。LMD、SSD和SGMD是针对非平稳信号的模态分解算法。具体来说,LMD是一种自适应模态分解算法,可以将复合故障信号分解为一组单分量即乘积函数。Jay Lee等人提出了一种基于LMD的复合包络构造方法用于往复压缩机的故障诊断[35]。LMD对调幅和调频信号具有良好的解调性能,但存在端点效应和模态混叠现象等局限性。SSD也是一种自适应算法,可以将非线性、非平稳的时间信号分解在窄带分量中。Wang等人提出了几种基于SSD的齿轮箱复合故障诊断方法,取得了较高的分解精度,并能在一定程度上克服模态混叠[36、37]。SGMD是一种利用辛几何相似变换将单分量与其对应的特征向量进行重构的分解方法。Pan等人提出了一种基于SGMD的CFD方法,对轴承故障和齿轮故障耦合而成的复合故障进行分离和识别[38]。以上讨论表明SSD和SGMD在CFD中得到了成功的应用。然而,由于SSD和SGMD具有很强的降噪能力,可以将微弱的故障信息当作噪声去除,因此很难提取复合故障信号中耦合的微弱单一故障的特征。此外,伪分量在强噪声环境下容易被分解。除了上述方法外,还有许多其他方法将信号分解算法与其他技术相结合来制作CFD。例如,Tang等人提出了一种角度域虚拟多通道信号的复合故障检测方法,并将其应用于监测变工况下的滚动轴承[43]。更多的细节可以在[40-48]中找到,这里没有列举。2)基于信号反卷积的方法基于信号反卷积的方法的本质是将复合信号反卷积为未耦合在一起的单一信号。基于信号反卷积的方法,如最小熵反卷积( MED ) [51-55]、最大相关峭度反卷积( MCKD ) [56-62]和周期平稳过程理论盲反卷积(CYCBD) [63]等,通过构造梳状滤波器来增强微弱周期特征和抑制信号噪声,已被证明是分离含微弱成分复合故障的有效工具。MED是为解决信号服从卷积形式时的反卷积问题而发展起来的一种技术。许多实例表明,MED赋予故障诊断方法对复合故障解耦的能力。例如,Fan等人提出了一种基于改进的MED调整和自适应信号稀疏分解的滚动轴承CFD方法,该方法通过轴承复合故障的产生和实验振动信号验证了所提出的复合故障特征提取的有效性[52]。在Feng等人[54]所做的工作中,也可以找到对风力发电机齿轮箱CFD的类似研究。基于MED的CFD方法的优点是它消除了对部件的强假设,只要求输出的简单性。与仅增强单脉冲成分的MED相比,基于MCKD的方法在CFD中表现出更强大的性能,因为MCKD可以提取连续的周期脉冲。例如,Lyu等人结合量子遗传算法( quantum genetic algorithm,QGA )提出了一种用于行星齿轮CFD的改进MCKD方法,其中单个故障相关特征由所提方法提取[58]。为了解决周期脉冲可能被强噪声污染的问题,Hong等提出了一种新的噪声抑制方法。通过结合开发了定制的自适应MCKD平衡多小波的CFD方法,其有效性在从航空发动机转子采集的仿真和实验数据上得到了验证[59]。MCKD已经与其他算法,如稀疏表示和卷积神经网络( CNNs )相结合,用于实现滚动轴承的CFD,相应的实验也表明这些方法可以有效地分离故障特征分量,并在CFD上取得良好的性能。虽然基于MCKD的方法在提取连续周期脉冲方面有一些指标,但其特征提取性能很大程度上依赖于它们的参数,例如滤波器长度和反卷积周期。CYCBD是一种盲解卷积算法,已被证明是CFD的有效工具,因为它可以从耦合的故障信号中重建周期性脉冲。在[63]中,Sun等人提出了一种改进的自适应CYCBD方法,并将其应用于强噪声背景下的齿轮箱CFD。基于CYCBD的方法为从复合故障信号中提取微弱冲击故障提供了另一种途径。值得注意的是,基于信号反卷积的CFD方法对关键参数的选取缺乏有效的评价标准,提取的特征容易受到信号噪声的影响。3 )基于BSP的方法基于BSP的方法本质是从混合或复合信号中分离出未知且独立的源信号。盲源分离( BSP ),又称盲信号分离( BSS ),是解决CFD问题而得到广泛发展的一种方法。各种有效的算法被提出,如独立成分分析( ICA ) [64-67]、稀疏成分分析( SCA ) [68、71]、形态成分分析( MCA ) [72]等方法[73、74]。这些算法能够从复杂的监测信号中分离出各单一故障源的识别特征,从而准确评估旋转机械的健康状态。ICA是一种常用的从混合信号中分离独立子成分的BSS算法,也适用于处理CFD中遇到的问题。Wang等[64]和Tang等[65]将CFD视为欠定BSS的振源估计问题,分别将ICA与其他模态分解算法相结合,提出了几种滚动轴承CFD方法。实验结果表明,这些方法对复合故障分离是有效的,并且在分离强噪声信号方面比信号分解方法[66、67]具有更好的性能。为了克服ICA必须在ICA之前进行信源数估计的局限性,显著增加了算法的复杂度,SCA可以避免这种估计,并通过对比解决欠定问题,在CFD中得到了广泛的应用。例如,Hao等人开发了几种基于SCA及其变体算法的CFD方法[68-70]。这些方法的核心步骤是首先使用信号处理算法提取振动信号的稀疏表示,然后将这些表示放入SCA中得到精确的源信号。结合SCA和其他技术,如sin C函数的形态学滤波和密度峰值聚类,Xie等人开发了一种有效分离轴承复合故障的方法[71]。除了轴承复合故障,Yu等人提出了一种改进的MCA方法,用于齿轮故障和轴承故障同时发生的情况下齿轮箱的CFD [72],其中复合故障信号中耦合了两个不同的分量(一个是齿轮故障引起的啮合分量,另一个是轴承故障引起的周期冲击分量)。此外,零空间追踪[73]和典型相关分析[74]等方法也被学者应用于航空发动机滚动轴承的CFD中。虽然BSP技术能够在一定程度上处理机械设备复合故障解耦中遇到的困难,但由于复杂故障监测信号具有非线性、高噪声、强耦合等特点,在提取或分离多个故障源时,仍存在性能不理想、结果可靠性不高等问题。此外,基于BSP的复合故障方法对观测信号的通道数要求较高;即传感器的数量要满足算法的要求,这可能会增加故障诊断的成本。4 )基于稀疏表示的方法稀疏表示方法的本质是通过使用给定的过完备字典将信号表示为少量原子的线性组合,从而实现对复合故障的分离。基于稀疏表示的方法已被证明是CFD中的一个流行工具,因为它具有许多优点,包括不同成分匹配、信号去噪和信号分离而不需要模式混合。一般来说,稀疏表示理论主要包含两个方面:过完备字典的构造[74-80]和稀疏系数的求解[81-85]。过完备字典的构造是发展CFD方法的关键问题之一。构造过完备字典的方法有两种。第一种是预定义的分析或静态字典。例如,Li等人提出了一种基于多重增强稀疏分解算法的齿轮箱CFD方法,其中通过考虑齿轮箱故障机制手动设计了三个子字典[78]。Meng等人提出了一种基于周期加权峭度稀疏去噪和周期滤波的CFD方法,相应的流程图如图5所示[79]。可以发现,构建脉冲字典是为了获得稀疏系数和故障类型。所设计的字典通常具有更明确的物理意义和良好的适应性,但其局限性在于处理未知信号时可能会失效。第二种是学习字典,由于它可以自适应地学习原子库以匹配目标信号,因此在复合故障信号的特征提取中表现出更大的优势;因此,它能更有效地捕捉故障相关特征,在故障诊断领域得到了广泛的应用。Lin等人提出了一种基于改进的双字典K -奇异值分解( K-SVD )的有效CFD方法,并将其应用于含有内外圈缺陷的滚动轴承[86]。尽管这些基于字典的稀疏表示方法已成功应用于旋转机械的复合故障分离,但在实际工业应用中,为CFD构建精确的字典仍然是一个具有挑战性的问题。图5 [79]中提出的CFD方法的流程图对于基于稀疏表示的方法,稀疏系数的求解是关键,对复合故障信号分解的性能有重要影响。许多近似方法被提出用于处理稀疏系数解,其中凸松弛优化[81-83]和正交匹配追踪(OMP) [84、85]是CFD中最受关注的方法。例如,Huang等人提出了齿轮箱的CFD方法,其中开发了多源保真稀疏表示算法,将信号重构问题转化为多元稀疏凸优化问题[82]。Zhang等人结合OMP算法,提出了一种多重增强稀疏表示方法,用于重构和识别每类故障诱导特征,以制作轴承的CFD [85]。尽管基于稀疏表示的方法为CFD带来了一些成功的突破,但距离在更复杂的工业场景中得到广泛应用还有很长的路要走。如何有效利用稀疏理论挖掘复合故障信号的内在特征,实现更复杂复合故障的分离,需要在未来投入更多的精力。值得注意的是,还有许多其他基于信号处理算法开发的CFD方法不包含在上述四个子类中,这将在此不予讨论[87-90]。通过以上概述和讨论可以发现,基于信号处理的CFD方法通常从采集到的复合故障信号中提取各个独立故障分量的特征;从而达到解耦和诊断复合故障的目的。然而,由于它们严重依赖于先进的信号处理方法和专家的经验知识,且无法揭示复合故障信号的耦合规律,因此对由三种或三种以上故障耦合而成的复杂复合故障的区分和解耦极为困难,限制了它们在复杂机械设备实际维修中的应用。 4.3 基于人工智能的CFD方法的应用基于人工智能的CFD方法旨在利用机器学习算法建立智能诊断模型,可以使CFD以模式识别的方式,将复合故障视为独立的模式进行分类或通过输出多个相应的单故障标签将其解耦为多个单一故障。基于人工智能的CFD方法的一般流程如图6所示。具体来说,首先收集监测数据/信号,从目标旋转机械来看,这是训练智能CFD模型的基础,因为这些方法通常通过观察给定的数据来识别复合故障。在监测数据采集完成后,选择合适的机器学习算法构建复合故障的IFD模型是关键的一步。一旦训练好IFD模型,就可以用端到端的方式对复合故障进行诊断,并从IFD模型的输出中得到相应的结果。众所周知,采集数据的数量和质量显著影响故障诊断的性能。因此,根据模型训练过程中是否有标注的复合故障数据,基于人工智能的方法可以分为两类:基于监督学习的CFD方法和基于无监督学习的CFD方法。图6 基于人工智能的CFD方法的一般流程1) 基于监督学习的方法基于监督学习的方法的本质是将CFD作为一个模式识别问题进行分类,简单地用另一个独立的标签对复合故障信号进行标注来训练CFD模型。也就是说,基于监督学习的方法与IFD方法一样,在过去十年中得到了广泛的研究。例如,Li等人详细介绍了IFD方法的一般过程,如图7 [3]所示,其中关键步骤是模型的构造。根据用于构建诊断模型的人工智能算法,基于监督学习的方法可以进一步划分:基于浅层学习的方法、基于深度学习的方法和基于多标记学习的方法。 图7智能故障诊断的一般流程[3] 基于浅层学习的方法通常使用传统的机器学习算法,如k最近邻( k-NN ) [91-94],概率图模型( PGM ) [95、96],支持向量机( SVM ) [97-102]和人工神经网络[103-107],来构建CFD模型。例如,Li和Yan等人利用小波变换( Wavelet Transform,WT )和经验模态分解( Empirical Mode Decomposition,EMD )等信号处理算法从非平稳振动信号中提取故障特征,并将其输入到模糊k - NN中对齿轮箱的多故障进行识别[91]。Li等人基于k - NN的核心思想提出了一种降维算法—最近最远距离保持投影( Nearest and Farthest Distance Preserving Projection,NFDPP ),并通过一个复合故障的汽车轴承数据集验证了该算法的有效性[92]。以非朴素贝叶斯模型( PGM的一个范例)为分类器,Asr等人提出了针对汽车变速箱的CFD方法[96]。作为一种流行的模式识别算法,Chen等人提出了一系列基于SVM的IFD方法,并将其应用于机车滚动轴承复合故障诊断中,实验结果表明这些方法更有效,优于其他对比方法[100、101]。同样,Lei等人提出了许多基于自适应神经模糊推理系统( ANFIS )和小波神经网络的混合IFD方法,提高了故障诊断[103、104]的准确性和可靠性。Wu等人将集成极限学习机( ELM )网络与二元分类器相结合,开发了两级齿轮箱的CFD方法。通过以上讨论可以发现,与基于故障机理的CFD方法和基于信号处理的CFD方法相比,基于浅层学习的CFD方法能够减少对专家经验和知识的依赖,在复合故障分类中表现出优势。然而,这些基于浅层学习算法的方法存在特征学习和提取能力差的局限性。与基于浅层学习的方法相比,其主要区别在于基于深度学习的方法旨在通过利用分层架构从原始振动信号中学习判别性和故障相关的表示,以端到端的方式弥合健康状况和监测数据之间的关系。学者们针对智能CFD开发了多种深度学习算法及其变体,如深度信念网络( DBNs ) [108-112]、稀疏自动编码器( SAE ) [113-117]、卷积神经网络( CNNs ) [118-126]、长短期记忆( LSTM )神经网络[127]、胶囊网络(CapsNet) [128]等[129]。例如,Shao等人提出了多种针对滚动轴承复合故障的IFD方法,其中DBNs算法与其他技术(如双树复小波包和压缩感知)相结合,以增强所提出的诊断模型[108、109]的性能;Xiang等提出了一种基于DBNs和将其应用于轴向柱塞泵[110]的多故障检测方法;Wang等人提出了一种模拟电路系统的CFD方法,在该方法中,带有AE的多个ELM被用于从原始信号中自动提取故障相关的表示[117];结合其他算法,如快速谱峭度(Fast Spectral Kurtosis,FSK)、支持向量机(Support Vector Machines,SVMs)和数据融合技术,CNNs也被许多学者开发并应用于旋转机械的CFD [118-126];Ma和Wang利用自适应chirp模型分解、Gini指数融合和LSTM等技术发展了一种CFD方法,获得了在轴承CFD上具有更好性能的故障诊断模型[127];Chen等人提出了一种快速鲁棒的CapsNet来检测通风机和水泵的复合故障[128]。尽管上述方法为旋转机械带来了许多成功的应用,但其明显的局限性在于这些方法只是简单地将复合故障视为与其对应的单一故障无关的独特故障进行故障分类。也就是说,这些方法忽略了复合故障与其对应的单一故障之间的关系。为了解决这个问题,引入了基于多标记学习的方法,使CFD具有多标记输出机制。与基于浅层学习和基于深度学习的方法仅用一个标签标注复合故障样本不同,基于多标签学习的方法通常用两个或多个标签标注复合故障样本进行监督学习。因此,通过输出多个标签,诊断模型可以将复合故障解耦为多个单一故障。近年来,基于多标记学习的方法引起了相关学者越来越多的关注,并基于这种思想提出了各种方法[130-135]。例如,Huang等人将深度卷积神经网络与多标签分类器相结合,开发了一个CFD框架,该分类器可以为测试样本输出单个或多个标签[130]。多标签分类器的本质是使用Sigmoid函数代替Softmax函数作为最后一个分类层的激活函数,使得每个分类神经元的输出概率是独立的,并且输出标签的数量可以通过定制的原则来确定。根据这些见解,有许多类似的方法已经被开发和研究用于旋转机械CFD[131-135]。从文献中可以得出结论,基于多标记学习的CFD方法的有效性已经得到了验证。然而,这些方法存在一个明显的局限性:这些模型的训练过程仍然依赖于带标签的复合故障数据,这对于在实际应用中开发有效的解决方案是一个困难的要求。还需要强调的是,如果复合故障数据不可得或无法标注,基于监督学习的CFD方法将失效,失去CFD的能力。2) 基于无监督学习的方法基于无监督学习的方法的本质是在没有复合故障数据的情况下将复合故障解耦为多个单一故障,这意味着CFD模型具有利用从单一故障数据中学习到的知识来诊断复合故障的能力。如图8所示,基于无监督学习的方法旨在模仿人类的现象,即通过捕获每个个体实体的关键特征,重叠的实体可以很容易地分离成相应的实体[3]。然而,对于基于人工智能的CFD方法来说,实现这样一个“简单”的任务仍然是一项具有挑战性的任务。幸运的是,在模型训练过程中复合故障数据不可用的场景下实现CFD已经进行了一些尝试,这一研究方向已经引起了学术界和工业界学者越来越多的关注[136-145]。 图8 图解复合故障解耦背后的动因[3] 第一个仅利用单故障数据对复合故障进行解耦的成功尝试是由Huang等人于2018年提出的深度解耦卷积神经网络( Deep Decoupling Convolutional Neural Network,DDCNN ) [136]。在DDCNN中,使用多个胶囊层构建解耦分类器作为传统Softmax分类器的替代者,其中复合故障样本可以解耦成具有多个标签的多个单一故障。在汽车变速器上进行的实验以无监督的方式证明了CFD的有效性。基于同样的目标,Dibaj等人提出了一种基于混合微调VMD和CNN的CFD方法,并将其应用于监测具有复合故障的齿轮箱[138]。在没有复合故障样本作为训练数据的情况下,Xing等人提出了一种基于零样本学习的智能CFD方法,并将其应用于旋转机械未知复合故障的检测[139]。从以上讨论可以得出结论,这些方法由于消除了对复合故障数据完备性的依赖,在CFD中取得了很大的进步。然而,上述方法的诊断性能仍受旋转机械工况变化的影响,阻碍了其在实际工业中的广泛应用。受迁移学习的核心思想启发,即通过学习来自不同但相关领域的通用知识来增强AI模型的泛化性能,Huang等人进一步提出了几种基于DTL算法的无监督智能CFD方法,如可迁移胶囊网络( Transferable CapsNet,TCN )和深度对抗胶囊网络( Deep Adversarial Capsule Network,DACN ),其中CFD模型的泛化性能在变化或未知工况[140、141]下得到了显著提升。具体来说,TCN的核心思想是将迁移学习技术嵌入到CFD模型(如DDCNN)中,该模型在变工况下具有比DDCNN更好的泛化性能[140]。引入对抗学习技术训练CFD模型,DACN进一步赋予CFD模型跨越未知工况智能解耦复合故障的能力[141]。基于DTL算法的CFD的更多细节可以在[3]中找到。除了基于DTL的算法,其他算法的变体,如零样本学习[142]和Caps Net [143],也被开发用于包括轴承和RV减速器在内的旋转机械CFD。通过以上讨论,近年来,工程师和学者们基于人工智能算法对旋转机械CFD进行了各种成功的尝试和应用。在他们的努力下,CFD模型的泛化性能得到了显著增强,并且通过引入无监督学习算法消除了对复合故障数据完整性的依赖。然而,从历史文献中不难发现,很少有工作关注3.1节中介绍的第三种复合故障,即发生在具有三个或三个以上单一故障的复杂机械系统中的复合故障。这些方面需要学者们在今后的研究中付出更多的努力。 5 未来的挑战与机遇尽管在过去的几十年里,来自学术界和工业界的学者和工程师为旋转机械的CFD带来了巨大的成功尝试,但在故障诊断领域,特别是在实际工业应用中,如何做出准确可靠的CFD仍然是一项重要而具有挑战性的任务[144]。这主要是由于历史的CFD方法远远落后于现代制造业对复杂机械智能维护的需求,而现代制造业更加强调诊断模型的可靠性和可解释性。因此,在概述了旋转机械CFD应用现状的基础上,对CFD中需要解决的挑战和有前途的机遇进行了讨论。5.1 复杂机械系统复合故障失效机理建模理解复合故障发生的物理失效机理是开发有效、准确的旋转机械故障诊断解决方案的基石。不可否认,4.1节中概述的基于失效机理的CFD方法旨在实现这一基本目标,并提供了许多揭示复合故障发生和演化根本原因的基本规律。然而,由于机械设备在结构、材料、功能、环境等方面的复杂性,对于复杂的机械系统,很难建立精确可靠的故障模型,更不用说复合故障了。因此,基于故障机理的CFD方法较少关注复杂机械系统的复合故障研究。因此,对于复杂机械系统复合故障的失效机理建模,应投入更多的精力。幸运的是,近年来,旨在构建与真实世界相同的物理系统、过程或环境的数字孪生技术引起了相关领域研究人员的日益关注[145]。我们相信,在不久的将来,它将是解决上述问题的一个很有前途的工具。5.2 信号处理算法的改进基于信号处理的CFD方法已经在许多实际工业应用中被证明可以有效地从复合故障信号中分离和提取每个独立故障分量的判别特征。然而,需要强调的是,没有一种通用的信号处理算法可以适用于CFD的所有场景,因为上述所有的信号处理方法都有各自的优缺点。此外,基于信号处理的CFD方法的诊断结果通常需要专家或工程师基于案例相关知识进行事后决策。因此,研究更强大的信号处理算法,提高其在实现CFD所需的各个方面的能力,如信号去噪性能、微弱故障的检测精度以及对更复杂的复合故障信号的解耦能力,是非常重要和必要的。随着传感技术的进步,在测量和失效机理技术中,基于信号处理的方法仍将是未来几十年的研究热点之一。 5.3 智能CFD模型的可解释性学者们基于人工智能算法为CFD的各个方面带来了巨大的、惊人的突破,这是公认的事实。然而,基于人工智能的CFD方法的瓶颈在于,这些算法被认为是一种不可解释的技术,缺乏说服机器操作者的理论依据,并且在长期的制造生产中无法重复和一致地工作。仍然很难理解或解释这些智能模型是如何以及为何做出最终决策的[146]。重要的是,在基于无监督学习的CFD方法中,很少有研究关注如何通过仅使用单一故障数据来训练CFD模型,将复合故障解耦为多个单一故障的可解释性。因此,缺乏清晰的可解释性成为开发面向实际应用的CFD解决方案的最大障碍。幸运的是,来自计算机科学领域和故障诊断领域的研究人员都投入了更多的精力来应对这些挑战。如何设计具有可解释性的CFD方法,增加其决策过程的透明性,也是故障诊断领域未来的发展趋势之一。5.4 更加智能的CFD方法尽管目前的IFD模型可以执行许多具有挑战性的任务,例如复合故障解耦和新兴故障检测,并且在某些方面的性能超过了人类水平[147、148],但仍然有许多能力是IFD模型无法执行的。大多数现有的人工智能算法很难完成一些人类容易完成的任务,例如从小的实例集 合中学习,对某事进行推断或猜测,以及实现多任务。与算法智能相比,人类智能在遇到高不确定性和低可预测性的情况时更加可靠。沿着这样的思路,我们相信,开发适应性更强、智能化程度更高的CFD方法将是未来不可阻挡的趋势,这将赋予智能模型模仿人类行为的能力。 6 结论在这篇综述文章中,对旋转机械的CFD进行了全面的调查,为潜在的读者和经验丰富的研究人员提供了一个系统的指南。在这项调查的开始,首先强调了对旋转机械实施CFD的重要性。介绍了CFD产生的背景,包括CFD的相关定义和分类,以便于下文讨论CFD的最新应用。从复合故障如何分离或解耦的角度,对3组CFD应用及其相应的子类进行了充分的探索和讨论,并总结了各自的优缺点。最后,概述了实施CFD的挑战和机遇,特别是针对复杂机械系统复合故障的失效机理建模、信号处理算法的能力提升、智能CFD模型的可解释性以及更智能的CFD方法,为故障诊断领域的研究人员开辟了一些未来的研究方向。 7 致谢本论文的研究工作得到了国家自然科学基金(52205100、52275111和52205101)、广东省自然科学基金(2023A1515012856)和中国博士后科学基金(2022M711197)的资助。欢迎大家留言交流~同时也欢迎大家投稿:woxuegongzhao@163.com 编辑:赵学功校核:李正平、陈凯歌、赵栓栓、曹希铭、白亮、陈少华该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除点击左下角阅读原文,即可在线阅读论文。来源:故障诊断与python学习

    未登录
    还没有评论
    课程
    培训
    服务
    行家
    VIP会员 学习 福利任务 兑换礼品
    下载APP
    联系我们
    帮助与反馈