首页/文章/ 详情

综述 | 数字孪生智能故障诊断最新进展综述(中)

1月前浏览343

接上期数字孪生智能故障诊断最新进展综述(上)。本期给大家推荐胡昌华教授的数字孪生智能故障诊断最新进展综述(中)。随着工业4.0时代的到来,智能制造和数字技术迅速发展,对工业设备的稳定性、可靠性和安全性提出了更高的要求。最近,数字孪生为智能故障诊断提供了一种新的解决方案。本文将从概念、关键技术、应用场景和挑战展望等方面对数字孪生技术在智能故障诊断的发展应用进行综述。

论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

论文基本信息


论文题目:

A state of the art in digital twin for intelligent fault diagnosis

论文期刊:Advanced Engineering Informatics

论文日期:2025年

论文链接:

https://doi.org/10.1016/j.aei.2024.102963

作者:Changhua Hu, Zeming Zhang, Chuanyang Li, Mingzhe Leng, Zhaoqiang Wang, Xinyi Wan, Chen Chen

机构:

Laboratory of Intelligent Control, PLA Rocket Force University of Engineering, Xi’an 710025, China

通讯作者邮箱: 

li_chuanyang@yeah.net


目录

1 摘要

2 引言

      2.1 相关工作回顾

      2.2 本文目的

3 研究方法

3.1 文献综述方法

3.2 文献分类标准

数字孪生的研究进展

4.1 数字孪生的起源与概念

4.2 数字孪生关键技术

5 智能故障诊断研究进展

      5.1 智能故障诊断定义及相关概念

      5.2 智能故障诊断方法

(以上标记章节为本文内容)

6 数字孪生在智能故障诊断中的应用

      6.1 数字孪生在工业制造领域智能故障诊断中的应用

      6.2 数字孪生在能源领域智能故障诊断中的应用

      6.3 数字孪生在航空航天领域智能故障诊断中的应用

      6.4 数字孪生在其他领域智能故障诊断中的应用

7 建议与未来展望

      7.1 面向数字孪生技术

      7.2 面向智能故障诊断

      7.3 面向数字孪生的智能故障诊断

8 总结

1 摘要

随着工业4.0时代的到来,智能制造和数字技术迅速发展,对工业设备的稳定性、可靠性和安全性提出了更高的要求。故障诊断(Fault Diagnosis, FD)是保证设备正常运行的关键步骤,其准确性和效率直接影响设备的稳定运行和经济效益。随着人工智能(Artificial Intelligence, AI)技术的进步,数据驱动的故障诊断方法在智能领域得到了发展,即智能故障诊断(Intelligent Fault Diagnosis, IFD)。最近,为IFD提供了一种新的解决方案。这就是数字孪生(Digital Twin, DT),一种连接物理世界和虚拟世界的桥梁技术。许多研究人员发表了关于使用DT技术进行设备IFD的研究。本文分析了2017年至2024年的260篇文章,系统地讨论了DT、IFD以及DT在IFD中的应用。首先,详细介绍了DT和IFD的概念、关键技术和应用场景;然后,重点介绍了DT技术在IFD领域的应用;最后,本文总结了存在的问题和挑战,提出了解决问题的建议,并对未来的发展进行了展望。这项工作有望为相关领域的研究人员提供有价值的参考和利用,并促进DT技术在IFD领域的进一步发展和应用。

关键词:工业4.0,数字孪生,智能故障诊断,文献综述

5 智能故障诊断研究进展

5.1 智能故障诊断定义及相关概念

故障通常定义为设备、系统或过程中的任何异常或不期望的状态,导致其无法 正常运行或无法按预期执行。故障的存在通常表明性能下降或偏离正常操作条件,可能由多种原因引起,如机械磨损、材料疲劳、组件老化、操作错误、设计缺陷或环境影响[80][81]。故障可能引发系统中的各种问题,因此,及时实施故障诊断是确保设备运行可靠性、提高生产力、减少维护成本、预防事故以及优化维护计划的必要措施。

故障诊断是通过监控和分析系统或设备,确定其是否存在故障,以及故障的类型、位置和程度的过程。它是确保设备正常运行、提高生产力和减少维护成本的重要工具[82]。然而,传统的故障诊断方法依赖于设备维护人员的经验和知识,通过监测和分析声音、温度、振动等参数来判断设备的状态[83]。这一过程如图8所示。

图8 传统故障诊断流程

随着人工智能、机器学习、大数据等技术的发展,智能故障诊断成为一个热门的研究领域。智能故障诊断是AI与故障诊断相结合的产物,利用AI技术自动监测和分析系统、组件或设备的运行状态,以检测和识别潜在或现有的故障,并确定其性质和原因[84]。智能故障诊断旨在提高故障诊断的准确性和效率,减少人工干预和误判,使故障诊断过程更加自动化和智能化[85]。它为维护和优化决策提供了科学依据,为现代复杂设备的可靠性维护提供了新的方法。智能故障诊断的过程如图9所示。

图9 智能故障诊断流程

从图8和图9可以看出,在传统的故障诊断过程中,手动操作是普遍存在的,从故障发生到检测、判断、干预和效果验证等每个步骤都需要人工参与和基于经验的判断。相比之下,在智能故障诊断中,过程更加自动化和数据驱动,涵盖了数据采集、预处理、模型分析、故障诊断,甚至干预实施和性能监测,显著提高了故障诊断的效率和准确性。

智能故障诊断可以视为故障诊断领域的技术创新,它是在传统故障诊断基础上引入现代技术手段,实现的一种更先进和自动化的故障诊断与分析方法,从而推动故障诊断技术向更加智能和高效的方向发展。

5.2 智能故障诊断方法

智能故障检测与诊断方法运用机器学习和迁移学习等人工智能技术,自动检测和诊断设备或系统的故障。其核心理念是对设备运行数据进行处理和分析,自动学习故障模式以区分正常与异常状态,从而实现高效准确的故障检测与诊断,减少人工干预,提高系统的可靠性和安全性。本节根据基于传统机器学习、深度学习和迁移学习的IFD方法进行总结,并介绍每类方法中的几种主流算法以及近年来的相关文献。

5.2.1 基于传统机器学习的IFD方法

SML方法在故障检测中的应用历史悠久,在许多工业场景中依然表现出色。SML模型结构简单,易于理解其决策过程和内部机制。由于通常不包含多层隐藏层,其具有较高的可解释性、较低的计算复杂度和较强的泛化能力。

基于SML的IFD方法是指通过对经过预处理和特征提取的运行数据应用简单的机器学习算法,自动诊断故障。其典型步骤包括数据采集与预处理、特征工程(特征提取与选择)、模型训练与验证,以及故障状态的分类和识别。常见的SML方法包括支持向量机[86][87]、决策树[88][89]、随机森林[90][91]和k近邻[92][93]。

1) 支持向量机

SVM由Cortes等人于1963年首次提出[94],是一种基于统计学中结构风险最小化概念的监督学习算法,其核心思想是在数据集中找到一个能最大化不同类数据点边界的最优超平面。

由于实际应用中难以获得足够的故障样本,SVM因其处理小样本数据的能力、良好的泛化性能、高维数据处理能力以及对异常值的不敏感性,广泛应用于故障检测。Ma等人[95]通过子空间交叉技术估计系统的互连项,并基于这些互连项及输入输出数据设计了子系统的故障检测器,同时引入遗传算法优化SVM参数以提高检测性能。Yan等人[86]基于粒子群优化算法构建SVM分类模型,实现了滚动轴承的多故障状态识别。Suo等人[96]提出了一种基于模糊贝叶斯风险和SVM的数据驱动故障检测策略,实现了卫星电源系统的故障检测。Zhao等人[97]通过构建高斯核和多项式核的多核SVM,实现了风机轴承的故障检测,与传统SVM相比诊断精度更高。Wei等人[98]结合聚类多数加权少数过采样和飞蛾火焰优化最小二乘SVM技术,解决了滚动轴承故障检测中的类别不平衡问题。Sarita等人[99]使用SVM技术进行故障检测和分类,并提出了一种基于小波包熵的故障定位算法,快速检测并定位多电平转换器中IGBT的开路故障。Ding等人[100]通过多个SVM分类器和混合优化算法实现故障检测,该方法结合了粒子群算法的全局搜索能力和鸽巢搜索算法的局部搜索能力,优化了多SVM分类器的参数,增强了其诊断性能。

2) 决策树与随机森林

决策树是一种基于树结构的监督学习算法,通过递归分裂数据构建模型,具有简单、直观且易于解释的特点,非常适合处理具有明确类标签的数据。决策树在故障检测任务中通过快速建立规则集,根据特征直接判断设备故障类型,已广泛应用于旋转机械和轴承等设备的故障分类任务。Praveenkumar等人[101]对汽车变速器的振动数据进行了时域和频域分析,利用决策树算法对归一化特征进行分类,实现了齿轮和轴承故障的实时诊断。Benkercha等人[102]基于气象和电力系统数据,采用C4.5决策树算法进行故障检测和诊断,其模型能够有效检测光伏系统的故障状态并识别具体故障类型。然而,决策树容易在含噪声训练数据中出现过拟合问题。

随机森林通过集成学习方法结合多个决策树,采用随机采样训练并通过投票或平均方式结合结果,显著提高模型的准确性和鲁棒性。在故障检测中,随机森林能够有效处理复杂的非线性故障模式,对噪声具有较强的抵抗力,适合处理高维数据。Wang等人[105]提出了一种基于小波包降噪和随机森林算法的滚动轴承故障检测方法,在模拟和实际轴承振动信号上均表现出较高的分类精度。Chen等人[90]利用网格搜索优化随机森林模型,在光伏阵列故障检测中表现出较高的诊断准确性,优于传统决策树方法。

3) K近邻

KNN是一种基于实例的非参数监督学习算法,其核心原理是计算待分类样本与训练集中各样本的距离,选择最近的k个邻居,并通过这些邻居的类别进行投票以确定样本的类别。在小样本或低噪声水平的情况下,KNN依然是故障分类的有效基准模型。例如,Madeti等人[111]基于光伏系统的实验数据提出了一种KNN故障检测与诊断技术,Song等人[112]提出了一种基于标准化KNN算法的故障检测方法,通过引入标准化距离和不同邻居的重要性权重,提高了故障检测的准确性,同时通过贪心算法降低了多变量故障检测的计算复杂度。

5.2.2 基于深度学习的IFD方法

DL 具备强大的数据处理和特征提取能力,能够从复杂的原始数据中自动学习高层次特征表示。这使得 DL 广泛应用于 FD,近年来已成为一种快速发展的高效方法。

基于 DL 的智能故障检测方法主要包括三个步骤:数据预处理、自动特征提取和故障分类。首先,原始数据经过降噪和归一化等预处理,以消除冗余和干扰;随后,DL 模型执行特征提取,自动识别数据中的潜在表示和故障模式;最后,基于提取的特征进行故障分类,以确定故障的类型和位置。常用的 DL 方法包括卷积神经网络[118]、循环神经网络[119]、长短期记忆网络 [120]、自编码器[121]、深度信念网络[122]、生成对抗网络[22]、扩散模型 [123] 和图卷积网络[124] 等。

鉴于基于 DL 的 IFD 方法近年来受到了广泛关注,每年都有大量相关文章发表。因此,本节总结了近年来主流 DL 方法在 IFD 中的应用,以反映其最新研究进展。

1)卷积神经网络

卷积神经网络(Convolutional Neural Network, CNN) 是一种典型的深度前馈神经网络,受生物感知机制的启发,通常由卷积层、池化层和全连接层组成。其核心理念是结合稀疏连接、权重共享和空间或时间下采样,通过从局部输入图像中逐步提取特征,完成分类和检测等任务 [125]。

在 IFD 中,CNN 在处理复杂数据和提取关键特征方面表现出色。通过端到端学习,CNN 能够从原始信号或图像数据中自动提取并分类复杂的故障特征。通过训练和优化 CNN 模型,可以提高 FD 的准确性和效率,为工业生产和设备维护提供强有力的支持。

CNN 可处理多种数据类型,包括一维 (one-dimensional, 1D) 和二维 (two-dimensional, 2D) 数据。1D 数据通常源自时间序列,例如机械设备的振动、温度或电流信号,可直接输入 CNN 进行 FD。Wang 等人 [126] 提出了一种基于多模态数据融合和 1D-CNN 网络的轴承 FD 方法,利用 1D-CNN 联合处理振动和声学信号,实现 FD,展示了其处理多源信号的能力。Ye 等人 [127] 通过引入早停和自注意机制增强了 1D-CNN,并结合变分模态分解实现滚动轴承的 FD。Zhang 等人 [128] 将 1D-CNN 与零样本方法相结合,有效解决了未知故障类别中训练样本不足的问题。Pang 等人 [129] 开发了一种可解释且轻量化的改进型 1D-CNN FD 模型,其特征提取层采用单层结构,省略了偏置、激活函数和池化层,替代传统全连接层的是带平方操作的全局平均池化层。该方法的有效性通过消融研究和对比实验得到验证。

同时,CNN 在利用整体数据结构处理高维信息和提取复杂空间特征方面具有优势,这在 1D 数据分析中具有挑战性。因此,一些学者将 1D 数据转换为 2D 图像或直接获取 2D 图像数据以进行 FD。Tang 等人 [130] 使用同步压缩小波变换将来自压力、振动和声学传感器的时间序列数据转换为 2D 图像,再利用深度自适应归一化 CNN 模型进行准确稳定的故障识别。Xiong 等人 [131] 通过结合基于互维和相似 Gram 矩阵的数据预处理方法与 CNN 模型,提高了传统无量纲 FD 方法的准确性。Sinitsin 等人 [132] 提出了一种混合输入 CNN 与多层感知器模型,结合原始振动信号和视频图像转换,实现 IFD。Huang 等人 [133] 引入多尺度 CNN 方法,利用小波包分解有效提取多尺度特征,保留关键故障信息,并增强特征提取、诊断和泛化能力,优于传统 CNN。Liu 等人 [134] 使用连续小波变换将振动信号转换为图像,再通过 CNN 进行特征提取,并利用优化的极限学习机进行分类,实现风力涡轮机轴承诊断。Vashishtha 等人 [135] 开发了一种新的优化算法,以微调 CNN 超参数,自适应提取时间频率图像中的故障信息,用于螺旋齿轮箱的智能诊断。Yu 等人 [136] 基于机制特征生成模型生成虚拟故障样本扩展训练数据,并结合 CNN 实现小样本情况下的旋转机械 FD。Yang 等人 [137] 提出了一种结合 SVM 的 CNN 集成方法,通过融合不同图像特征进行分类。

2)循环神经网络和长短期记忆网络

循环神经网络(Recurrent Neural Network, RNN) 是一种为处理序列数据(包括文本、语音和时间序列)设计的深度学习模型 [138]。其特点是在网络结构中引入循环机制,可以处理任意长度的序列数据,并通过在序列时间步之间传递隐藏状态来捕获时间依赖关系。

在 IFD 中,Mohammadi 等人 [139] 提出了一种基于 RNN 残差的数值积分分析方法,并成功应用于动态系统的故障诊断。Li 等人 [140] 开发了一种将振动信号转化为图像的图像处理方法,并在卷积块注意力模块中使用基于双阶段注意力的 RNN,用于不平衡数据条件下滚动轴承的故障诊断,并通过两个数据集验证了该方法的有效性。Mansouri 等人 [141] 提出了一种基于区间值降维 RNN 的故障检测和诊断方法,在风能转换系统的故障检测和诊断方面具有创新性。Bouazzi 等人 [142] 使用贝叶斯算法优化构建的 RNN 模型,有效提高了故障诊断的准确性。然而,标准 RNN 在处理长期依赖关系时经常会遇到梯度消失或梯度爆炸的问题,从而限制了其效果 [143]。为了解决这一问题,LSTM 被引入深度学习领域。

长短期记忆网络是一种特殊的 RNN 架构,通过引入记忆单元和门控机制来捕获和保持长期记忆。它可以更好地处理具有长期依赖关系的序列数据,特别是在需要学习长期依赖信息的故障预测和诊断中具有优势。An 等人 [144] 提出了一种基于周期稀疏注意力和 LSTM 的故障诊断方法,利用轴承故障的周期性特征。为了提高诊断的准确性和效率,研究者将 LSTM 与 CNN 结合用于故障诊断。例如,Huang 等人 [145] 使用 CNN 和 LSTM 分别处理故障诊断中的特征提取和时间延迟信息,并取得了显著效果。Li 等人 [146] 开发了一种 CNN 和 LSTM 融合模型,用于故障诊断和传感器校准,高效处理时间序列数据并增强特征提取和学习能力。

同时,一些学者改进了 LSTM。Ren 等人 [147] 提出了一种基于超特征和堆叠 LSTM 的故障诊断方法,有效提高了工业生产过程系统的诊断精度。Han 等人 [148] 开发了一种增强型 LSTM 模型,用于解决传统 LSTM 中的信息不平衡问题,并将其输出与 SVM 结合进行故障分类,在多种故障类型上表现优异。Shi 等人 [149] 提出了一种用于行星齿轮箱故障诊断的双向卷积 LSTM 模型。

一些学者通过优化算法改进了诊断性能,优化模型的超参数。例如,Dao 等人 [150] 使用 CNN 自适应地提取并减少故障特征,并将其输入 LSTM 模型进行学习和训练,同时使用贝叶斯优化算法优化模型超参数,从而提高了诊断准确性。Si 等人 [151] 提出了一种基于注意力协作堆叠 LSTM 网络的多信息特征融合诊断方法,并利用粒子群优化算法智能调整网络超参数,以提高模型的诊断性能和有效性。

3)生成对抗网络

生成对抗网络(Generative Adversarial Network, GAN)是一种经典的生成模型,采用创新的对抗性深度学习训练框架,由Ian Goodfellow及其同事在2014年首次提出[152]。GAN由两个主要网络组成:生成器和判别器。生成器的目标是从随机噪声中生成数据,模仿实际数据的分布,而判别器则评估这些数据是来自实际数据集还是生成器。两个网络在训练过程中相互对抗,不断提升其性能,形成一种“博弈”关系。

在故障诊断中,故障数据通常在实际应用中稀缺且不平衡,GAN通过生成合成的故障数据来提高数据的质量和数量,从而增强故障诊断模型的准确性和鲁棒性。尽管GAN主要用于生成任务,但它在故障分类中也发挥了重要作用,尤其是在数据增强、特征表示学习和模型泛化能力提升等方面具有创新性应用。

例如,Xu等人[153]将轴承的动态模型与GAN结合,解决了零样本故障诊断的新问题。Su等人[154]利用GAN生成与实际数据分布相似的故障特征,通过逻辑回归分割来实现风力发电机齿轮箱在不平衡数据条件下的故障诊断。Du等人[155]提出了一种结合GAN与增量学习和支持向量机模型的故障诊断方法,取得了可接受的诊断准确度。Bai等人[156]提出了一种能够有效处理短时序列数据并保持高准确度的故障诊断方法,结合了时间间隔返回图特征提取和GAN数据增强。

尽管GAN在解决数据不平衡问题和故障诊断等领域展现了巨大的潜力,但仍面临如崩溃、过拟合和训练不稳定等挑战。为了解决这些问题,研究人员提出了多种改进的GAN变体。例如,Li等人[157]通过引入独立分类器并增强监督模型,提升了辅助分类器GAN的判别精度,并增强了多模态故障数据的生成能力,特别针对数据不平衡的故障诊断问题。Guo等人[158]采用了梯度惩罚的Wasserstein GAN来生成故障特征,并与小波包变换相结合,诊断风力发电机齿轮箱的故障。Fan等人[159]提出了一种改进的GAN,通过引入梯度归一化来提高训练稳定性,并使用全注意力机制提高生成器的特征学习能力,从而生成高质量的样本。然后,使用浅层1D-CNN进行故障诊断,验证了该方法在样本不平衡故障诊断中的优越性。

Liu等人[160]将Harr小波引入GAN用于数据增强和故障诊断;Shang等人[161]提出了一种新型的多模式生成器和模式切换策略,增强了GAN的稳定性以及数据的质量和多样性,成功解决了管道故障诊断中的类别不平衡问题。针对故障样本数据不足,导致故障识别和分析困难的问题,Zhang等人[162]利用深度卷积GAN生成虚拟故障数据,扩展了训练样本并增强了数据多样性,并结合残差链接的CNN模型用于永磁电动机的故障诊断。Xu等人[163]提出了一种新颖的机制—数据融合诊断方案,将轴承动态模型与多智能体多样性GAN融合,促进模拟域与真实域之间的转换并共享诊断知识,从而解决样本稀缺问题,提升了故障诊断性能。

针对严重数据不平衡场景中故障样本稀缺的普遍问题,Ren等人[164]提出了一种基于少样本GAN的故障诊断方法。Gao等人[165]提出了一种改进的条件GAN方法,在故障样本极其有限的情况下进行数据增强,并成功应用于电潜油泵的故障诊断。Wang等人[166]提出了一种零样本故障诊断方法,采用类别关联建模方法,通过增强稀疏约束GAN,在不同的工作条件下建立类别之间的关系,从而实现新环境下的零样本故障诊断。

4)扩散模型

扩散模型 (Diffusion Model, DM) 是一类基于概率扩散过程的生成模型。其核心思想是模拟扩散过程,即通过逐步向数据添加噪声,使其最终接近完全随机的噪声分布,然后通过反向去噪的过程逐步重建数据,生成与真实数据分布相似的新样本[167]。与其他生成模型,如生成对抗网络相比,DM的生成过程更稳定,不依赖于对抗训练。因此,DM在生成高质量和多样化数据方面表现优异,通常适用于高维数据生成任务。近年来,DM因其在图像生成等任务中的出色表现而受到广泛关注[168]。

在故障诊断中,DM通过逐渐生成接近真实故障分布的数据,既能生成高质量的故障数据,又能有效增强数据集,同时保持数据的多样性,弥补了传统数据增强方法的不足。Yau等人[169]使用DM进行故障数据增强,通过仅使用少量轴承声音数据提高故障检测模型的性能。Mueller[170]提出了一种基于注意力增强的条件扩散模型,用于生成类似真实数据的合成数据,这显著减轻了数据稀缺和类别不平衡对机器故障诊断结果的影响。Wei等人[171]提出了一种基于混合多样性损失扩散模型和参数转移的轴承故障数据增强方法。该方法无需分类器的指导即可生成多类样本,并通过参数转移技术改善小样本数据集的性能,从而即使在没有真实数据的训练集情况下,模型也能保持较好的诊断性能。

随着DM在故障诊断领域的广泛应用,越来越多的研究者开始关注如何通过改进模型结构和生成策略进一步提升数据增强效果和诊断性能。越来越多先进的DM模型相继问世。为了应对传统生成对抗网络方法训练过程中常见的模式崩塌和不稳定问题,Yang等人[172]提出了一种基于去噪扩散概率模型的数据增强新方法,以解决工业故障诊断中的数据不平衡问题。该方法通过物理仿真生成样本,避免了这些问题,并提供了更稳定的训练过程。实验结果表明,这种方法优于其他现有的数据增强算法。Yu等人[173]设计了一种重新参数化的残差扩散模型,改善了滚动轴承故障诊断中的数据不平衡问题,并通过优化模型架构和特征提取,显著提高了模型性能。Zhang等人[174]提出了一种可解释的潜在去噪扩散概率模型,通过将数据压缩至低维潜在空间,并结合可解释的卷积核提取与故障相关的信息,从而在数据稀缺的情况下提高机械故障诊断的准确性。

6)图卷积网络 

图卷积网络 (Graph Convolutional Network, GCN) 是一种擅长处理图结构数据的深度学习模型。其核心思想是通过卷积操作将邻接节点的信息聚合到目标节点,从而进行特征学习和分类。与传统的卷积神经网络不同,GCN能够有效处理非欧几里得空间数据,如图形、社交网络和传感器网络[175]。在过去两年中,GCN在故障诊断领域也展现出了良好的发展趋势。特别是在复杂系统的设备健康监测和故障诊断中,由于设备通常具有复杂的拓扑结构,GCN可以利用图结构建模节点之间的关系,并提取有用的故障特征。

在IFD中,Liao等人[176]提出了一种基于GCN的变换器故障诊断方法,该方法能够同时使用图卷积层提取气体溶解数据与故障类型之间的复杂非线性关系。实验结果证明,该方法在不同输入特征和数据量下,故障诊断的准确性优于CNN、KNN等方法。Chen等人[177]提出了一种融合测量数据和先验知识的GCN故障诊断方法。首先,通过结构分析进行初步诊断,然后将结果转化为关联图,并将其与测量数据一同输入GCN模型进行故障分类,显著提高了故障诊断的准确性。

尽管GCN在IFD领域表现良好,其应用仍面临一些挑战。例如,GCN依赖于图的拓扑结构来聚合节点特征,但故障数据通常是非结构化或不规则的,这就需要将这些数据有效地转化为适合的图结构[178]。此外,GCN具有较高的计算复杂度,尤其是在大规模网络数据中,容易产生计算瓶颈。因此,部分学者提出了各种改进方法,以提高GCN的计算效率和诊断性能。为了解决传统单通道数据未能充分反映机电耦合系统故障特征的问题,Zhang等人[179]提出了一种改进的GCN模型,结合多源信息融合技术用于机电系统的故障诊断。他们利用KNN算法构建图数据,并将Dirichlet分布和Softplus层引入GCN网络,替代传统的Softmax层,优化了图数据构建和分类过程,同时有效解决了分类过程中的过度自信问题。与此同时,他们提出了一种简化的D-S证据理论来处理多源信息融合中的冲突,从而提高了故障诊断的准确性和可信度,尤其在强噪声环境下表现出了卓越的鲁棒性。此外,团队还解决了传统GCN只能捕捉相邻节点关系的局限性,提出了一种基于超图神经网络的新方法[180],该方法构建了能够连接多个节点的边,从而捕捉更复杂的多节点关系。该网络首次应用于电流信号分析,广泛的实验验证了其在复杂机械系统故障诊断中的有效性和可靠性。Xiang等人[181]提出了一种基于精细拓扑和时空GCN的齿轮箱故障诊断方法,解决了传统GCN方法中拓扑构建不准确、基于单一指标的边权计算导致节点间关系片面表示以及时空信息提取不足的问题。

5.2.3 基于迁移学习的IFD方法

迁移学习是一种将来自数据和知识丰富的领域(源域)的模型或知识,迁移到需要应对新挑战的领域(目标域),从而增强目标领域学习的技术[182]。在许多领域,如机械设备、电气系统和网络安全中,经常出现新的故障类型或新的运行条件,这使得基于传统机器学习方法的故障诊断模型需要不断收集数据并从头开始训练,这不仅效率低下,而且成本高昂。迁移学习正是针对这一挑战提供了解决方案。

基于TL的故障诊断方法利用现有的故障数据和诊断经验(源域),以应对新的和未知的故障(目标域),借助已有的知识解决新领域或任务中的故障诊断问题。常见的迁移学习方法包括模型迁移和特征迁移,这些方法有助于在不同的工作条件或设备类型之间进行故障诊断[183]。跨案例迁移涉及将故障诊断知识转移到同一设备的不同运行条件(例如不同的转速、负载)。跨设备迁移则应用将一个设备的故障诊断知识迁移到另一个设备,使用现有设备的数据来支持新设备的故障诊断,从而减少对新设备故障数据的依赖。本节还提供了近年来基于迁移学习的故障诊断方法的文献综述,以反映其最新的研究进展。

1)基于模型迁移的故障诊断

基于模型迁移的故障诊断方法通过微调预训练模型以适应新任务,从而实现知识迁移。最初,使用源领域的带标签数据构建诊断模型。然后,利用目标领域的一小部分带标签数据对该模型进行微调,以使其适应新任务。该方法在处理大数据集时节省了计算资源。Deng等人[184]应用模型迁移策略进行跨领域故障诊断,通过比较各种策略并使用t-SNE可视化结果,优化了诊断准确性。Zhong等人[185]开发了一种基于自注意力的轻量级诊断模型,该模型在ImageNet上训练,向目标模型转移了大量参数知识,然后通过少量样本进行微调,以便在资源有限的平台上进行准确的故障诊断。Zhang等人[186]提出了一种高效且精确的故障诊断方法,结合了连续小波变换、卷积神经网络和支持向量机模型迁移,克服了传统方法的局限性。该方法在多个故障数据集上进行了验证,取得了良好的结果。Zhong等人[187]将深度卷积生成对抗网络与自注意力和谱归一化相结合,提出了一种基于VGG-16的微调迁移学习方法,改进了轴承故障诊断结果。Asutkar等人[188]讨论了机器故障诊断中领域适应和迁移学习的挑战,提出了一种基于轻量级CNN的迁移学习方法,改善了模型的泛化能力。Chen等人[189]提出了一种新型的1D-CNN故障诊断方法,促进了来自多个源领域到多个目标领域的知识迁移。与传统的单源单目标领域方法相比,该方法为复杂的故障诊断挑战提供了更强的解决方案。Liang等人[190]提出了一种结合Isolation Forest的无监督深度迁移学习方法,用于机器故障诊断,并通过参数微调进一步提高了深度模型的准确性,在机器故障诊断领域具有很高的实用价值和应用前景。Wang等人[191]引入了一种增强型1D视觉变换器和迁移学习策略,用于模拟电路中的间歇性故障诊断。

基于模型迁移的故障诊断方法有效解决了数据不平衡问题,通过在源领域进行离线训练,然后微调预训练模型以应用于目标领域。这种方法在故障数据稀缺或难以标注的情况下尤其有用,显著提高了故障诊断的效率和准确性。离线训练与在线诊断相结合,使得模型迁移在各行各业的故障诊断中展示了广泛的应用潜力。然而,除了直接迁移预训练模型外,特征迁移方法则通过寻找源领域和目标领域之间的共同特征表示,构建共享特征空间,从而使跨领域故障诊断更加灵活。接下来将讨论基于特征迁移的故障诊断方法,这些方法通过特征提取和映射,进一步提高了不同工作条件和设备上的故障诊断性能。

2)基于特征迁移的故障诊断

基于特征迁移的故障诊断方法主要关注识别源领域和目标领域之间的共同特征表示,以促进知识迁移。该方法通过从源领域和目标领域提取共同特征来构建共享特征空间,从而实现有效的跨领域故障诊断。基于特征迁移的方法可以分为两类:基于最大均值差异(Maximum Mean Discrepancy, MMD)的深度迁移学习诊断和基于领域对抗神经网络的深度迁移学习诊断。

在基于MMD的方法中,Wang等人[192]提出了一种多尺度深度类内适应迁移学习网络,用于不同工作条件下的轴承故障诊断。他们通过改进的ResNet-50提取低级特征,使用多尺度特征提取器分析高级特征,并引入条件MMD来减少领域间分布的差异。他们还结合伪标签计算进一步提高了未标注数据的诊断准确性。Yang等人[193]设计了一种深度部分迁移学习网络架构,领域判别器自动学习不对称因子,使用MMD调整源领域样本的权重,有选择地转移诊断知识。这能够有效提高诊断模型的性能,尤其是当源领域和目标领域的数据分布不平衡时。Xu等人[194]采用迭代剪枝技术压缩模型,减少冗余通道,并结合MMD度量最小化不同领域数据分布的差异,从而提高跨领域故障诊断的效率和准确性。通过减少内存使用、计算成本和推理时间,诊断准确性得以保持或提高。针对传统MMD方法在表示数据分布方差信息时能力有限的问题,Qian等人[195]提出了一种新的差异表示度量——最大均方差异(Maximum Mean Square Discrepancy, MMSD),该方法不仅反映了数据样本的均值信息,还全面表达了样本的方差信息。通过在风力发电机行星齿轮箱的跨负载转移诊断实验中验证了该方法在诊断准确性和分布差异表示能力方面的优越性。

在基于对抗神经网络的方法中,Song等人[196]通过领域适应网络最小化源领域和目标领域之间的特征差异,并在源领域数据上训练分类模型。然后,使用伪标记的目标领域测试数据重新训练领域适应网络,该方法在不同工作条件和环境下的故障诊断中表现出色,具有良好的领域适应性和高诊断准确性。为了解决在缺乏标记数据或标记数据不足的情况下的故障诊断问题,Cheng等人[197]提出了一种基于Wasserstein距离的深度对抗迁移学习网络。在多个转移场景中的实验表明,该方法能够有效处理实际工业环境中的故障诊断问题。Li等人[198]设计了一种新的加权对抗转移网络,通过引入对抗训练来学习判别特征和领域不变特征。该方法采用加权学习策略来识别和过滤掉源领域中与目标领域无关的样本,从而减少共享类别之间的分布差异,在多个故障诊断数据集上表现优于现有方法。


编辑:任超
校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、海洋、Tina、陈宇航、陈莹洁,王金
该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除
点击左下角阅读原文,即可在线阅读论文。


来源:故障诊断与python学习
振动疲劳非线性旋转机械电源航空航天汽车电力python风能UM理论电机材料数字孪生人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-01-11
最近编辑:1月前
故障诊断与python学习
硕士 签名征集中
获赞 77粉丝 82文章 170课程 0
点赞
收藏
作者推荐

ASOC论文学习 | 一种数据不平衡下数字孪生辅助的滚动轴承故障诊断框架

本期给大家推荐由作者投稿的文章《一种数据不平衡下数字孪生辅助的滚动轴承故障诊断框架》。本文提出了一种数字孪生辅助的诊断模型,作者通过试验台数据和工程实测数据进行验证,结果表明所提框架的诊断性能显著优于现有方法,这对于深度学习故障诊断方法在工业环境中的应用具有重要意义,适合于研究数字孪生和深度学习方法融合的学习者。(投稿方式点击这)论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Digital twin-assisted fault diagnosis framework for rolling bearings under imbalanced data论文期刊:Applied Soft Computing论文日期:2025年论文链接:https://doi.org/10.1016/j.asoc.2024.112528作者:Zhen Ming , Baoping Tang *, Lei Deng , Qichao Yang , Qikang Li机构:The State Key Laboratory of Mechanical Transmission, Chongqing University, Chongqing 400030, China目录1 摘要2 引言3 预备知识3.1 问题定义3.2 轴承动力学仿真模型4 所提数字孪生辅助的不平衡故障诊断框架4.1 数字孪生辅助的数据融合策略 DTDFS 4.1.1 数据分解与重构 4.1.2 数字孪生数据筛选4.2 频域滤波子域适应网络FFSAN 4.2.1 深度频域滤波的特征提取器 4.2.2 子域自适应机制 4.2.3 优化目标5 实验与结果分析5.1 航空轴承全寿命加速试验数据集5.2 结果分析 5.2.1 数字孪生辅助的数据融合策略有效性分析 5.2.2 诊断性能分析6 工程应用6.1 风电齿轮箱轴承数据集6.2 结果分析 6.2.1 数字孪生辅助的数据融合策略有效性分析 6.2.2 诊断性能分析7 总结1 摘要实际工业场景中数据不平衡制约了深度学习故障诊断方法的应用。许多研究提出将动力学模型响应集成到训练过程中以解决数据不平衡问题,但动力学模型响应与实测数据之间存在显著的分布差异,导致诊断性能欠佳。针对上述问题,本研究提出了一种数据不平衡下数字孪生辅助的滚动轴承故障诊断框架,旨在通过信息传递和领域适应最小化动力学模型响应与实测数据之间的分布差异。首先,提出了数字孪生辅助的数据融合策略(Digital Twin-assisted Data Fusion Strategy, DTDFS),通过信号分解与虚实融合重构,实现从物理实体到动力学模型的信息传递,生成用于数据增强的数字孪生数据。其次,提出频域滤波子域适应网络(Frequency Filter Subdomain Adaptation Network, FFSAN)实现数字孪生数据与实测数据间的领域适应,构建频域滤波模块缓解DTDFS过程中的能量变化,采用子域自适应机制实现孪生数据与实测数据间的细粒度特征对齐。最后,通过试验台数据和工程实测数据进行验证,结果表明所提框架的诊断性能显著优于现有方法,这对于深度学习故障诊断方法在工业环境中的应用具有重要意义。关键词:数字孪生、分布差异、数据融合、滚动轴承、不平衡故障诊断2 引言滚动轴承是机械传动系统中的关键部件[1,2],被广泛应用于航空航天、风力发电等重要行业。滚动轴承的健康状态对于设备运行的安全与稳定具有重大影响,一旦发生故障需要及时采取相应措施,否则可能造成经济损失和人员伤亡[3,4]。因此,滚动轴承故障诊断技术对于保证设备安全平稳运行、指导设备维修具有重要意义[5,6]。深度学习[7]由于其强大的自适应特征提取能力被广泛应用于故障诊断领域[8–10]。然而,深度学习模型通常基于各类样本分布均衡的假设,这些条件在实际工业中难以满足[11]。实际工业场景中机械设备通常在正常状态下运行,故障状态的持续时间非常短,监测系统能采集到大量正常样本,但故障样本数量非常稀少。利用这种不平衡数据集训练深度学习模型,会导致网络倾向于识别数量庞大的正常样本,而忽视数量稀缺的故障样本[12]。因此,数据不平衡问题限制了深度学习故障诊断方法的实际应用。为解决这个问题,学者们展开了大量数据不平衡下故障诊断方法的研究,主要可分为两类:算法层面和数据层面。算法层主要通过代价敏感学习(又称重加权)改变模型的训练过程,从而使模型适应不平衡数据集。具体来说是对损失函数中稀疏的训练样本分配较大权重,通过增强稀疏样本的学习成本,使模型可以得到稀疏样本的隐藏故障特征,从而实现数据不平衡下的故障诊断。Jia et al. [13]根据样本频率设计损失函数来解决数据不平衡下的故障诊断问题;Xu et al. [14]基于Focal Loss[15],根据数据不平衡率设计权重系数以进行数据不平衡下故障诊断;Zhao et al. [16]考虑到模型训练过程中 特征提取能力的变化,设计了自适应特征变化的权重系数,将训练轮次作为参数引入损失函数中;Hou et al.[17]通过对比学习增强与有效样本的相似性来更好地适应不平衡数据集。目前重加权在类不平衡下的故障诊断任务中取得了一定成效,但局限性如下:1) 严重不平衡的数据容易导致过拟合,降低分类精度;2) 重加权改变样本特征的频率,扭曲了原始样本的分布,不利于模型学习到原始数据的真实分布;3) 模型对于少数样本中 特征信息的依赖性较大,泛化能力不足。 数据层是通过生成对抗网络(Generative Adversarial Network, GAN)[18]补充故障样本,实现各类样本间的均衡,随后利用平衡的数据集对分类器进行训练,从而实现样本故障诊断。Li等[19]引入辅助分类对抗网络(Auxiliary Classifier GAN, ACGAN)框架提升分类与判别之间的兼容性,并基于Wasserstein距离设计损失函数防止模式崩溃;Liu等[20]设计变分自编码器对抗网络(Variational Auto Encoder GAN, VAEGAN)提升生成样本的质量;Wang et al. [21]在Conditional Generative Adversarial Network(CGAN)前置了变分自编码(Variational Auto Encoder, VAE)的Encoder用以学习真实数据的特征分布,再通过CGAN生成故障样本;Wang et al. [22]将注意力机制引入GAN架构中,生成更加真实的故障样本。以上方法在不平衡故障诊断任务中取得了一定成果,但也存在以下缺陷:1) GAN的训练过程极不稳定,容易出现模式崩溃[23–25];2) GAN使用不平衡数据集进行训练,仍然会导致生成的数据偏向于多数类,生成不良或者无效样本;3) 重构所得的平衡数据集的故障类样本的特征信息仍是不完备的。综上所述,以上两类常用的不平衡故障诊断方法均有其局限性。近期,许多研究提出通过构建物理模型生成动力学响应以补充故障样本[26]。相比利用GAN网络进行故障样本生成,该类方法具有较高的可控性与稳定性,并且生成的样本具备完整故障信息,对稀缺的故障样本具有良好的补充作用,为解决实际工业中数据不平衡问题提供了新思路。Yu et al. [27]首次利用仿真数据补充训练样本实现滚动轴承智能诊断;Zhang et al.[28]结合动力学仿真数据与部分域适应实现轴承故障诊断;Liu et al.[29]结合仿真信号与子域适应实现样本缺失情况下的轴承故障诊断;Ma et al.[30]利用元迁移学习实现仿真信号向测量信号的迁移;Yan et al.[12]基于动力学仿真数据,通过子域适应和边缘正则化实现数据不平衡下的故障诊断;Liu et al.[31]建立并修正轴承有限元模型以补充训练样本。以上基于仿真数据的样本扩充方法缓解了故障样本稀缺问题,为实现数据不平衡下的故障诊断提供参考。但以上方法局限性在于:1) 仅限于单部件级的物理实体,无法应用于齿轮箱等复杂装配体中;2) 仿真数据中缺少多部件耦合响应、噪声等成分,与实测数据间的分布差异较大,导致诊断效果不佳。为解决以上挑战,本文提出了一种数字孪生辅助的轴承不平衡样本故障诊断框架,该框架通过数字孪生辅助的数据融合策略得到大量与实测数据分布差异小的数字孪生数据,再通过频域滤波子域适应网络实现数字孪生数据与实测数据的域泛化。该框架不仅适用于轴承试验台,还适用于复杂装配体中的轴承故障诊断。本文的主要贡献在于:1、提出了数字孪生辅助的滚动轴承不平衡故障诊断框架,通过信息传递和领域适应最小化动力学响应与实测数据之间的分布差异;2、提出数字孪生辅助的数据融合策略(Digital Twin-assisted Data Fusion Strategy, DTDFS),实现从物理实体到动力学模型的信息传递,生成用于数据增强的数字孪生数据。DTDFS将源自实测数据的成分集成到动力学响应中,从而获得与实测数据具有较小分布差异的孪生数据。通过特征向量距离进一步筛选孪生数据,确保其作为补充扩充数据的适用性。3、提出频域滤波子域适应网络(Frequency Filter Subdomain Adaptation Network, FFSAN),实现孪生数据与实测数据之间的领域适应。构建深度频域滤波器(Deep Frequency Filter, DFF)以自适应过滤频率成分,缓解DTDFS过程中的能量变化并增强网络的频域感知能力。采用子域适应实现数字孪生数据与实测数据之间的细粒度特征对齐。本文主要安排如下:第2节定义所解决的问题,并构建滚动轴承动力学仿真模型;第3节介绍本文所提数字孪生辅助的不平衡故障诊断框架;第4节通过实验对所提框架进行验证;第5节为所提方法在风力发电机齿轮箱中的应用;第6节对本文进行总结。3 预备知识3.1 问题定义本文主要解决数据不平衡条件下的轴承故障诊断问题,本节对所执行的故障诊断任务进行定义,并提出一些基本假设。在实际工业中,正常运行数据 相对容易获得,但故障数据 非常稀缺,故障数据中除了轴承响应,还包含了其它部件响应、噪声干扰以及测量误差等成分[26]: 其中, 代表实测故障数据, 代表轴承响应, 代表其它部件响应, 表示噪声, 表示测量误差。通过部件级动力学模型可以获取滚动轴承的仿真动态响应 ,但无法获取故障样本中的其它成分,这导致仿真与测量数据存在较大的分布差异,使得利用仿真数据扩充故障样本的诊断方法效果不佳。建立整机级别的仿真模型可以获取 和 ,但这类模型建立难度极高,且消耗巨大算力,不适合作为一种通用框架。本文的目标是通过分解少量实测信号 得到 和 ,再将它们与动力学仿真模型得到的大量故障样本 进行融合,从而得到大量的孪生数据 ,并依据 对 进行评价与筛选,在扩充样本的同时,最大程度地使得孪生数据 接近实测数据 。随后,再构建领域适应模型进一步对齐少量实测数据 和大量孪生数据 ,在样本有限的前提下实现滚动轴承的智能诊断。3.2 轴承动力学仿真模型图1 滚动轴承的动力学模型为得到滚动轴承动力学响应 ,扩充故障诊断中故障样本的数量,本文通过集中质量法建立滚动轴承动力学仿真模型获取仿真数据。如图1为本文构建的轴承仿真模型示意图,其动力学微分方程如下: 其中, , , 分别表示转轴与内圈的质量、轴承外圈质量以及轴承座质量, , 表示转轴在轴承处的阻尼,下标 和 分别代表水平与垂直方向, , 表示转轴在轴承处的阻尼, 表示轴承座与地面之间的阻尼, , 表示转轴的刚度, , 表示外圈与轴承座之间的刚度, 表示外圈与地面之间的刚度, 是轴承所受载荷, , 是轴承所受的支撑力。由非线性赫兹接触理论,可以得到第 个滚子与滚道之间的接触压力 : 其中, 为赫兹接触刚度, 为载荷-变形指数, 为开关函数, 和 为内圈中心在 和 方向产生的初始位移, 为第 个滚子的角度, 为滚子与内外圈之间的初始间隙, 为损伤引起的额外间隙。 在 和 方向的分量为: 滚动轴承所产生的支撑力为: 图2 滚动轴承动态模型中的故障建模滚动轴承故障建模如图2所示,当滚子通过损伤区域时,滚动体间隙 将发生变化,产生周期性冲击信号,冲击信号由损伤所在区域和损伤的形状决定。4 所提数字孪生辅助的不平衡故障诊断框架图3 所提出的框架总体流程本节介绍所提数字孪生辅助的不平衡故障诊断框架,如图3展示所提框架总体流程。首先,以滚动轴承为物理实体部分,构建动力学仿真模型作为虚拟部分。在物理实体中通常只能采集到极少量故障数据,但它们能最真实反映设备的故障响应。在虚拟体中能获得数量丰富的动力学仿真数据,但是由于仿真与现实的差距,导致其数据质量较低。随后,本文引入DTDFS作为虚拟部分与实体部分之间的连接。DTDFS通过分解实测数据,并将实测数据的成分与仿真数据进行融合,获得数字孪生数据。通过特征向量的距离对数字孪生数据进行筛选,从而得到大量且高质量的数字孪生数据,实现有效的数据扩充。该过程包含了物理部分、虚拟部分、数据和虚—实连接,符合数字孪生的概念。最后,将扩充后的数据集共同输入到本文所提的FFSAN中。FFSAN构建DFF,以缓解DTDFS过程中各成分的能量变化,并增强网络的频域感知能力,通过子域适应机制对齐测量信号与数字孪生信号的细粒度特征。最终,将训练好的网络用于轴承故障诊断中。本节将详细介绍所提框架的细节。4.1 数据分解与重构 4.1.1 数据分解与重构图4 数据分解与重构本文所提的信号融合与重构测量如图4所示。首先,利用变分经验模态分解(Variational Mode Decomposition, VMD)将少数测量信号分解为多个固有模态(Intrinsic Mode Functions,IMF)。VMD是一种基于优化方法的信号分解技术,它能够将复杂信号分解为多个IMF,揭示信号的局部振荡和周期性结构,被广泛应用于振动信号分析、特征提取等。VMD将信号定义为 个分量,保证各模态的估计带宽之和最小,约束条件为所有模态之和与原始信号相等: 通过引入拉格朗日乘子 与二次惩罚因子 ,将该问题转换为无约束变分问题: 采用交替方向乘子法(Alternate Direction Method of Multipliers, ADMM)迭代更新 , 和 ,多次迭代后将测量信号分解为 个IMF。利用故障特征系数(Fault Feature Coefficient, FFC)[32]和包络谱分析,筛选出IMFs中代表滚动轴承故障响应的 。FFC计算方式如下: 随后,通过等值映射的方法,将仿真信号 与轴承响应 进行等值映射: 最终,将映射后的 、其它IMFs以及残差融合,得到虚实融合的数字孪生数据 。该方法将测量数据中除轴承响应以外的成分全部传递给了动力学仿真数据 ,最大程度地减小了仿真与测量数据之间的分布差异。4.1.2 数字孪生数据筛选本文所提的数据融合策略是将大量仿真数据与少量实测数据进行融合,当不同相位的信号融合时,由于相位差的存在,部分分量可能会相互抵消,从而导致能量发生改变,使得孪生数据与原始信号间存在一定差异。为得到与原始信号分布差异较小的孪生数据,本文设计了一种数据筛选策略,通过均值、标准差、方根幅值、有效值、绝对峰峰值、偏度指标、峭度指标、峰值因子、裕度指标、波形指标、脉冲指标等[8]时域特征构造特征向量 ,如下: 利用特征向量之间的欧式距离筛选出特征分布与测量信号较小的孪生数据,欧式距离计算公式如下: 当实测故障样本为1时,选择欧式距离最近的孪生数据作为训练样本,从而保证将分布差异较大的信号滤除;当实测故障样本大于1时,筛选方法如所示。计算每两个实测样本之间欧式距离的平均值,设定阈值系数 ,得到筛选阈值 : 随后,计算孪生数据与每个实测信号的欧式距离,求取平均值,选用距离平均值小于 的孪生数据作为训练样本,且每个故障样本生成的孪生数据数目相等。筛选过程表示为: 图5 孪生数据滤波方法如图5所示,该筛选方法在保证孪生数据与实测数据分布差异不大的前提下,尽可能地覆盖测量信号的分布范围,避免孪生数据过于聚焦,从而提升深度学习模型的泛化性。4.2 频域滤波子域适应网络FFSAN4.2.1 深度频域滤波的特征提取器经本文所提的数据融合策略后,虽然孪生数据在理论上具备了测量信号的各个成分,但融合过程中各成分的能量占比会发生改变,为缓解融合过程中能量改变对信号质量的影响,同时提升神经网络的全局感知能力,本文构建了深度频域滤波模块[33],对数据进行自适应频域滤波,从而调整信号的各个频率分量,进一步减小孪生与实测数据之间的差异性,提取主要故障特征。 图6 深度频率滤波器如图6所示,对于每个样本,深度频域滤波器先利用FFT得到它的频域信号 ,再通过卷积模块提取频域信号的主要特征,通过最大、平均池化层得到两个频域特征描述,将它们级联之后利用 函数得到自适应滤波器 ,过程如下式: 其中, 表示 函数, 表示1维卷积层, 为平均池化层, 为最大池化层。随后利用 对 进行自适应滤波操作,调整 中各个成分的含量,加强主要特征成分的同时抑制不利于泛化的成分: 其中, 表示逐个元素相乘。最后,利用快速逆傅里叶算法将信号转换到时域空间中,以便下一步的特征提取。如图3所示,特征提取器 中包含三个卷积块,以及两个DFF,特征提取器 将一维振动信号 投影至特征空间中,随后由分类器 将特征向量映射至类标签,分类器 由两个全连接层构成,利用交叉熵作为分类损失函数 。4.2.2 子域自适应机制图7 子域自适应机制 为进一步实现孪生数据向实测故障信号的域泛化,将孪生数据中提取的故障知识迁移至实测信号的故障诊断中,本文引入了子域自适应机制[34]对齐孪生与实测数据的细粒度特征,如图7所示。子域自适应机制主要基于局部最大均值差异(Local Maximum Mean Discrepancy,LMMD),该方法能够度量同一类别内子域之间的分布差异: 其中, 代表故障的类别数, 和 分别代表孪生样本 与实测样本 为类别 的权重, 和 表示孪生与实测样本的数量, 和 的值等于1, 表示特征提取器, 将特征向量映射至希尔伯特空间中, 是被用于特征映射的核函数。对于每个孪生与实测的故障样本 ,其标签向量可用one-hot向量 表示, 可被表示为: 通过最小化 ,即可实现每类故障下的孪生与测量样本的条件分布对齐。4.2.3 优化目标最终,本文所提FFSAN的总损失函数可被表示为: 其中, 和 表示特征提取器 与分类器 的参数, 和 表示所有训练样本及其标签, 表示孪生故障样本, 表示实测故障样本。是时间变化权重系数,用于调整 和 的比例, 可表示为: 其中, 为超参数, 表示模型训练的迭代数, 表示总迭代次数。该策略保证模型在训练前期聚焦于分类损失,后期聚焦于子域泛化。使用凯明初始化方法[35]对模型进行初始化,Adam优化器[36]对参数 和 进行训练。5 实验与结果分析5.1 航空轴承全寿命加速试验数据集通过本实验室搭建的航空轴承全寿命试验台数据验证所提方法有效性,该深沟球轴承被用于某型号飞行器的关键部位中,精确识别它的健康状况有助于保证飞机运行的安全性和稳定性。本文利用三组全寿命数据构成不平衡数据集,故障类型包括外圈故障、内圈故障和滚动体故障,取轴承全寿命数据中最后20组测量数据作为故障数据,最初14组测量数据混合作为正常数据,在每组数据中切割10个长度为2048的样本。测试集由每类200个样本构成,训练集中包括了200个正常样本,根据不平衡数据集的不同,故障样本分别有1,2,4个,具体如表 1所示。表1 不平衡数据集的组成 5.2 结果分析5.2.1 数字孪生辅助的数据融合策略有效性分析图8 动态模型响应波形、真实的测量数据和数字孪生数据为验证本文所提DTDFS的有效性,在每类故障中随机选取某个实测信号,其仿真、实测、孪生数据的时域波形如图8所示,从图中可以看出,仿真信号虽然具备轴承故障响应,但缺少了其它部件响应以及噪声等成分,导致其时域波形过于干净,与测量信号有较大分布差异。本文所提融合策略将实测信号中不代表轴承故障的成分引入仿真信号,通过虚实融合使得孪生数据既具备故障特征,又有测量信号中的其它成分,实现样本扩充的同时,最大程度保证了与测量信号的相似性。图9 基于特征向量欧氏距离的孪生数据滤波如图9表示了本文所提孪生数据筛选策略在D3中的结果,D3中每类故障有4个实测样本,每个实测样本对应200个孪生样本,横坐标表示孪生样本序号,纵坐标为该孪生样本与4个实测样本的特征向量平均欧式距离,红线是k取2时的筛选阈值。通过该策略,成功将分布差异较大的孪生样本滤除,从而减小孪生数据与测量数据的分布差异。完成筛选后,在大量合格的孪生样本中,每个实测样本选取同等数目的孪生样本构成训练样本。 图10 动态响应、实测数据和孪生数据的概率密度函数 为了更进一步展示本文所提数字孪生辅助数据融合策略(Digital twin-assisted data fusion strategy, DTDFS)的有效性,图10分别展示了3类故障的测量数据与仿真数据、孪生数据的概率密度函数图,从图中可以明显看出,未经融合的动力学仿真数据与测量数据之间具有较大的分布差异,而使用本文所提DTDFS后,数据间分布差异明显减小。这是由于DTDFS将测量信号中轴承响应以外的成分引入到仿真信号中,构成虚实融合的数字孪生信号,最大程度地减小与测量数据之间的分布差异。较小的分布差异有助于深度学习模型实现域泛化,从而提高故障识别率。5.2.2 诊断性能分析为证明本文所提方法的诊断性能,以卷积神经网络(Convolutional Neural Network,CNN)为Baseline,选择四种常用的数据不平衡故障诊断方法作为对比实验,两种算法层方法Focal loss(Focal loss, FL)[15]和Class-Balanced Loss(Class-Balanced Loss, CBLoss)[37],两种数据层方法VAE-GAN[20]与ACGAN[19]。本文所提FFSAN及对比方法的主要超参数设置如下:学习率为0.0001,样本批次为40,迭代次数为100,模型每迭代30次,学习率衰减90%。所以实验均在CPU为Inteli7-12700,内存为16GB,GPU为NVIDIA GeForce RTX 4070 Ti的PC机上实现,使用Pytorch平台进行编程,GPU加速训练。表2 每种方法的诊断准确性 每种方法重复训练10次,其平均准确率及标准差如表2所示。在每个不平衡数据集中,所提方法均达到了最高诊断准确率与最低标准差。在故障样本严重稀缺的D1与D2中,本文所提方法具有最少8%的精度提升,这是由于所提方法将仿真与测量数据进行虚实融合,并对孪生数据进行筛选,从而有效扩充了故障样本,并且通过DFF提升网络的频域感知能力,利用子域自适应机制进一步对齐了孪生数据与实测数据之间的细粒度特征,从而达到最高诊断性能。在D3中,本文所提方法对比其它方法的优势较小,这是由于数据量相对充足时,数据驱动的不平衡故障诊断方法能够充分捕捉到样本中的故障信息,通过生成样本或者调整样本权重的策略,得到较高诊断精度。但当故障样本数量严重稀缺时,生成式网络ACGAN与VAE-GAN无法捕捉极少数故障样本的内在故障特征,从而无法生成高质量信号,导致分类精度偏低。通过样本权重调整的CBL和FL则由于特征提取器无法提取足量故障信息,导致诊断精度严重下降。图11 消融实验中的测试精度 为了进一步明确DTDFS和FFSAN的有效性,在三个测试集中进行消融实验。其中DTDFS代表不使用本文所提的数据融合与筛选策略,训练集中仅使用动力学仿真数据与少量实测数据;FFSAN代表不使用本文所提的频域滤波子域适应网络,使用卷积神经网络完成诊断任务;DTDFS+FFSAN表示两者都不使用。以上每种方法重复10次,测试集平均准确率如图11所示,从图中可以看出,在样本数非常稀缺的D1中,采用DTDFS策略相比直接用动力学仿真数据测试精度提升了4%,而FFSAN提升了2%测试集精度。随着故障样本数的增多,FFSAN的作用逐渐增大,在D3中,FFSAN提升了7%精度,而DTDFS提升了5%。可能的原因是故障样本过少时,FFSAN无法充分提取测量样本的细粒度特征,导致精度提升较小,而DTDFS在样本数较小时仍具备较强的样本扩充能力,所以精度提升在三个不平衡数据集中都非常可观。6 工程应用6.1 风电齿轮箱轴承数据集图12 风力涡轮机齿轮箱结构示意图表3 不平衡数据集的组成 选取中国某风场2MW风机的轴承为例,将本文所提方法进行工程应用。所选风电齿轮箱包括一级行星齿轮和两级平行齿轮,结构如图12所示。选择2轴的中间轴承数据对本文所提框架进行工程应用验证,通过风电机组安装的状态监测系统获取振动数据。振动信号每天采集一次,采样频率为25600Hz。根据两台风机的故障检测报告,选择故障发生前10至20天的数据作为故障数据,故障类型包括轴承内圈故障和外圈故障,混合选择两台风机平稳运行时的数据作为正常数据,每组数据切割成多个长度为4096的样本。测试集由每类160个样本构成,训练集中包括了160个正常样本,根据不平衡数据集的不同,故障样本分别有2,4,8个,具体如表3所示。6.2 结果分析6.2.1 数字孪生辅助的数据融合策略有效性分析图13 动力学仿真数据、实测数据和数字孪生数据 图14 动力学仿真数据、实测数据和数字孪生数据的概率密度函数 在每类故障中随机选择一个实测样本进行数据分解与融合,其仿真、测量、孪生数据的波形如图13所示,从图中可以看出,本文所提DTDFS将测量数据中不代表轴承故障的成分引入了仿真数据,通过虚实融合的方式,使得孪生数据在具备故障特征的同时,最大程度地提升其与测量样本的相似性,从而实现数据扩充。图14展示了S2数据集使用DTDFS后仿真、实测与孪生数据的概率密度函数,经过数据分解与虚实融合,并使用特征向量欧式距离进行筛选,孪生数据与测量数据的分布差异达到了较小值。通过DTDFS可以在数据量较小的情况下有效实现数据扩充,这对基于深度学习的故障诊断方法具有重要帮助。6.2.2 诊断性能分析表4 每种方法的诊断准确性图15 通过每种方法提取的特征分布的可视化超参数设置、对比方法以及训练策略与4.2节中一样,诊断结果如表4所示,本文所提方法在各数据集中取得了最高性能,相比常用的不平衡故障诊断方法,在S1、S2、S3中分别有至少8%、7%和5%的精度提升。由于风机的振动数据中有较大的噪声以及多部件耦合等因素的干扰,导致故障样本的识别难度较大。在这种情况下,生成式网络难以提取数据中隐含的多种特征,所以无法生成高质量样本,最终导致精度偏低。通过样本权重调整的策略在故障数据较丰富时取得了不错的效果,但当故障数据极少时,该方法难以通过极其有限的训练样本提取故障特征,从而导致效果不佳。图15展示了各方法在S2中所提特征的可视化分布,从图中可以看出本文所提方法的聚类效果最好,各类样本之间的决策边界非常清晰。这是由于本文通过DTDFS得到大量高质量数字孪生样本,有效实现了故障样本的扩充,通过FFSAN增强了网络的频域感知能力,有效实现了孪生与测量样本间的细粒度特征对齐,最终达到了最高的诊断性能。表5 每种方法的诊断评价指标消融实验的设置与4.2节中相同,各数据集中的平均测试精度如表5所示。由于仿真数据只具备轴承的动力学特征,而风机测量数据是多部件耦合且具有较大的噪声干扰,在不使用DTDFS的前提下诊断精度非常低,由于仿真与测量数据的分布差异过大,难以通过FFSAN提升精度。但是,在使用了DTDFS后,相比只用动力学仿真数据进行样本补充,各个数据集分别提升了5%、11%和15%的精度。而且FFSAN在DTDFS的基础上能够实现领域泛化,也达到了明显精度提高,分别为3%、4%和5%。这充分证明本文所提方法通过DTDFS扩充了大量与测量数据分布差异较小的数字孪生数据,随后利用FFSAN进一步对齐融合与测量数据间的细粒度特征,在故障样本稀缺的前提下实现了风电齿轮箱轴承故障诊断,具有一定的实用价值和参考性。6 结论数据不平衡问题限制了深度学习故障诊断方法在实际中的应用。本文提出了一种数字孪生辅助的不平衡故障诊断框架,该框架可以最小化动力学模型响应与实测数据之间的分布差异。首先,针对故障数据稀缺的问题,提出了数字孪生数据融合策略(DTDFS)。该策略将动力学模型响应与实测数据进行虚实融合以获得数字孪生数据,并通过基于欧氏距离的选择确保数据质量,从而有效实现数据增强。其次,为实现数字孪生数据向实测数据的领域适应,提出了频率滤波子域适应网络(FFSAN)。该网络构建深度频率滤波器以缓解DTDFS过程中的能量变化,引入子域适应实现孪生数据与实测数据之间的细粒度特征对齐。最后,在航空轴承和风电齿轮箱轴承的诊断结果表明,所提出的框架在极度不平衡数据条件下实现了高精度故障诊断。与常用的不平衡故障诊断方法相比,本文提出的框架表现出显著优势,尤其在严重数据不平衡的场景中。在航空轴承数据集中,在不平衡比为0.005、0.01和0.02时,本方法的准确率分别比现有方法至少提高7%、7%和2%。同样,在风电齿轮箱轴承数据集中,在不平衡比为0.0125、0.025和0.05时,本方法的准确率分别比现有方法至少提高8%、7%和5%。本文提出的框架为不平衡数据条件下的数据增强和领域适应提供了有价值的思路,对推进深度学习方法在故障诊断领域的工业应用具有重要意义。然而,该框架仅关注滚动轴承的已知故障。在工业场景中,可能会出现未知和非典型故障。未来工作将引入开集域泛化以考虑未知故障的可能性,使模型能够识别先前未知的故障类型。编辑:曹希铭校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、海洋、冯珽婷、陈宇航、陈莹洁、王金该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除点击左下角阅读原文,即可在线阅读论文。来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈