首页/文章/ 详情

研究热点!数字孪生!|不平衡样本下基于逆物理信息的数字孪生轴承故障诊断神经网络

2月前浏览3583

数字孪生是当前故障诊断领域的研究热点之一。它们只需要很少的实际信号就可以产生故障样本,从而降低了实验成本。小编整理搜集了一些相关研究与大家进行分享。本期分享的是不平衡样本下基于逆物理信息的数字孪生轴承故障诊断神经网络,该论文发表于Knowledge-Based Systems,适合具备一定有信号基础并打算在故障诊断领域深入挖掘的学习者,非常值得阅读

论文链接通过点击最左下角的阅读原文进行在线阅读及下载

1 论文基本信息

论文题目Inverse physics–informed neural networks for digital twin–based bearing fault diagnosis under imbalanced samples

论文期刊Knowledge-Based Systems

Doi: https://doi.org/10.1016/j.knosys.2024.111641

论文时间2024年

作者Yi Qin (a), Hongyu Liu (a), Yi Wang (a), Yongfang Mao(b)

机构:

a: State Key Laboratory of Mechanical Transmission for Advanced equipment, Chongqing University, Chongqing 400044, PR China;
b: School of Automation, Chongqing University, Chongqing 400044, PR China.

2 目录

1 论文基本信息
2 目录
3
4 引言
5 准备工作
5.1 PINN
5.2 数字孪生
提出的轴承故障振动数据生成方法
6.1 轴承故障动力学模型
6.2 逆PINN
6.3 轴承故障数据生成
实验结果与分析
7.1 实验描述
7.2 实验结果与分析
7.3 数据生成示例
总结
注:本文只选中原论文部分进行分享,若想拜读,请下载原论文进行细读。
小编能力有限,如有翻译不恰之处,请多多指正~

3 摘要

在实际工程中,各种故障类别的轴承样本不足,给滚动轴承的智能故障诊断带来了很大障碍。为了解决样本不平衡的问题,本工作探索了一种基于数字孪生技术的轴承故障数据生成方法。首先,通过将轴承动态模型嵌入到神经网络中,建立逆物理信息神经网络(Inverse Physics–informed Neural Network, PINN)来识别动态模型参数。在该网络中,设计了一个边界损失来快速确定加速网络收敛的参数的近似范围,并构造了一个真值损失来评估模拟数据和实际数据之间的频谱差异。然后,利用逆PINN、轴承故障动态模型和实际振动数据,提出了一种基于数字孪生的故障数据生成方法,用于在多种工况和故障模式下生成高质量的轴承故障样本。最后,将该方法应用于特定工况下的轴承故障振动样本生成。将生成样本用于训练诊断网络,解决了样本不平衡的问题。多个实验的对比结果表明,所提出的数据生成方法有效地提高了跨工况轴承故障诊断的精度,并超过了多种先进的诊断方法。

关键词数字孪生,物理信息神经网络,轴承动态模型,故障诊断,样本不平衡

4 引言

已提出的轴承故障诊断方法大致可分为基于信号处理的方法[1]和基于人工智能的技术[2]。深度学习方法,包括卷积神经网络[3]、深度神经网络[4]和联邦学习[5],在智能轴承故障诊断中占据主导地位。然而,这些深度学习方法通常需要大量的故障样本。在许多工程应用中,正常的轴承振动信号样本非常丰富,而故障振动信号样本的可用性有限。此外,一些故障的样本可能比其他故障少得多。因此,轴承数据集表现出样本不平衡,这可能会显著影响故障诊断的效率。故障样本的稀缺性和数据集的不平衡性可能会阻碍故障诊断模型识别某些故障类型。为了解决这些问题,Zhao等人[6]提出了一种基于小波变换和CNN的机械故障诊断方法。[7]研究了一种能够进行多领域特征提取和选择的代价敏感学习方法,有效地降低了漏报率和平均代价。此外,Li 等人[8]在训练数据类型较少的情况下,引入持续学习来提高故障诊断的效果。另一种可用的方法是添加相关的故障样本。
基于实际信号的数据生成是一种可行的采样增强技术。Wang等人[9]建立了一种自适应、高效的亚像素网络DAESPN用于变速条件下的故障样本扩充和智能故障诊断。An等人[10]开发了一种主动构造的数据增强模型以增强轴承故障诊断。Pei等人[11]设计了一种改进的基于元学习的Wasserstein自动编码器以增加滚动轴承数据,提高轴承故障诊断能力。然而,这些数据驱动的方法往往需要大量的实际样本来训练生成式模型,而且生成的样本往往与训练样本相似,限制了多样性,阻碍了故障诊断准确率的提高。
另一种方法是利用故障动态模型来生成故障样本。Shao等人[12]建立了转子-轴承系统动力学模型,该模型产生了不同健康状态的轴承振动信号;这些信号随后被用于具有生成式对抗性网络(Generative Adversarial Network, GAN)的实际轴承的故障诊断。Qin等人提出了一种利用时变激励生成故障样本的故障动力学模型[13]。类似地,Liu 等人的研究[14]建立了用于故障样本产生的现实的轴承振动模型,并将其用于基于GAN的轴承故障诊断。Liu等人[15]提出了一种个性化故障诊断方法,通过有限元仿真训练智能传感器网络,提高了故障样本缺失时故障诊断的有效性。然而,基于动态模型的数据生成方法需要确定故障动态模型的关键参数,如刚度和阻尼比。这些参数通常是由经验设定的。估计参数和实际参数之间的差异导致了仿真数据和测量数据之间的差异,影响了仿真数据对诊断模型训练的效果。数字孪生模型只需要很少的实际信号就可以生成故障样本,从而节省了实验材料和时间。
基于数字孪生的样本扩充技术结合数据驱动和基于模型的方法,并引起了人们的极大兴趣。它们只需要很少的实际信号就可以产生故障样本,从而降低了实验成本。提出了几种提高轴承振动数据的方法。Piltan等人[16]建立了机械模型与自适应观测器相结合的轴承数字孪生框架,实现了轴承裂纹尺寸的精确检测。为了阐述退化过程中的轴承振动响应,Qin等人[17]建立了全生命周期的轴承数字孪生模型。值得注意的是,一种新的基于循环GAN的映射网络(CycleGAN)[18]最大限度地减少了模拟信号和实际信号之间的差异信号进行调整的。此外,动态模型没有完全集成到神经网络中。
为了将物理模型与神经网络相结合,人们提出了各种PINN,其中一些已成功地应用于滚动轴承的故障预测和诊断。例如,Chen等人[19]提出了一种物理信息-退化一致性递归神经网络来预测机器RUL,并将机器部件的退化能力集成到神经网络中。Yucesan等人[20]建立了基于物理信息的PINN模型,用于风电机组主轴承疲劳建模。然而,这些方法主要是利用物理信息进行RUL预测,而不是求解物理模型。已经提出了一些用于求解各种物理模型的PINN。例如,Ling等人[21]用PINN和Mao等人预测湍流和高速气动扰流。[22]用PINN对高速气动流动进行了模拟。不幸的是,现有的PINN无法计算二自由度轴承动力学模型的振动响应,因为两个微分方程组是相互耦合的。因此,需要对PINN进行改进,以便对故障滚动轴承进行动态建模。
刚度和阻尼比是轴承动力学模型中的两个重要参数,一般都是凭经验设定的,往往会导致仿真信号与实测信号存在较大的偏差。为了解决这一问题,提出了一种滚动轴承的逆PINN。与传统的PINN方法不同的是,直接利用滚动轴承的二自由度微分方程组而不是损失函数来计算振动响应,并将网络损耗视为模拟信号与采集的真实信号之间的频谱差异,以防止沿X和Y方向的动态微分方程组之间的耦合效应。同时,逆PINN的优化对象是轴承的动态参数,而不是振动响应,因此可以精确地辨识轴承动力学模型的参数。利用逆PINN和轴承动力学模型,提出了一种新的故障数据生成方法,用于产生各种工况下的高精度轴承振动信号。最后,将生成的数据成功地应用于样本不平衡情况下的跨工况轴承故障诊断。本研究的贡献如下:
1. 为了辨识动态模型的参数,我们提出了一种逆PINN方法,将轴承动态模型集成到神经网络中。在该网络中,边界损失被设计为快速确定参数的近似范围,从而加速网络收敛,并构造了真值损失来评估模拟数据与实际数据之间的频谱差异。利用所提出的逆PINN方法,可以准确地辨识轴承的动态参数。
2. 利用逆PINN、轴承故障动态模型和采集的振动信号,提出了一种新的基于数字孪生的数据生成方法,可以在多个工作条件下生成高质量的故障样本。该方法从单一工况下采集的少量轴承样本中生成出不同工况下高质量的轴承故障振动样本。由此可见,该方法实现了故障滚动轴承的数字孪生。
3. 对于具有不平衡轴承振动样本的跨工况故障诊断,该方法被用来生成特定工况下的轴承故障振动样本。然后,将样本用于诊断网络的训练。实验结果表明,与现有的各种SOTA数据生成和不平衡故障诊断方法相比,该方法能够提高跨工况轴承故障诊断的精度。

5 准备工作

5.1 PINN

PINN可以结合经验数据和抽象的数学运算符[23],例如偏微分方程(Partial Differential Equations, PDE)。一旦将物理原理或约束嵌入到PINN中,网络就会表现出更强的可解释性和抗干扰性。一般来说,一个典型的Pinn的损失被定义为:
   
其中, 表示输出数据和实际数据之间的差距, 表示初始值和边界损失, 由微分方程式决定, 用于平衡三个损失之间相互作用的影响的权重,可以由使用者定义或自动调整。PINN的参数通过各种基于梯度的优化器(例如ADAM和L-BFGS)来最小化损失来进行优化。然而,传统的PINN算法主要用于求解单个偏微分方程组。

5.2 数字孪生

图1 数字孪生框架示意图

作为一种新的设备运行和维护方法,数字孪生技术起源于2003年格里夫斯教授在密歇根大学的一次演讲[24]。在本讲座中,定义了数字孪生模型,它包含三个基本组成部分:虚拟空间、物理空间和数据流的互联性。2012年,NASA[25]将数字孪生视为集成多个物理域、尺度和概率的模拟过程。这一创新方法在各种设备的设计、制造和运行维护方面已被证明是成功的。Deon等人[26]建立了火电厂发电机组预知检修的数字孪生模型。如图1所示,数字孪生框架主要由物理空间、虚拟空间以及它们之间的数据流或映射关系组成。物理空间表示被分析的系统或部件;虚拟空间是所建立的分析模型,诸如有限元模型或集总参数动态模型。并且数据流或映射用于桥接物理空间和虚拟空间之间的关系。针对轴承故障诊断中样本不均衡的问题,利用数字孪生技术生成轴承故障样本。

6 提出的轴承故障振动数据生成方法

6.1 轴承故障动力学模型

图2 简化故障的形状
首先建立了轴承故障动力学模型。通过将外圈上的轴承故障简化为立方体,降低了模型的复杂性(图2)。立方体的长度、宽度和高度分别由L、B和H表示。根据故障和滚动轴承参数,通过下式计算故障引起的最大位移激励      :       式中,D表示滚子的直径,    表示位移激励的理论最大值。
考虑半正弦激励,我们可以定义位移激励函数如下[27]: 
 
其中  表示进入故障区域时滚动体与X轴的夹角,  表示离开故障区域时滚动体与X轴的夹角,  表示第j个滚动体的位置。滚动体与滚子接触的法向变形包含了轴承故障位移激励函数的影响。接触变形表达式为:    其中,    分别表示滚动轴承在X和Y方向上的位移,ε表示轴承公差。我们建立了故障轴承的两自由度动力学方程:
其中m表示当量轴承质量;K表示力变形系数(即刚度);c表示当量阻尼比;  表示第j滚子在接触区的判断系数,下式给出:   刚度K和阻尼比c是轴承故障动力学模型中的两个关键参数,对模拟振动响应的质量有很大影响。然而,它们通常是通过实际经验来确定的。在下一节中,我们将讨论如何通过测量的轴承故障振动信号来准确识别K和c。
6.2 逆PINN

图3 逆PINN结构

在这一部分中,将详细阐述所提出的逆PINN。

逆PINN原理:与现有的PINN不同,本文提出的逆PINN的优化目标是获得两个动力学参数,而不是一个轴承振动响应。逆PINN的结构图如图3所示,逆PINN的输入是从实际物理空间测得的滚动轴承故障振动信号,其输出是动态参数。在网络训练期间,动态参数被更新。根据滚动轴承的最新动态参数和已知的滚子数、滚子直径、故障位置、初始角位置等结构参数,采用Runge-Kutta方法结合张量计算,求解了非线性轴承故障动力学方程,得到了故障轴承在X、Y方向的振动响应。然后,将测量信号和模拟信号的FFT之差计算为损失。此外,还设计了两个动态参数的边界损失,用于网络训练。

由于刚度K和阻尼比c之间的差高一个数量级,所以K不是由神经网络直接输出的,而是通过将网络输出值乘以七个数量级而得到的。这种方法可以确保网络输出的两个参数尽可能地处于相似的数量级,并有利于所提出的网络的PINN收敛。逆PINN的目标与原PINN不同,前者的结构比后者更简单。

逆PINN的损失函数:逆PINN的损失函数由两部分组成。第一部分是边界损失,它包含所有未知参数的边界条件。传统PINN中的边界损失主要是用来约束某一时间点或空间点的响应值或物理量。例如,在基于流体力学的PINN中,某一位置的流体速度为零或某一值,可以利用这些信息来表示边界损失。然而,在逆PINN中,目标值不再是特定的响应,而是未知的物理参数。这些参数的近似值范围被用作边界条件。当动态参数在特定范围内更新时,可以加速网络训练。边界损失表示      为:     其中,      表示由网络模型输出的第j个参数;      和      分别是参数的下限和上限;以及n是参数的数目。本文考虑了两个动力参数:轴承刚度K和阻尼比c,并根据这两个参数的取值范围设定了具体的上下限。根据目标方位的经验知识,可以确定参数值的近似范围。例如,轴承的阻尼比通常在10到1000之间,而刚度通常在      到      之间。

损失函数的第二部分是模拟振动与测量信号之间的偏差。通过在频域中计算这部分的损失函数,抑制了被测信号样本中噪声的影响。通过将时域信号转换为频域信号来防止由相位差和其他因素造成的干扰。此外,动态参数,包括刚度和阻尼比,对频谱的影响比时域信号更显著。因此,基于频域信号的损失函数保证了这些参数的准确、快速的优化。将测量的振动信号和模拟的振动信号的频域变换结果之间的均方根误差(RMSE)作为损失,称为      。这一损失被定义为:

    

其中,X和Y是测量的振动信号沿X和Y方向的傅里叶变换;X和Y是对应于通过逆PINN更新的动态参数的模拟振动信号的傅里叶变换;real(·)和imag(·)分别表示数据的实部和虚部。真值损失有效地减小了模拟信号和测量信号之间的频谱差异。利用这一损失来训练逆PINN,可以得到更接近实际情况的动态参数。然后,将这些动态参数引入到轴承故障动态模型中,从而提高了仿真信号与实测信号之间的相似性。总而言之,建议的逆PINN的损失公式如下:   6.3 轴承故障数据生成
在此基础上,提出了一种基于数字孪生模型的故障数据生成方法,并给出了具体的实现步骤。
第一步:输入滚动轴承的结构参数,将在某一工况下采集到的测量振动信号送入逆变器。根据专家经验设置两个动态参数的取值范围,然后分别在两个范围内初始化两个动态参数。
第二步:根据故障轴承的结构参数、工况参数和动力学参数,采用Runge-Kutta算法结合张量计算,求解故障轴承的二自由度动力学方程。然后,得到模拟的振动信号。
第三步:计算模拟振动信号和测量信号的傅里叶变换。用逆PINN法计算输出动态参数。
第四步:通过公式计算    。然后,用EQ计算边界损失    
第五步:使用获得的损失,用ADAM优化器训练反PINN。通过损耗调整网络参数。
第六步:重复步骤2到5,直到逆PINN收敛。完成网络训练后,准确识别两个动态参数K和c。
第七步:将获得的动态参数提交到轴承故障动态模型中,计算出各种工况和故障模式(包括故障大小)下的模拟振动信号。
第八步:在轴承振动响应中加入高斯白噪声,以提高生成数据的多样性。

7 实验结果与分析

7.1 实验描述

提出的方法将通过两个实验进行验证。第一个实验基于Case Western Reserve University(CWRU)的轴承故障测试。两个测试SKF轴承(6205-2RS)位于轴承处。采用驱动端故障直径为0.54 mm(即L=B=H=0.54 mm)的故障滚动轴承的振动信号。在实验过程中,电机转速为1750rpm,信号采集频率为12 kHz。第二个实验是基于西安交通大学的轴承故障测试[28]。主要用于轴承退化试验。采用两台由PCB公司生产的加速度计,以25.6 kHz的采样频率沿X和Y方向测量轴承加速度信号。

7.2 实验结果及分析

表4 由逆PINN和专家经验在两个实验中获得的动力学参数

图7 CWRU实验中模拟信号与实测信号的比较:  

(A)由优化参数得到的模拟结果;(B)由经验参数得到的模拟结果

在CWRU和XJTU实验中,故障滚动轴承的动态参数(表4)是通过逆PINN估计的。同时,表4也列出了其他文献[17,27]设定的经验参数。观察到这两类动力学参数之间有很大的差异。不同的动力参数会导致不同的振动响应。在CWRU实验中,利用这两种动力学参数计算了振动信号。模拟信号和测量信号同时显示在图7中。在时间域波形中,很难确定K优化的参数是否优于经验参数。  

图8 CWRU实验中仿真频谱与实验频谱的比较:  

(A)基于经验参数的仿真结果;(B)基于逆PINN优化参数的仿真结果

图9 XJTU实验中仿真频谱与实验频谱的比较:  

(A)基于经验参数的仿真结果;(B)基于逆PINN优化参数的仿真结果


动态参数K和c不影响旋转频率和故障特征频率,但影响其他频率成分,如固有频率。为了弄清动力参数对振动响应的影响,我们计算了由两种动力参数得到的振动信号的频谱,并分别将它们与被测信号的频谱进行了比较。CWRU实验的比较结果如图8(A)和(B)所示。提出的逆PINN方法得到的频谱与实测信号的频谱接近,而基于经验参数的频谱的主成分与实际信号的主成分有很大的偏差。XJTU实验中的比较结果如图9(A)和(B)所示。也得到了类似的结论。

根据振动信号的频谱和文章中的时频频谱,根据最大峰值可以估计出轴承的固有频率。为了说明该参数优化方法相对于其他方法的优越性,计算了逆PINN法和专家经验估计的固有频率的误差和错误率。由所提出的逆PINN估计的固有频率具有很高的精度,这意味着所提出的逆PINN可以求解动态参数,并且提高了仿真模型的精度。

 

7.3 数据生成示例

图11以外圈故障为样本,在40赫兹的转速和10kN的载荷下,  

模拟和测量了轴承振动信号的频谱。  

在用逆PINN识别出轴承的动态参数后,利用所开发的基于数字孪生故障数据生成方法,可以模拟故障轴承在任何工况下的振动响应。以XJTU实验中的轴承故障数据生成为例。利用所获得的动力学参数和轴承故障动力学模型,生成了在40 Hz旋转频率和10kN载荷下发生外环故障的轴承振动数据。计算了产生的和测量的信号的频谱(图11)。这两个频谱具有相似的特征谱线,即有效地模拟和产生了轴承振动信号中的主要特征频率分量。

8 总结

本文研究了一种轴承数据生成方法,以提高对不平衡样本的跨工况轴承故障诊断能力。为了准确识别轴承的动态参数,将轴承动力学模型与神经网络相结合,建立了一种新的逆PINN模型。这种网络的原理与传统的PINN相反。在逆PINN中,建立边界损失和真值损失来加速网络收敛,并将其用于评估模拟频域数据与真实频域数据之间的差异。提出了一种基于逆PINN、故障轴承动力学模型和实际数据的故障数据生成方法,用于生成特定工况下补充样本的轴承故障信号。然后,用它们来训练故障诊断网络。实验结果表明,该方法能有效克服轴承故障诊断中的样本平衡问题,优于SOTA数据生成方法和不平衡故障诊断方法。未来,我们将从强背景噪声的测量信号中识别模型参数,进一步提高生成数据的质量和多样性。


 
客官,球球再点个广告,再走吧~

编辑:曹希铭

校核:李正平、陈凯歌、赵栓栓、董浩杰赵学功、白亮、陈少华

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

点击左下角阅读原文,即可在线阅读论文。

来源:故障诊断与python学习
MechanicalSystem振动疲劳非线性旋转机械湍流裂纹参数优化理论电机材料
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-08-25
最近编辑:2月前
故障诊断与python学习
硕士 签名征集中
获赞 70粉丝 66文章 141课程 0
点赞
收藏
作者推荐

SCI一区开源代码推荐 | 分类器引导的神经盲解卷积

SCI一区开源代码推荐 | 分类器引导的神经盲解卷积:用于噪声条件下轴承故障诊断的物理信息引导的去噪模块本期受文章作者投稿给大家分享一篇SCI一区的开源代码文章。如果有故障诊断相关方向研究人员希望宣传自己研究成果,欢迎大家在公众 号后台与小编联系投稿,大家一起交流学习。本文提出了一种分类器引导的盲解卷积(Classifie-guided neural BD, ClassBD),旨在实现基于BD的特征提取与基于深度学习的故障诊断的协同学习。希望对大家的学习有所帮助,也同时希望大家可以多多引用。论文基本信息论文题目:Classifier-guided neural blinddeconvolution: A physics-informed denoising module for bearing fault diagnosisunder noisy conditions论文期刊:Mechanical Systems and Signal Processing (SCI一区Top)论文日期:2024.07论文链接: https://doi.org/10.1016/j.ymssp.2024.111750作者:Jing-Xiao Liao1,2, Chao He3,4,Jipu Li1, Jinwei Sun2, Shiping Zhang2*, XiaogeZhang1*机构:1.Department of Industrial and SystemsEngineering, The Hong Kong Polytechnic University, Hong Kong, SpecialAdministrative Region of China2.School of Instrumentation Science andEngineering, Harbin Institute of Technology, Harbin, China3.School of Mechanical, Electronic andControl Engineering, Beijing Jiaotong University, Beijing, China4.State Key Laboratory of Advanced RailAutonomous Operation, Beijing Jiaotong University, Beijing, China 通讯作者邮箱:xiaoge.zhang@polyu.edu.hk作者简介:廖敬骁,现为香港理工大学工业及系统工程学系和哈尔滨工业大学仪器科学与工程学院双学位博士生,在IEEE TII、MSSP、IEEE JBHI、IEEE TAI、IEEE TIM等期刊上发表了多篇学术论文,研究方向为深度学习理论,非平稳信号处理,多项式神经网络,轴承故障诊断。通讯作者:张晓革,香港理工大学工业及系统工程学系助理教授,主要从事智能系统可靠性与安全评估以及风险管理相关方面的研究工作,相关研究成果应用于物流运输、航空交通管理等领域。曾于2016年8月至12月在美国国家航空航天局艾姆斯研究中心(NASA Ames Research Center)担任研究工程师,于2020年3至2021年8月在美国联邦快递总部担任高级运筹学分析师,并获得Bravo Zulu Award。主持香港大学教育资助委员会(RGC)杰出青年学者计划基金一项,在NatureCommunications、MSSP、RESS、IEEE TII、IEEE Trans. on Reliability等国际知名期刊发表高水平学术论文70余篇,论文总引用量达到3200余次,曾获得省部级二等奖一项,国家优秀自费留学生奖学金等荣誉。通讯作者:张世平,哈尔滨工业大学仪器科学与工程学院副教授,精密电测技术与仪器研究所所长,主要从事传感技术、信号检测及处理,以及人工智能等方向研究,先后主持承担和参与国家自然基金,以及航天、石油、电网等领域的多项科研项目。目录1 摘要2 盲解卷积3 方法 3.1 时域二阶卷积滤波器 3.2 频域线性滤波及包络谱 3.3 基于不确定性感知加权的集成4 主要实验结果5 结论1 摘要盲解卷积(Blind Deconvolution, BD)是一种有效的非平稳信号处理方法,能够从强背景噪声下的振动信号中提取轴承故障特有的特征。尽管BD在自适应性和数学可解释性上已经获得了显著的成果,但依然存在一个重大的挑战:如何有效地将BD与故障诊断分类器结合?因为传统的BD方法仅设计用于特征提取,具有独立的优化方法和目标函数。而当BD与下游的深度学习分类器结合时,不同的学习目标很容易产生冲突。为了解决这一问题,本文提出了一种分类器引导的盲解卷积(Classifie-guided neural BD, ClassBD),旨在实现基于BD的特征提取与基于深度学习的故障诊断的协同学习。为此,本文首先开发了一种基于时频域的神经BD(Neural BD),构造神经网络实现了传统BD的功能,从而促进了BD与深度学习分类器的无缝集成,实现模型参数的协同优化。Neural BD中集成了两个滤波器:一是在时域中使用的二阶神经滤波器,利用二阶卷积神经网络(Quadratic Neural Network)提取周期性脉冲;二是在频域中设计了一个由全连接神经网络组成的线性神经滤波器,用于增强离散频率成分。其次,构建了一个基于深度学习分类器的统一框架,以引导BD滤波器的学习。最后,设计了一个物理信息引导的损失函数,该函数结合了峭度(Kurtosis)、𝑙2/𝑙4范数和交叉熵损失,以协同优化BD滤波器和深度学习分类器。通过这种方式,在强噪声环境中,故障标签被充分利用来指导BD提取区分类别的特征。这是首次成功将BD方法应用于轴承故障诊断。三个不同数据集的实验结果表明ClassBD在噪声条件下的表现优于其他最先进的方法。关键词:盲解卷积;二次卷积神经滤波;频率线性神经滤波器;分类器引导信号处理;轴承故障诊断2 盲解卷积在非平稳信号处理领域,解卷积用于逆转线性时不变系统对输入信号进行卷积操作的影响。这种技术的一个特殊表示,被称为盲解卷积或更准确地说是无监督反卷积,旨在当未知信号传输系统和输入信号时,利用输出信号来恢复输入信号[1]。在旋转机械振动信号的背景下,测量信号可以解释为周期性故障脉冲与从故障源到传感器的传输路径函数之间的卷积的结果[2]。数学上,给定被测信号 、故障源信号 和加性噪声 (如高斯噪声、拉普拉斯噪声等),信号传输过程可以定义如下: 其中, 和 表示传输函数, 表示卷积操作。 BD的目标是从测量信号中提取与故障相关的特征(周期性脉冲)。为此,它通过构建滤波器 来恢复更接近故障源的信号 : 上述公式表示的是信号传输过程的简化描述,并未明确定义为线性系统。根据[2],噪声 包含各种噪声和干扰成分,这些成分可能包括由机械旋转和齿轮啮合引起的周期性谐波、外部冲击导致的随机脉冲成分以及背景噪声。这些噪声通过不同的传输路径到达传感器。然而,由于机械系统的复杂性,准确估计传输函数及其频率响应通常是不现实的。这个挑战因不可预测的噪声的存在而变得更加复杂。因此,在缺乏先验信息(如准确的故障脉冲周期)的情况下,BD 被认为是一个病态问题。鉴于故障特征的非平稳性和周期性,提出了各种稀疏性指标作为优化目标函数[3-5] 。一个典型的例子是峭度[6],它在MED中被用作目标函数[7]: 其中 表示BD滤波器的输出,其长度等于输入 。 本质上,峭度是一种评估数据分布的统计量。峭度值的增加表明数据偏离标准正态分布[6]。直观上,当故障发生时,振动信号中会出现周期性脉冲,振动信号的峭度值由于更多峰值(离群值)的存在而增加。因此,最大化峰度驱动自适应滤波器恢复更多脉冲。优化目标定义如下: 目前已经开发了几种有效的BD优化方法,包括矩阵运算[7-8]、粒子群优化 [9] 和反向传播算法[10-11]。BD的性能也会受到优化方法影响。因此,近年来,针对BD方法的研究包括提出更通用的刻画目标信号本质特征的目标函数,设计新的滤波器及初始化技术,开发更强大的优化方法等[2]。3 方法所提出的框架,如图1所示,主要由两个 BD 滤波器组成,即时域二阶卷积滤波器和频域线性滤波器。这些滤波器作为即插即用的去噪模块,执行与传统 BD方法相同的功能,以确保输出与输入维度一致。1.时域滤波器的特点是由两个对称的二次卷积神经网络(QCNN)层组成。一个16通道的QCNN用于滤波输入信号(1×2048),然后通过一个反QCNN层将16个通道融合为一个,以恢复输入信号。2.频域滤波器首先使用快速傅里叶变换(FFT)将时域信号转换为频域。随后,使用一个线性神经层对信号的频域进行滤波,并通过逆傅里叶变换(IFFT)恢复时域信号。此外,还设计了一个包络谱(ES)中的目标函数用于优化。图1 神经盲解卷积滤波器Neural BD滤波器后可以直接使用1D深度学习分类器,如ResNet、CNN或Transformer等,来识别故障类型。本文采用了WDCNN[12]作为分类器。最后,设计了一个物理信息损失函数作为优化目标来指导模型的学习。该函数包括交叉熵损失 、峭度 和 范数 , 和 分别用于计算时域滤波器和频域滤波器输出的统计特性。 3.1 时域二阶卷积滤波器二阶神经网络(quadratic convolutional neural networks, QCNN)是时域卷积滤波器的关键组成部分。二阶神经网络将传统的线性神经元替换为二阶神经神经元,以实现更强的表示能力。本文使用Fan等人提出的二阶神经元表达式[13]: 其中∗为卷积操作, 为非线性激活函数, , 为权重参数。本文进一步证明了二阶网络对循环特征提取的优越性。相比于传统神经网络,二阶神经网络的模型参数数量和非线性乘法运算显著增加。因此,需要计算难度大幅增加。先前的研究表明,传统的初始化技术会显著阻碍二次网络的收敛[14-15]。为了解决这个问题,设计了一种专门的策略来初始化二次网络:其中, 表示均值为零的高斯分布, 表示范围在 内的均匀分布, 表示 的核大小。 分组初始化策略,也称为 ReLinear[14] ,迫使 QCNN 从近似线性神经元开始训练。高阶权重的初始值被设为零,以便其缓慢增长。这一策略通过避免梯度爆炸,大大提高了二次网络在训练过程中的稳定性。本文采用两个 QCNN 层来形成对称结构,模仿多层反卷积滤波器。第一个 QCNN 层将输入映射到16个通道,而第二个QCNN层将这16个通道合并为一个输出。输出的维度被刻意保持与输入相同。这一操作有效地使用卷积神经网络实现了传统的BD滤波器。最后,由于QCNN作为时域BD使用,可以使用峭度作为时域BD目标函数: 3.2 频域线性滤波及包络谱损失函数频域滤波器作为辅助模块,直接处理信号频域。其主要思想是通过傅里叶变换,并利用神经网络作为频域内的滤波器。这种方法通常被称为傅里叶神经网络[16-17]。设通过时域滤波器的信号为 ,应用FFT 将信号转换到频域: 根据卷积定理,两个时域数据的卷积等价于其傅里叶变换域中的内积。因此,频域滤波器采用线性操作在频域内滤波信号,从而替代时域中的卷积操作。即使用全连接神经网络来实现频域滤波器: 应用IFFT将信号恢复到时域: 其次,还需要为频域滤波器设计一个目标函数。先前的研究提出了一些频域BD目标函数,如包络谱𝑙1/𝑙2范数[18] 、包络谱峰度(ESK)[19]和𝑙𝑝/𝑙𝑞范数[4] 。这些方法的基本概念是增强频域信号的稀疏性,从而有效减轻噪声频率成分的影响。本文采用这一思路,基于包络谱(ES)设计目标函数。目标函数设计为衡量信号包络谱的稀疏性指标(包络谱的𝑙2/𝑙4范数): 3.3 基于不确定性感知加权的集成优化故障诊断任务通常需要一个深度学习分类器,此时损失函数演变为联合损失: 其中, 表示交叉熵损失。 此时,优化ClassBD被转换为一个多任务学习问题[20]。在多任务学习的背景下,一个关键挑战在于平衡不同损失项。为了解决这个问题,采用了不确定性感知加权损失,以自动平衡每个损失函数对学习问题的重要性[21] 。假设所有任务都有任务相关或同方差的不确定性,所有任务的损失函数都受到高斯噪声的影响,则似然函数可以定义为: 其中 表示噪声的方差。 联合损失可以转换为: 𝜎的值越大,对应损失的贡献就越小,反之亦然。每个𝜎被视为一个可学习的参数,其初始值设定为−0.5,见[21-22]。在训练过程中,尺度由最后一项log𝜎调节,如果𝜎过大将受到惩罚。尽管这种策略无法实现完美的平衡,但它可以让每个损失平稳下降,防止快速收敛到零。4 主要实验结果表1 PU数据集强噪声分类结果表2 JNU数据集强噪声分类结果表3 PU "N09M07F10" 数据集不同类型噪声下分类结果表4 PU数据集基于ClassBD使用不同分类器的分类结果图2 TSNE可视化结果图3 BD方法特征提取结果(增强包络谱)图4 传统神经网络和二阶神经网络特征提取结果5 结论本研究提出了一种新颖的方法,称为ClassBD,用于在强噪声条件下进行轴承故障诊断。ClassBD由级联的时域和频域Neural BD滤波器组成,随后连接一个深度学习分类器。具体来说,时域BD滤波器采用二次卷积神经网络(QCNN),在数学上证明了其在时域提取周期性脉冲特征的优越能力。频域BD滤波器包括一个全连接线性滤波器,补充了神经网络对频域的提取能力。此外,ClassBD直接集成一个深度学习分类器实现了端到端的故障诊断。设计了一个物理信息损失函数,该损失函数由峭度、 范数和交叉熵损失组成,以促进分类器引导BD学习。这个统一的框架将传统的无监督BD转变为监督学习,并由于保留了传统BD操作而提供了解释性。最后,三个公开和自测数据集上进行的综合实验表明,ClassBD优于其他最先进的方法。ClassBD是第一个可以直接应用于分类的BD方法,表现出良好的抗噪性和可移植性。因此,ClassBD在未来研究中具有进一步推广到其他困难任务(如跨域和小样本问题)的巨大潜力。编辑:李正平校核:陈凯歌、赵栓栓、曹希铭、赵学功、白亮、陈少华该文资料(BD)搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除。来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈