首页/文章/ 详情

综述 | 智能故障预测和健康管理的小样本数据挑战(中)

2月前浏览2244

本期受文章作者投稿给大家分享一篇SCI二区的小样本数据综述文章。如果有故障诊断相关方向研究人员希望宣传自己研究成果欢迎大家在公众 号后台与小编联系投稿,大家一起交流学习。

本期给大家推荐一篇的关于小样本数据的综述文章,该综述阐明了小样本数据的定义、成因和对PHM任务的影响,分析了当前解决小样本数据问题的主流方法及其优缺点,指出一些有前景的方向以启发未来研究。

本综述分3次推送,第1部分为综述 | 智能故障预测和健康管理的小样本数据挑战(上),本节推文是这篇文章的第2部分,希望对大家的学习有所帮助,也同时希望大家可以多多引用

论文链接:通过点击本文左下角阅读原文进行在线阅读及下载。

论文基本信息

论文题目Small data challenges for intelligent prognostics and health management: a review
论文期刊Artificial Intelligence Review(SCI二区Top)
论文日期2024.07
论文链接https://doi.org/10.1007/s10462-024-10820-4 
作者Chuanjiang Li(1), Shaobo Li(1), Yixiong Feng(1),  Konstantinos Gryllias(2), Fengshou Gu(3),  Michael Pecht(4)
机构
1 State Key Laboratory of Public Big Data, Guizhou University, Guiyang 550025, Guizhou, China 
2 Department of Mechanical Engineering, Flanders Make, KU Leuven, 3000 Louvain, Belgium 
3 School of Computing and Engineering, University of Huddersfield, Huddersfield HD1 3DH, UK 
4 Advanced Life Cycle Engineering, University of Maryland, College Park, MD 20742, USA
通讯作者邮箱licj@gzu.edu.cn
作者简介:李传江,工学博士,贵州大学公共大数据国家重点实验室专任教师、特聘教授C岗、硕士生导师。2021-2024年在比利时鲁汶大学(KU Leuven)联合培养,合作导师为Konstantinos Grylias教授。主要开展无人机大数据融合分析、通用人工智能算法、数字孪生与智能运维等研究,主持国家重点研发计划子课题1项,留学基金委联合培养博士项目1项、贵州大学特岗基金1项,主研国家重点研发计划、国家自然科学基金、集成公关大平台等项目6项,参编专著2部已发表SCI/EI检索论文20余篇,入选ESI全球Top1%高被引论文2篇。参加国际国内学术会议10余次并作学术报告,担任《Smart Construction》、《中国测试》、《无人系统技术》等国际国内著名学术期刊的青年编委,担任Transactions on Pattern Analysis and Machine Intelligence、 Knowledge Based Systems, ArtificialIntelligence Review等多个国际SC|期刊审稿人,指导学生参加互联网+、挑战杯等多项国际国内竞赛并获奖。个人主页:http://pbd.gzu.edu.cn/2024/0105/c17349a211760/page.htm

目录

1 摘要
2 引言
3 小样本数据在PHM中挑战分析
    3.1 什么是小样本数据
    3.2 PHM中小样本问题的原因
    3.3 PHM任务中小样本数据的影响
PHM中应对小样本数据挑战的方法综述
    4.1 数据增强方法
    4.2 迁移学习方法
    4.3 小样本学习方法
5 PHM应用中问题讨论
    5.1 AD任务的小样本数据问题
    5.2 FD任务的小样本数据问题
    5.3 RUL任务的小样本数据问题
6 数据集和实验设置
    6.1 数据集
    6.2 实验设置
7 未来研究方向
    7.1 数据治理
    7.2 多模态学习
    7.3 基于物理信息数据驱动的方法
    7.4 弱监督学习
    7.5 联邦学习
    7.6 大模型
8 总结

4 PHM中应对小样本数据挑战的方法概述

本节概述了在处理PHM典型任务(如AD、FD和RUL预测)中的小样本数据挑战方面的最新进展。如图5右侧所示,从当前文献中提炼了三种主要策略:数据增强(DA)、迁移学习(TL)和小样本学习(FSL)。接下来将深入探讨每一类相关理论和提出的方法,并进行简要总结。

4.1 数据增强方法

数据增强方法为处理小样本数据问题提供了数据层面的解决方案,其有效性已在许多研究中得到验证。基本原理是通过创建现有数据的副本新的合成样本来提高训练数据集的数量或质量(Gay等人,2023)。根据辅助数据的生成方式,分析了基于变换、基于采样和基于深度生成模型的数据增强方法。

4.1.1 基于变换的数据增强 ‍‍‍‍

基于变换的方法是数据增强中最早的一类,通过对现有样本进行几何变换而不改变标签来增加小样本数据集的大小。这些变换非常多样化和灵活,包括随机裁剪垂直水平翻转以及噪声注入。然而,大多数方法最初是为二维图像增强而设计的,难以直接应用于设备的一维信号(Iglesias等人,2023)。

考虑到监测数据的时序特性,学者们已经设计出适用于增加一维数据的变换方法(Meng等人,2019;Li等人,2020a;Zhao等人,2020a;Fu等人,2020;Sadoughi等人,2019;Gay等人,2022)。例如,Meng等人(2019)提出了一种用于旋转机械故障诊断的数据增强方法,该方法将原始样本均等分割,然后随机重组片段以形成新的故障样本。在Li等人(2020a)和Zhao等人(2020a)的研究中,同时应用了多种变换技术,如高斯噪声随机缩放时间拉伸信号平移,如图6所示。值得注意的是,所有上述技术都是对整个信号施加的全局变换,可能会忽视局部故障特性。因此,一些研究结合了局部和全局变换(Zhang等人,2020a;Yu等人,2020,2021a),以改变原始信号的局部和整体部分,从而获得更真实的样本。例如,Yu等人(2020)同时使用了局部和全局信号放大、噪声添加和数据交换的策略,以提高故障样本的多样性。

图6 Li等人提出的变换方法示意图(2020a),高斯噪声被随机添加到原始样本中,通过将原始信号乘以随机因子来实现随机缩放,通过沿时间轴水平拉伸信号来实现时间拉伸,通过向前或向后移动信号来完成信号转换。

4.1.2 基于采样的数据增强

基于采样的数据增强方法通常用于解决小样本下数据不平衡问题。其中,欠采样技术通过减少多数类的样本大小来解决数据不平衡问题,而过采样方法则通过扩展少数类的样本来实现数据增强。过采样可以进一步分为随机过采样合成少数类过采样技术(SMOTE)(Chawla等人,2002),取决于是否创建了新的类别。如图7所示,随机过采样将少数类的数据复 制次以增加数据量,而SMOTE通过计算少数类样本的个最近邻来创建合成样本,同时增强样本的数量和多样性。

图7 随机过采样与SMOTE的比较

为了解决监测数据中健康样本丰富而故障样本较少导致的数据不平衡问题,一些研究(Yang等人,2020a;Hu等人,2020)引入了增强的随机过采样方法。例如,Yang等人(2020a)针对故障诊断任务中的不平衡和不完整数据,通过引入一种变尺度采样策略增强了随机过采样效果;而Hu等人(2020)使用重采样方法来模拟不同工况下的数据,以降低领域偏差。相比之下,由于SMOTE技术具有固有优势,在PHM任务中得到了广泛应用(Hao和Liu,2020;Mahmoodian等人,2021)。Hao和Liu(2020)将SMOTE与欧几里得距离相结合,实现了对少数类样本更好的过采样。为了解决合成样本选择适当最近邻的困难,Zhu等人(2022)计算了最近邻的欧几里得距离和马氏距离,而Wang等人(2023)则利用邻域分布的特征来平衡样本。此外,Liu和Zhu,Fan,Dou等人的研究通过采用加权分布来进一步提高了SMOTE的适应性,使分类边界的重要性更多地转向具有挑战性的少数类,从而有效解决了数据不平衡问题。

4.1.3 基于深度生成模型的数据增强

此外,自2017年以来,深度生成模型已成为解决小样本数据问题的极具前景的手段,其中自编码器(AE)和生成对抗网络(GAN)是两个典型代表(Moreno-Barea等人,2020)。AE是一种特殊类型的神经网络,其特点是以无监督的方式将输入编码到输出(Hinton和Zemel,1994),优化目标是学习输入数据的有效表示。AE的基本架构如图8a所示,包括两个对称部分,前半部分称为编码器,将输入数据转换为潜在空间,而后半部分(解码器)则将这种潜在表示解码以重建数据。同样,GAN也由两个基本组件组成,如图8b所示。第一个是生成器,负责根据输入的随机噪声获取假样本,第二个是判别器,用于识别生成样本的真实性。这两个组件参与对抗性训练过程,逐步趋向于纳什均衡状态。

图8 AE和GAN的基本结构

GAN在生成多样样本方面的独特优势,使其相较于传统的过采样数据增强方法更具优势,特别是在处理PHM任务中的数据不平衡问题时(Behera等人,2023)。目前已涌现出多种变体模型,包括变分自编码器(VAE)(Qi等人,2023)、深度卷积生成对抗网络(DCGAN)(Zheng等人,2019)、Wasserstein GAN(Yu等人,2019)等,根据其输入类型分为两类。第一类方法通常从一维输入(如原始信号)(Zheng等人,2019;Yu等人,2019;Dixit和Verma,2020;Ma等人,2021;Zhao等人,2021a,2020b;Liu等人,2022;Guo等人,2020;Wan等人,2021;Huang等人,2020,2022;Zhang等人,2020b;Behera和Misra,2021;Wenbai等人,2021;Jiang等人,2023)和频率特征(Ding等人,2019;Miao等人,2021;Mao等人,2019)生成数据,能够捕获信号中的固有时间信息,而无需复杂的预处理。例如,Dixit和Verma(2020)提出了一种改进的条件VAE,利用原始振动信号生成合成样本,即使在数据有限的情况下也能获得显著的故障诊断性能。在Mao等人(2019)的工作中,应用了快速傅里叶变换(FFT)将原始信号转换为频域输入给GAN,从而获得了更高质量的生成样本。另一方面,一些研究(Du等人,2019;Yan等人,2022;Liang等人,2020;Zhao和Yuan,2021;Zhao等人,2022;Sun等人,2021;Zhang等人,2022b;Bai等人,2023)结合了AEs和GAN在图像领域的优势,旨在利用二维时频表示生成相应的图像。例如,Bai等人(2023)采用跨时间返回图将时间序列数据转换为二维图像,作为Wasserstein GAN的输入,该方法减少了数据不平衡并提高了轴承故障的诊断准确性。

4.1.4 小结

表4总结了基于数据增强方法的各种解决方案,用于解决PHM中的小样本数据问题,包括每种技术所解决的具体问题以及每种方法的优缺点。显然,数据增强方法侧重于在数据层面缓解小样本数据挑战,包括标签训练数据不足、类别不平衡、数据不完整以及样本受到噪声污染等问题。其中,基于变换的方法主要通过在信号上施加变换来增加训练数据集的大小,但其有效性取决于原始信号的质量;而基于采样的方法在处理PHM任务中的不平衡问题上表现出色,SMOTE方法不仅擅长增加少数类样本的数量,还能使其组成更加多样化,但完善最近邻选择和加强对高度类别不平衡的适应性仍是开放的研究领域;虽然基于深度生成模型的数据增强方法灵活且有前景,能够生成不同工况下设备的样本,但还需要更深入的研究以结合PHM具体任务特性、评估生成数据的质量以及高效地训练生成模型。

4.2 迁移学习方法

传统深度学习模型假设训练数据和测试数据来自相同的域,然而,工况变化不可避免地导致数据分布差异。迁移学习(TL)是一种新兴技术,通过从相关域转移和重用数据或知识,降低对数据分布一致性的要求,从而解决目标域中小样本数据问题。迁移学习根据域和任务来定义,每个域  由一个特征空间和一个对应的边缘分布组成,而与每个域相关联的任务 包含一个标签空间和一个学习函数(Yao等人,2023)。

在PHM背景下,迁移学习可以简洁地定义为:给定一个源域  和及任务  ,以及一个目标域  及任务  ,目标是在  或  的设置下,利用从  和  中学习到的某些设备的知识来增强   中  的学习过程,并且源域的数据量远大于目标域。在现有文献中,迁移学习方法有多种分类标准。从实施阶段“迁移什么”划分,迁移学习可以分为三类:基于实例的迁移学习、基于特征的迁移学习和基于参数的迁移学习。其中,前两种属于数据层面,而后者则属于模型层面方法。这些分类在图9中得到了直观的展示。

图9 迁移学习方法分类

4.2.1 基于实例的迁移学习

应用迁移学习的前提是源域包含足够的标签数据,而目标域要么缺乏足够的标签数据,要么主要由未标注数据组成。虽然最直接的方法是利用源域的样本为目标域训练模型,但由于两域之间固有的分布差异,该方法被证明是不切实际的。因此,在源域中找到并应用与目标域具有相似数据分布的标记实例是关键。为此,提出了各种方法来最小化分布差异,其中加权策略是最广泛使用的。

动态权重调整(DWA)是一种有效策略,其新颖之处在于根据源域和目标域样本对目标模型学习的贡献来重新加权。以著名的TrAdaBoost算法(Dai等人,2007)为例,该算法增加了与目标域相似的样本的权重,并降低了不相关源域实例的权重。TrAdaBoost在风力涡轮机(Chen等人,2021)、轴承(Miao等人,2020)和感应电机(Xiao等人,2019)的故障诊断中的有效性已得到验证。进一步地,学者们还将多目标优化(Lee等人,2021)和深度学习理论(Jamil等人,2022;Zhang等人,2020c)引入TrAdaBoost,以提高模型训练效率。然而,DWA需要目标样本的标签,否则,需要基于核映射技术的权重调整方法来估计关键权重参数,例如在再生核希尔伯特空间(RKHS)中匹配源域和目标域样本的均值(Tang等人,2023a)。Chen等人(2020)设计了一种基于核主成分分析的白余弦相似度准则,以确定源域和目标域中数据的权重参数,从而在有限数据和不同工作条件下提高了齿轮的诊断性能。更多研究可参见Liu和Ren(2020)、Xing等人(2021)、Ruan等人(2022)的研究。

4.2.2 基于特征的迁移学习

与在原始样本空间中寻找不同域之间相似性的基于实例迁移学习不同,基于特征的方法在源域和目标域之间的共享特征空间内进行知识迁移。如图10所示,基于特征的迁移学习在域适应域泛化场景中得到了广泛应用,前者关注如何将知识从源域迁移到目标域,而域泛化旨在开发一个跨多源域的鲁棒模型,以能够泛化到任何新领域。基于特征迁移学习的关键在于通过操作(如基于差异的方法和特征约简方法)来减少不同域之间的边缘分布和条件分布差异,使模型能够在目标任务上实现优异的适应性和泛化能力(Qin等人,2023)。

图10 基于特征的迁移学习应用场景

基于差异方法的主要挑战在于如何准确地量化不同域之间的分布相似性,这依赖于特定的距离度量标准。表5列出了常用的度量标准(Borgwardt等人,2006;Kullback和Leibler,1951;Gretton等人,2012;Sun和Saenko,2016;Arjovsky等人,2017)以及应用于PHM任务(故障预测与健康管理)的算法(Yang等人,2018,2019a;Cheng等人,2020;Zhao等人,2020c;Xia等人,2021;Zhu等人,2023a;Li等人,2020b,c,2021a;He等人,2021)。其中,最大均值差异(MMD)计算再生核希尔伯特空间(RKHS)中实例均值之间的距离,而Wasserstein距离则通过考虑几何属性来评估概率分布的相似性,这两者都得到了广泛应用。例如,Yang等人(2018)设计了一个具有多核MMD的卷积适应网络,以最小化从实验室和真实机器故障数据中提取的特征分布之间的差异。Cheng等人(2020)引入的Wasserstein距离极大地增强了所提出模型的域适应能力。此外,Fan等人(2023a)提出了一种基于域的差异度量方法,用于在未见条件下的领域泛化故障诊断,这有助于模型平衡多个源域之间的域内和域间距离。另一方面,特征约简方法旨在自动捕获不同域之间的一般表示,主要使用无监督方法,如聚类(Michau和Fink,2021;He等人,2020a;Mao等人,2021)和自编码器(AE)模型(Tian等人,2020;Lu和Yin,2021;Hu等人,2021a;Mao等人,2020)。例如,Mao等人(2021)将时间序列聚类整合到迁移学习中,并利用从每个聚类获得的元退化信息进行轴承剩余使用寿命预测的时域适应。为了提高模型在不平衡和可迁移故障诊断中的性能,Lu和Yin(2021)设计了一种弱监督卷积自编码器(CAE)模型,以从多域数据中学习表示。Liao等人(2020)提出了一种深度半监督领域泛化网络,在未见速度工况下进行旋转机械故障诊断时表现出了优异的泛化性能。

表5 PHM任务中度量方法

4.2.3 基于参数的迁移学习

第三类方法是基于参数的迁移学习,假设源域任务和目标任务在模型层面上共享一定知识,这些知识被编码在源域上预训练的模型架构和参数中。这一方法的动机在于,从头训练一个模型需要大量数据和时间,而直接在目标域中迁移预训练的参数并进行微调则更为高效。因此,根据迁移参数在目标模型训练中的利用方式,主要有两种实现方式:全局微调(或冻结)和部分微调(或冻结),如图11所示。

图11 基于参数的迁移学习. a 全局微调(或冻结),b部分微调(或冻结)

全局微调(或冻结)意味着从源域迁移过来的所有参数使用目标域中有限的标记数据进行微调,或者在目标模型训练过程中这些参数会被冻结而不进行更新。相反,部分微调(或冻结)是选择性地对特定的高层或参数进行微调,同时保持低层参数与预训练模型一致。在这两种情况下,目标模型的分类器或预测器都需要使用随机初始化的参数进行重新训练,以与目标任务中的类别数量或数据分布相匹配。全局微调(或冻结)方法适用于源域和目标域样本具有高度相似性的情况,这样可以使用预训练参数从目标域中提取通用特征(Cho等人,2020;He等人,2019,2020b;Zhiyi等人,2020;Wu和Zhao,2020;Peng等人,2021;Zhang等人,2018;Che等人,2020;Cao等人,2018;Wen等人,2020,2019)。从预训练模型的大小和微调时间来看,全局微调和全局冻结策略分别适用于小型和大型模型。例如,He等人(Zhiyi等人,2020)提出,通过用少量目标训练样本对预训练参数进行全局微调,实现不同机器上轴承之间的知识迁移。在Wen等人(2020,2019)的研究中,研究人员应用了深度卷积神经网络(CNN)——ResNet-50(一个50层的CNN)和VGG-19(一个19层的CNN),这两个网络在ImageNet上进行了预训练并用作特征提取器,然后使用全局冻结方法训练目标故障诊断(FD)模型。相比之下,部分微调(或冻结)策略更适合处理域差异显著的情况(Wu等人,2020;Zhang等人,2020d;Yang等人,2021;Brusa等人,2021;Li等人,2021b),如复杂工况间的迁移(Wu等人,2020)和多模态数据间的迁移(Brusa等人,2021)。此外,Kim和Youn(2019)介绍了一种称为选择性参数冻结(SPF)的创新方法,其中只有每层的部分参数被冻结,从源域模型中显式选择对输出敏感的参数,从而在数据有限的情况下降低目标模型过拟合的风险。

4.2.4 小结

迁移学习框架打破了传统深度学习对训练和测试数据同分布的假设,通过从大量易于收集的数据中获取和迁移知识来弥补目标域中数据标记不足的问题。如表6所示,基于实例的迁移学习可以视为一种借用式增强,其中利用具有相似分布的其他数据集来丰富目标域中的样本。其中,数据加权策略在解决目标数据标记不足和数据不平衡问题上表现优越,但其高计算成本和对相似分布的高依赖性需要进一步优化。相比之下,基于特征的迁移学习通过学习通用故障表征来进行知识迁移,并有能力处理具有大分布差异的领域适应和领域泛化任务,如不同工况间的迁移(He等人,2020a)、不同部件间的迁移(Yang等人,2019a),甚至从模拟到物理过程的迁移(Li等人,2020b)。而且,基于弱监督的特征降维技术能够自适应地发现更好的特征表示,并在开放域泛化问题中展现出巨大潜力。最后,基于参数的迁移学习避免了目标模型从头开始训练,但这些参数的有效性取决于源域样本的数量和质量,可以考虑在多源域数据上进行模型预训练(Li等人,2023b;Tang等人,2021)。

4.3 小样本学习方法

数据增强和迁移学习方法都要求训练数据集包含一定数量的(从几十个到几百个不等)标记样本。然而,在某些工业场景下,特定类别(如早期故障或复合故障)的样本可能极其罕见且难以获取,每类只有少数几个样本(例如5-10个)用于深度学习模型训练,导致模型在这种“小样本”问题上的性能较差(Song等人,2022)。受人类从以前任务中学习和重用先验知识能力的启发,Jürgen Schmidhuber将这种能力命名为元学习(Schmidhuber 1987),提出了小样本学习(FSL)方法旨在学习一个模型可以在仅有少量示例的情况下进行训练和快速适应任务。如图12所示,传统深度学习模型、迁移学习和小样本学习方法之间存在一些差异:

1)传统深度学习和迁移学习是在单一任务数据点上进行训练和测试,而小样本学习方法则在任务层面进行学习

2)传统深度学习模型需要大量标记的训练和测试样本,迁移学习需要源域中大量的标记训练数据,而小样本学习方法则使用有限的数据进行元训练和元测试

小样本学习任务遵循“N-way K-shot Q-query”协议(Thrun和Pratt 2012),随机选择N个类别,并从每个类别的每个任务中随机抽取K个支持样本和Q个查询样本。小样本学习的目标是在元训练期间将先前从多个任务中获得的知识与少量支持样本相结合,以预测元测试期间查询样本的类别。根据先验知识的学习方式,本文主要讨论基于度量、优化和属性的小样本学习方法。

图12 传统深度学习模型、迁移学习和小样本学习的对比
4.3.1 基于度量的小样本学习方法

基于度量的小样本学习通过测量样本相似性来学习先验知识,包含两个组成部分:特征嵌入模块负责将样本映射为特征向量;度量模块,用于计算相似性(Li等人,2021)。孪生神经网络是这一领域的先驱之一,最初由Koch等人在2015年提出,用于单样本图像识别(Koch等人,2015),使用两个并行的卷积神经网络(CNN)和L1距离来确定成对的输入是否相同。随后,Vinyals等人(2016)引入了带有注意力机制的长短期记忆(LSTM)网络,以有效评估多类相似性;Snell等人(2017)开发了原型网络来计算原型表示之间的距离;而关系网络(Sung等人,2018)则使用了自适应神经网络而不是传统函数。表7列出了这些代表性方法在嵌入模块和度量函数方面的差异。

表7 基于度量的FSL经典方法之间的差异

根据目前研究,基于度量的小样本学习方法在PHM任务执行中主要有两种形式。第一种是利用固定度量(如余弦距离)来测量相似性,第二种是利用可学习的度量,如关系网络中的神经网络。例如,Zhang等人(2019)首次将基于宽核深度卷积神经网络的孪生网络引入滚动轴承的故障诊断中,该网络在不同工况下利用有限数据实现了优异的诊断性能。随后,基于孪生网络(Li等人,2022c;Zhao等人,2023;Wang和Xu,2021)、匹配网络(Xu等人,2020;Wu等人,2023;Zhang等人,2020e)和原型网络(Lao等人,2023;Jiang等人,2022;Long等人,2023;Zhang等人,2022c)的各种小样本学习算法被开发出来。Zhang等人(2020e)设计了一种结合选择性信号重用策略的迭代匹配网络,用于风力发电机的小样本故障诊断。Jiang等人(2022)开发了一种双分支原型网络(TBPN)模型,集成了时域和频域信号以提高故障分类的准确性。当测量来自不同领域的样本时,关系网络显示出比基于固定度量的FSL方法更优的性能,因此被广泛用于跨域小样本任务(Lu等人,2021;Wang等人,2020b;Luo等人,2022;Yang等人,2023a;Tang等人,2023b)。例如,Lu等人(2021)将旋转机械在有限数据下的故障诊断视为一个相似性度量问题,并将关系网络引入迁移学习框架作为解决方案。Luo等人(2022)提出了一种三重关系网络方法,用于执行跨部件的小样本故障诊断任务。Tang等人(2023b)设计了一种新颖的轻量化关系网络,用于高效执行跨域的小样本故障诊断任务。此外,为了解决由不同工况引起的领域偏移问题,Feng等人(2021)将基于相似性的元学习网络与领域对抗相结合,用于跨域的故障识别。

4.3.2 基于优化的小样本学习

基于优化的FSL方法遵循“学会优化”的原则,以解决小样本带来的过拟合问题。具体来说,这些方法学习跨多个任务的全局初始化参数,使模型在元测试阶段能够迅速适应新的小样本任务(Parnami和Lee,2022)。以最知名的模型无关元学习(MAML)(Finn等人,2017)算法为例,基于优化的FSL通常遵循双循环学习过程,首先在内部循环中针对给定任务学习一个特定于任务的模型(基础学习器),然后在外部循环中跨任务分布学习一个元学习器,其中元知识嵌入在模型参数中,用作元测试任务中模型的初始化参数。MAML与多种使用梯度下降训练的模型兼容,使模型能够很好地泛化到新的小样本任务上,而不会过拟合。

最近的研究文献证明了MAML在PHM中的潜力,主要集中在元分类和元回归方法。对于元分类方法,目标是基于多个元训练任务学习一个优化的分类模型,该模型能够在元测试阶段以少量样本作为支持,准确地对新类别进行分类,通常用于异常检测(Chen等人,2022)和故障诊断任务(Li等人,2021c,2023c;Hu等人,2021b;Lin等人,2023;Yu等人,2021b;Chen等人,2023b;Zhang等人,2021;Ren等人,2024)。例如,Li等人(2021c)提出了一种基于MAML的元学习故障诊断技术,该技术利用已知工作条件的先验知识,对新工况下的轴承进行故障诊断。为了进一步提高元学习能力,设计了诸如任务序列MAML(Hu等人,2021b)和元迁移MAML(Li等人,2023c)等先进模型,用于少量样本的故障诊断任务,并提出了一种基于元学习的领域泛化框架,以解决资源不足和领域偏移问题(Ren等人,2024)。另一方面,元回归方法针对PHM中的预测任务,旨在从类似回归任务中获得元优化模型,使用有限的输入样本来预测连续变量(Li等人,2019,2022d;Ding等人,2021,2022a;Mo等人,2022;Ding和Jia,2021)。在2019年,Li等人首次探索了MAML在小型数据集剩余使用寿命(RUL)预测中的应用,设计了一个基于全连接神经网络(FCNN)的元回归模型,用于预测在不同切削条件下工具的磨损情况。此外,MAML还已被整合到强化学习中,用于退化条件下的故障控制,更多见解可参见Dai等人(2022)和Yu等人(2023)的研究。

4.3.3 基于属性的小样本学习方法

还有一种独特的小样本学习范式,被称为“零样本学习”(Yang等人,2022),模型需要预测在元训练过程中未见过的类别。在这种设置中,由于缺少训练数据,需要辅助信息来弥补未见类别之间的信息差距,补充信息必须是有效、独特且具有代表性的,以便有效地区分不同类别,例如计算机视觉中图像的属性信息。如图13所示,未见动物的类别是通过迁移类间属性来推断的,如动物的形状、声音或栖息地的语义描述,这些属性的有效性已在许多零样本任务中得到了验证(Zhou等人,2023b)。

图13 基于属性的零样本图像识别

基于属性的小样本学习方法为PHM任务中的零样本问题提供了潜在解决方案。然而,由于视觉属性与传感器信号的物理意义不匹配,因此无法直接使用。为此,学者们一直在研究有效的故障属性。鉴于可以从维护记录中轻松获得与故障相关的语义描述,并且可以在实践中为特定故障进行定义,因此语义属性在当前研究中得到了广泛应用(Zhuo和Ge,2021;Feng和Zhao,2020;Xu等人,2022;Chen等人,2023c;Xing等人,2022)。例如,Feng和Zhao(2020)率先实现了基于故障描述属性转移的零样本故障诊断,这些属性包括故障位置、故障原因和后果,为目标故障提供了辅助知识。Xu等人(2022)设计了复合故障诊断的零样本学习框架,该框架的语义描述符可以为单一和复合故障定义不同的故障语义。Fan等人(2023b)提出了一种针对具有新故障模式的零样本故障诊断的属性融合迁移方法。尽管在描述驱动的语义属性方面取得了长足进步,但仍存在一些局限性,包括依赖专家见解和信息来源不准确。最近,在没有语义信息的情况下(称为非语义属性),Lu等人(2022)和Lv等人(2020)也进行了探索。Lu等人(2022)开发了零样本智能故障诊断系统,采用了从信号的时域和频域中提取的统计属性。

4.3.4 小结
小样本学习方法在解决样本数量极其有限的PHM任务方面具有优势,例如每个任务中每类仅有出五个、一个甚至零个样本。如表8所示,基于度量的FSL方法在原理和计算上都很简洁,将重点从样本数量转移到内在相似性上,但在特征嵌入训练过程中对标记数据的依赖限制了在监督环境中的适用性;基于优化的FSL,特别是以MAML为基础的FSL,具有更广泛的应用场景,包括故障分类、剩余使用寿命预测和故障控制,但这些技术需要大量的计算资源来进行深度神经网络的梯度优化,而优化参数与模型训练速度之间的平衡是关键(Hu等人,2023);基于属性的FSL是一个新兴但具有前景的研究课题,有可能大幅降低工业中数据收集的成本,零样本学习则使模型能够推广到新的故障模式或工况下无需重新训练,即使在“零”异常或故障样本的情况下,也能实现复杂系统的智能预测。在工业中,小样本学习往往伴随着由不同速度和负载条件引起的领域偏移问题,这是一个更为困难的问题,对传统FSL方法提出了挑战,要求学习足够的代表性故障特征,以适应和推广到未见过的数据分布,而该领域的研究最近才刚刚开始(Liu等人,2023)。




 
客官,球球再点个广告,再走吧~

点击左下角阅读原文,即可在线阅读论文。


来源:故障诊断与python学习
ACTMechanicalSystem振动化学旋转机械通用航空ANSAUG声学理论电机创新方法数字孪生控制人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-09-01
最近编辑:2月前
故障诊断与python学习
硕士 签名征集中
获赞 57粉丝 63文章 133课程 0
点赞
收藏
作者推荐

研究热点!数字孪生!|不平衡样本下基于逆物理信息的数字孪生轴承故障诊断神经网络

数字孪生是当前故障诊断领域的研究热点之一。它们只需要很少的实际信号就可以产生故障样本,从而降低了实验成本。小编整理搜集了一些相关研究与大家进行分享。本期分享的是不平衡样本下基于逆物理信息的数字孪生轴承故障诊断神经网络,该论文发表于Knowledge-Based Systems,适合具备一定有信号基础并打算在故障诊断领域深入挖掘的学习者,非常值得阅读!论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。1 论文基本信息论文题目:Inverse physics–informed neural networks for digital twin–based bearing fault diagnosis under imbalanced samples论文期刊:Knowledge-Based SystemsDoi: https://doi.org/10.1016/j.knosys.2024.111641论文时间:2024年作者:Yi Qin (a), Hongyu Liu (a), Yi Wang (a), Yongfang Mao(b)机构:a: State Key Laboratory of Mechanical Transmission for Advanced equipment, Chongqing University, Chongqing 400044, PR China;b: School of Automation, Chongqing University, Chongqing 400044, PR China.2 目录1 论文基本信息2 目录3 摘要4 引言5 准备工作5.1 PINN5.2 数字孪生6 提出的轴承故障振动数据生成方法6.1 轴承故障动力学模型6.2 逆PINN6.3 轴承故障数据生成7 实验结果与分析7.1 实验描述7.2 实验结果与分析7.3 数据生成示例8 总结注:本文只选中原论文部分进行分享,若想拜读,请下载原论文进行细读。小编能力有限,如有翻译不恰之处,请多多指正~3 摘要在实际工程中,各种故障类别的轴承样本不足,给滚动轴承的智能故障诊断带来了很大障碍。为了解决样本不平衡的问题,本工作探索了一种基于数字孪生技术的轴承故障数据生成方法。首先,通过将轴承动态模型嵌入到神经网络中,建立逆物理信息神经网络(Inverse Physics–informed Neural Network, PINN)来识别动态模型参数。在该网络中,设计了一个边界损失来快速确定加速网络收敛的参数的近似范围,并构造了一个真值损失来评估模拟数据和实际数据之间的频谱差异。然后,利用逆PINN、轴承故障动态模型和实际振动数据,提出了一种基于数字孪生的故障数据生成方法,用于在多种工况和故障模式下生成高质量的轴承故障样本。最后,将该方法应用于特定工况下的轴承故障振动样本生成。将生成样本用于训练诊断网络,解决了样本不平衡的问题。多个实验的对比结果表明,所提出的数据生成方法有效地提高了跨工况轴承故障诊断的精度,并超过了多种先进的诊断方法。关键词:数字孪生,物理信息神经网络,轴承动态模型,故障诊断,样本不平衡4 引言已提出的轴承故障诊断方法大致可分为基于信号处理的方法[1]和基于人工智能的技术[2]。深度学习方法,包括卷积神经网络[3]、深度神经网络[4]和联邦学习[5],在智能轴承故障诊断中占据主导地位。然而,这些深度学习方法通常需要大量的故障样本。在许多工程应用中,正常的轴承振动信号样本非常丰富,而故障振动信号样本的可用性有限。此外,一些故障的样本可能比其他故障少得多。因此,轴承数据集表现出样本不平衡,这可能会显著影响故障诊断的效率。故障样本的稀缺性和数据集的不平衡性可能会阻碍故障诊断模型识别某些故障类型。为了解决这些问题,Zhao等人[6]提出了一种基于小波变换和CNN的机械故障诊断方法。[7]研究了一种能够进行多领域特征提取和选择的代价敏感学习方法,有效地降低了漏报率和平均代价。此外,Li 等人[8]在训练数据类型较少的情况下,引入持续学习来提高故障诊断的效果。另一种可用的方法是添加相关的故障样本。基于实际信号的数据生成是一种可行的采样增强技术。Wang等人[9]建立了一种自适应、高效的亚像素网络DAESPN用于变速条件下的故障样本扩充和智能故障诊断。An等人[10]开发了一种主动构造的数据增强模型以增强轴承故障诊断。Pei等人[11]设计了一种改进的基于元学习的Wasserstein自动编码器以增加滚动轴承数据,提高轴承故障诊断能力。然而,这些数据驱动的方法往往需要大量的实际样本来训练生成式模型,而且生成的样本往往与训练样本相似,限制了多样性,阻碍了故障诊断准确率的提高。另一种方法是利用故障动态模型来生成故障样本。Shao等人[12]建立了转子-轴承系统动力学模型,该模型产生了不同健康状态的轴承振动信号;这些信号随后被用于具有生成式对抗性网络(Generative Adversarial Network, GAN)的实际轴承的故障诊断。Qin等人提出了一种利用时变激励生成故障样本的故障动力学模型[13]。类似地,Liu 等人的研究[14]建立了用于故障样本产生的现实的轴承振动模型,并将其用于基于GAN的轴承故障诊断。Liu等人[15]提出了一种个性化故障诊断方法,通过有限元仿真训练智能传感器网络,提高了故障样本缺失时故障诊断的有效性。然而,基于动态模型的数据生成方法需要确定故障动态模型的关键参数,如刚度和阻尼比。这些参数通常是由经验设定的。估计参数和实际参数之间的差异导致了仿真数据和测量数据之间的差异,影响了仿真数据对诊断模型训练的效果。数字孪生模型只需要很少的实际信号就可以生成故障样本,从而节省了实验材料和时间。基于数字孪生的样本扩充技术结合数据驱动和基于模型的方法,并引起了人们的极大兴趣。它们只需要很少的实际信号就可以产生故障样本,从而降低了实验成本。提出了几种提高轴承振动数据的方法。Piltan等人[16]建立了机械模型与自适应观测器相结合的轴承数字孪生框架,实现了轴承裂纹尺寸的精确检测。为了阐述退化过程中的轴承振动响应,Qin等人[17]建立了全生命周期的轴承数字孪生模型。值得注意的是,一种新的基于循环GAN的映射网络(CycleGAN)[18]最大限度地减少了模拟信号和实际信号之间的差异信号进行调整的。此外,动态模型没有完全集成到神经网络中。为了将物理模型与神经网络相结合,人们提出了各种PINN,其中一些已成功地应用于滚动轴承的故障预测和诊断。例如,Chen等人[19]提出了一种物理信息-退化一致性递归神经网络来预测机器RUL,并将机器部件的退化能力集成到神经网络中。Yucesan等人[20]建立了基于物理信息的PINN模型,用于风电机组主轴承疲劳建模。然而,这些方法主要是利用物理信息进行RUL预测,而不是求解物理模型。已经提出了一些用于求解各种物理模型的PINN。例如,Ling等人[21]用PINN和Mao等人预测湍流和高速气动扰流。[22]用PINN对高速气动流动进行了模拟。不幸的是,现有的PINN无法计算二自由度轴承动力学模型的振动响应,因为两个微分方程组是相互耦合的。因此,需要对PINN进行改进,以便对故障滚动轴承进行动态建模。刚度和阻尼比是轴承动力学模型中的两个重要参数,一般都是凭经验设定的,往往会导致仿真信号与实测信号存在较大的偏差。为了解决这一问题,提出了一种滚动轴承的逆PINN。与传统的PINN方法不同的是,直接利用滚动轴承的二自由度微分方程组而不是损失函数来计算振动响应,并将网络损耗视为模拟信号与采集的真实信号之间的频谱差异,以防止沿X和Y方向的动态微分方程组之间的耦合效应。同时,逆PINN的优化对象是轴承的动态参数,而不是振动响应,因此可以精确地辨识轴承动力学模型的参数。利用逆PINN和轴承动力学模型,提出了一种新的故障数据生成方法,用于产生各种工况下的高精度轴承振动信号。最后,将生成的数据成功地应用于样本不平衡情况下的跨工况轴承故障诊断。本研究的贡献如下:1. 为了辨识动态模型的参数,我们提出了一种逆PINN方法,将轴承动态模型集成到神经网络中。在该网络中,边界损失被设计为快速确定参数的近似范围,从而加速网络收敛,并构造了真值损失来评估模拟数据与实际数据之间的频谱差异。利用所提出的逆PINN方法,可以准确地辨识轴承的动态参数。2. 利用逆PINN、轴承故障动态模型和采集的振动信号,提出了一种新的基于数字孪生的数据生成方法,可以在多个工作条件下生成高质量的故障样本。该方法从单一工况下采集的少量轴承样本中生成出不同工况下高质量的轴承故障振动样本。由此可见,该方法实现了故障滚动轴承的数字孪生。3. 对于具有不平衡轴承振动样本的跨工况故障诊断,该方法被用来生成特定工况下的轴承故障振动样本。然后,将样本用于诊断网络的训练。实验结果表明,与现有的各种SOTA数据生成和不平衡故障诊断方法相比,该方法能够提高跨工况轴承故障诊断的精度。5 准备工作5.1 PINNPINN可以结合经验数据和抽象的数学运算符[23],例如偏微分方程(Partial Differential Equations, PDE)。一旦将物理原理或约束嵌入到PINN中,网络就会表现出更强的可解释性和抗干扰性。一般来说,一个典型的Pinn的损失被定义为: 其中, 表示输出数据和实际数据之间的差距, 表示初始值和边界损失, 由微分方程式决定, , 和 用于平衡三个损失之间相互作用的影响的权重,可以由使用者定义或自动调整。PINN的参数通过各种基于梯度的优化器(例如ADAM和L-BFGS)来最小化损失来进行优化。然而,传统的PINN算法主要用于求解单个偏微分方程组。 5.2 数字孪生图1 数字孪生框架示意图作为一种新的设备运行和维护方法,数字孪生技术起源于2003年格里夫斯教授在密歇根大学的一次演讲[24]。在本讲座中,定义了数字孪生模型,它包含三个基本组成部分:虚拟空间、物理空间和数据流的互联性。2012年,NASA[25]将数字孪生视为集成多个物理域、尺度和概率的模拟过程。这一创新方法在各种设备的设计、制造和运行维护方面已被证明是成功的。Deon等人[26]建立了火电厂发电机组预知检修的数字孪生模型。如图1所示,数字孪生框架主要由物理空间、虚拟空间以及它们之间的数据流或映射关系组成。物理空间表示被分析的系统或部件;虚拟空间是所建立的分析模型,诸如有限元模型或集总参数动态模型。并且数据流或映射用于桥接物理空间和虚拟空间之间的关系。针对轴承故障诊断中样本不均衡的问题,利用数字孪生技术生成轴承故障样本。6 提出的轴承故障振动数据生成方法6.1 轴承故障动力学模型图2 简化故障的形状首先建立了轴承故障动力学模型。通过将外圈上的轴承故障简化为立方体,降低了模型的复杂性(图2)。立方体的长度、宽度和高度分别由L、B和H表示。根据故障和滚动轴承参数,通过下式计算故障引起的最大位移激励 : 式中,D表示滚子的直径, 表示位移激励的理论最大值。考虑半正弦激励,我们可以定义位移激励函数如下[27]: 其中 表示进入故障区域时滚动体与X轴的夹角, 表示离开故障区域时滚动体与X轴的夹角, 表示第j个滚动体的位置。滚动体与滚子接触的法向变形包含了轴承故障位移激励函数的影响。接触变形表达式为: 其中, 和 分别表示滚动轴承在X和Y方向上的位移,ε表示轴承公差。我们建立了故障轴承的两自由度动力学方程: 其中m表示当量轴承质量;K表示力变形系数(即刚度);c表示当量阻尼比; 表示第j滚子在接触区的判断系数,下式给出: 刚度K和阻尼比c是轴承故障动力学模型中的两个关键参数,对模拟振动响应的质量有很大影响。然而,它们通常是通过实际经验来确定的。在下一节中,我们将讨论如何通过测量的轴承故障振动信号来准确识别K和c。6.2 逆PINN图3 逆PINN结构在这一部分中,将详细阐述所提出的逆PINN。逆PINN原理:与现有的PINN不同,本文提出的逆PINN的优化目标是获得两个动力学参数,而不是一个轴承振动响应。逆PINN的结构图如图3所示,逆PINN的输入是从实际物理空间测得的滚动轴承故障振动信号,其输出是动态参数。在网络训练期间,动态参数被更新。根据滚动轴承的最新动态参数和已知的滚子数、滚子直径、故障位置、初始角位置等结构参数,采用Runge-Kutta方法结合张量计算,求解了非线性轴承故障动力学方程,得到了故障轴承在X、Y方向的振动响应。然后,将测量信号和模拟信号的FFT之差计算为损失。此外,还设计了两个动态参数的边界损失,用于网络训练。由于刚度K和阻尼比c之间的差高一个数量级,所以K不是由神经网络直接输出的,而是通过将网络输出值乘以七个数量级而得到的。这种方法可以确保网络输出的两个参数尽可能地处于相似的数量级,并有利于所提出的网络的PINN收敛。逆PINN的目标与原PINN不同,前者的结构比后者更简单。逆PINN的损失函数:逆PINN的损失函数由两部分组成。第一部分是边界损失,它包含所有未知参数的边界条件。传统PINN中的边界损失主要是用来约束某一时间点或空间点的响应值或物理量。例如,在基于流体力学的PINN中,某一位置的流体速度为零或某一值,可以利用这些信息来表示边界损失。然而,在逆PINN中,目标值不再是特定的响应,而是未知的物理参数。这些参数的近似值范围被用作边界条件。当动态参数在特定范围内更新时,可以加速网络训练。边界损失表示 为: 其中, 表示由网络模型输出的第j个参数; 和 分别是参数的下限和上限;以及n是参数的数目。本文考虑了两个动力参数:轴承刚度K和阻尼比c,并根据这两个参数的取值范围设定了具体的上下限。根据目标方位的经验知识,可以确定参数值的近似范围。例如,轴承的阻尼比通常在10到1000之间,而刚度通常在 到 之间。损失函数的第二部分是模拟振动与测量信号之间的偏差。通过在频域中计算这部分的损失函数,抑制了被测信号样本中噪声的影响。通过将时域信号转换为频域信号来防止由相位差和其他因素造成的干扰。此外,动态参数,包括刚度和阻尼比,对频谱的影响比时域信号更显著。因此,基于频域信号的损失函数保证了这些参数的准确、快速的优化。将测量的振动信号和模拟的振动信号的频域变换结果之间的均方根误差(RMSE)作为损失,称为 。这一损失被定义为: 其中,X和Y是测量的振动信号沿X和Y方向的傅里叶变换;X和Y是对应于通过逆PINN更新的动态参数的模拟振动信号的傅里叶变换;real(·)和imag(·)分别表示数据的实部和虚部。真值损失有效地减小了模拟信号和测量信号之间的频谱差异。利用这一损失来训练逆PINN,可以得到更接近实际情况的动态参数。然后,将这些动态参数引入到轴承故障动态模型中,从而提高了仿真信号与实测信号之间的相似性。总而言之,建议的逆PINN的损失公式如下: 6.3 轴承故障数据生成在此基础上,提出了一种基于数字孪生模型的故障数据生成方法,并给出了具体的实现步骤。第一步:输入滚动轴承的结构参数,将在某一工况下采集到的测量振动信号送入逆变器。根据专家经验设置两个动态参数的取值范围,然后分别在两个范围内初始化两个动态参数。第二步:根据故障轴承的结构参数、工况参数和动力学参数,采用Runge-Kutta算法结合张量计算,求解故障轴承的二自由度动力学方程。然后,得到模拟的振动信号。第三步:计算模拟振动信号和测量信号的傅里叶变换。用逆PINN法计算输出动态参数。第四步:通过公式计算 。然后,用EQ计算边界损失 。第五步:使用获得的损失,用ADAM优化器训练反PINN。通过损耗调整网络参数。第六步:重复步骤2到5,直到逆PINN收敛。完成网络训练后,准确识别两个动态参数K和c。第七步:将获得的动态参数提交到轴承故障动态模型中,计算出各种工况和故障模式(包括故障大小)下的模拟振动信号。第八步:在轴承振动响应中加入高斯白噪声,以提高生成数据的多样性。7 实验结果与分析7.1 实验描述提出的方法将通过两个实验进行验证。第一个实验基于Case Western Reserve University(CWRU)的轴承故障测试。两个测试SKF轴承(6205-2RS)位于轴承处。采用驱动端故障直径为0.54 mm(即L=B=H=0.54 mm)的故障滚动轴承的振动信号。在实验过程中,电机转速为1750rpm,信号采集频率为12 kHz。第二个实验是基于西安交通大学的轴承故障测试[28]。主要用于轴承退化试验。采用两台由PCB公司生产的加速度计,以25.6 kHz的采样频率沿X和Y方向测量轴承加速度信号。7.2 实验结果及分析表4 由逆PINN和专家经验在两个实验中获得的动力学参数图7 CWRU实验中模拟信号与实测信号的比较: (A)由优化参数得到的模拟结果;(B)由经验参数得到的模拟结果在CWRU和XJTU实验中,故障滚动轴承的动态参数(表4)是通过逆PINN估计的。同时,表4也列出了其他文献[17,27]设定的经验参数。观察到这两类动力学参数之间有很大的差异。不同的动力参数会导致不同的振动响应。在CWRU实验中,利用这两种动力学参数计算了振动信号。模拟信号和测量信号同时显示在图7中。在时间域波形中,很难确定K优化的参数是否优于经验参数。 图8 CWRU实验中仿真频谱与实验频谱的比较: (A)基于经验参数的仿真结果;(B)基于逆PINN优化参数的仿真结果图9 XJTU实验中仿真频谱与实验频谱的比较: (A)基于经验参数的仿真结果;(B)基于逆PINN优化参数的仿真结果动态参数K和c不影响旋转频率和故障特征频率,但影响其他频率成分,如固有频率。为了弄清动力参数对振动响应的影响,我们计算了由两种动力参数得到的振动信号的频谱,并分别将它们与被测信号的频谱进行了比较。CWRU实验的比较结果如图8(A)和(B)所示。提出的逆PINN方法得到的频谱与实测信号的频谱接近,而基于经验参数的频谱的主成分与实际信号的主成分有很大的偏差。XJTU实验中的比较结果如图9(A)和(B)所示。也得到了类似的结论。根据振动信号的频谱和文章中的时频频谱,根据最大峰值可以估计出轴承的固有频率。为了说明该参数优化方法相对于其他方法的优越性,计算了逆PINN法和专家经验估计的固有频率的误差和错误率。由所提出的逆PINN估计的固有频率具有很高的精度,这意味着所提出的逆PINN可以求解动态参数,并且提高了仿真模型的精度。 7.3 数据生成示例图11以外圈故障为样本,在40赫兹的转速和10kN的载荷下, 模拟和测量了轴承振动信号的频谱。 在用逆PINN识别出轴承的动态参数后,利用所开发的基于数字孪生故障数据生成方法,可以模拟故障轴承在任何工况下的振动响应。以XJTU实验中的轴承故障数据生成为例。利用所获得的动力学参数和轴承故障动力学模型,生成了在40 Hz旋转频率和10kN载荷下发生外环故障的轴承振动数据。计算了产生的和测量的信号的频谱(图11)。这两个频谱具有相似的特征谱线,即有效地模拟和产生了轴承振动信号中的主要特征频率分量。8 总结本文研究了一种轴承数据生成方法,以提高对不平衡样本的跨工况轴承故障诊断能力。为了准确识别轴承的动态参数,将轴承动力学模型与神经网络相结合,建立了一种新的逆PINN模型。这种网络的原理与传统的PINN相反。在逆PINN中,建立边界损失和真值损失来加速网络收敛,并将其用于评估模拟频域数据与真实频域数据之间的差异。提出了一种基于逆PINN、故障轴承动力学模型和实际数据的故障数据生成方法,用于生成特定工况下补充样本的轴承故障信号。然后,用它们来训练故障诊断网络。实验结果表明,该方法能有效克服轴承故障诊断中的样本平衡问题,优于SOTA数据生成方法和不平衡故障诊断方法。未来,我们将从强背景噪声的测量信号中识别模型参数,进一步提高生成数据的质量和多样性。 客官,球球再点个广告,再走吧~ 编辑:曹希铭校核:李正平、陈凯歌、赵栓栓、董浩杰、赵学功、白亮、陈少华该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除点击左下角阅读原文,即可在线阅读论文。来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈