首页/文章/ 详情

TIM论文学习 | FedLED:基于垂直联邦迁移学习的无标签设备故障诊断

3小时前浏览3
 本期给大家推荐一篇故障诊断领域中关于联邦迁移学习论文FedLED :基于垂直联邦迁移学习的无标签设备故障诊断方法,论文旨在解决实际应用中故障样本稀缺和数据隐私问题。模型结构中,为了实现垂直联邦联合域对抗适应,构建源域和目标域的特征提取器、分类器和域判别器,通过条件域判别器将异构的特征空间映射到公共的潜在特征空间,消除特征异构性的影响;然后进行联合域对齐,通过最小化源域标签分布和目标域分类结果分布之间的距离,进一步增强无标签模型迁移的有效性。该方法在联邦学习框架下进行模型训练,源域和目标域分别进行本地训练,并通过中央服务器进行模型参数的更新和同步。FedLED方法无需目标域的故障标签,即可实现高效的模型迁移。支持不同特征空间的设备之间进行模型迁移,无需共享原始数据,有效保护数据隐私。在多个真实设备故障数据集上进行的实验表明,FedLED 在诊断精度和泛化能力方面均优于现有方法。

论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

论文基本信息

论文题目:

FedLED: Label-Free Equipment Fault Diagnosis with Vertical Federated Transfer Learning 

论文期刊:IEEE Transactions on Instrumentation and Measurement

论文日期:2024年

论文链接:

https://doi.org/10.1109/TIM.2024.3352702

作者:

Jie Shen(a), Shusen Yang(a,b), Cong Zhao(a), Xuebin Ren(a), Peng Zhao(a), Yuqian Yang(a), Qing Han(a), and Shuaijun Wu(a).

机构:

a: Engineering Laboratory for Big Data Analytics, Xi’an Jiaotong University, Xi’an, China;

b: the Ministry of Education Key Laboratory for Intelligent Networks and Network Security, Xi’an Jiaotong University, Xi’an, China.

作者简介:

沈杰,于 2020 年获得中国西安交通大学数学学士学位,目前正在数学与统计学院攻读数学博士学位,他的研究兴趣包括联邦迁移学习和工业智能。(来自IEEE)

目录

1 摘要
2 引言
3 相关工作
3.1 智能设备故障诊断
3.2 设备故障诊断中的迁移学习
3.3 联邦迁移学习在设备故障诊断中的应用
4 系统模型和问题定义
4.1 系统模型
4.2 问题定义
5 无标签设备故障诊断与垂直FTL
       5.1 模型结构
       5.2 无监督的联邦模型训练方案
6 评估
       6.1 实验方法
       6.2 故障诊断准确性
       6.3 不同领域异质性水平下的普遍性
       6.4 结果分析
 7 结论  

1 摘要

基于联邦迁移学习(FTL)的智能设备故障诊断引起了学术界和工业界的广泛关注。它允许现实世界中具有有限样本的工业代理(industrial agents)来构建一个故障诊断模型,而不危及其原始数据的隐私。然而,现有的方法既不能解决由于实际代理的不同工作条件而造成的样本异质性,也不能解决新部署的设备的极端故障标签稀缺甚至为零的问题。为了解决这些问题,我们提出了FedLED,一种垂直FTL设备故障诊断方法,进一步利用未标记目标域的知识进行有效的无监督模型迁移。利用真实设备监测数据进行的大量实验,结果表明,FedLED在诊断准确性(高达4.13倍)和通用性方面都明显优于SOTA方法。我们希望我们的工作能够激发进一步研究无标签设备故障诊断系统

关键词:无标签设备辅助诊断,无监督迁移学习,垂直联邦学习

2 引言

大量涌现的数据驱动的方法已被证明在智能设备故障诊断中具有广阔的应用前景[1],其中,诊断模型通常利用各种监测信号,如电流、电压、振动、温度和声信号,对“正常”和“故障”样本进行分类[2]。主要的方法依赖于大量的标记的样本来训练各种机器学习(ML)模型(例如SVM,DNN),这些模型显著优于基于部分系统机制或专家经验的传统诊断方法。

然而,在实践中[3]-[5],由于各种工业设备持有者(以下简称代理)的故障样品极度稀缺,这种标记样本密集型方法的应用受到了严重限制。例如,对于任何拥有新部署设备的智能制造商,考虑到设备故障通常是小概率事件,通常需要相当长的时间才能发生单个故障,可以收集带有确定“故障”标签的样本[6]。构建故障标签较少甚至为零的有效故障诊断模型成为常见瓶颈。

为了解决这个问题,一个直观的想法是在其他具有相同类型设备的代理上训练一个模型,使用更多标记良好的样本(即源代理),然后,在样本稀缺的(即目标代理)上部署训练好的模型,假设来自不同代理的样本是独立同分布的(Independently and Identically Distributed , IID)。不幸的是,这样的假设在实践中几乎不可能得到保证。由于监测设置、工作负载、传递路径、噪声干扰、故障程度等差异,不同工作条件下的代理样本不可避免地具有明显的离散分布[8],也就是说,不同的代理通常有不同的样本域。迁移学习[9]主要用于构建跨不同领域的迁移模型,并已在设备故障诊断[10]领域得到应用。然而,现有的方法需要在源和目标代理之间交换样本以提取共同知识,考虑到像通用数据保护条例(GDPR)[12]这样的严格规定,这种方法对代理的数据隐私构成了严重威胁[11]。因此,联邦迁移学习(FTL)方法[13]应运而生,它使得不同代理的数据“孤岛”之间可以进行迁移学习,所有原始样本都保持本地化,只有中间学习结果(例如,梯度)在代理之间交换。

图1 基于垂直联邦迁移学习的一般设备故障诊断场景

图1所示,构建一个故障诊断模型,然而,在上述实际情况下,由于实际设备的监测数据存在以下两个基本问题,现有的FTL方法不能直接应用:

1)强样本异质性:基于机器学习(ML)的FTL方法,如文献14,需要重叠样本(即源和目标代理都拥有的同一组样本)来实现有效的模型迁移。在实践中这几乎是不可能的,因为两个代理无法拥有重叠的样本(来自同一设备在相同的监控设置下),除非交换原始数据。基于深度学习(DL)的FTL[15]故障诊断不需要重叠样本,但假设两个共享相同的特征空间,即水平FTL,其中两个使用相同的传感器集与相同的监控部署。然而,在实践中,由于各个代理的不同监测设置,不同代理的特征空间通常是多尺度的[16]且高度异质的[2]。例如,源样本  是由  个传感器收集的,而目标样本  是由  个传感器收集的,其中只有  个传感器是共享的。基于垂直联邦迁移学习的故障诊断具有重要意义。

2)零故障标签:大多数FTL方法,如文献17,需要目标代理内的一组标记样本用于模型训练。然而,实际人员,特别是那些拥有新部署设备的人员,很可能有零故障标签[5],[18],[19](即没有  )。唯一不需要目标领域标签的无监督FTL故障诊断方法[20]受限于相同的特征空间假设,不能应用于上述的垂直FLT场景。

为了解决上述问题,我们提出了一种垂直FTL设备故障诊断方法FedLED。它允许模型从一个强自身异构源域以零故障标签迁移到目标域。本文的主要贡献如下:

1)我们首先重点研究了具有异构特征空间和零目标域故障标签的之间的设备故障诊断模型的转换问题,这是该行业常见的瓶颈。提出了一种基于无监督垂直FTL的新型故障诊断方法,该方法可广泛应用于各种代理,特别是那些使用新部署设备的代理。

2)在FedLED中,提出了一种垂直联邦联合域自适应方法,将异构源和目标特征映射到潜在特征空间。为了提高零故障标签模型转换的有效性,我们构造了一种新的联合域对齐,使源标签分配与目标分类结果分布之间的距离最小化,与传统的不广泛利用目标域信息完全不同。

3)我们使用不同的真实设备的故障数据集(即:两个轴承和一个齿轮)来全面验证我们的方法的有效性。实验结果表明,在不同的垂直FTL场景下,FedLED在诊断准确性上显著优于目前最先进方法(高达4.13倍)。此外,FedLED在不同的垂直联邦学习设置(即样本/特征重叠比率)下,稳定地保持了所有比较方法中的最高诊断准确性,并且在更严酷的条件下(例如,当样本/特征完全没有重叠时)显示出更明显的优势。

本文其余部分的组织如下。第3节讨论了智能设备故障诊断的相关工作。系统模型和问题定义在第4节提供。第5节详细介绍了FedLED。实验结果在第6节提供并进行了全面讨论。我们在第7节总结了本文。

3 相关工作

在本节中,我们将讨论智能设备故障诊断方面的现有成果。

3.1 智能设备故障诊断

近年来,智能数据驱动的设备故障诊断在很大程度上得益于深度学习的成功发展,这吸引了业界的关注,因为它具有高诊断准确性[21]。然而,现有的方法通常依赖于大量的良好标记数据或独立同分布(IID)假设[22],[23],这严重限制了它们在实践中的可用性。迁移学习可以用来协助在不同场景下使用来自其他相关代理的非IID样本进行训练。

3.2 设备故障诊断中的迁移学习

1)异构迁移学习:大多数现有研究遵循在实践中难以满足的同分布假设[24]。在故障诊断领域,异构样本处理方法主要通过特征筛选等方法处理异构特征,然后将它们替换到传统的机器学习方法(如SVM[25],KNN等)中进行训练。

2)无监督迁移学习:广泛采用的无监督迁移学习方法可以分为基于差异和基于对抗的无监督迁移学习。基于差异的方法通过测量数据分布之间的距离来对齐源域和目标域。常见的分布距离测量方法包括相关性对齐(CORAL)[26]、最大均值差异(MMD)[27]和联合分布适应(JMMD)[28]。基于对抗的方法使用领域判别器来减少由特征提取器产生的源域和目标域之间的特征分布差异,从而实现跨机器故障排除。主要的方法包括领域对抗神经网络(DANN)[29]和条件领域对抗网络(CDAN)[30]。

大多数迁移学习方法需要通过访问源域和目标域的原始数据来获取共享知识,这严重威胁到数据隐私。FTL方法[31]应运而生以解决数据隐私问题。

3.3 联邦迁移学习在设备故障诊断中的应用

传统的FTL方法[31]需要共享样本和目标域中的少量标签,这限制了它们在实际场景中的使用。随着AI技术的发展,深度学习方法已逐渐成为主流。[32]提出了解决联邦网络中的域偏移问题基于对抗性领域自适应的学习。[33]提供了一种利用先验分布知识来减少域间距离的FTL系统。

然而,以上所有的研究都是基于水平联邦学习,其中源域和目标域共享相同的特征空间。在垂直的FTL场景中,无法保证它们的性能。

图2 无监督垂直联邦迁移模型的结构

4 系统模型和问题定义

在本节中,我们提供了图1中基于垂直FTL的故障诊断的通用系统模型,以及我们的研究问题的形式化定义。

4.1 系统模型

图1中的场景为例,有两个垂直FTL代理:源域代理S和目标域代理T。对于具有良好标签的源域,  , 其中  是  域中样品总数量。  和  表示  域中第i个样本及其标签。  , 其中  是源特征空间,  表示特征数量。对于无标签的目标域,  ,其中,  是样本数量,  表示目标特征空间,  是特征数量。考虑到源域和目标域代理都关注同一类型设备的相同类型的故障,我们假设源域和目标域在同一标签空间中遵循相同的故障分布。

考虑到实际应用中的异构源域和目标域,其中有1)  ,即没有重叠样本,2)  ,其中M表示  和  之间重叠特征的数量,  。这种特征空间的异质性极有可能引起一个不可忽视的距离    。

4.2 问题定义

垂直FTL任务是一个机器学习中的分类问题,使用分类器  。考虑我们的系统模型,必须满足两个约束条件:1)强烈的样本异质性,  和     。2)零故障标签,  不可用。垂直FTL任务可以定义为一个约束优化问题:

    

考虑到样本的强异质性,基于特征的领域自适应方法可以用来构建特征提取器    和    ,将源域和目标域映射到一个潜在的共同空间。对于零故障标签,假设源域和目标域的标签空间相同,源域和目标域的输出标签分布    可以进行对齐,我们的研究问题可以转换为公式(2):

    

问题定义的补充细节在补充材料1 S.1中呈现。

(材料下载链接为: https://github.com/htkg987/FedLED/blob/main/supplemental material.pdf)

5 无标签设备故障诊断与垂直FTL

在本节中,考虑到我们的系统模型和问题定义,我们提出了一种无监的垂直FTL设备故障诊断方法FedLED。它包括一个可以训练目标域故障诊断器的垂直联邦传输模型,以及一个无监督的联邦模型训练方案。

5.1 模型结构

公式(2)中的问题可以建模为一个无监督的领域自适应问题,有三个联合优化目标,即分类损失、特征对齐损失和输出标签对齐损失。整个网络结构如图2所示。考虑到垂直联邦迁移学习(Vertical FTL)的两个约束条件,我们的无监督垂直联邦迁移模型结构由两部分组成:1) 用于计算分类和特征对齐损失的垂直联邦联合领域对抗性自适应,和2) 用于计算输出标签对齐损失的联合领域对齐。

我们提出了一种基于对抗性方法CDAN和垂直联邦方案的垂直联邦联合领域对抗性自适应。其关键是一个新颖的条件领域判别器,该判别器基于领域特定特征表示和分类器预测的交叉协方差条件化,能够将异构的源和目标特征空间映射到一个潜在的共同空间。即使判别器完全被混淆,也不能保证特征提取器能够提取出领域不变的特征。由于领域对抗性自适应已经对齐了特征空间,我们额外添加了基于差异的联合对齐方法作为联合领域对齐来计算输出标签对齐损失,这最小化了源标签分布和目标分类结果分布之间的距离,与不全面利用目标领域信息的传统伪标签方法根本不同。模型构建的更多补充细节见补充材料S.2。

5.1.1 针对样本强异质性的垂直联邦联合域对抗性适应  

垂直联邦联合域对抗性自适应基于条件域对抗性网络(Conditional Domain Adversarial Network, CDAN) [34]来计算分类损失和特征对齐损失。CDAN的关键是一个新颖的条件领域判别器,该判别器基于特征表示和分类器预测的交叉协方差,能够从异构特征中提取领域不变特征。

特征对齐损失:首先被定义为一个有两个竞争误差项的极小极大优化问题,总体目标函数如下:

    

其中,  和  分别代表源域的高层特征和通过高层特征输出的分类器结果,  ,  对应于目标域的高级特征及其在分类器上的输出。⊗表示多线性映射,表示多个随机向量的外乘积。任意两个随机向量  的联合分布     可以通过使用交叉协方差(  )得到,其中Φ表示可重复的核函数。同时,采用附加的动态样本权值法,避免负样本影响训练。样本权重的更新方法为公式(4),其中p表示分类器最终得到每个类别的概率:

    

联合域对抗学习的优化方法是:通过最小化(3),优化分类器C和特征提取器  的参数,同时最大化(3)来优化领域判别器D,每个模型的目标函数如下:

    

    

分类损失:为了避免目标域和源域在域不变特征上的任务差异,最终的全局分类任务减弱。因此,在源域的监督学习方法来防止分类器的分类偏差。监督分类任务的目标函数如下:

      

5.1.2 零故障标签的联合域对齐

最近的工作[34]表明,即使判别器被完全混淆,也不能保证特征提取器能够提取出领域不变的特征。这种风险来自于对抗性学习中存在的均衡挑战。由于CDAN已经对齐了特性空间,所以我们还添加了基于差异的对齐[35]方法,以计算输出标签对齐损失。

输出标签对齐损失:联合域对齐过程的目标函数如下:

     


其中  代表源域中高级特征输入到分类器网络中,其在第l层的输出,而      表示分类器每一层的输出通过多维线性映射投影到希尔伯特空间。|L|表示分类器中的层数,通常选择分类器输出的最后两层用于不同域上的故障诊断任务对齐。

5.2 无监督的联邦模型训练方案

整个联邦训练方案在训练过程中分为两个步骤:联邦模型初始化和联邦模型训练。

5.2.1 联邦模型初始化

联合初始化采用在[36]中证明有效的预训练-微调方法。与从头开始训练相比,预训练模型可以减少训练时间并加快训练收敛速度。预训练的结果只是初步改进,以防止过拟合。联合初始化阶段的目标函数定义如下:

    

我们的联邦初始化过程如算法1所示,其中,带标签的源域和无标签的目标域分别用预训练和随机初始化。

算法1 联邦模型初始化

5.2.2 联邦模型训练

在联邦模型训练过程中,中央服务器计算相应的损失和梯度,然后将梯度传输给相应的参与者。整体工作流程如图3所示。考虑到模型结构,FedLED训练的目标函数如方程(10)所示。

    

其中λ和β是两个超参数,网络参数在训练过程中使用Adam优化器进行更新,而对抗网络优化问题则通过梯度反转层[37]解决。在每次训练迭代中,参数的更新如下所示:

    

    

    

    

µ 是学习率,t 表示第 t 次迭代更新。我们的训练过程在算法 2 中描述。通过上述方案,我们得到了由 Ft 和 C 组成的故障诊断器,该诊断器被部署在目标域进行在线推理。

图3 联邦模型训练的整体工作流程

算法2 联邦模型训练

6 评估

在本节中,我们在不同的垂直空间条件下使用真实设备故障数据进行了广泛的实验,以进行性能评估。首先介绍了实验方法,然后给出了实验结果和分析结果。

6.1 实验方法

通过与不同设置下的SOTA方法的比较,我们验证了其有效性(诊断准确性)和通用性(对不同级别的源-目标域异质性的适用性)。

6.1.1 数据集

我们的实验使用了两个公共数据集,包含三种不同的真实设备(两种携带设备的实际设备)的不同监控信号和故障标签:即:CWRU[38]和齿轮箱[39].

CWRU是一个广泛采用的故障诊断基准测试数据集,包含三个振动信号(驱动侧加速度数据DE,风扇侧加速度数据FE和基座加速度数据BA)的SKF6205轴承的1067个样本。振动信号可以通过靠近电机驱动端的加速度计以12kHz的采样频率获取。通过电火花加工(EDM)引入单点故障来测试轴承,产生直径分别为0.007、0.014和0.021英寸的三种严重程度的损伤。根据故障位置,有三种类型的轴承故障,即内圈故障(IF)、外圈故障(OF)和滚动体故障(BF)。此外,还测试了正常状态(NC)的轴承。由于异质性,源域和目标域分别包含三个信号(特征)中的两个,这些信号并不完全重叠。只有源域拥有故障标签(九种类型的轴承故障)。如表I所示,选定了六种不同的故障诊断任务。

表 I 基于CWRU的故障诊断任务

齿轮箱包含八个监测信号(采样率为12kHz)的DDS轴承和齿轮。DDS由一个制动器、一个行星齿轮箱、一个平行齿轮箱和一个电机组成。此外,两个三轴(x、y和z)加速度传感器收集六个振动信号通道,这些传感器分别安装在平行齿轮箱和行星齿轮箱上。扭矩传感器安装在电机和行星齿轮箱之间,用于测量负载。每个数据文件中有八个信号特征,分别代表:电机振动信号、行星齿轮箱在x、y、z三个方向上的振动信号、电机扭矩数据以及平行齿轮箱在x、y、z三个方向上的振动。根据每台机械设备的健康状况,准备了总共5115个样本。每个样本具有不同数量的特征,这取决于任务类型,每个特征有1024个数据点。由于异质性,源域和目标域分别包括了八个信号(特征)中的四个/五个,这些信号(特征)并不完全重叠。只有源域拥有故障标签(轴承和齿轮各有五种故障类型)。如表II所示,对于轴承和齿轮,分别选定了六种不同的故障诊断任务。

表 II 基于齿轮箱的故障诊断任务

使用非重叠滑动窗口方法[40]从所有监测信号中提取学习样本,并进一步按照7:3的比例划分为训练集和测试集。详细操作在补充材料S.3.1中提供。

6.1.2 比较

我们比较了FedLED与以下方法的性能。

1) 基准方法:在源域上训练模型,并直接将训练好的模型应用于目标域。

2) SFL-multi方法 [17]:目前唯一可用的基于FTL的设备故障诊断方法。

3) 基于差异的方法:基于不同距离度量的最先进的无监督迁移学习方法,包括使用协方差的CORAL [26],使用最大均值差异(MMD)的MK-MMD [41],以及使用联合最大均值差异(JMMD)的JAN [35]。

4) 基于对抗的方法:最先进的无监督基于对抗的迁移学习方法,包括DANN [29]和CDA+E [30]。

5)  消融研究方法:消融实验1和2分别只保留了联合域对齐和联合域对抗适应。

6.1.3 实现

FedLED及其所有比较方法都是使用PyTorch V1.3.1实现的,并且所有评估都是在Tesla V100 GPU上进行的。对于参数设置,训练的批量大小和迭代次数分别是64和100。我们使用的学习率为    ,其中p ∈ (0, 1]是动态衰减率。

6.1.4 评估指标

我们使用目标域测试集上的准确度作为评估指标。

    

其中,    代表所有测试样本,    是所有正确诊断的样本数量。为了减少随机性和特殊性,我们记录了10次重复实验的平均准确率作为最终结果。

6.2 故障诊断准确性

为了验证我们方法的有效性,我们按照前述任务在CWRU和齿轮箱数据集上进行了FedLED和比较方法的实验。当FedLED和其他比较方法设置为非重叠样本空间时,考虑到重叠样本对于SFL-multi方法是必须的,我们为它单独设置了10%的样本重叠比例。所有方法的故障诊断准确性在图4∼6中展示,并且详细结果在补充材料S.3.2中提供。很明显,FedLED在所有数据集上实现了最高的平均诊断准确性(即,77.52%,95.51%,98.47%)。FedLED和比较方法的性能进一步分析如下。

根据图4∼6,DANN在所有任务上表现不佳,这可能是由于缺乏初始化造成的。通常,基于对抗的方法通过减少其鉴别能力来提高域判别器D的领域自适应能力。由于DANN缺乏初始化,其域判别器D具有更强的鉴别能力,严重限制了领域自适应能力。SFL-multi方法由于重叠样本数量少而避免了过拟合,在所有任务上表现稳定。

根据图4,基线方法在各种CWRU任务上表现稳定,平均准确率为50.92%,显示出    和    之间的相对低相似性。根据图5和图6,基线方法在齿轮箱T4∼T6上表现良好,而在齿轮箱T1∼T3上表现较弱,表明T4∼T6的    相对较小,而T1∼T3的相对较大。特别地,当    较小时(例如齿轮箱T4∼T6),基于对抗的方法(包括消融实验1)优于基于差异的方法(包括消融实验2)。在特征异质性强烈的案例中,例如,所有CWRU任务和齿轮箱 T1至T3,基于对抗的方法的性能比基于差异的方法弱,因为强大的区分能力限制了D的领域自适应能力。考虑到这些结果,FedLED的显著性能清楚地表明,我们引入的联合领域对齐成功有效地消除了强烈的特征异质性对一般基于对抗的方法的影响。

图 4 CWRU 上的故障诊断准确性

图 5 齿轮箱轴承故障诊断准确性

图6 齿轮箱-齿轮故障诊断准确性

6.3 不同领域异质性水平下的普遍性

为了验证我们方法的普遍性,我们在垂直联邦学习(FTL)场景中改变了样本和特征重叠的比例。所有方法的故障诊断准确性分别在图78中展示。详细结果在补充材料S.3.2中的表S4至S7提供。

1) 样本重叠比例的影响:为了研究样本空间差异的影响,我们首先将源域和目标域之间的样本重叠比例设置为0%,20%,50%和100%。

根据7,FedLED在所有样本重叠比例下(即90.55%,91.26%,91.92%,92.76%)都实现了最佳性能,并且随着比例的增加,准确性略有提高。随着样本重叠比例的增加,SFL-multi的准确性显著提高。这是因为SFL-multi需要在重叠样本上训练一个可迁移的模型,其性能与重叠样本的数量正相关。与SFL-multi不同,其他不需要样本重叠的比较方法的性能并没有明显增强。

2) 特征重叠比例的影响:为了研究特征空间差异的影响,我们分别进行了两组实验,源域和目标域之间的特征重叠比例分别为0%和100%。

图7 不同样本重叠率下的故障诊断准确性

图8 有/无重叠特征的故障诊断准确性

根据图8所示,FedLED在有/无特征重叠的情况下都达到了最高的平均诊断准确率(即98.83%,90.50%),表明它成功地将不同的特征空间映射到一个潜在的共同空间。相比之下,所有比较方法在没有特征重叠的情况下性能显著下降,这清楚地表明源域和目标域的特征空间异质性严重限制了现有故障诊断方法的可用性。

6.4 结果分析

为了突出我们方法的统计显著性,我们对上述实验结果进行了未来分析,以评估其稳定性和复杂性。图9显示了在所有三个数据集下不同方法的箱形图,反映了它们准确性的统计特征。可以发现,我们的方法具有相对较好的稳定性,并满足实际应用的需求。

我们在CWRU和齿轮箱数据集上记录了我们的方法和比较方法在100个周期内的平均运行时间,这些记录在表III中。原始的SFL方法仅适用于二分类问题。我们通过使用多个分类器将其扩展到多分类问题,这也导致了比其他方法消耗更多的时间。图10(a)b)是在CWRU下随时间变化的损失和准确率趋势图。可以发现,由于每个周期的训练时间较长,我们的方法的整体收敛速度比其他比较方法稍慢。然而,由于准确率的提高,我们的方法达到相同的可接受准确率(70%)所需的时间实际上与其他比较方法相似。

图9 不同方法的箱形图
表 III 不同方法在100个训练周期内的平均消耗时间(秒)

图10 CWRU下的时间趋势图表

网络复杂性包括空间复杂性和时间复杂性。我们的FedLED网络的复杂性与其他可比方法(除了SFL)处于相同的数量级。我们的方法和其他可比方法(除了SFL)基于相同的深度迁移学习骨干,外加一个3层域判别器,其空间复杂性与骨干相比可以忽略不计,因此我们方法的空间复杂性与其他可比方法相似。至于时间复杂性,FedLED包括垂直联邦联合域对抗性适应和联合域对齐,它们的时间复杂性分别对应于基于对抗性和基于差异的方法。因此,我们方法的时间复杂性是这两部分时间复杂性的总和,这意味着它与其他可比方法的时间复杂性处于相同的数量级。总结来说,尽管我们的方法比其他可比方法稍微耗时,但与准确性的提高相比,这种权衡是可接受的,也是值得的。

7 结论

在本文中,我们提出了FedLED,这是首个无监督的垂直联邦迁移学习(FTL)方法,它使得各种工业代理能够进行无需标签的设备故障诊断。它使得从有标签的源域向高度异构的目标域迁移故障诊断模型成为可能,即使目标域中没有故障标签,同时也能保护两个域的数据隐私。使用真实设备监控数据进行的广泛实验清楚地表明,FedLED在诊断准确性(高达4.13倍)和通用性方面具有明显优势,这是通过利用未标记目标域的知识实现的,与那些严重依赖源域知识的最新方法不同。我们期望FedLED能够激发更多关于通过系统性目标域知识提取(例如对比学习)增强的无标签故障诊断的洞察。


编辑:CYJ

校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、Tina、陈宇航、海洋、 王金

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

点击左下角阅读原文,即可在线阅读论文。

来源:故障诊断与python学习
ACT振动旋转机械通用航空ANSApython海洋UM声学电机材料多尺度数控
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-01-11
最近编辑:3小时前
故障诊断与python学习
硕士 签名征集中
获赞 77粉丝 78文章 165课程 0
点赞
收藏
作者推荐

综述 | 数字孪生智能故障诊断最新进展综述(上)

本期给大家推荐胡昌华教授的数字孪生智能故障诊断的最新进展综述(上)。随着工业4.0时代的到来,智能制造和数字技术迅速发展,对工业设备的稳定性、可靠性和安全性提出了更高的要求。最近,数字孪生为智能故障诊断提供了一种新的解决方案。本文将从概念、关键技术、应用场景和挑战展望等方面对数字孪生技术在智能故障诊断的发展应用进行综述。论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:A state of the art in digital twin for intelligent fault diagnosis论文期刊:Advanced Engineering Informatics论文日期:2025年论文链接:https://doi.org/10.1016/j.aei.2024.102963作者:Changhua Hu, Zeming Zhang, Chuanyang Li, Mingzhe Leng, Zhaoqiang Wang, Xinyi Wan, Chen Chen机构:Laboratory of Intelligent Control, PLA Rocket Force University of Engineering, Xi’an 710025, China通讯作者邮箱:li_chuanyang@yeah.net目录1 摘要2 引言 2.1 相关工作回顾 2.2 本文目的3 研究方法3.1 文献综述方法3.2 文献分类标准4 数字孪生的研究进展4.1 数字孪生的起源与概念4.2 数字孪生关键技术(以上标记章节为本文内容)5 智能故障诊断研究进展 5.1 智能故障诊断定义及相关概念 5.2 智能故障诊断方法6 数字孪生在智能故障诊断中的应用 6.1 数字孪生在工业制造领域智能故障诊断中的应用 6.2 数字孪生在能源领域智能故障诊断中的应用 6.3 数字孪生在航空航天领域智能故障诊断中的应用 6.4 数字孪生在其他领域智能故障诊断中的应用7 建议与未来展望 7.1 面向数字孪生技术 7.2 面向智能故障诊断 7.3 面向数字孪生的智能故障诊断8 总结1 摘要随着工业4.0时代的到来,智能制造和数字技术迅速发展,对工业设备的稳定性、可靠性和安全性提出了更高的要求。故障诊断(Fault Diagnosis, FD)是保证设备正常运行的关键步骤,其准确性和效率直接影响设备的稳定运行和经济效益。随着人工智能(Artificial Intelligence, AI)技术的进步,数据驱动的故障诊断方法在智能领域得到了发展,即智能故障诊断(Intelligent Fault Diagnosis, IFD)。最近,为IFD提供了一种新的解决方案。这就是数字孪生(Digital Twin, DT),一种连接物理世界和虚拟世界的桥梁技术。许多研究人员发表了关于使用DT技术进行设备IFD的研究。本文分析了2017年至2024年的260篇文章,系统地讨论了DT、IFD以及DT在IFD中的应用。首先,详细介绍了DT和IFD的概念、关键技术和应用场景;然后,重点介绍了DT技术在IFD领域的应用;最后,本文总结了存在的问题和挑战,提出了解决问题的建议,并对未来的发展进行了展望。这项工作有望为相关领域的研究人员提供有价值的参考和利用,并促进DT技术在IFD领域的进一步发展和应用。关键词:工业4.0,数字孪生,智能故障诊断,文献综述2 引言随着现代工业系统的复杂性和自动化程度的逐步提高,工业设备在各个领域的应用越来越广泛,其结构和功能也越来越复杂。然而,在长时间运行过程中,由于高温、灰尘、过载、强烈振动等多种因素的影响,不可避免地会出现各种故障,影响设备的正常运行,造成人员伤亡和财产损失。因此,故障诊断(Fault Diagnosis, FD)作为确保设备运行的安全性、稳定性和可靠性的关键步骤变得越来越重要[1]。传统的FD方法通常依赖于人工经验和定期维护,效率低下,难以应对复杂系统突发故障的挑战。因此,智能故障诊断(Intelligent Fault Diagnosis, IFD)技术应运而生,该技术通过结合先进的计算机、传感器、信号处理、多模态信息融合和人工智能(Artificial Intelligence, AI)技术来实现实时状态监测和诊断,提高了系统的可靠性和安全性,降低了维护成本,提高了生产效率[2]。随着人工智能技术的快速发展,特别是机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)等智能算法的广泛应用,IFD技术取得了重大进展。这些方法首先从大量数据中提取有效特征;然后建立精确的FD模型;最后实现复杂设备的IFD。与此同时,物联网(Internet of Things, IoT)和云计算等技术的普及提高了IFD系统的实时性、可扩展性和智能性。数据驱动的IFD方法被证明是FD领域有前景的工具。然而,其有效性在很大程度上取决于所获取数据的数量、质量和多样性,这是耗时、昂贵和不确定的,特别是在复杂或危险的工业系统中。近年来,数字孪生(Digital Twin, DT)作为一种新的前沿技术概念,逐渐引起了工业界和学术界的广泛关注[3]。数字孪生通过数字手段创建与虚拟空间中物理对象相对应的高保真数字模型,实现物理世界和数字世界之间的实时映射和交互。数字孪生技术为工业系统的设计、制造、运行和维护管理提供了新的视角和工具。在这方面,在虚拟环境中模拟物理系统的运行状态和性能特征,这有助于研究人员更好地了解系统行为,预测潜在问题,优化系统性能。这提高了产品设计质量和生产率,同时降低了运营成本和维护难度。数字孪生技术在航空航天、工业制造、能源管理和智慧城市等领域取得了重大成就。显然,数字孪生技术通过构建和模拟物理设备的高保真虚拟模型,能够再现设备在各种工况下的运行状态。它生成的数据与正常运行和故障条件下实际设备的输出非常相似[4]。利用感兴趣的故障数据,对设备的性能进行了更深入的分析和评估。在这方面,提供了一种新的解决方案来克服IFD方法的局限性,如数据依赖性,从而提高了设备的实时监测水平、可靠性和安全性。目前,许多学者对DT在某些领域的应用进行了研究。然而,目前还没有人系统地整理和总结关于DT在IFD中的应用的文献,这是本文感兴趣的关键工作。2.1 相关工作回顾随着工业的不断发展,故障诊断和设备维护变得不可或缺。然而,传统的FD方法不再满足现代工业的要求,导致IFD技术的广泛采用和进步。随着IFD领域的研究成果激增,学者们基于ML和DL方法分析了IFD[5],[6],以及它在旋转机械[7]、电力技术[8]、风力发电[9]等领域的应用。自21世纪初以来,物联网技术的兴起为DT技术带来了新的机遇和挑战,随后引起了广泛的关注和应用。特别是自2017年以来,人工智能、大数据和其他新兴信息技术的迅速发展刺 激了DT技术的繁荣。DT的概念[10],[11]、核心组件[12]、关键技术[13],[14]及其在智能城市[15]、医疗保健[16]、工业4.0[17]、能源[18]、建筑[19]和航空航天[20]等不同领域的应用在许多文章中得到了回顾。这些进步同时提高了IFD技术的智能性和精度。在IFD领域,许多研究人员讨论了机器学习、不平衡学习、云计算和人工智能等方法的应用。Lei等人[5]通过将机器学习理论组织成过去、现在和未来的阶段,对IFD中的机器学习理论进行了系统的回顾。然后,作者提供了一个发展路线图,概述了潜在的研究趋势,从而为未来几年IFD的进展提供了指导。Zhu等人[6]讨论了DL算法在旋转机械FD和预测领域的应用。首先,他们列出了几种常用的旋转机械公共数据集,然后详细讨论了五种主流DL方法的原理,包括卷积神经网络(Convolutional Neural Network, CNN)和生成对抗网络(Generative Adversarial Network, GAN),以及它们在旋转机械IFD中的应用。这为研究人员选择合适的数据集和模型提供了宝贵的指导。此外,他们还解决了与基于DL的FD方法相关的挑战,并提出了未来的研究方向,这对旋转机械中IFD技术的进步具有重要意义。Chen等人[21]总结了基于知识校准和妥协的迁移学习(Transfer Learning, TL)方法在IFD 中的应用,同时提出了三个原则和一种新的分类策略来指导基于TL的FD方法的设计。Ren等人[22]通过考虑不平衡学习方法在实际工程场景中对IFD的影响,对其进行了回顾。然后,他们对提高IFD模型性能的研究改进进行了总结。Maurya等人[23]聚焦在物联网、云计算和人工智能等先进技术集成方面,全面回顾了IFD和状态监测系统的发展。他们指出未来感兴趣的方向和趋势,为相关领域的研究人员提供了优先关注点。在数字孪生领域,DT技术的概念和各种应用在各个领域的众多研究中得到了探索。Liu等人[12]系统地分析了2017年至2022年的177篇文章,同时阐明了DT的定义和特征、应用领域及其核心成分的研究方法。Peng等人[24]全面概述了滚动轴承DT的核心方面,包括检测、建模、预测和健康管理技术。这项研究表明,这些核心技术在滚动轴承中的应用仍然处于起步阶段,突出了需要解决的几个挑战。Giovanni等人[20]回顾了DT技术在航空航天维护、修理和大修系统中的应用;然后他们为未来的发展提出了一种基于物联网的模块化架构。此外,他们还探索了DT技术在航空航天领域的潜在应用和挑战。Errandonea等人[25]专注于DT在维护中的应用。他们介绍了四种维护策略:纠正性维护、状态维护、预测性维护和指向性维护,并指出DT可以优化维护活动。此外,强调了DT在维护中的重要性,特别是对于复杂设备和恶劣环境。Karabulut等人[26]分析了82篇关于认知孪生的文章,重点研究了语义网技术在DT系统中的应用。他们探索了本体的价值、它在各个层面的应用、特定领域的分析以及知识图谱在DT中的使用,为理解本体的应用提供了见解。这些综述文章展示了关于智能故障诊断和数字孪生概念、相关技术及其应用领域的广泛研究。文中讨论的问题、方法、结论以及未来展望均得到了这两个领域最新进展的验证。然而,以往的综述通常是分别探讨IFD和DT,尚未有关于其集成应用的全面总结被报道。2.2 本文目的近年来,DT技术在各个领域显示出相当大的潜力和发展前景,引起了学术界和工业界的关注。以“数字孪生”和“故障诊断”为主题词,在IEEE Xplore、Scopus和Web of Science三个主要学术数据库中搜索,得出了2017年至2024年关于DT技术在FD中的使用的出版物统计数据,如图1所示。该图显示了近年来DT技术在IFD中的应用出版物数量的增长趋势,突显了该领域研究的重要性和未来潜力。因此,本文旨在提供全面详细的综述,目标如下:图1 2017年至2024年的相关出版物数量1)分析数字孪生的研究进展。探讨数字孪生的概念、历史发展以及其应用所需的关键技术,包括物理模型、数据集成与分析、实时交互、虚拟仿真和语义建模等内容。2)研究智能故障诊断的发展动态。详细阐述智能故障诊断的相关概念、发展历史,以及机器学习和深度学习等智能算法在IFD中的应用,包括算法选择、模型训练和性能提升等方面的研究进展。3)重点分析DT技术在IFD中的应用聚焦于数字孪生在智能故障诊断中的具体应用,通过案例或实践探讨如何利用DT技术提高故障诊断的准确性、实时性和智能化水平,揭示两者融合的技术路径与方法。4)总结DT技术在IFD应用中的现存问题与挑战,提出建议和未来展望。系统梳理DT技术在IFD领域应用中的关键瓶颈,如数据质量、模型复杂度、计算资源、跨领域集成等,提出解决方案并预测未来发展趋势,强调该领域的研究前景和创新方向。本文其余部分的组织结构如下:第2部分描述了分类文献综述的方法和标准;第3部分详细阐述了数字孪生的研究进展;第4部分聚焦于智能故障诊断的研究进展;第5部分回顾了DT在IFD中的应用;第6部分总结了现存问题与挑战,并提出建议与未来展望;第7部分提供了总结与结论。本文的整体框架如图2所示。图2 文章整体框架3 研究方法3.1 文献综述方法本文采用的文献综述方法包括三个步骤:文献检索与下载、文献阅读与筛选、文献分类与综述,以确保研究的全面性与系统性。图2(a)展示了具体的研究框架。自2017年以来,与数字孪生相关的出版物数量迅速增长[12]。因此,在检索与下载阶段,本研究从2017年至2024年通过Google等学术数据库和搜索引擎获取并下载了427篇论文,来源包括国际期刊、主要会议论文以及白 皮书。检索关键词包括“数字孪生”(Digital Twin)、“故障诊断”(Fault Diagnosis),以及其在各子领域的应用,如“数字孪生关键技术”(Digital Twin Key Technologies)、“数字孪生可视化”(Digital Twin Visualization)、“数字孪生建模”(Digital Twin Modeling)、“预测与健康管理”(Prognostics and Health Management)、“故障检测”(Fault Detection)和“深度学习故障诊断”(Deep Learning Fault Diagnosis)。表1详细列出了用于文献综述的数据库、检索词及其来源信息。随后,对文献进行了初步统计分析。表1 文献综述检索索引在阅读与筛选阶段,我们重点关注427篇检索文献的标题、摘要和结论,初步筛选出与综述主题无关的文献,将文献数量缩减至318篇。接着,对剩余文献的引言、章节标题和案例研究部分进行了进一步阅读,根据文献的质量及其与研究主题的相关性,剔除了低质量或相关性较弱的文献,最终筛选出260篇文献。其中,第1部分中仅引用了24篇文献,其余236篇文献按照既定标准进行了分类、分析和系统性讨论。3.2 文献分类标准本文为文献分类建立了明确的分类标准,以确保系统综述提取的信息具有条理性和针对性。首先,根据研究内容,将236篇文献分为三个类别:DT、IFD以及DT在IFD中的应用,各类别所包含的文献数量如图3所示。其中有3篇文献同时属于两个类别。随后,基于不同的分类标准对这三个主要类别中的文献进行了进一步细分。图3 每个类别的论文数量在DT类别中,共包含55篇文献。首先,分析DT的起源与概念,共包含8篇文章。接着,根据技术类型对其余文献进行分类,分为五个子类别:数据采集与处理、DT模型构建、数据分析与融合、数据可视化以及模型的持续迭代与更新。具体来说,数据采集与处理子类别包含3篇文章,涵盖数据预处理和实时处理等技术;DT模型构建子类别包含9篇文章,讨论了物理模型、数据驱动模型及两者结合的混合模型;数据分析与融合子类别包含12篇文章,重点在于各种传感器和数据格式的整合;数据可视化子类别包含10篇文章,描述了复杂数据向直观图表和实时界面的转化;模型持续迭代与更新子类别包含13篇文章,突出了自学习和基于反馈的更新技术。这些子类别的深入分析为理解DT的关键技术及其在提升设备和系统可靠性与性能方面的应用提供了全面的视角。在IFD类别中,共包含122篇文献。首先,与领域相关的概念部分包含6篇文章。随后,根据FD方法中核心技术和学习策略将其余文献分为三个子类别:基于传统机器学习(Shallow Machine Learning, SML)的IFD、基于深度学习(Deep Learning,DL)的IFD,以及基于迁移学习的IFD。其中,基于SML的IFD包含34篇文章,涉及支持向量机和随机森林等技术;基于DL的IFD包含65篇文章,使用卷积神经网络和长短期记忆网络等方法;基于TL的IFD包含17篇文章,重点在于通过迁移学习技术实现跨场景故障诊断。这种分类有助于系统性地比较各种故障诊断技术的优势及其应用场景,为选择合适的故障诊断方法提供了理论和实践指导。在DT用于IFD的类别中,共包含62篇文献。根据不同的应用行业或领域将其分为四个子类别:工业制造、能源、航空航天和其他领域。其中,工业制造子类别包含22篇文章,研究DT技术在各种机械故障诊断中的应用;能源子类别包含26篇文章,探讨DT在风能、太阳能和储能等领域的故障诊断应用;航空航天子类别包含3篇文章,涉及从航空发动机到卫星系统在故障诊断中的DT应用;其他领域子类别包含11篇文章,探索DT技术在上述领域之外的应用。这种分类方式全面分析了DT在IFD中跨行业应用的现状、技术挑战和未来方向,同时揭示了其跨领域应用的广阔潜力。4 数字孪生研究进展4.1 数字孪生的起源与概念数字孪生技术的起源和发展历史如图4所示。DT的多样化起源和发展方向导致了其概念和内涵的不同解释。一直以来,学术界没有对DT进行明确和统一的定义。图4 数字孪生技术的起源与进化“孪生”这一概念最早出现在1970年美国国家航空航天局(National Aeronautics and Space Administration,NASA)的“阿波罗计划”中,该计划创建了一个位于地面的航天器模拟器,形成了“物理孪生”。通过使用实时状态数据,调整地面模拟器的环境参数,以匹配航天器的实际情况。2003年,美国Grieves教授在其产品生命周期课程中提出了镜像空间模型。该模型包括物理空间、信息空间及其之间的信息流[27],也被认为是当时数字孪生的初步三维模型,如图5所示。然而,由于当时技术能力的局限性,该概念和模型未能引起专家学者的关注。图5 Grieves教授提出的DT三维模型直到2010年,美国国家航空航天局正式提出了数字孪生的概念,并将DT范式描述为一种长期愿景,定义DT为通过利用物理模型、传感器和操作历史的数据,整合多学科和多尺度的仿真过程,进而在虚拟空间中镜像物理产品,从而反映其整个生命周期[28]。简单来说,DT涉及在虚拟世界中构建一个数字模型,该模型与现实世界中的物理对象密切相似,通过收集和分析各种数据实现。该模型能够模拟和预测物理对象的行为和性能,以帮助优化设计方案、提高生产力并降低运营成本等。美国国家航空航天局已广泛应用DT技术于航天领域,用于建模和仿真复杂系统,如航天器和发动机,并对飞行过程中的飞行器状态进行实时监控和预测。这些应用有助于确保航天任务的安全性和可靠性,并提高任务执行效率。随后,Tao等人[29]在三维模型的基础上提出了数字孪生的全面五维模型,涵盖了物理、虚拟、连接、数据和服务等方面。该模型被认为是管理整个产品生命周期的有效工具,如图6所示。在2019年,他们在《自然》期刊上的综述中指出,数字孪生作为实现虚拟与现实之间双向映射、动态交互和实时连接的关键方式,可以将物理实体和系统的属性、结构、状态、功能和行为映射到虚拟世界,形成高保真、动态的多维度、多尺度、多物理量的模型,为观察、识别、理解、控制和转化物理世界提供了有效的手段[30]。图6 陶飞教授提出的DT五维模型此外,2019年中国Ansys亚太数字孪生技术实验室发布的《数字孪生技术白 皮书》对14个不同组织和学者的数字孪生定义和分析进行了总结[31]。通过分析这些公司和学者的观点,白皮 书将数字孪生定义为现有或未来物理实体的数字模型,能够通过测量、仿真和数据分析进行实时感知、诊断和预测。它通过优化和指令调节物理对象的行为,通过相关数字模型的相互学习不断进化,并在物理对象的生命周期中改善利益相关者的决策。数字孪生的核心思想是在虚拟环境中构建一个与物理实体密切相似的数字模型,实现全面的监控、仿真、优化和预测性维护[32]。该数字模型包含物理实体的几何形状、材料属性、运动状态等静态信息,并能够实时反映物理实体的动态行为、环境变化及其与其他实体的交互。数字孪生技术通过整合先进的信息技术,促进了对物理实体的精准感知、实时分析和智能决策[33]。它被认为是推动数字化转型和智能升级的关键技术,在工业制造、航空航天、城市管理、医疗等领域具有广泛的应用前景。在数字孪生技术的实施过程中,数据采集、传输、处理和分析是关键环节[34]。通过各种传感器和智能设备对物理实体进行实时监控,捕获大量的操作和环境数据。这些数据通过高速网络传输到云或边缘计算平台进行处理,处理结果再通过可视化展示给用户,为决策提供科学依据。4.2 数字孪生关键技术数字孪生技术架构的关键组成部分如图7所示。从整体上看,数字孪生技术架构包含了物联网、大数据、人工智能、模型仿真等多个学科和交叉技术领域。这个架构为各种实体或系统的监控、诊断、预测和优化提供了有力支持。图7 数字孪生技术架构4.2.1 数据采集与处理技术数据采集是数字孪生技术的核心,负责从物理世界及其操作环境中捕获实体状态的信息。传感器网络和远程监控系统是实现这一数据采集的关键。采集到的原始数据必须经过清洗、整合和格式化,才能被数字孪生系统有效利用。此外,大数据技术的发展使得实时数据流的处理和分析成为数字孪生中的一大挑战。张等人[13]探讨了数字孪生数据处理的各种原则和方法,包括数据的采集、存储、交互、关联、融合、演变和服务,并提出了数字孪生数据的概念。数据采集涵盖了物理实体数据、虚拟模型数据、服务数据和领域知识。此外,他们还识别了模拟数据生成和物理数据融合等挑战,为推进数字孪生技术提供了理论和方法基础。孔等人[35]提出了一种车间数字孪生系统应用设计的数据构建方法,该方法涉及分层数据表示、各种应用的特征表示、原始数据预处理、针对不同算法的定制化处理以及大规模制造数据的存储和检索,分为数据表示、数据组织和数据管理三个模块。这一框架为各种车间数字孪生系统应用提供了稳定高效的数据支持。黄等人[36]介绍了一种基于区块链的数字孪生产品数据管理方法,解决了数据存储、访问、共享和真实性方面的挑战。4.2.2 数字建模技术数字建模技术是数字孪生的基石,通过使用先进的计算机技术和三维建模技术,在虚拟世界中创建高保真模型,这些模型精确地代表物理实体的几何形状、物理属性、行为特征等。Unity3D、ANSYS、MATLAB(Simulink)、COMSOL Multiphysics、AutoCAD等工具联合使用,发挥着数字孪生建模中的重要作用。数字孪生高保真创建与物理实体紧密相似的虚拟模型,准确地再现它们的几何形状,重要的是模拟其时空状态、行为和功能等。Schroeder等人[37]提出了一种基于模型驱动的数字孪生设计方法,利用AutomationML和Web服务用于特定的数字孪生架构,并介绍了一种自动化数字孪生部署方法,使建模、部署和与物理设备的实时同步变得更加灵活。王等人[38]采用SysML表示数字孪生系统设计,从基于知识的角度开发了统一的“5维系统设计数字孪生”建模框架。吴等人[39]介绍了一种利用集成的五维框架和TRIZ功能模型的概念性数字孪生建模方法,准确描绘了数字孪生的组件、行为和规则。数字孪生技术是数字化和智能化的重要手段,随着对多尺度和多场景仿真需求的增长,数字孪生建模变得愈加复杂。贾等人[40]提出了一种新型的多尺度和多场景数字孪生建模方法,基于标准化模型分段和装配。魏等人[41]讨论了机电设备的当前多领域建模,并提出了三种常见的方法:多模型平台、高级架构和统一建模语言。他们还提出了指导原则和构建过程,用于开发一致的多领域数字孪生模型。这些原则和过程提高了模型构建的效率和可重用性,支持后续基于模型的应用,如机电设备的操作、维护和故障诊断,从而推动其智能处理。张等人[42]首次提出了一个多层建模框架,支持从单元级到系统级的建模和反向更新,可以实现数字孪生模型的装配和更新,更好地模拟和预测制造系统的行为和性能。人工智能技术通过启用智能和自主决策能力,提升了数字孪生模型的准确性和可靠性,采用了机器学习(Machine Learning,ML)和深度学习等技术。巴里亚等人[43]探索了数字孪生与人工智能之间的相互作用,突出了数字孪生在网络设计和优化中的潜力,并研究了数字孪生和人工智能如何协同克服它们的局限性,实现可靠、高效和低延迟的网络。黄等人[44]提出了一种基于混合学习的数字孪生建模框架,将数据驱动的机器学习与基于物理原理的建模相结合,以优化和预测复杂过程,利用异构数据源。张等人[45]介绍了一种基于生成对抗网络的数字孪生通道建模方法,应用于智能通信网络的物联网,讨论了数字孪生和人工智能在无线通信通道研究中的应用,以及生成对抗网络和变分自编码器等深度学习方法在通信通道建模中的挑战与机遇。4.2.3 数据分析与挖掘技术在数字孪生(DT)领域,数据分析与挖掘是理解和优化物理实体及其运行的核心,赋予数字孪生深入洞察物理实体行为的能力。通过使用统计学、机器学习和深度学习方法处理大量数据,执行模式识别、趋势预测和关联规则挖掘等操作。这些分析结果有助于优化数字孪生模型的准确性和性能,使其不仅能够模拟和监控当前状态,还能及时检测潜在问题,从而为预测性维护、运营优化和效率提升提供科学决策依据。王等人[46]设计了一个基于数字孪生的大数据学习与分析模型,提出了具体的建模方法和过程。这些模型在虚拟空间中迭代优化和验证,提高了准确性和可靠性。Ruah等人[47]提出了一种基于贝叶斯框架的无线系统控制、监控和数据收集的数字孪生方法。Renganathan等人[48]提出了一种考虑数据不确定性并结合领域知识进行主观数据假设的数据融合方法。通过融合来自不同来源的数据,该方法提高了整体预测准确性,并允许对数据不确定性进行量化,显著推进了数字孪生概念的发展。马等人[49]提出了一种基于本体的数据模型耦合方法,涉及关系建立、数据模型耦合和关系演化,实现了数字孪生中的物理与虚拟一致性。利用深度学习强大的数据分析与处理能力,李等人[50]提出了一种基于深度学习的智慧城市数字孪生概念,利用该方法进行智慧城市中大规模数据生成的广泛数据分析。它能够有效应对多源数据的复杂性和高维特征,提高数据分析的准确性和效率。孔等人[35]根据制造数据特征分析功能需求,设计了一个数据构建框架,其中包含数据表示、组织和管理模块。何等人[51]应用数据融合技术增强可持续的数字孪生系统,将专家经验与机器人传感数据结合,用于产品可持续性评估和优化。何等人[52]提出了一种数据驱动的数字孪生系统,协同整合虚拟建模、过程监控、诊断和最优控制,提升过程系统管理。王等人[53]提出了一种基于迁移学习的创新多源数据融合方法,以增强数字孪生建模。Arsiwala等人[54]使用机器学习技术分析收集的碳排放数据。Regis等人[55]对比了两种基于物理建模和数据分析的数字孪生方法,用于在动态负荷下诊断轴承磨损。传统的数据融合方法通常需要大量高保真数据来构建精确的数字孪生系统,这可能会非常昂贵。因此,王等人[56]提出了一种基于生成对抗网络的多保真数据融合方法,利用大量低保真和少量高保真数据来构建精确的数字孪生系统,从而降低数据采集成本。4.2.4 可视化技术数字孪生可视化技术构成了一个综合系统,涵盖数据采集、建模、集成、处理、显示和交互,是数字化转型和智能升级的重要工具。可视化展示是数字孪生可视化技术的核心。通过先进的图形渲染和用户界面设计,数字孪生模型以直观易懂的方式展示给用户。同时,用户可以控制和操作界面与数字孪生模型互动,从而增强对实际物体或过程状态与行为的理解与分析。此外,数字孪生可视化技术还结合了三维可视化、虚拟现实和增强现实,使用户能够深入了解实际物体或过程的细节与特征,提高决策的准确性和效率。Yan等人[57]提出了一种集成的知识可视化和数字孪生系统,展示了如何使用战略数字孪生管理决策系统作为一种更具可视性、适应性和有效性的决策模型。Chen等人[58]利用Cesium技术进行可靠的环境感知数据可视化,并详细介绍了视频投影在虚拟环境中的应用。Haghshenas等人[59]使用Unity3D可视化风电场的数字孪生模型,允许直观地观察和分析其运行和数据。Fan等人[60]提出了一种通用的数字孪生可视化架构,用于灵活制造系统,探索如何利用数字孪生场景信息进行三维可视化,以实现人机交互。Shin等人[61]开发了数字孪生管道的科学模拟和混合现实可视化,介绍了数字孪生建模方法和科学模拟的可视化技术。Kikuchi等人[62]进行了一项关于未来景观可视化的研究,结合增强现实和无人机技术的城市数字孪生技术。Bodin等人[63]描述了选择三维物体可视化技术平台的标准,并提出了一种基于Unity3D的可视化系统。Zhu等人[64]展示了利用Unity3D进行的数字孪生可视化,通过虚拟环境和物理空间之间的连接实现虚拟与物理实体的双向互动。Yu等人[65]强调了Web技术在动态和交互式时空数据可视化中的优势,展示了它们在城市数字孪生中的应用。Tadeja等人[66]研究了AeroVR,一种用于航空设计和虚拟现实中数字孪生的沉浸式可视化系统。该系统使用虚拟现实创建一个沉浸式环境,增强了航空工程师可视化和分析设计数据的能力。4.2.5 持续迭代和更新技术数字孪生不仅仅是一次性构建的,而是需要一个持续发展的过程。随着物理实体及其操作环境的变化,数字孪生系统与现实之间可能会出现差异,因此需要不断收集新数据并更新模型和仿真,以保持虚拟与物理世界的一致性。因此,学者们探索了迭代模型更新的理论和方法,以不断描述物理对象的特征。其他研究则探讨了利用物联网确保连接性和交互,从而维持虚拟与物理空间之间的一致性。最初,关于数字孪生模型更新方法的研究较少。为了解决计算机数控机床数字孪生模型中的一致性问题,Wei等人[67]研究了计算机数控机床数字孪生模型的性能衰退更新方法,并提出了一种维护一致性的方法。Jiang等人[68]引入了一种基于区块链的数字孪生边缘网络中合作式联邦学习和模型更新验证的方法。Luo等人[69]提出了一种数据驱动的虚拟模型知识更新框架,涵盖了模型构建、交互和模型筛选算法。过去两年,关于数字孪生模型更新技术的研究迅速增加。例如,Zhang等人[70]提出了一种数字孪生模型更新的通用框架,探索了多维模型更新方法,并通过现实应用示例讨论了物理模型的更新。Shi等人[71]提出了一种能够动态更新和实时映射的数字孪生模型,扩展了滚动轴承全生命周期的局部缺陷分析。Xia等人[72]使用基于物理-虚拟交互的模型更新方法,通过优化过程提高生成数据的质量,以减少虚拟和实际信号之间的差异。Liu等人[73]强调了知识更新的重要性和相关性,提出了一种实现知识更新的模型。Angelis等人[74]将不确定性概率集成到结构模型更新中,用于数字孪生模型的应用。Kessels等人[75]将逆向映射参数更新方法扩展到非线性动力系统,使用一种通过瞬态信号输出特征推断参数的模型进行实时数字孪生模型更新。该方法具有物理可解释性,且在线计算成本低。Rodríguez等人[76]通过检测错误数据并基于历史数据和实时数据的分析触发学习机制,更新数字孪生模型的性能。Donato等人[77]描述了如何通过数据同化更新数字孪生系统。Wu等人[78]使用在线极限学习机和核函数方法构建了一个自更新的数字孪生模型。Guo等人[79]提出了一种基于双回路的数字孪生预测与健康管理框架,通过从物理到虚拟的数据实时更新,实现了对产品退化的准确监控和表征。编辑:任超校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、海洋、Tina、陈宇航、陈莹洁、王金该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除点击左下角阅读原文,即可在线阅读论文。来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈