首页/文章/ 详情

综述 | 数字孪生智能故障诊断最新进展综述(上)

1月前浏览337
本期给大家推荐胡昌华教授的数字孪生智能故障诊断的最新进展综述(上)。随着工业4.0时代的到来,智能制造和数字技术迅速发展,对工业设备的稳定性、可靠性和安全性提出了更高的要求。最近,数字孪生为智能故障诊断提供了一种新的解决方案。本文将从概念、关键技术、应用场景和挑战展望等方面对数字孪生技术在智能故障诊断的发展应用进行综述。

论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

论文基本信息

论文题目:A state of the art in digital twin for intelligent fault diagnosis

论文期刊:Advanced Engineering Informatics

论文日期:2025年

论文链接:https://doi.org/10.1016/j.aei.2024.102963

作者:Changhua Hu, Zeming Zhang, Chuanyang Li, Mingzhe Leng, Zhaoqiang Wang, Xinyi Wan, Chen Chen

机构:Laboratory of Intelligent Control, PLA Rocket Force University of Engineering, Xi’an 710025, China

通讯作者邮箱:li_chuanyang@yeah.net

目录

1 摘要

2 引言

      2.1 相关工作回顾

      2.2 本文目的

3 研究方法

3.1 文献综述方法

3.2 文献分类标准

数字孪生的研究进展

4.1 数字孪生的起源与概念

4.2 数字孪生关键技术

(以上标记章节为本文内容)

5 智能故障诊断研究进展

      5.1 智能故障诊断定义及相关概念

      5.2 智能故障诊断方法

6 数字孪生在智能故障诊断中的应用

      6.1 数字孪生在工业制造领域智能故障诊断中的应用

      6.2 数字孪生在能源领域智能故障诊断中的应用

      6.3 数字孪生在航空航天领域智能故障诊断中的应用

      6.4 数字孪生在其他领域智能故障诊断中的应用

7 建议与未来展望

      7.1 面向数字孪生技术

      7.2 面向智能故障诊断

      7.3 面向数字孪生的智能故障诊断

8 总结

1 摘要

随着工业4.0时代的到来,智能制造和数字技术迅速发展,对工业设备的稳定性、可靠性和安全性提出了更高的要求。故障诊断(Fault Diagnosis, FD)是保证设备正常运行的关键步骤,其准确性和效率直接影响设备的稳定运行和经济效益。随着人工智能(Artificial Intelligence, AI)技术的进步,数据驱动的故障诊断方法在智能领域得到了发展,即智能故障诊断(Intelligent Fault Diagnosis, IFD)。最近,为IFD提供了一种新的解决方案。这就是数字孪生(Digital Twin, DT),一种连接物理世界和虚拟世界的桥梁技术。许多研究人员发表了关于使用DT技术进行设备IFD的研究。本文分析了2017年至2024年的260篇文章,系统地讨论了DT、IFD以及DT在IFD中的应用。首先,详细介绍了DT和IFD的概念、关键技术和应用场景;然后,重点介绍了DT技术在IFD领域的应用;最后,本文总结了存在的问题和挑战,提出了解决问题的建议,并对未来的发展进行了展望。这项工作有望为相关领域的研究人员提供有价值的参考和利用,并促进DT技术在IFD领域的进一步发展和应用。

关键词:工业4.0,数字孪生,智能故障诊断,文献综述

2 引言

随着现代工业系统的复杂性和自动化程度的逐步提高,工业设备在各个领域的应用越来越广泛,其结构和功能也越来越复杂。然而,在长时间运行过程中,由于高温、灰尘、过载、强烈振动等多种因素的影响,不可避免地会出现各种故障,影响设备的正常运行,造成人员伤亡和财产损失。因此,故障诊断(Fault Diagnosis, FD)作为确保设备运行的安全性、稳定性和可靠性的关键步骤变得越来越重要[1]。传统的FD方法通常依赖于人工经验和定期维护,效率低下,难以应对复杂系统突发故障的挑战。因此,智能故障诊断(Intelligent Fault Diagnosis, IFD)技术应运而生,该技术通过结合先进的计算机、传感器、信号处理、多模态信息融合和人工智能(Artificial Intelligence, AI)技术来实现实时状态监测和诊断,提高了系统的可靠性和安全性,降低了维护成本,提高了生产效率[2]。

随着人工智能技术的快速发展,特别是机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)等智能算法的广泛应用,IFD技术取得了重大进展。这些方法首先从大量数据中提取有效特征;然后建立精确的FD模型;最后实现复杂设备的IFD。与此同时,物联网(Internet of Things, IoT)和云计算等技术的普及提高了IFD系统的实时性、可扩展性和智能性。

数据驱动的IFD方法被证明是FD领域有前景的工具。然而,其有效性在很大程度上取决于所获取数据的数量、质量和多样性,这是耗时、昂贵和不确定的,特别是在复杂或危险的工业系统中。

近年来,数字孪生(Digital Twin, DT)作为一种新的前沿技术概念,逐渐引起了工业界和学术界的广泛关注[3]。数字孪生通过数字手段创建与虚拟空间中物理对象相对应的高保真数字模型,实现物理世界和数字世界之间的实时映射和交互。数字孪生技术为工业系统的设计、制造、运行和维护管理提供了新的视角和工具。在这方面,在虚拟环境中模拟物理系统的运行状态和性能特征,这有助于研究人员更好地了解系统行为,预测潜在问题,优化系统性能。这提高了产品设计质量和生产率,同时降低了运营成本和维护难度。数字孪生技术在航空航天、工业制造、能源管理和智慧城市等领域取得了重大成就。

显然,数字孪生技术通过构建和模拟物理设备的高保真虚拟模型,能够再现设备在各种工况下的运行状态。它生成的数据与正常运行和故障条件下实际设备的输出非常相似[4]。利用感兴趣的故障数据,对设备的性能进行了更深入的分析和评估。在这方面,提供了一种新的解决方案来克服IFD方法的局限性,如数据依赖性,从而提高了设备的实时监测水平、可靠性和安全性。

目前,许多学者对DT在某些领域的应用进行了研究。然而,目前还没有人系统地整理和总结关于DT在IFD中的应用的文献,这是本文感兴趣的关键工作。

2.1 相关工作回顾

随着工业的不断发展,故障诊断和设备维护变得不可或缺。然而,传统的FD方法不再满足现代工业的要求,导致IFD技术的广泛采用和进步。随着IFD领域的研究成果激增,学者们基于ML和DL方法分析了IFD[5],[6],以及它在旋转机械[7]、电力技术[8]、风力发电[9]等领域的应用。

自21世纪初以来,物联网技术的兴起为DT技术带来了新的机遇和挑战,随后引起了广泛的关注和应用。特别是自2017年以来,人工智能、大数据和其他新兴信息技术的迅速发展刺 激了DT技术的繁荣。DT的概念[10],[11]、核心组件[12]、关键技术[13],[14]及其在智能城市[15]、医疗保健[16]、工业4.0[17]、能源[18]、建筑[19]和航空航天[20]等不同领域的应用在许多文章中得到了回顾。这些进步同时提高了IFD技术的智能性和精度。

在IFD领域,许多研究人员讨论了机器学习、不平衡学习、云计算和人工智能等方法的应用。Lei等人[5]通过将机器学习理论组织成过去、现在和未来的阶段,对IFD中的机器学习理论进行了系统的回顾。然后,作者提供了一个发展路线图,概述了潜在的研究趋势,从而为未来几年IFD的进展提供了指导。Zhu等人[6]讨论了DL算法在旋转机械FD和预测领域的应用。首先,他们列出了几种常用的旋转机械公共数据集,然后详细讨论了五种主流DL方法的原理,包括卷积神经网络(Convolutional Neural Network, CNN)和生成对抗网络(Generative Adversarial Network, GAN),以及它们在旋转机械IFD中的应用。这为研究人员选择合适的数据集和模型提供了宝贵的指导。此外,他们还解决了与基于DL的FD方法相关的挑战,并提出了未来的研究方向,这对旋转机械中IFD技术的进步具有重要意义。Chen等人[21]总结了基于知识校准和妥协的迁移学习(Transfer Learning, TL)方法在IFD 中的应用,同时提出了三个原则和一种新的分类策略来指导基于TL的FD方法的设计。Ren等人[22]通过考虑不平衡学习方法在实际工程场景中对IFD的影响,对其进行了回顾。然后,他们对提高IFD模型性能的研究改进进行了总结。Maurya等人[23]聚焦在物联网、云计算和人工智能等先进技术集成方面,全面回顾了IFD和状态监测系统的发展。他们指出未来感兴趣的方向和趋势,为相关领域的研究人员提供了优先关注点。

在数字孪生领域,DT技术的概念和各种应用在各个领域的众多研究中得到了探索。Liu等人[12]系统地分析了2017年至2022年的177篇文章,同时阐明了DT的定义和特征、应用领域及其核心成分的研究方法。Peng等人[24]全面概述了滚动轴承DT的核心方面,包括检测、建模、预测和健康管理技术。这项研究表明,这些核心技术在滚动轴承中的应用仍然处于起步阶段,突出了需要解决的几个挑战。Giovanni等人[20]回顾了DT技术在航空航天维护、修理和大修系统中的应用;然后他们为未来的发展提出了一种基于物联网的模块化架构。此外,他们还探索了DT技术在航空航天领域的潜在应用和挑战。Errandonea等人[25]专注于DT在维护中的应用。他们介绍了四种维护策略:纠正性维护、状态维护、预测性维护和指向性维护,并指出DT可以优化维护活动。此外,强调了DT在维护中的重要性,特别是对于复杂设备和恶劣环境。Karabulut等人[26]分析了82篇关于认知孪生的文章,重点研究了语义网技术在DT系统中的应用。他们探索了本体的价值、它在各个层面的应用、特定领域的分析以及知识图谱在DT中的使用,为理解本体的应用提供了见解。

这些综述文章展示了关于智能故障诊断和数字孪生概念、相关技术及其应用领域的广泛研究。文中讨论的问题、方法、结论以及未来展望均得到了这两个领域最新进展的验证。然而,以往的综述通常是分别探讨IFD和DT,尚未有关于其集成应用的全面总结被报道。

2.2 本文目的

近年来,DT技术在各个领域显示出相当大的潜力和发展前景,引起了学术界和工业界的关注。以“数字孪生”和“故障诊断”为主题词,在IEEE Xplore、Scopus和Web of Science三个主要学术数据库中搜索,得出了2017年至2024年关于DT技术在FD中的使用的出版物统计数据,如图1所示。该图显示了近年来DT技术在IFD中的应用出版物数量的增长趋势,突显了该领域研究的重要性和未来潜力。因此,本文旨在提供全面详细的综述,目标如下:

图1 2017年至2024年的相关出版物数量

1)分析数字孪生的研究进展。探讨数字孪生的概念、历史发展以及其应用所需的关键技术,包括物理模型、数据集成与分析、实时交互、虚拟仿真和语义建模等内容。

2)研究智能故障诊断的发展动态。详细阐述智能故障诊断的相关概念、发展历史,以及机器学习和深度学习等智能算法在IFD中的应用,包括算法选择、模型训练和性能提升等方面的研究进展。

3)重点分析DT技术在IFD中的应用聚焦于数字孪生在智能故障诊断中的具体应用,通过案例或实践探讨如何利用DT技术提高故障诊断的准确性、实时性和智能化水平,揭示两者融合的技术路径与方法。

4)总结DT技术在IFD应用中的现存问题与挑战,提出建议和未来展望。系统梳理DT技术在IFD领域应用中的关键瓶颈,如数据质量、模型复杂度、计算资源、跨领域集成等,提出解决方案并预测未来发展趋势,强调该领域的研究前景和创新方向。

本文其余部分的组织结构如下:第2部分描述了分类文献综述的方法和标准;第3部分详细阐述了数字孪生的研究进展;第4部分聚焦于智能故障诊断的研究进展;第5部分回顾了DT在IFD中的应用;第6部分总结了现存问题与挑战,并提出建议与未来展望;第7部分提供了总结与结论。本文的整体框架如图2所示。

图2 文章整体框架

3 研究方法

3.1 文献综述方法

本文采用的文献综述方法包括三个步骤:文献检索与下载、文献阅读与筛选、文献分类与综述,以确保研究的全面性与系统性。图2(a)展示了具体的研究框架。

自2017年以来,与数字孪生相关的出版物数量迅速增长[12]。因此,在检索与下载阶段,本研究从2017年至2024年通过Google等学术数据库和搜索引擎获取并下载了427篇论文,来源包括国际期刊、主要会议论文以及白 皮书。检索关键词包括“数字孪生”(Digital Twin)、“故障诊断”(Fault Diagnosis),以及其在各子领域的应用,如“数字孪生关键技术”(Digital Twin Key Technologies)、“数字孪生可视化”(Digital Twin Visualization)、“数字孪生建模”(Digital Twin Modeling)、“预测与健康管理”(Prognostics and Health Management)、“故障检测”(Fault Detection)和“深度学习故障诊断”(Deep Learning Fault Diagnosis)。表1详细列出了用于文献综述的数据库、检索词及其来源信息。随后,对文献进行了初步统计分析。

表1 文献综述检索索引

在阅读与筛选阶段,我们重点关注427篇检索文献的标题、摘要和结论,初步筛选出与综述主题无关的文献,将文献数量缩减至318篇。接着,对剩余文献的引言、章节标题和案例研究部分进行了进一步阅读,根据文献的质量及其与研究主题的相关性,剔除了低质量或相关性较弱的文献,最终筛选出260篇文献。其中,第1部分中仅引用了24篇文献,其余236篇文献按照既定标准进行了分类、分析和系统性讨论。

3.2 文献分类标准

本文为文献分类建立了明确的分类标准,以确保系统综述提取的信息具有条理性和针对性。首先,根据研究内容,将236篇文献分为三个类别:DT、IFD以及DT在IFD中的应用,各类别所包含的文献数量如图3所示。其中有3篇文献同时属于两个类别。随后,基于不同的分类标准对这三个主要类别中的文献进行了进一步细分。

图3 每个类别的论文数量

在DT类别中,共包含55篇文献。首先,分析DT的起源与概念,共包含8篇文章。接着,根据技术类型对其余文献进行分类,分为五个子类别:数据采集与处理、DT模型构建、数据分析与融合、数据可视化以及模型的持续迭代与更新。具体来说,数据采集与处理子类别包含3篇文章,涵盖数据预处理和实时处理等技术;DT模型构建子类别包含9篇文章,讨论了物理模型、数据驱动模型及两者结合的混合模型;数据分析与融合子类别包含12篇文章,重点在于各种传感器和数据格式的整合;数据可视化子类别包含10篇文章,描述了复杂数据向直观图表和实时界面的转化;模型持续迭代与更新子类别包含13篇文章,突出了自学习和基于反馈的更新技术。这些子类别的深入分析为理解DT的关键技术及其在提升设备和系统可靠性与性能方面的应用提供了全面的视角。

在IFD类别中,共包含122篇文献。首先,与领域相关的概念部分包含6篇文章。随后,根据FD方法中核心技术和学习策略将其余文献分为三个子类别:基于传统机器学习(Shallow Machine Learning, SML)的IFD、基于深度学习(Deep Learning,DL)的IFD,以及基于迁移学习的IFD。其中,基于SML的IFD包含34篇文章,涉及支持向量机和随机森林等技术;基于DL的IFD包含65篇文章,使用卷积神经网络和长短期记忆网络等方法;基于TL的IFD包含17篇文章,重点在于通过迁移学习技术实现跨场景故障诊断。这种分类有助于系统性地比较各种故障诊断技术的优势及其应用场景,为选择合适的故障诊断方法提供了理论和实践指导。

在DT用于IFD的类别中,共包含62篇文献。根据不同的应用行业或领域将其分为四个子类别:工业制造、能源、航空航天和其他领域。其中,工业制造子类别包含22篇文章,研究DT技术在各种机械故障诊断中的应用;能源子类别包含26篇文章,探讨DT在风能、太阳能和储能等领域的故障诊断应用;航空航天子类别包含3篇文章,涉及从航空发动机到卫星系统在故障诊断中的DT应用;其他领域子类别包含11篇文章,探索DT技术在上述领域之外的应用。这种分类方式全面分析了DT在IFD中跨行业应用的现状、技术挑战和未来方向,同时揭示了其跨领域应用的广阔潜力。

4 数字孪生研究进展

4.1 数字孪生的起源与概念

数字孪生技术的起源和发展历史如图4所示。DT的多样化起源和发展方向导致了其概念和内涵的不同解释。一直以来,学术界没有对DT进行明确和统一的定义。

图4 数字孪生技术的起源与进化

“孪生”这一概念最早出现在1970年美国国家航空航天局(National Aeronautics and Space Administration,NASA)的“阿波罗计划”中,该计划创建了一个位于地面的航天器模拟器,形成了“物理孪生”。通过使用实时状态数据,调整地面模拟器的环境参数,以匹配航天器的实际情况。

2003年,美国Grieves教授在其产品生命周期课程中提出了镜像空间模型。该模型包括物理空间、信息空间及其之间的信息流[27],也被认为是当时数字孪生的初步三维模型,如图5所示。然而,由于当时技术能力的局限性,该概念和模型未能引起专家学者的关注。


图5 Grieves教授提出的DT三维模型

直到2010年,美国国家航空航天局正式提出了数字孪生的概念,并将DT范式描述为一种长期愿景,定义DT为通过利用物理模型、传感器和操作历史的数据,整合多学科和多尺度的仿真过程,进而在虚拟空间中镜像物理产品,从而反映其整个生命周期[28]。简单来说,DT涉及在虚拟世界中构建一个数字模型,该模型与现实世界中的物理对象密切相似,通过收集和分析各种数据实现。该模型能够模拟和预测物理对象的行为和性能,以帮助优化设计方案、提高生产力并降低运营成本等。美国国家航空航天局已广泛应用DT技术于航天领域,用于建模和仿真复杂系统,如航天器和发动机,并对飞行过程中的飞行器状态进行实时监控和预测。这些应用有助于确保航天任务的安全性和可靠性,并提高任务执行效率。

随后,Tao等人[29]在三维模型的基础上提出了数字孪生的全面五维模型,涵盖了物理、虚拟、连接、数据和服务等方面。该模型被认为是管理整个产品生命周期的有效工具,如图6所示。在2019年,他们在《自然》期刊上的综述中指出,数字孪生作为实现虚拟与现实之间双向映射、动态交互和实时连接的关键方式,可以将物理实体和系统的属性、结构、状态、功能和行为映射到虚拟世界,形成高保真、动态的多维度、多尺度、多物理量的模型,为观察、识别、理解、控制和转化物理世界提供了有效的手段[30]。


图6 陶飞教授提出的DT五维模型

此外,2019年中国Ansys亚太数字孪生技术实验室发布的《数字孪生技术白 皮书》对14个不同组织和学者的数字孪生定义和分析进行了总结[31]。通过分析这些公司和学者的观点,白皮 书将数字孪生定义为现有或未来物理实体的数字模型,能够通过测量、仿真和数据分析进行实时感知、诊断和预测。它通过优化和指令调节物理对象的行为,通过相关数字模型的相互学习不断进化,并在物理对象的生命周期中改善利益相关者的决策。

数字孪生的核心思想是在虚拟环境中构建一个与物理实体密切相似的数字模型,实现全面的监控、仿真、优化和预测性维护[32]。该数字模型包含物理实体的几何形状、材料属性、运动状态等静态信息,并能够实时反映物理实体的动态行为、环境变化及其与其他实体的交互。

数字孪生技术通过整合先进的信息技术,促进了对物理实体的精准感知、实时分析和智能决策[33]。它被认为是推动数字化转型和智能升级的关键技术,在工业制造、航空航天、城市管理、医疗等领域具有广泛的应用前景。

在数字孪生技术的实施过程中,数据采集、传输、处理和分析是关键环节[34]。通过各种传感器和智能设备对物理实体进行实时监控,捕获大量的操作和环境数据。这些数据通过高速网络传输到云或边缘计算平台进行处理,处理结果再通过可视化展示给用户,为决策提供科学依据。

4.2 数字孪生关键技术

数字孪生技术架构的关键组成部分如图7所示。从整体上看,数字孪生技术架构包含了物联网、大数据、人工智能、模型仿真等多个学科和交叉技术领域。这个架构为各种实体或系统的监控、诊断、预测和优化提供了有力支持。

图7 数字孪生技术架构

4.2.1 数据采集与处理技术

数据采集是数字孪生技术的核心,负责从物理世界及其操作环境中捕获实体状态的信息。传感器网络和远程监控系统是实现这一数据采集的关键。采集到的原始数据必须经过清洗、整合和格式化,才能被数字孪生系统有效利用。此外,大数据技术的发展使得实时数据流的处理和分析成为数字孪生中的一大挑战。

张等人[13]探讨了数字孪生数据处理的各种原则和方法,包括数据的采集、存储、交互、关联、融合、演变和服务,并提出了数字孪生数据的概念。数据采集涵盖了物理实体数据、虚拟模型数据、服务数据和领域知识。此外,他们还识别了模拟数据生成和物理数据融合等挑战,为推进数字孪生技术提供了理论和方法基础。孔等人[35]提出了一种车间数字孪生系统应用设计的数据构建方法,该方法涉及分层数据表示、各种应用的特征表示、原始数据预处理、针对不同算法的定制化处理以及大规模制造数据的存储和检索,分为数据表示、数据组织和数据管理三个模块。这一框架为各种车间数字孪生系统应用提供了稳定高效的数据支持。黄等人[36]介绍了一种基于区块链的数字孪生产品数据管理方法,解决了数据存储、访问、共享和真实性方面的挑战。

4.2.2 数字建模技术

数字建模技术是数字孪生的基石,通过使用先进的计算机技术和三维建模技术,在虚拟世界中创建高保真模型,这些模型精确地代表物理实体的几何形状、物理属性、行为特征等。Unity3D、ANSYS、MATLAB(Simulink)、COMSOL Multiphysics、AutoCAD等工具联合使用,发挥着数字孪生建模中的重要作用。

数字孪生高保真创建与物理实体紧密相似的虚拟模型,准确地再现它们的几何形状,重要的是模拟其时空状态、行为和功能等。Schroeder等人[37]提出了一种基于模型驱动的数字孪生设计方法,利用AutomationML和Web服务用于特定的数字孪生架构,并介绍了一种自动化数字孪生部署方法,使建模、部署和与物理设备的实时同步变得更加灵活。王等人[38]采用SysML表示数字孪生系统设计,从基于知识的角度开发了统一的“5维系统设计数字孪生”建模框架。吴等人[39]介绍了一种利用集成的五维框架和TRIZ功能模型的概念性数字孪生建模方法,准确描绘了数字孪生的组件、行为和规则。

数字孪生技术是数字化和智能化的重要手段,随着对多尺度和多场景仿真需求的增长,数字孪生建模变得愈加复杂。贾等人[40]提出了一种新型的多尺度和多场景数字孪生建模方法,基于标准化模型分段和装配。魏等人[41]讨论了机电设备的当前多领域建模,并提出了三种常见的方法:多模型平台、高级架构和统一建模语言。他们还提出了指导原则和构建过程,用于开发一致的多领域数字孪生模型。这些原则和过程提高了模型构建的效率和可重用性,支持后续基于模型的应用,如机电设备的操作、维护和故障诊断,从而推动其智能处理。张等人[42]首次提出了一个多层建模框架,支持从单元级到系统级的建模和反向更新,可以实现数字孪生模型的装配和更新,更好地模拟和预测制造系统的行为和性能。

人工智能技术通过启用智能和自主决策能力,提升了数字孪生模型的准确性和可靠性,采用了机器学习(Machine Learning,ML)和深度学习等技术。巴里亚等人[43]探索了数字孪生与人工智能之间的相互作用,突出了数字孪生在网络设计和优化中的潜力,并研究了数字孪生和人工智能如何协同克服它们的局限性,实现可靠、高效和低延迟的网络。黄等人[44]提出了一种基于混合学习的数字孪生建模框架,将数据驱动的机器学习与基于物理原理的建模相结合,以优化和预测复杂过程,利用异构数据源。张等人[45]介绍了一种基于生成对抗网络的数字孪生通道建模方法,应用于智能通信网络的物联网,讨论了数字孪生和人工智能在无线通信通道研究中的应用,以及生成对抗网络和变分自编码器等深度学习方法在通信通道建模中的挑战与机遇。

4.2.3 数据分析与挖掘技术

在数字孪生(DT)领域,数据分析与挖掘是理解和优化物理实体及其运行的核心,赋予数字孪生深入洞察物理实体行为的能力。通过使用统计学、机器学习和深度学习方法处理大量数据,执行模式识别、趋势预测和关联规则挖掘等操作。这些分析结果有助于优化数字孪生模型的准确性和性能,使其不仅能够模拟和监控当前状态,还能及时检测潜在问题,从而为预测性维护、运营优化和效率提升提供科学决策依据。

王等人[46]设计了一个基于数字孪生的大数据学习与分析模型,提出了具体的建模方法和过程。这些模型在虚拟空间中迭代优化和验证,提高了准确性和可靠性。Ruah等人[47]提出了一种基于贝叶斯框架的无线系统控制、监控和数据收集的数字孪生方法。Renganathan等人[48]提出了一种考虑数据不确定性并结合领域知识进行主观数据假设的数据融合方法。通过融合来自不同来源的数据,该方法提高了整体预测准确性,并允许对数据不确定性进行量化,显著推进了数字孪生概念的发展。马等人[49]提出了一种基于本体的数据模型耦合方法,涉及关系建立、数据模型耦合和关系演化,实现了数字孪生中的物理与虚拟一致性。利用深度学习强大的数据分析与处理能力,李等人[50]提出了一种基于深度学习的智慧城市数字孪生概念,利用该方法进行智慧城市中大规模数据生成的广泛数据分析。它能够有效应对多源数据的复杂性和高维特征,提高数据分析的准确性和效率。孔等人[35]根据制造数据特征分析功能需求,设计了一个数据构建框架,其中包含数据表示、组织和管理模块。何等人[51]应用数据融合技术增强可持续的数字孪生系统,将专家经验与机器人传感数据结合,用于产品可持续性评估和优化。何等人[52]提出了一种数据驱动的数字孪生系统,协同整合虚拟建模、过程监控、诊断和最优控制,提升过程系统管理。王等人[53]提出了一种基于迁移学习的创新多源数据融合方法,以增强数字孪生建模。Arsiwala等人[54]使用机器学习技术分析收集的碳排放数据。Regis等人[55]对比了两种基于物理建模和数据分析的数字孪生方法,用于在动态负荷下诊断轴承磨损。传统的数据融合方法通常需要大量高保真数据来构建精确的数字孪生系统,这可能会非常昂贵。因此,王等人[56]提出了一种基于生成对抗网络的多保真数据融合方法,利用大量低保真和少量高保真数据来构建精确的数字孪生系统,从而降低数据采集成本。

4.2.4 可视化技术

数字孪生可视化技术构成了一个综合系统,涵盖数据采集、建模、集成、处理、显示和交互,是数字化转型和智能升级的重要工具。可视化展示是数字孪生可视化技术的核心。通过先进的图形渲染和用户界面设计,数字孪生模型以直观易懂的方式展示给用户。同时,用户可以控制和操作界面与数字孪生模型互动,从而增强对实际物体或过程状态与行为的理解与分析。此外,数字孪生可视化技术还结合了三维可视化、虚拟现实和增强现实,使用户能够深入了解实际物体或过程的细节与特征,提高决策的准确性和效率。

Yan等人[57]提出了一种集成的知识可视化和数字孪生系统,展示了如何使用战略数字孪生管理决策系统作为一种更具可视性、适应性和有效性的决策模型。Chen等人[58]利用Cesium技术进行可靠的环境感知数据可视化,并详细介绍了视频投影在虚拟环境中的应用。Haghshenas等人[59]使用Unity3D可视化风电场的数字孪生模型,允许直观地观察和分析其运行和数据。Fan等人[60]提出了一种通用的数字孪生可视化架构,用于灵活制造系统,探索如何利用数字孪生场景信息进行三维可视化,以实现人机交互。Shin等人[61]开发了数字孪生管道的科学模拟和混合现实可视化,介绍了数字孪生建模方法和科学模拟的可视化技术。Kikuchi等人[62]进行了一项关于未来景观可视化的研究,结合增强现实和无人机技术的城市数字孪生技术。Bodin等人[63]描述了选择三维物体可视化技术平台的标准,并提出了一种基于Unity3D的可视化系统。Zhu等人[64]展示了利用Unity3D进行的数字孪生可视化,通过虚拟环境和物理空间之间的连接实现虚拟与物理实体的双向互动。Yu等人[65]强调了Web技术在动态和交互式时空数据可视化中的优势,展示了它们在城市数字孪生中的应用。Tadeja等人[66]研究了AeroVR,一种用于航空设计和虚拟现实中数字孪生的沉浸式可视化系统。该系统使用虚拟现实创建一个沉浸式环境,增强了航空工程师可视化和分析设计数据的能力。

4.2.5 持续迭代和更新技术

数字孪生不仅仅是一次性构建的,而是需要一个持续发展的过程。随着物理实体及其操作环境的变化,数字孪生系统与现实之间可能会出现差异,因此需要不断收集新数据并更新模型和仿真,以保持虚拟与物理世界的一致性。因此,学者们探索了迭代模型更新的理论和方法,以不断描述物理对象的特征。其他研究则探讨了利用物联网确保连接性和交互,从而维持虚拟与物理空间之间的一致性。

最初,关于数字孪生模型更新方法的研究较少。为了解决计算机数控机床数字孪生模型中的一致性问题,Wei等人[67]研究了计算机数控机床数字孪生模型的性能衰退更新方法,并提出了一种维护一致性的方法。Jiang等人[68]引入了一种基于区块链的数字孪生边缘网络中合作式联邦学习和模型更新验证的方法。Luo等人[69]提出了一种数据驱动的虚拟模型知识更新框架,涵盖了模型构建、交互和模型筛选算法。

过去两年,关于数字孪生模型更新技术的研究迅速增加。例如,Zhang等人[70]提出了一种数字孪生模型更新的通用框架,探索了多维模型更新方法,并通过现实应用示例讨论了物理模型的更新。Shi等人[71]提出了一种能够动态更新和实时映射的数字孪生模型,扩展了滚动轴承全生命周期的局部缺陷分析。Xia等人[72]使用基于物理-虚拟交互的模型更新方法,通过优化过程提高生成数据的质量,以减少虚拟和实际信号之间的差异。Liu等人[73]强调了知识更新的重要性和相关性,提出了一种实现知识更新的模型。Angelis等人[74]将不确定性概率集成到结构模型更新中,用于数字孪生模型的应用。Kessels等人[75]将逆向映射参数更新方法扩展到非线性动力系统,使用一种通过瞬态信号输出特征推断参数的模型进行实时数字孪生模型更新。该方法具有物理可解释性,且在线计算成本低。Rodríguez等人[76]通过检测错误数据并基于历史数据和实时数据的分析触发学习机制,更新数字孪生模型的性能。Donato等人[77]描述了如何通过数据同化更新数字孪生系统。Wu等人[78]使用在线极限学习机和核函数方法构建了一个自更新的数字孪生模型。Guo等人[79]提出了一种基于双回路的数字孪生预测与健康管理框架,通过从物理到虚拟的数据实时更新,实现了对产品退化的准确监控和表征。

编辑:任超
校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、海洋、Tina、陈宇航、陈莹洁、王金
该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除
点击左下角阅读原文,即可在线阅读论文。


来源:故障诊断与python学习
Comsol振动非线性旋转机械通用航空航天建筑电力MATLABpython云计算AutoCADUM声学电场理论电机材料数字孪生
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-01-11
最近编辑:1月前
故障诊断与python学习
硕士 签名征集中
获赞 77粉丝 81文章 170课程 0
点赞
收藏
作者推荐

ASOC论文学习 | 一种数据不平衡下数字孪生辅助的滚动轴承故障诊断框架

本期给大家推荐由作者投稿的文章《一种数据不平衡下数字孪生辅助的滚动轴承故障诊断框架》。本文提出了一种数字孪生辅助的诊断模型,作者通过试验台数据和工程实测数据进行验证,结果表明所提框架的诊断性能显著优于现有方法,这对于深度学习故障诊断方法在工业环境中的应用具有重要意义,适合于研究数字孪生和深度学习方法融合的学习者。(投稿方式点击这)论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Digital twin-assisted fault diagnosis framework for rolling bearings under imbalanced data论文期刊:Applied Soft Computing论文日期:2025年论文链接:https://doi.org/10.1016/j.asoc.2024.112528作者:Zhen Ming , Baoping Tang *, Lei Deng , Qichao Yang , Qikang Li机构:The State Key Laboratory of Mechanical Transmission, Chongqing University, Chongqing 400030, China目录1 摘要2 引言3 预备知识3.1 问题定义3.2 轴承动力学仿真模型4 所提数字孪生辅助的不平衡故障诊断框架4.1 数字孪生辅助的数据融合策略 DTDFS 4.1.1 数据分解与重构 4.1.2 数字孪生数据筛选4.2 频域滤波子域适应网络FFSAN 4.2.1 深度频域滤波的特征提取器 4.2.2 子域自适应机制 4.2.3 优化目标5 实验与结果分析5.1 航空轴承全寿命加速试验数据集5.2 结果分析 5.2.1 数字孪生辅助的数据融合策略有效性分析 5.2.2 诊断性能分析6 工程应用6.1 风电齿轮箱轴承数据集6.2 结果分析 6.2.1 数字孪生辅助的数据融合策略有效性分析 6.2.2 诊断性能分析7 总结1 摘要实际工业场景中数据不平衡制约了深度学习故障诊断方法的应用。许多研究提出将动力学模型响应集成到训练过程中以解决数据不平衡问题,但动力学模型响应与实测数据之间存在显著的分布差异,导致诊断性能欠佳。针对上述问题,本研究提出了一种数据不平衡下数字孪生辅助的滚动轴承故障诊断框架,旨在通过信息传递和领域适应最小化动力学模型响应与实测数据之间的分布差异。首先,提出了数字孪生辅助的数据融合策略(Digital Twin-assisted Data Fusion Strategy, DTDFS),通过信号分解与虚实融合重构,实现从物理实体到动力学模型的信息传递,生成用于数据增强的数字孪生数据。其次,提出频域滤波子域适应网络(Frequency Filter Subdomain Adaptation Network, FFSAN)实现数字孪生数据与实测数据间的领域适应,构建频域滤波模块缓解DTDFS过程中的能量变化,采用子域自适应机制实现孪生数据与实测数据间的细粒度特征对齐。最后,通过试验台数据和工程实测数据进行验证,结果表明所提框架的诊断性能显著优于现有方法,这对于深度学习故障诊断方法在工业环境中的应用具有重要意义。关键词:数字孪生、分布差异、数据融合、滚动轴承、不平衡故障诊断2 引言滚动轴承是机械传动系统中的关键部件[1,2],被广泛应用于航空航天、风力发电等重要行业。滚动轴承的健康状态对于设备运行的安全与稳定具有重大影响,一旦发生故障需要及时采取相应措施,否则可能造成经济损失和人员伤亡[3,4]。因此,滚动轴承故障诊断技术对于保证设备安全平稳运行、指导设备维修具有重要意义[5,6]。深度学习[7]由于其强大的自适应特征提取能力被广泛应用于故障诊断领域[8–10]。然而,深度学习模型通常基于各类样本分布均衡的假设,这些条件在实际工业中难以满足[11]。实际工业场景中机械设备通常在正常状态下运行,故障状态的持续时间非常短,监测系统能采集到大量正常样本,但故障样本数量非常稀少。利用这种不平衡数据集训练深度学习模型,会导致网络倾向于识别数量庞大的正常样本,而忽视数量稀缺的故障样本[12]。因此,数据不平衡问题限制了深度学习故障诊断方法的实际应用。为解决这个问题,学者们展开了大量数据不平衡下故障诊断方法的研究,主要可分为两类:算法层面和数据层面。算法层主要通过代价敏感学习(又称重加权)改变模型的训练过程,从而使模型适应不平衡数据集。具体来说是对损失函数中稀疏的训练样本分配较大权重,通过增强稀疏样本的学习成本,使模型可以得到稀疏样本的隐藏故障特征,从而实现数据不平衡下的故障诊断。Jia et al. [13]根据样本频率设计损失函数来解决数据不平衡下的故障诊断问题;Xu et al. [14]基于Focal Loss[15],根据数据不平衡率设计权重系数以进行数据不平衡下故障诊断;Zhao et al. [16]考虑到模型训练过程中 特征提取能力的变化,设计了自适应特征变化的权重系数,将训练轮次作为参数引入损失函数中;Hou et al.[17]通过对比学习增强与有效样本的相似性来更好地适应不平衡数据集。目前重加权在类不平衡下的故障诊断任务中取得了一定成效,但局限性如下:1) 严重不平衡的数据容易导致过拟合,降低分类精度;2) 重加权改变样本特征的频率,扭曲了原始样本的分布,不利于模型学习到原始数据的真实分布;3) 模型对于少数样本中 特征信息的依赖性较大,泛化能力不足。 数据层是通过生成对抗网络(Generative Adversarial Network, GAN)[18]补充故障样本,实现各类样本间的均衡,随后利用平衡的数据集对分类器进行训练,从而实现样本故障诊断。Li等[19]引入辅助分类对抗网络(Auxiliary Classifier GAN, ACGAN)框架提升分类与判别之间的兼容性,并基于Wasserstein距离设计损失函数防止模式崩溃;Liu等[20]设计变分自编码器对抗网络(Variational Auto Encoder GAN, VAEGAN)提升生成样本的质量;Wang et al. [21]在Conditional Generative Adversarial Network(CGAN)前置了变分自编码(Variational Auto Encoder, VAE)的Encoder用以学习真实数据的特征分布,再通过CGAN生成故障样本;Wang et al. [22]将注意力机制引入GAN架构中,生成更加真实的故障样本。以上方法在不平衡故障诊断任务中取得了一定成果,但也存在以下缺陷:1) GAN的训练过程极不稳定,容易出现模式崩溃[23–25];2) GAN使用不平衡数据集进行训练,仍然会导致生成的数据偏向于多数类,生成不良或者无效样本;3) 重构所得的平衡数据集的故障类样本的特征信息仍是不完备的。综上所述,以上两类常用的不平衡故障诊断方法均有其局限性。近期,许多研究提出通过构建物理模型生成动力学响应以补充故障样本[26]。相比利用GAN网络进行故障样本生成,该类方法具有较高的可控性与稳定性,并且生成的样本具备完整故障信息,对稀缺的故障样本具有良好的补充作用,为解决实际工业中数据不平衡问题提供了新思路。Yu et al. [27]首次利用仿真数据补充训练样本实现滚动轴承智能诊断;Zhang et al.[28]结合动力学仿真数据与部分域适应实现轴承故障诊断;Liu et al.[29]结合仿真信号与子域适应实现样本缺失情况下的轴承故障诊断;Ma et al.[30]利用元迁移学习实现仿真信号向测量信号的迁移;Yan et al.[12]基于动力学仿真数据,通过子域适应和边缘正则化实现数据不平衡下的故障诊断;Liu et al.[31]建立并修正轴承有限元模型以补充训练样本。以上基于仿真数据的样本扩充方法缓解了故障样本稀缺问题,为实现数据不平衡下的故障诊断提供参考。但以上方法局限性在于:1) 仅限于单部件级的物理实体,无法应用于齿轮箱等复杂装配体中;2) 仿真数据中缺少多部件耦合响应、噪声等成分,与实测数据间的分布差异较大,导致诊断效果不佳。为解决以上挑战,本文提出了一种数字孪生辅助的轴承不平衡样本故障诊断框架,该框架通过数字孪生辅助的数据融合策略得到大量与实测数据分布差异小的数字孪生数据,再通过频域滤波子域适应网络实现数字孪生数据与实测数据的域泛化。该框架不仅适用于轴承试验台,还适用于复杂装配体中的轴承故障诊断。本文的主要贡献在于:1、提出了数字孪生辅助的滚动轴承不平衡故障诊断框架,通过信息传递和领域适应最小化动力学响应与实测数据之间的分布差异;2、提出数字孪生辅助的数据融合策略(Digital Twin-assisted Data Fusion Strategy, DTDFS),实现从物理实体到动力学模型的信息传递,生成用于数据增强的数字孪生数据。DTDFS将源自实测数据的成分集成到动力学响应中,从而获得与实测数据具有较小分布差异的孪生数据。通过特征向量距离进一步筛选孪生数据,确保其作为补充扩充数据的适用性。3、提出频域滤波子域适应网络(Frequency Filter Subdomain Adaptation Network, FFSAN),实现孪生数据与实测数据之间的领域适应。构建深度频域滤波器(Deep Frequency Filter, DFF)以自适应过滤频率成分,缓解DTDFS过程中的能量变化并增强网络的频域感知能力。采用子域适应实现数字孪生数据与实测数据之间的细粒度特征对齐。本文主要安排如下:第2节定义所解决的问题,并构建滚动轴承动力学仿真模型;第3节介绍本文所提数字孪生辅助的不平衡故障诊断框架;第4节通过实验对所提框架进行验证;第5节为所提方法在风力发电机齿轮箱中的应用;第6节对本文进行总结。3 预备知识3.1 问题定义本文主要解决数据不平衡条件下的轴承故障诊断问题,本节对所执行的故障诊断任务进行定义,并提出一些基本假设。在实际工业中,正常运行数据 相对容易获得,但故障数据 非常稀缺,故障数据中除了轴承响应,还包含了其它部件响应、噪声干扰以及测量误差等成分[26]: 其中, 代表实测故障数据, 代表轴承响应, 代表其它部件响应, 表示噪声, 表示测量误差。通过部件级动力学模型可以获取滚动轴承的仿真动态响应 ,但无法获取故障样本中的其它成分,这导致仿真与测量数据存在较大的分布差异,使得利用仿真数据扩充故障样本的诊断方法效果不佳。建立整机级别的仿真模型可以获取 和 ,但这类模型建立难度极高,且消耗巨大算力,不适合作为一种通用框架。本文的目标是通过分解少量实测信号 得到 和 ,再将它们与动力学仿真模型得到的大量故障样本 进行融合,从而得到大量的孪生数据 ,并依据 对 进行评价与筛选,在扩充样本的同时,最大程度地使得孪生数据 接近实测数据 。随后,再构建领域适应模型进一步对齐少量实测数据 和大量孪生数据 ,在样本有限的前提下实现滚动轴承的智能诊断。3.2 轴承动力学仿真模型图1 滚动轴承的动力学模型为得到滚动轴承动力学响应 ,扩充故障诊断中故障样本的数量,本文通过集中质量法建立滚动轴承动力学仿真模型获取仿真数据。如图1为本文构建的轴承仿真模型示意图,其动力学微分方程如下: 其中, , , 分别表示转轴与内圈的质量、轴承外圈质量以及轴承座质量, , 表示转轴在轴承处的阻尼,下标 和 分别代表水平与垂直方向, , 表示转轴在轴承处的阻尼, 表示轴承座与地面之间的阻尼, , 表示转轴的刚度, , 表示外圈与轴承座之间的刚度, 表示外圈与地面之间的刚度, 是轴承所受载荷, , 是轴承所受的支撑力。由非线性赫兹接触理论,可以得到第 个滚子与滚道之间的接触压力 : 其中, 为赫兹接触刚度, 为载荷-变形指数, 为开关函数, 和 为内圈中心在 和 方向产生的初始位移, 为第 个滚子的角度, 为滚子与内外圈之间的初始间隙, 为损伤引起的额外间隙。 在 和 方向的分量为: 滚动轴承所产生的支撑力为: 图2 滚动轴承动态模型中的故障建模滚动轴承故障建模如图2所示,当滚子通过损伤区域时,滚动体间隙 将发生变化,产生周期性冲击信号,冲击信号由损伤所在区域和损伤的形状决定。4 所提数字孪生辅助的不平衡故障诊断框架图3 所提出的框架总体流程本节介绍所提数字孪生辅助的不平衡故障诊断框架,如图3展示所提框架总体流程。首先,以滚动轴承为物理实体部分,构建动力学仿真模型作为虚拟部分。在物理实体中通常只能采集到极少量故障数据,但它们能最真实反映设备的故障响应。在虚拟体中能获得数量丰富的动力学仿真数据,但是由于仿真与现实的差距,导致其数据质量较低。随后,本文引入DTDFS作为虚拟部分与实体部分之间的连接。DTDFS通过分解实测数据,并将实测数据的成分与仿真数据进行融合,获得数字孪生数据。通过特征向量的距离对数字孪生数据进行筛选,从而得到大量且高质量的数字孪生数据,实现有效的数据扩充。该过程包含了物理部分、虚拟部分、数据和虚—实连接,符合数字孪生的概念。最后,将扩充后的数据集共同输入到本文所提的FFSAN中。FFSAN构建DFF,以缓解DTDFS过程中各成分的能量变化,并增强网络的频域感知能力,通过子域适应机制对齐测量信号与数字孪生信号的细粒度特征。最终,将训练好的网络用于轴承故障诊断中。本节将详细介绍所提框架的细节。4.1 数据分解与重构 4.1.1 数据分解与重构图4 数据分解与重构本文所提的信号融合与重构测量如图4所示。首先,利用变分经验模态分解(Variational Mode Decomposition, VMD)将少数测量信号分解为多个固有模态(Intrinsic Mode Functions,IMF)。VMD是一种基于优化方法的信号分解技术,它能够将复杂信号分解为多个IMF,揭示信号的局部振荡和周期性结构,被广泛应用于振动信号分析、特征提取等。VMD将信号定义为 个分量,保证各模态的估计带宽之和最小,约束条件为所有模态之和与原始信号相等: 通过引入拉格朗日乘子 与二次惩罚因子 ,将该问题转换为无约束变分问题: 采用交替方向乘子法(Alternate Direction Method of Multipliers, ADMM)迭代更新 , 和 ,多次迭代后将测量信号分解为 个IMF。利用故障特征系数(Fault Feature Coefficient, FFC)[32]和包络谱分析,筛选出IMFs中代表滚动轴承故障响应的 。FFC计算方式如下: 随后,通过等值映射的方法,将仿真信号 与轴承响应 进行等值映射: 最终,将映射后的 、其它IMFs以及残差融合,得到虚实融合的数字孪生数据 。该方法将测量数据中除轴承响应以外的成分全部传递给了动力学仿真数据 ,最大程度地减小了仿真与测量数据之间的分布差异。4.1.2 数字孪生数据筛选本文所提的数据融合策略是将大量仿真数据与少量实测数据进行融合,当不同相位的信号融合时,由于相位差的存在,部分分量可能会相互抵消,从而导致能量发生改变,使得孪生数据与原始信号间存在一定差异。为得到与原始信号分布差异较小的孪生数据,本文设计了一种数据筛选策略,通过均值、标准差、方根幅值、有效值、绝对峰峰值、偏度指标、峭度指标、峰值因子、裕度指标、波形指标、脉冲指标等[8]时域特征构造特征向量 ,如下: 利用特征向量之间的欧式距离筛选出特征分布与测量信号较小的孪生数据,欧式距离计算公式如下: 当实测故障样本为1时,选择欧式距离最近的孪生数据作为训练样本,从而保证将分布差异较大的信号滤除;当实测故障样本大于1时,筛选方法如所示。计算每两个实测样本之间欧式距离的平均值,设定阈值系数 ,得到筛选阈值 : 随后,计算孪生数据与每个实测信号的欧式距离,求取平均值,选用距离平均值小于 的孪生数据作为训练样本,且每个故障样本生成的孪生数据数目相等。筛选过程表示为: 图5 孪生数据滤波方法如图5所示,该筛选方法在保证孪生数据与实测数据分布差异不大的前提下,尽可能地覆盖测量信号的分布范围,避免孪生数据过于聚焦,从而提升深度学习模型的泛化性。4.2 频域滤波子域适应网络FFSAN4.2.1 深度频域滤波的特征提取器经本文所提的数据融合策略后,虽然孪生数据在理论上具备了测量信号的各个成分,但融合过程中各成分的能量占比会发生改变,为缓解融合过程中能量改变对信号质量的影响,同时提升神经网络的全局感知能力,本文构建了深度频域滤波模块[33],对数据进行自适应频域滤波,从而调整信号的各个频率分量,进一步减小孪生与实测数据之间的差异性,提取主要故障特征。 图6 深度频率滤波器如图6所示,对于每个样本,深度频域滤波器先利用FFT得到它的频域信号 ,再通过卷积模块提取频域信号的主要特征,通过最大、平均池化层得到两个频域特征描述,将它们级联之后利用 函数得到自适应滤波器 ,过程如下式: 其中, 表示 函数, 表示1维卷积层, 为平均池化层, 为最大池化层。随后利用 对 进行自适应滤波操作,调整 中各个成分的含量,加强主要特征成分的同时抑制不利于泛化的成分: 其中, 表示逐个元素相乘。最后,利用快速逆傅里叶算法将信号转换到时域空间中,以便下一步的特征提取。如图3所示,特征提取器 中包含三个卷积块,以及两个DFF,特征提取器 将一维振动信号 投影至特征空间中,随后由分类器 将特征向量映射至类标签,分类器 由两个全连接层构成,利用交叉熵作为分类损失函数 。4.2.2 子域自适应机制图7 子域自适应机制 为进一步实现孪生数据向实测故障信号的域泛化,将孪生数据中提取的故障知识迁移至实测信号的故障诊断中,本文引入了子域自适应机制[34]对齐孪生与实测数据的细粒度特征,如图7所示。子域自适应机制主要基于局部最大均值差异(Local Maximum Mean Discrepancy,LMMD),该方法能够度量同一类别内子域之间的分布差异: 其中, 代表故障的类别数, 和 分别代表孪生样本 与实测样本 为类别 的权重, 和 表示孪生与实测样本的数量, 和 的值等于1, 表示特征提取器, 将特征向量映射至希尔伯特空间中, 是被用于特征映射的核函数。对于每个孪生与实测的故障样本 ,其标签向量可用one-hot向量 表示, 可被表示为: 通过最小化 ,即可实现每类故障下的孪生与测量样本的条件分布对齐。4.2.3 优化目标最终,本文所提FFSAN的总损失函数可被表示为: 其中, 和 表示特征提取器 与分类器 的参数, 和 表示所有训练样本及其标签, 表示孪生故障样本, 表示实测故障样本。是时间变化权重系数,用于调整 和 的比例, 可表示为: 其中, 为超参数, 表示模型训练的迭代数, 表示总迭代次数。该策略保证模型在训练前期聚焦于分类损失,后期聚焦于子域泛化。使用凯明初始化方法[35]对模型进行初始化,Adam优化器[36]对参数 和 进行训练。5 实验与结果分析5.1 航空轴承全寿命加速试验数据集通过本实验室搭建的航空轴承全寿命试验台数据验证所提方法有效性,该深沟球轴承被用于某型号飞行器的关键部位中,精确识别它的健康状况有助于保证飞机运行的安全性和稳定性。本文利用三组全寿命数据构成不平衡数据集,故障类型包括外圈故障、内圈故障和滚动体故障,取轴承全寿命数据中最后20组测量数据作为故障数据,最初14组测量数据混合作为正常数据,在每组数据中切割10个长度为2048的样本。测试集由每类200个样本构成,训练集中包括了200个正常样本,根据不平衡数据集的不同,故障样本分别有1,2,4个,具体如表 1所示。表1 不平衡数据集的组成 5.2 结果分析5.2.1 数字孪生辅助的数据融合策略有效性分析图8 动态模型响应波形、真实的测量数据和数字孪生数据为验证本文所提DTDFS的有效性,在每类故障中随机选取某个实测信号,其仿真、实测、孪生数据的时域波形如图8所示,从图中可以看出,仿真信号虽然具备轴承故障响应,但缺少了其它部件响应以及噪声等成分,导致其时域波形过于干净,与测量信号有较大分布差异。本文所提融合策略将实测信号中不代表轴承故障的成分引入仿真信号,通过虚实融合使得孪生数据既具备故障特征,又有测量信号中的其它成分,实现样本扩充的同时,最大程度保证了与测量信号的相似性。图9 基于特征向量欧氏距离的孪生数据滤波如图9表示了本文所提孪生数据筛选策略在D3中的结果,D3中每类故障有4个实测样本,每个实测样本对应200个孪生样本,横坐标表示孪生样本序号,纵坐标为该孪生样本与4个实测样本的特征向量平均欧式距离,红线是k取2时的筛选阈值。通过该策略,成功将分布差异较大的孪生样本滤除,从而减小孪生数据与测量数据的分布差异。完成筛选后,在大量合格的孪生样本中,每个实测样本选取同等数目的孪生样本构成训练样本。 图10 动态响应、实测数据和孪生数据的概率密度函数 为了更进一步展示本文所提数字孪生辅助数据融合策略(Digital twin-assisted data fusion strategy, DTDFS)的有效性,图10分别展示了3类故障的测量数据与仿真数据、孪生数据的概率密度函数图,从图中可以明显看出,未经融合的动力学仿真数据与测量数据之间具有较大的分布差异,而使用本文所提DTDFS后,数据间分布差异明显减小。这是由于DTDFS将测量信号中轴承响应以外的成分引入到仿真信号中,构成虚实融合的数字孪生信号,最大程度地减小与测量数据之间的分布差异。较小的分布差异有助于深度学习模型实现域泛化,从而提高故障识别率。5.2.2 诊断性能分析为证明本文所提方法的诊断性能,以卷积神经网络(Convolutional Neural Network,CNN)为Baseline,选择四种常用的数据不平衡故障诊断方法作为对比实验,两种算法层方法Focal loss(Focal loss, FL)[15]和Class-Balanced Loss(Class-Balanced Loss, CBLoss)[37],两种数据层方法VAE-GAN[20]与ACGAN[19]。本文所提FFSAN及对比方法的主要超参数设置如下:学习率为0.0001,样本批次为40,迭代次数为100,模型每迭代30次,学习率衰减90%。所以实验均在CPU为Inteli7-12700,内存为16GB,GPU为NVIDIA GeForce RTX 4070 Ti的PC机上实现,使用Pytorch平台进行编程,GPU加速训练。表2 每种方法的诊断准确性 每种方法重复训练10次,其平均准确率及标准差如表2所示。在每个不平衡数据集中,所提方法均达到了最高诊断准确率与最低标准差。在故障样本严重稀缺的D1与D2中,本文所提方法具有最少8%的精度提升,这是由于所提方法将仿真与测量数据进行虚实融合,并对孪生数据进行筛选,从而有效扩充了故障样本,并且通过DFF提升网络的频域感知能力,利用子域自适应机制进一步对齐了孪生数据与实测数据之间的细粒度特征,从而达到最高诊断性能。在D3中,本文所提方法对比其它方法的优势较小,这是由于数据量相对充足时,数据驱动的不平衡故障诊断方法能够充分捕捉到样本中的故障信息,通过生成样本或者调整样本权重的策略,得到较高诊断精度。但当故障样本数量严重稀缺时,生成式网络ACGAN与VAE-GAN无法捕捉极少数故障样本的内在故障特征,从而无法生成高质量信号,导致分类精度偏低。通过样本权重调整的CBL和FL则由于特征提取器无法提取足量故障信息,导致诊断精度严重下降。图11 消融实验中的测试精度 为了进一步明确DTDFS和FFSAN的有效性,在三个测试集中进行消融实验。其中DTDFS代表不使用本文所提的数据融合与筛选策略,训练集中仅使用动力学仿真数据与少量实测数据;FFSAN代表不使用本文所提的频域滤波子域适应网络,使用卷积神经网络完成诊断任务;DTDFS+FFSAN表示两者都不使用。以上每种方法重复10次,测试集平均准确率如图11所示,从图中可以看出,在样本数非常稀缺的D1中,采用DTDFS策略相比直接用动力学仿真数据测试精度提升了4%,而FFSAN提升了2%测试集精度。随着故障样本数的增多,FFSAN的作用逐渐增大,在D3中,FFSAN提升了7%精度,而DTDFS提升了5%。可能的原因是故障样本过少时,FFSAN无法充分提取测量样本的细粒度特征,导致精度提升较小,而DTDFS在样本数较小时仍具备较强的样本扩充能力,所以精度提升在三个不平衡数据集中都非常可观。6 工程应用6.1 风电齿轮箱轴承数据集图12 风力涡轮机齿轮箱结构示意图表3 不平衡数据集的组成 选取中国某风场2MW风机的轴承为例,将本文所提方法进行工程应用。所选风电齿轮箱包括一级行星齿轮和两级平行齿轮,结构如图12所示。选择2轴的中间轴承数据对本文所提框架进行工程应用验证,通过风电机组安装的状态监测系统获取振动数据。振动信号每天采集一次,采样频率为25600Hz。根据两台风机的故障检测报告,选择故障发生前10至20天的数据作为故障数据,故障类型包括轴承内圈故障和外圈故障,混合选择两台风机平稳运行时的数据作为正常数据,每组数据切割成多个长度为4096的样本。测试集由每类160个样本构成,训练集中包括了160个正常样本,根据不平衡数据集的不同,故障样本分别有2,4,8个,具体如表3所示。6.2 结果分析6.2.1 数字孪生辅助的数据融合策略有效性分析图13 动力学仿真数据、实测数据和数字孪生数据 图14 动力学仿真数据、实测数据和数字孪生数据的概率密度函数 在每类故障中随机选择一个实测样本进行数据分解与融合,其仿真、测量、孪生数据的波形如图13所示,从图中可以看出,本文所提DTDFS将测量数据中不代表轴承故障的成分引入了仿真数据,通过虚实融合的方式,使得孪生数据在具备故障特征的同时,最大程度地提升其与测量样本的相似性,从而实现数据扩充。图14展示了S2数据集使用DTDFS后仿真、实测与孪生数据的概率密度函数,经过数据分解与虚实融合,并使用特征向量欧式距离进行筛选,孪生数据与测量数据的分布差异达到了较小值。通过DTDFS可以在数据量较小的情况下有效实现数据扩充,这对基于深度学习的故障诊断方法具有重要帮助。6.2.2 诊断性能分析表4 每种方法的诊断准确性图15 通过每种方法提取的特征分布的可视化超参数设置、对比方法以及训练策略与4.2节中一样,诊断结果如表4所示,本文所提方法在各数据集中取得了最高性能,相比常用的不平衡故障诊断方法,在S1、S2、S3中分别有至少8%、7%和5%的精度提升。由于风机的振动数据中有较大的噪声以及多部件耦合等因素的干扰,导致故障样本的识别难度较大。在这种情况下,生成式网络难以提取数据中隐含的多种特征,所以无法生成高质量样本,最终导致精度偏低。通过样本权重调整的策略在故障数据较丰富时取得了不错的效果,但当故障数据极少时,该方法难以通过极其有限的训练样本提取故障特征,从而导致效果不佳。图15展示了各方法在S2中所提特征的可视化分布,从图中可以看出本文所提方法的聚类效果最好,各类样本之间的决策边界非常清晰。这是由于本文通过DTDFS得到大量高质量数字孪生样本,有效实现了故障样本的扩充,通过FFSAN增强了网络的频域感知能力,有效实现了孪生与测量样本间的细粒度特征对齐,最终达到了最高的诊断性能。表5 每种方法的诊断评价指标消融实验的设置与4.2节中相同,各数据集中的平均测试精度如表5所示。由于仿真数据只具备轴承的动力学特征,而风机测量数据是多部件耦合且具有较大的噪声干扰,在不使用DTDFS的前提下诊断精度非常低,由于仿真与测量数据的分布差异过大,难以通过FFSAN提升精度。但是,在使用了DTDFS后,相比只用动力学仿真数据进行样本补充,各个数据集分别提升了5%、11%和15%的精度。而且FFSAN在DTDFS的基础上能够实现领域泛化,也达到了明显精度提高,分别为3%、4%和5%。这充分证明本文所提方法通过DTDFS扩充了大量与测量数据分布差异较小的数字孪生数据,随后利用FFSAN进一步对齐融合与测量数据间的细粒度特征,在故障样本稀缺的前提下实现了风电齿轮箱轴承故障诊断,具有一定的实用价值和参考性。6 结论数据不平衡问题限制了深度学习故障诊断方法在实际中的应用。本文提出了一种数字孪生辅助的不平衡故障诊断框架,该框架可以最小化动力学模型响应与实测数据之间的分布差异。首先,针对故障数据稀缺的问题,提出了数字孪生数据融合策略(DTDFS)。该策略将动力学模型响应与实测数据进行虚实融合以获得数字孪生数据,并通过基于欧氏距离的选择确保数据质量,从而有效实现数据增强。其次,为实现数字孪生数据向实测数据的领域适应,提出了频率滤波子域适应网络(FFSAN)。该网络构建深度频率滤波器以缓解DTDFS过程中的能量变化,引入子域适应实现孪生数据与实测数据之间的细粒度特征对齐。最后,在航空轴承和风电齿轮箱轴承的诊断结果表明,所提出的框架在极度不平衡数据条件下实现了高精度故障诊断。与常用的不平衡故障诊断方法相比,本文提出的框架表现出显著优势,尤其在严重数据不平衡的场景中。在航空轴承数据集中,在不平衡比为0.005、0.01和0.02时,本方法的准确率分别比现有方法至少提高7%、7%和2%。同样,在风电齿轮箱轴承数据集中,在不平衡比为0.0125、0.025和0.05时,本方法的准确率分别比现有方法至少提高8%、7%和5%。本文提出的框架为不平衡数据条件下的数据增强和领域适应提供了有价值的思路,对推进深度学习方法在故障诊断领域的工业应用具有重要意义。然而,该框架仅关注滚动轴承的已知故障。在工业场景中,可能会出现未知和非典型故障。未来工作将引入开集域泛化以考虑未知故障的可能性,使模型能够识别先前未知的故障类型。编辑:曹希铭校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、海洋、冯珽婷、陈宇航、陈莹洁、王金该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除点击左下角阅读原文,即可在线阅读论文。来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈