首页/文章/ 详情

综述 | 物理信息-数据驱动的剩余使用寿命预测综述:挑战与机遇(上)

1月前浏览545

    本期给大家推荐司小胜教授团队的物理信息-数据驱动的剩余使用寿命预测综述:挑战与机遇(上)基于物理信息-数据驱动的剩余寿命预测已经成为预测领域的一个新兴话题。然而,目前还没有专门针对这一话题的系统综述。为了填补这一空白,文章回顾了基于物理信息的数据驱动剩余寿命预测方法的最新进展。将这类方法大致分为三类,即物理模型和数据融合方法、基于随机退化模型的方法和基于物理信息的机器学习(Physics-Pnformed Machine Learning, PIML)方法。尤其以基于PIML方法为中心进行综述。通过讨论现有方法的优缺点,讨论了指导物理信息-数据驱动的剩余寿命预测方法未来发展的挑战和可能的机遇

    论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

    论文基本信息

    论文题目:

    A review on physics-informed data-driven remaining useful life prediction: Challenges and opportunities

    论文期刊:Mechanical Systems and Signal Processing

    论文日期:2024年1月

    论文链接:

    https://doi.org/10.1016/j.ymssp.2024.111120 

    作者:Huiqin Li (a), Zhengxin Zhang (a), Tianmei Li (a), Xiaosheng Si (a)

    机构:

    a: Zhijian Laboratory, Rocket Force University of Engineering, Xi’an 710025, PR China

    通讯作者邮箱: 

    zhengxinzhang@tsinghua.org.cn (Z.  Zhang).

    sixiaosheng@126.com (X.  Si).   

    作者简介:

    司小胜,火箭军工程大学教授、博士生导师。2014年博士毕业于火箭军工程大学控制科学与工程学科(与清华大学联合培养)。近年来,主要从事随机退化系统剩余寿命预测与健康管理方面理论及应用研究,在EJOR、RESS、IEEE汇刊等国内外重要期刊发表论文50余篇,2篇论文为IEEE可靠性汇刊/EJOR近20/10年被引最多论文,出版中英文专著各1部,谷歌学术引用6200余次。先后主持国家自然科学优秀青年基金1项,完成国家自然科学基金面上项目2项,获国家自然科学二等奖(2019,排名3)、教育部自然科学一等奖(2018,排名3)、CAA自然科学一等奖(2016,排名3)、CAA优秀博士论文等。目前担任中国自动化学会技术过程的故障诊断与安全性专业委员会及大数据专业委员会委员,国际权威期刊《Mechanical Systems and Signal Processsing》编委(Editorial Member)

    目录

    1 摘要

    1.1 RUL预测的发展趋势

    1.2 RUL预测的现有方法

    1.3 与现有关于 RUL 预测综述论文的差异

    1.4 本文的动机和贡献

    2 物理信息驱动的 RUL 预测概述

    2.1 物理模型和数据融合方法

    2.2 基于随机退化模型的方法

    2.3 基于 PIML 的方法

    3 物理模型和数据融合的RUL 预测方法

    3.1 通用物理模型

    3.2 数据驱动的测量模型与物理模型的结合

    3.3 数据驱动模型与物理模型的决策级融合

    基于随机退化模型的 RUL 预测方法

    4.1 基于随机退化模型的 RUL 预测方法基础

    4.2 随机系数回归模型

    4.3 维纳过程

    4.4 Gamma 过程

    4.5 逆高斯过程

    (以上标记章节为本文内容)

    5 基于 PIML 的 RUL 预测方法

    6  挑战与机遇讨论

    7 总结

    摘要

    剩余寿命(Remaining Useful Life, RUL)预测,长期以来一直被认为是预测和健康管理(Prognostics and Health Management, PHM)中的关键技术之一。对保障系统的安全性和可靠性,降低运行和管理成本至关重要。随着传感和状态监测技术的迅猛发展,数据驱动的RUL预测引起了人们的广泛关注,并研究了各种数据驱动的RUL预测方法。

    尽管学者们对数据驱动的RUL预测方法进行了广泛的研究,但这些方法的成功应用在很大程度上取决于数据的数量和质量,纯粹的数据驱动方法可能产生物理上不可行/不一致的RUL预测结果,并且具有有限的推广性和可解释性。值得注意的是,越来越多的人认为,将物理或领域知识嵌入到数据驱动方法中,并开发基于物理信息的数据驱动方法,将有望提高RUL预测结果的可解释性和效率,并降低对数据量和质量的依赖。在这种背景下,基于物理信息-数据驱动的RUL预测已经成为预测领域的一个新兴话题。然而,目前还没有专门针对这一话题的系统综述。为了填补这一空白,本文回顾了基于物理信息的数据驱动RUL预测方法的最新进展。本文将这类方法大致分为三类,即理模型和数据融合方法基于随机退化模型的方法基于物理信息的机器学习( Physics-Informed Machine Learning, PIML)方法。由于基于PIML的方法在过去五年中得到了快速的发展,因此本文尤其以这类方法为中心进行综述。通过讨论现有方法的优缺点,讨论了指导物理信息数据驱动的RUL预测方法未来发展的挑战和可能的机遇。

    关键词:预测,剩余寿命,物理信息,数据驱动,可解释性

    1 引言

    随着第四次工业革命的重大进展和现代制造技术的不断提高,航空航天系统、工业机器人、风力发电系统、高速列车等大型复杂装备日益呈现出自动化、集成化、智能化的发展趋势。然而,由于各种内外因素的影响,包括机械磨损、疲劳、蠕变损伤、变载荷、动态运行环境、大扰动、外部冲击等,这些系统的性能在其生命周期内会随着运行时间的推移而下降。这种性能下降将损害系统的健康,最终导致系统失效,如果不采取措施,甚至会造成灾难性事故和重大经济损失。因此,主动健康管理技术对于确保这些关键系统的运行可靠性和安全性至关重要[1]。

    为了确保关键系统运行可靠性和安全性,预测和健康管理(PHM)应运而生,作为一种系统故障排除技术,PHM通过诊断、预测系统健康管理[2]等三个关键成分有效预防意外故障。其中,预测是通过监测系统健康状况,评估在预期使用条件下其健康状态的退化程度来预测系统的剩余寿命(RUL)的过程。基于预测信息,可以积极地做出与安全、状态维护、备件订购和寿命延长相关的健康管理决策,以提高工作效率,降低系统的运行风险和成本[3]。

    在下文中,我们首先讨论了RUL预测的一般发展趋势和现有RUL预测方法的主要原理,然后阐明了本文与现有关于RUL预测综述论文的区别。最后,我们介绍了本文的动机和相关贡献。

    1.1 RUL预测的发展趋势

    在PHM中,RUL预测长期以来一直被认为是PHM中保障系统安全性和可靠性、降低运营和管理成本的关键技术之一[4]。近年来,RUL预测已成为研究热点,越来越受到学术界和工业界的关注。在学术研究方面,Web of Science数据库是一个国际公认的数据库,反映了科学研究的发展,包括各个领域的大部分研究论文。因此,我们选择Web of Science数据库来分析RUL预测领域的已发表论文。为了避免数据库更新的影响,所有出版物的收集都是在2022年12月完成的。为了确保数据的权威性和准确性,本文使用Web of Science Core collection作为主要数据来源,包括2003年至2022年的出版物。为确保检索到的文献与本研究密切相关,定义为“articles not related with the RUL prediction were excluded by checking titles and abstracts”,具体的纳入标准为[主题=(“remaining useful life” OR“residual useful life” OR“RUL”)] AND [发表类型=(文章)OR(综述)OR(论文集)] AND [语言=(英语)] AND [发表年份=(“2003-2022”)]。根据上述标准,本文统计了过去20年中关于RUL预测主题的出版物数量,如图1所示。

    图1 Web of Science中关于RUL预测主题的出版物数量
    从图1中可以看出,自2003年以来,每年关于RUL预测的出版物总数呈明显增长趋势,特别是自2013年以来呈指数级增长趋势。与此同时,在工业应用方面,RUL预测技术已被应用于许多重要领域,包括但不限于航空航天系统[5-7]、工业机器人[8,9]、风力发电系统[10-12]、高速列车[13,14]等。学术和工业领域的这些进步反映了RUL预测主题日益重要和普及。

    1.2 RUL预测的现有方法

    一般来说,系统的RUL是指从当前时间到性能退化故障时间    的时间间隔,这是预先未知的[15],即    。因此,RUL预测的主要任务是在系统仍在运行时(即    )根据与系统退化相关的信息预测剩余时间    。准确预测退化系统的RUL对于及时安排维护和备件补充,确保系统安全可靠运行和节省运营成本具有重大的理论意义和实际应用价值。为了实现准确的RUL预测,现有文献中已经开发了大量的预后方法,大致可分为三类,即基于物理的方法数据驱动的方法混合方法[16,17]。
    基于物理的方法通过分析系统的物理故障机制并基于第一性原理对其物理模型进行建模来表征相关的退化过程,从而实现RUL预测。这类经典模型主要包括裂纹扩展模型[18]、轴承动力学模型[19]、磨损模型[20]、电化学模型[21]等。通常,如果能够充分理解物理故障机制或领域知识,并且可以在测量数据的帮助下估计相关物理模型中的参数,则基于物理的方法可以实现对RUL的准确、可推广和可解释的预测。然而,在大多数情况下,特别是对于复杂的工程系统,它们的物理故障机制和领域知识是不完整的,甚至几乎不可用[22]。在这种情况下,已建立的物理模型不可避免地被迫进行一些简化或做出一些假设。因此,相关的物理模型必然是对现实的近似,这不仅会引入偏差并降低RUL预测的性能,还会使故障物理难以理解和分析,特别是由于不同系统(甚至属于同一类型)的潜在退化过程存在很大的异质性。所有这些方面都限制了基于物理的RUL预测方法的广泛应用。

    随着传感和状态监测技术的进步,可以更容易、更经济地获得与系统退化过程相关的监测数据,这些退化监测数据有望提供有关系统寿命的丰富信息。因此,如果可以适当地对这种退化数据进行建模,则可以相应地预测相关系统的RUL。这提供了一种经济可行的方法来缓解对物理知识完整性要求很高的基于物理的方法和具有足够故障时间数据的传统寿命数据拟合方法的局限性。基于监测数据,在过去的几十年里,人们对开发各种数据驱动的RUL预测方法进行了广泛的研究[23]。数据驱动的RUL预测的一般过程如图2所示。在这个过程中,首先通过各种传感器对退化系统进行监测,以获取传感信号来收集状态监测数据,然后通过适当的信号处理算法(如归一化和平滑)对监测数据进行预处理。利用预处理后的数据,提取退化特征,以表征相关系统的退化过程。最后,通过对系统的退化过程进行建模,可以根据退化处理超过预定义故障阈值或故障标签的时间来预测RUL。

    图2 数据驱动的RUL预测流程图

    目前,数据驱动的RUL预测方法主要包括统计数据驱动方法和基于机器学习(Machine Learning, ML)的方法。统计数据驱动方法的基本思想是利用随机模型来拟合退化指标的演变过程,然后将退化过程外推到定义的故障阈值,从而实现RUL预测,其中模型参数是基于监测数据估计的[24]。这种方法的主要优点在于能够提供退化过程的可视化形式,并通过获得RUL的概率分布来量化预后不确定性,这是RUL预测的基本要求,因为RUL预测对应于未来故障事件的预测,并且本质上具有不确定性。另一个优点是,模型参数在一定程度上具有可解释性,例如反映退化速度和时变动力学的参数,这种可解释的机制将有助于理解退化失效过程和预测结果。然而,随机退化模型的选择和退化建模统计假设的合理性是影响此类方法预测性能的重要方面。更重要的是,统计数据驱动方法的成功在很大程度上取决于退化指标的可用性,其趋势是增加还是减少。换句话说,这种退化指标的质量对统计数据驱动方法的预测准确性有固有的影响,但这种方法从监测数据中提取所需退化指标的能力相对有限。

    随着工业4.0[25]、网络物理系统(Cyber-Physical System, CPS)[26]和物联网(Internet of Things , IoT)[27]的进步,随机退化系统的状态监测数据的可用性提高已成为现实,从而推动了RUL预测研究进入大数据时代。在大数据的背景下,基于机器学习的RUL预测,特别是深度学习(Deep Learning, DL),已成为预测领域的热点话题,并且已经进行了大量的研究来开发各种基于机器学习(ML)的RUL预测方法[28]。通常,基于机器学习的RUL预测方法是通过使用神经网络等机器学习模型建立从监测数据到RUL信息的映射关系来实现的。作为代表,DL方法已被证明是一种强大的工具,可以处理高维非线性的监测数据,从海量数据中自动提取深度退化特征,或实现端到端的预测,从而减少人为干预[29]。这种方法的主要优点在于,当无法完全掌握潜在的失效物理或领域知识时,模型拟合具有很强的灵活性和通用性。因此,在过去五年中,观察到基于机器学习或更精确地说基于深度学习的RUL预测研究的爆炸性增长并不奇怪。然而,众所周知,基于机器学习的方法以黑盒方式运行,并且缺乏透明度和可解释性[30]。尽管ML模型中的每个组件相对简单,但整个模型的结构仍然非常复杂,以至于其设计者和用户可能无法完全理解。因此,在实践中经常采用精度-可解释性权衡。此外,基于机器学习的方法的性能在很大程度上取决于监测数据的数量和质量,如果没有带标签的代表性数据,则无法保证这些方法的预后性能。特别是,很容易观察到,ML模型在训练/测试数据集上看起来很好(即使在交叉验证之后),但在可用的标记数据之外表现不佳,甚至产生物理上不可行/不一致的RUL预测结果。因此,如何提高基于机器学习的方法对未知数据的泛化能力仍然是一个非常具有挑战性的问题。最后但同样重要的是,在大多数基于机器学习的RUL预测研究中,尽管在某些应用中可以实现令人满意的精度预测结果,但由于机器学习模型的确定性结构,很难提供预测RUL的概率分布。因此,尽管RUL预测的不确定性量化是协助评估PHM应用中故障风险的关键问题,但通过基于ML的方法量化预后不确定性的能力是有限的。

    从上述讨论中可以看出,纯物理方法和纯数据驱动方法在模型建立、模型假设、数据要求、可推广性、可解释性等不同方面都有各自的优缺点。在这种情况下,一个自然的想法是将这两种方法结合起来,利用基于物理的方法和数据驱动的方法的优点来提高RUL预测性能。因此,已经开发了结合基于物理和数据驱动方法的混合方法来预测RUL。Liao和Kottig[31]对故障预测的混合方法进行了全面的综述,并使用基于物理的数据驱动和方法的各种组合介绍四类混合方法。混合方法的主要优点是,随着这些方法的集成,预测的RUL对模型假设和数据选择策略等可能的影响具有鲁棒性。

    结合上述讨论,当前的基于物理的方法、数据驱动的方法和混合方法在应用于RUL预测时各有优缺点。表1总结了四类现有RUL预测方法的优缺点。

    表1 关于RUL预测方法的优缺点总结

    1.3 与现有关于 RUL 预测综述论文的差异

    在过去的十年中,许多学者综述了各种 RUL 预测方法,表 2 列出了一些具有代表性的 RUL 预测方法综述,这些综述具有不同的方法侧重点。具体而言,Si 等人 [32] 系统地回顾了依赖于现有监测数据和统计模型的统计数据驱动的 RUL 预测方法。Liao 和 Kottig  [31] 全面回顾了混合方法驱动的 RUL 预测研究,并通过在电池退化案例中的应用说明了混合方法的潜在优势。Cubillo 等人 [33] 总结了旋转机械常见的故障模式和退化机制,重点讨论了基于物理的 RUL 预测模型及其在齿轮和轴承中的应用。Zhang 等人 [34] 重点介绍了基于维纳过程的退化数据分析和 RUL 预测方法的建模进展及其在 PHM 领域的应用。Lei 等人 [35] 系统地回顾了从数据采集到 RUL 预测的机械整个预测过程。Guo 等人 [36] 回顾了工程系统预测建模方法的进展和应用,并根据故障物理知识是否纳入 RUL 预测讨论了数据驱动、基于物理和混合方法的优势和局限性。Kordestani 等人 [37] 对数据驱动、基于物理和混合方法进行故障预测的研究进行了调查,并强调了相关的重要应用领域。Wang 等人 [38] 比较了用于锂离子电池 RUL 预测的深度学习算法的不同自适应数学模型。Ferreira 和 Gonçalves [39] 为基于 ML 的 RUL 预测过程提出了一个明确的通用过程分析框架,并讨论了最相关的 ML 方法的优缺点。Guo 等人 [40] 系统地回顾了通过基于物理的模型和数据驱动模型的不同组合方法进行电池寿命预测的“灰箱”寿命建模的进展。Wang等人 [41] 全面概述了数据驱动方法和相关的建模过程,并讨论了物理模型和数据驱动模型的结合及其在金属材料疲劳寿命预测中的应用。

    表2 关于 RUL 预测的典型综述论文总结

    虽然表 2 中的综述文章并未详尽收录文献中出现的所有综述论文,但无疑反映了 RUL 预测领域的重要性、繁荣和快速发展。然而,值得注意的是,现有的关于 RUL 预测的综述主要集中在数据驱动方法上,而没有强调物理知识的整合。此外,除了 [31,40,41] 之外,大多数综述只是从结合数据驱动和基于物理的方法的角度部分讨论了混合方法的进展,对物理知识整合的讨论不足。虽然 Liao 和 Kottig [31] 专注于系统地讨论混合方法,但由于该综述 [31] 发表已九年多,因此没有涵盖近年来混合方法的最新研究进展。最新的综述 [40,41] 包括了通过基于物理的模型和数据驱动模型的不同组合方法进行寿命预测的最新进展,但涉及的方法仅限于电池或金属材料的应用,因此不具有对其他应用的通用性。更重要的是,即使现有综述中经常讨论混合方法,但这些方法基本上是通过简单地组合不同的方法来实现的,因此预测性能将受到单一方法性能的限制。因此,物理知识是以浅层方式集成的,而不是以嵌入物理知识来指导数据驱动方法实施的深度集成方式。

    1.4 本文的动机和贡献

    分析迄今为止对RUL预测的研究,尽管取得了重大进展,但机遇与挑战并存。特别是德国工业4.0、美国工业互联网、中国制造2025、日本超智能社会5.0等新工业革命,为RUL预测的先进技术以及大数据驱动下提出的以知识为中心的智能技术提供了发展机遇[42]。在此背景下,维持工业系统安全可靠运行的需求为发展RUL预测的先进技术提供了机遇。在新工业革命的背景下,当工程系统发生性能退化时,就会收集大量的监测数据,然而实践中的监测数据普遍表现出多源异构[43]、低值密度[44]、不完整性[45]、数据质量低等特点,难以使用纯数据驱动的方法准确有效地预测相关系统的RUL。实际上,系统从运行状态到故障的演化通常遵循一些物理规律或化学机制,实践中可能存在一些物理知识或领域知识。在数据或知识可用的情况下,可以为建模和预测任务设计一些新的途径。例如,基于大数据的分析和挖掘,可以进行问题建模和预测,获得数据中蕴含的知识。此外,可以利用物理或领域知识来辅助数据建模和预测,形成闭环机制,实现数据和知识的深度融合,如图3所示。

    图3 数据与知识的深度融合机制

    值得注意的是,虽然图 3 中提出的本质思想与跨行业标准数据挖掘流程 ( Cross-Industry Standard Process for Data Mining, CRISP-DM) 方法论 [46] 在从数据中获取知识方面相似,但这里的主要区别在于,图 3 中的每个步骤在预测的背景下都是不可逆和不可或缺的,总体上形成了数据和知识集成的闭环,但 CRISP-DM 方法论中每个阶段的顺序并不固定,取决于前一阶段特定任务的输出是否是下一阶段的必要输入。另一个不同之处在于,除了表明基于数据挖掘分析可以从数据中获取知识外,图 3 还强调了使用物理知识帮助数据建模和预测实现数据和知识的深度融合的重要性,而这在 CRISP-DM 方法论中是缺失的。在图 3 所示的新范式中,引入物理知识可以有效缓解纯数据驱动模型带来的问题。通过专业机制支撑数据建模,有望减少模型训练所需的数据,提高预测结果的可靠性、鲁棒性和可解释性。此外,与混合方法中的浅层组合不同,将物理知识嵌入到数据驱动建模中实现深度集成,有望使已建立的预测模型生成物理一致的结果。因此,将物理或领域知识嵌入数据驱动方法、发展物理信息化的数据驱动方法,有望提高RUL预测结果的可解释性和效率,降低对数据量和质量的要求,已逐渐成为共识。在此背景下,物理信息化数据驱动的RUL预测已成为预测领域的一个新兴课题,近三年来物理信息化数据驱动的RUL预测研究呈急剧上升趋势。最近,Xu 等人 [47] 回顾了物理信息机器学习方法在可靠性和系统安全性应用中的最新进展,并指出此类方法在可靠性和系统安全性评估方面的快速发展。然而,很少有人关注物理信息机器学习技术在 RUL 预测任务中的应用。

    从以上讨论和分析中可以得出结论,物理信息数据驱动的 RUL 预测主题将成为未来的新热点。然而,目前还没有专门针对这一新兴主题的系统综述,至少没有深入探讨。为了填补这一空白,本文回顾了物理信息数据驱动的 RUL 预测方法的最新发展,以促进开发用于预测研究的新型物理信息数据驱动方法。这是本文的主要贡献。考虑到关于这个主题的研究有很多名称,包括“物理引导”、“物理信息”、“物理感知”、“物理嵌入”、“物理继承”等,我们将在整个综述中使用术语“物理信息”以保持一致。具体而言,根据物理或领域知识与数据的集成机制,目前属于这一类型的方法大致分为三类,即物理模型和数据融合方法基于随机退化模型的方法基于物理信息机器学习 (Physics-Informed Machine Learning, PIML) 的方法。特别地,本综述以基于 PIML 的方法为中心,因为此类方法在过去五年中发展迅速。通过讨论现有方法的优缺点,我们全面讨论了可能的机会和挑战,以引导物理信息数据驱动的 RUL 预测方法的未来发展。

    2 物理信息驱动的 RUL 预测概述

    在本部分中,我们尝试对本文讨论的物理信息数据驱动的 RUL 预测方法进行概述。广义上,根据所采用的表征退化现象的模型以及物理或领域知识与数据的集成机制,有三种实现物理信息数据驱动的 RUL 预测的思路。第一,基于底层故障机制建立物理模型,并通过融合监测数据来校准模型参数。第二,基于领域知识和历史监测数据建立可解释的随机退化模型。第三,将物理或领域知识集成到 ML 方法中,建立监测数据与 RUL 之间的映射关系以实现预测。因此,本文将现有的物理信息数据驱动的 RUL 预测方法分为三类,即物理模型和数据融合方法、基于随机退化模型的方法和基于物理信息机器学习 (PIML) 的方法。物理信息数据驱动的 RUL 预测方法的详细分类如图4所示。

    图4 物理信息数据驱动的 RUL 预测方法的分类

    按照图 4 所示的分类,对物理信息数据驱动的 RUL 预测主题进行文献计量分析,主要基于 Web of Science 数据库中的搜索结果。为了更加完整,考虑到 Web of Science 数据库仅包含已发表的论文和已接受的早期访问论文,我们在此额外包含了与物理信息数据驱动的 RUL 预测相关的在线可用论文,这些论文不一定发表在同行评审的期刊或会议上,例如从 Google Scholar 和 arXiv 搜索到的论文。图 5 展示了与本文涉及的三种物理信息数据驱动的 RUL 预测方法相关的出版物饼图。

    图5 本文涉及的三种基于物理信息的数据驱动RUL预测方法的相关出版物

    与图 1 中统计的与 RUL 预测整个领域相关的 10,000 多篇论文结果不同,图 5 统计了 106 篇与物理信息数据驱动的 RUL 预测研究密切相关的论文。但值得注意的是,关于物理信息数据驱动的 RUL 预测方法的详尽参考文献收集仍然难以实现,本文可能并未包括近年来的所有出版物。主要原因之一是物理信息数据驱动的 RUL 预测主题引起了越来越多的关注,并且有更多与该主题相关的研究论文正在涌现。尽管如此,图 5 中的统计结果仍然表明了每个类别的大致比例,并有望反映物理信息数据驱动的 RUL 预测的发展趋势。我们希望本文的观点和讨论能够促进开发新的物理信息数据驱动的预测方法。

    在以下小节中,分别对三个类别进行简要概述,以了解每个类别的总体思想以及我们认为这些方法是物理信息数据驱动方法的原因。

    2.1 物理模型和数据融合方法

    物理模型与数据融合方法主要基于随机退化系统的失效机理建立物理模型,并结合监测数据对物理模型参数进行估计。通过物理模型与监测数据的融合,利用系统的实时监测数据更新物理模型参数,从而预测在役系统的RUL。根据物理模型与监测数据融合机制的不同,此类RUL预测方法又可分为两类:数据驱动的测量模型与物理模型的结合方法决策层的数据模型与物理模型的融合方法。表征退化至失效过程的常见物理模型包括疲劳裂纹扩展的 Paris 模型 [48] 和 Forman 模型 [49]、电池容量退化的经验老化模型 [50]、轴承失效的动态模型 [51] 等。常见的参数更新方法包括贝叶斯方法 [52]、卡尔曼滤波 [53]、粒子滤波 [54] 等。由于使用物理模型来表示退化过程,物理模型和数据融合方法用于 RUL 预测可以具有整合物理知识的天然优势。同时,在役系统的监测数据也可用于校准物理模型。因此,物理模型和数据融合方法属于物理信息数据驱动方法的基本方法之一
    2.2 基于随机退化模型的方法

    工程实践中,动态环境和各种不确定因素引起失效物理的变化,由于对退化过程的认识有限或不完整以及退化过程的异质性较大,难以建立准确的退化系统物理模型。在此情况下,应用随机退化模型来表征退化过程,为描述不确定运行环境中的故障产生机制和特征提供灵活性。利用基于监测数据估计参数的随机退化模型,通过求解所表征的退化过程达到预定失效阈值的概率分布,可预测RUL。从物理退化现象来看,由于内部应力和外部环境的综合作用,系统性能退化是不可避免的,相关退化变量的监测数据将呈现增加或减少的趋势。这可以看作是从物理现象中归纳出来的领域知识。受这些领域知识的启发,各种随机模型被开发来描述这种退化现象,包括随机效应回归模型[55]、维纳过程模型[56]、伽马过程模型[57]、马尔可夫链模型[58]、随机滤波器模型[59]、逆高斯过程模型[60]等。此外,已经证明,随机模型能够描述物理退化过程的必要性质是数学中的无限可分性[61]。具有这种性质的代表性模型包括维纳过程模型、伽马过程模型、逆高斯过程模型等。例如,由于良好的数学性质和物理可解释性,维纳过程可以很好地描述退化过程的非单调动态特性,被广泛应用于滚动轴承、惯性陀螺和激光器的RUL预测。与维纳过程不同,Gamma 过程和逆高斯过程描述的是严格单调的退化过程,通常用于模拟疲劳裂纹扩展、腐蚀磨损等不可逆过程的退化。其中,Gamma过程为纯跳跃过程,退化轨迹不连续,因此,该模型可用于描述连续小冲击引起的缓慢退化过程和大冲击引起的严重损伤。随机冲击达到过程可以用泊松过程近似。在泊松过程中,每次冲击对系统造成的损伤都是微小的、随机的。因此,复合泊松过程可用于描述随机冲击及其相关损伤对系统退化的影响。Ye和Chen[62]证明了逆高斯过程是复合泊松过程的极限分布,这为系统在随机环境下运行的逆高斯退化建模提供了明确的物理解释。从以上对基于随机退化模型的方法的一般性讨论中可以看出,这些方法通常用随机退化模型代替物理模型来表示失效过程。然而,基于随机退化模型的方法的共同点在于,所采用的随机退化模型都是从物理现象中衍生出的领域知识中获取灵感。此外,随机退化模型的选择取决于退化监测数据的特征和模型的物理性质。基于所选的随机退化模型,可以根据历史退化数据估计模型参数,并根据在役系统的实时监测数据进行更新。

    结合以上讨论,可以看出系统的随机退化过程具有以下特点:(1)系统的退化过程随运行时间逐渐增大或减小,退化速率和退化波动往往具有时间相关性;(2)系统性能退化特征的物理或化学性质可能导致退化路径呈现凸或凹的非线性变化趋势;(3)由于复杂的监控机制和各种不确定因素,系统的退化初始值、退化速率和退化波动一般具有随机性;(4)环境条件和应力可能直接加速或抑制系统的退化过程,导致退化过程具有复杂的特性,包括多个阶段、退化量的厚尾特性等。上述特点是客观存在的,很大程度上源于相关系统预期物理机制的变化。因此,发展能够描述退化系统上述普遍特征的随机退化模型自然具有一定的物理可解释性,即具有物理学意义。总之,我们观察到基于随机退化模型的方法利用领域知识,在进行 RUL 预测时具有数据驱动的性质。因此,在本综述论文中,我们将基于随机退化模型的方法视为另一类基于物理的数据驱动方法。

    2.3 基于 PIML 的方法

    近年来,由于机器学习方法具有快速前馈特性和强大的数据驱动能力,被广泛应用于复杂系统的RUL预测。一般而言,基于机器学习的RUL预测方法通过利用机器学习模型建立从监测数据到RUL信息的映射关系来进行RUL预测。然而,传统的基于机器学习的方法忽略了系统底层的退化机制,由于没有将领域特定知识考虑进建模过程,导致相关预测缺乏透明度和可解释性。为了解决传统基于机器学习方法中存在的问题,将物理或领域知识嵌入机器学习模型的开发中受到了研究界的广泛关注,即PIML。虽然PIML的理念提出不久,但由于其潜在的优势,已在流体力学[63]、生物医学[64]、断裂力学[65]、电力系统[66]、地球物理学[67]等多个科学领域得到迅速发展。一般而言,机器学习方法由数据、架构设计、优化和初始化四个关键组件组成。因此,根据物理知识融入上述四个组件的方式,PIML 方法的核心思想主要包括基于物理的数据增强、基于物理的架构设计、基于物理的初始化和基于物理的损失函数。此外,机器学习模型还可用于预测物理模型产生的误差,并将基于机器学习的预测误差模型与物理模型相结合,以提升最终的预测性能。本文将这种集成物理知识的实现过程称为基于物理的残差建模。基于上述思想,PIML 方法利用物理知识指导机器学习的数据增强、架构设计、功能优化和模型评估,从而充分发挥纯数据驱动方法和物理知识的优势。为此,PIML 方法有望具有许多优点,包括提高可解释性、物理上一致的结果、更好的泛化性、提高优化效率、降低对训练数据的数量和质量的要求等。目前,PIML 因其潜在的优势已成为 ML 领域越来越受欢迎的范例,并且将物理知识集成到 ML 方法中以开发基于 PIML 的 RUL 预测方法的研究趋势不可阻挡。因此,在本文中,我们将基于 PIML 的方法视为一种新兴但重要的物理信息数据驱动的 RUL 预测方法类别。

    根据上述分类和讨论,我们将在以下三个部分中回顾每类物理信息数据驱动方法在 RUL 预测中的现状。但需要注意的是,即使不是从物理信息的角度进行的,许多现有评论也部分考虑了前两类,如表 2 所示。因此,本文简要讨论了这两类,重点介绍了最新进展。相反,由于目前还没有针对基于 PIML 的 RUL 预测方法的现有评论,因此本文将详细介绍基于 PIML 的 RUL 预测方法的进展。

    3 物理模型和数据融合的RUL 预测方法

    3.1 通用物理模型

    在本部分中,我们首先介绍基于相关物理控制方程构建的用于不同类型系统的物理模型。广义上,用于 RUL 预测的物理模型主要包括描述裂纹扩展的 Paris 模型、电池老化的电化学模型、轴承故障的动态模型等。下面提供了这些代表性物理模型的相关公式。

    ● 疲劳裂纹扩展模型

    疲劳裂纹扩展模型是指在重复载荷作用下,疲劳裂纹在材料中出现并逐渐扩展的物理模型。疲劳裂纹扩展规律有多种形式。其中一种表示疲劳裂纹扩展的著名模型是Paris模型。一般来说,Paris模型下的裂纹扩展规律可以表示为如下形式[48]:    其中,  为裂纹长度,  为施加载荷的循环次数,σ 为应力范围,   为材料常数。

    ● 电池老化模型

    锂电池老化可分为日历老化和循环老化。日历老化是当电池闲置时由于材料的热力学不稳定性产生的副作用。以日历老化为例,影响日历老化的三个因素是温度、充电状态和时间,如下式所示 [68]:   

     其中    为容量损失,SoC为充电状态,T为温度,    为描述日历老化的SoC和T依赖性的函数,t为时间,z为拟合参数。

    ● 轴承动力学模型

    动力学建模与分析可以有效描述故障轴承的运动状态,揭示相关的潜在故障机理,为轴承RUL预测研究提供理论支持。在实践中,轴承系统的动力学非常复杂,难以准确建模,特别是在轴承发生退化的情况下。以最简单的单自由度轴承系统为例,其动力学模型基本由以下方程描述[51]: 
      其中,y为振动响应的位移,{F}为激励力矩阵,[M]、[C]、[K]分别为系统质量、阻尼系数和刚度矩阵。

    实际上,磨损退化会影响轴承系统的动态响应,包括但不限于质量、阻尼系数、刚度和激励力。例如,从轴承表面去除的材料将通过减少或改变均匀分布来影响质量。表面缺陷会扰乱润滑膜的均匀性,并导致阻尼比发生一些变化。当出现凹痕或缺陷时,它会在表面上留下空间,从而改变刚度。当滚动体穿过有缺陷表面的边缘(即冲击区域)时,缺陷还会引入激励力。根据公式(3)中的动态模型,可以推导出反映退化状态的变形指数[69]。

    上述模型只是用于表示不同环境下系统退化机制的物理模型的一些示例。值得注意的是,文献中还报道了许多其他物理模型,关于不同环境下物理模型的详细讨论可以在一些评论中找到,包括从电化学行为的角度分析电池的物理模型[40]、从机械的角度分析机械的物理模型[70]、从金属材料的角度分析金属模型[71]等。利用物理模型,可以使用相关变量的监测数据或测量值来识别未知的模型参数。这样,通过物理模型和监测数据的融合,可以根据故障的定义预测相关系统的 RUL。下面从两个角度讨论了用于 RUL 预测的物理模型和数据融合方法的一些发展:数据驱动的测量模型和物理模型的结合,以及决策级数据模型和物理模型的融合。

    3.2 数据驱动的测量模型与物理模型的结合

    数据驱动的测量模型与物理模型的结合是开发基于物理模型和数据融合的RUL预测方法的典型途径。按照这种方式,基于监测数据构建物理模型描述的退化状态的数据驱动测量模型。为此,可以通过将物理模型建立的状态方程与数据驱动描述得到的测量方程相结合来形成状态空间模型。这样,可以通过卡尔曼滤波器、粒子滤波器和其他滤波算法来估计退化状态和未知模型参数。利用估计的退化状态和模型参数,可以通过将物理模型表征的退化状态外推到预定义的故障阈值来预测系统的RUL。Cheng 等人 [72] 和 Pecht 等 人[73] 有效地将物理模型与数据驱动方法结合起来,实现了动态 RUL 预测,其中通过故障模式、机理和影响分析确定监测参数,并提出回归模型计算残差来检测异常数据并估计模型参数,最后通过物理故障模型预测 RUL。Liao 和 F. Kottig [74] 将数据驱动的测量模型和预测未来测量模型引入基于物理的粒子滤波框架,提高了锂离子电池 RUL 的预测精度。Lei 等人 [70] 结合物理模型和数据驱动的测量模型,提出了一种新的机械 RUL 预测方法。该方法首先应用 Paris-Erdogan 模型来描述半裂纹长度作为退化状态。然后,通过融合来自多个特征的互信息,构建了一个数据驱动的健康指标——加权最小量化误差,并与机械的退化过程正确关联。为此,以Paris-Erdogan模型为状态,以构建的健康指标为量度,采用基于粒子滤波的算法预测机械设备的RUL,并采用最大似然估计法初始化整个模型参数。Wang 等人[75]利用Frechet距离从物理原理中推导出的指数退化模型中选取最优参数,有效缓解了模型参数初始化的问题。研究发现,将Frechet距离与指数退化模型相结合,可以更准确地预测轴承退化路径。Han 等人[76]提出了一种考虑内阻和温度的改进的电池容量退化半经验模型。对监测数据进行小波包去噪后,采用遗传算法辨识初始模型参数。然后,设计粒子滤波框架来更新模型参数,实现在线RUL预测。Zeng 等人[77]基于磨损机理,建立了车轮直径和轮缘厚度的基本磨损模型,并利用磨损数据对磨损模型进行训练。利用磨损测量数据识别物理磨损模型,得到RUL分布,并以点估计和区间估计的形式输出RUL预测值。考虑到监测数据不足对预测精度的影响,Pan 等人[78]发展了一种数据增强方法,将退化机制与监测数据相结合,提高小样本下油液状态预测精度。在具体实施过程中,首先建立考虑退化机制的退化模型,利用监测数据估计模型参数,然后采用粒子滤波方法获取增强数据并进行预测。在这些结合方式的工作中,物理模型所代表的退化状态被认为是隐藏的、无法直接准确测量的,从监测数据中估计模型参数和隐藏的退化状态。尽管利用监测数据来标定物理模型,但由于预测是通过将当前退化状态外推到故障阈值来实现的,因此RUL预测的性能在很大程度上取决于物理模型的精度。此外,在状态空间建模的框架内,通常会将数据驱动的测量模型与物理模型相结合进行预测,但需要进一步探索将物理模型与数据驱动的测量模型相结合的创新方法,以提高 RUL 预测性能并降低对物理模型准确性的依赖。

    3.3 数据驱动模型与物理模型的决策级融合

    发展基于物理模型和数据融合的 RUL 预测方法的另一个重要途径是分别基于物理模型和数据驱动模型进行 RUL 预测,然后通过某种融合方法集成基于物理和数据驱动模型的 RUL 预测结果,称为数据驱动模型和物理模型的决策级融合。沿着决策级融合的思路,Goebel 和 Eklund [79] 首先考虑系统的物理特性来模拟故障传播,然后利用实验数据和已知条件下的部件损伤程度来估计条件故障传播速率。最后,采用基于核的时间回归算法集成这两种预测方法的输出。Wen 等人 [80] 提出了一种数据级和决策级混合融合方法来预测 RUL。在本研究中,首次使用遗传规划将物理传感器源集成到复合健康指标中,并得到了一个显式的非线性数据级融合模型。然后,在可靠性理论框架下,采用决策级融合方法集成基于各种物理传感器和综合健康指标的RUL预测。Goebel等人[81]利用实验数据和部件损伤程度建立了估计条件故障传播速率的经验模型,并引入Dempster-Shafer (DS)证据组合方法实现决策级融合。实验结果表明,融合方法比单独使用任何一种方法都能产生更准确、更可靠的结果。值得注意的是,决策级融合途径的实现过程相对简单且独立,可以整合各种数据驱动和基于物理的方法的优势,以提高RUL预测结果的鲁棒性和准确性。然而,实现不同预测方法集成的决策级融合形式相对多样,融合方法有多种,包括算术平均、加权平均、几何平均、核回归、DS证据组合等,因此决策级融合机制的设计和选择具有上下文相关性且具有挑战性。此外,虽然RUL预测的鲁棒性可以得到一定程度的提高,但最终预测的性能会受到融合所采用的单一预测方法的制约。

    从现有研究可以看出,物理模型与数据融合方法用于RUL预测的思路直接自然,可以实现基于物理的RUL预测,并且由于继承了基于物理和数据驱动方法的优势,可以提高预测性能和可解释性。因此,成功应用物理模型与数据融合方法的前提是获得准确可靠的物理模型和实时监测数据。然而,准确可靠的物理模型往往难以获得,或者掌握建模的失效机理成本高昂且耗时长。对于重要而复杂的系统尤其如此。因此,需要对复杂系统进行更多的物理化学和实验分析,以便有效地构建可靠的基于物理的模型。此外,由于物理模型与数据融合方法通常是通过组合多种算法来实现的,因此相关的计算复杂度通常很高。因此,开发更合理的融合框架将有助于提高计算效率。最后,对于多参数高度非线性的物理模型,模型中包含的大量参数将导致参数识别不准确和过拟合的问题,从而影响预测的准确性和效率。针对这一挑战,开发物理模型和数据融合方法的另一种方法是使用数据驱动的方法来预测物理模型中难以或不准确的中间参数,而不是数据驱动方法和物理模型之间的简单组合或浅层融合。通过将数据驱动的结果输入物理模型,这种深度集成的方法不仅会表现出更好的预测性能,而且还会修正现有物理模型中的不足,例如模型简化或假设

    4 基于随机退化模型的 RUL 预测方法

    本节首先介绍基于随机退化模型的 RUL 预测方法的一般原理和关键组成部分,然后讨论一些代表性随机退化模型应用于 RUL 预测的最新进展。通过这些讨论,可以得出现有研究的优点和局限性,从而为未来的新研究方向提供参考。

    4.1 基于随机退化模型的 RUL 预测方法基础

    如2.2节所述,动态环境和各种不确定的内外部因素会引起故障物理的变化,实际系统的退化过程会表现出很大的异质性。基于随机退化模型的RUL预测方法具有反映退化过程的不确定性和随机性以及提供RUL的概率分布以量化预测不确定性的优势,因此取得了重大进展,因为这类方法可以自然地描述实际系统的随机故障产生机制和不确定运行环境的影响。基于随机退化模型的RUL预测方法的基本原理如图6所示。图6所示的原理是,基于退化系统的监测数据,通过拟合系统性能退化变量的演变过程并将其外推到预定义的故障阈值,可以基于随机模型预测系统的RUL [32]。在这个实现过程中,可以根据退化数据的特点和领域知识,确定刻画性能退化的随机退化模型,包括趋势性、单调性、鲁棒性等

    图6 基于随机退化模型的 RUL 预测方法的基本原理说明
    遵循上述基本原则,目前基于随机退化模型的 RUL 预测方法通常由以下三个关键部分组成。第一个部分是随机退化建模。由于老化、负载和环境变化等各种随机因素的相互影响,退化系统的性能下降是不可避免的。退化过程会在运行过程中不断积累,并最终导致这些系统的故障。因此,系统的退化变量将在系统运行过程中随机演变。因此,采用随机模型来表征这种随机演变过程是一种自然的选择。目前,尽管用于退化建模的随机模型有很多变体,但它们通常可以描述为:    式中,  为系统退化变量,反映运行时刻    的退化状态;    为初始退化;  为时间相关函数,参数向量为    ,用于建模退化过程的时变趋势;  为随机项,用于建模退化过程的时间不确定性或随机性。根据对退化趋势  的建模原理,随机退化模型可分为参数模型、半参数模型和非参数模型。根据  的函数形式,随机退化模型包括线性模型和非线性模型。除了退化趋势建模之外,对随机项   的建模也是预测中的另一个重要方面,因为系统的退化过程受各种不确定因素的影响,具有内在的随机性。

    基于随机退化模型的方法的第二个部分是随机退化模型的参数估计。由于所采用的随机模型是根据所涉及系统的统计特征或领域知识选择的,因此模型参数是未知的。在这种情况下,为了进行预测,应首先基于监测退化数据估计所用随机模型的模型参数。广泛使用的参数估计方法包括最大似然估计法、贝叶斯方法、期望最大算法等。这类方法的第三个部分是求解 RUL 的概率分布。基于随机退化建模和相关参数估计,求解 RUL 的概率分布是预测的关键任务。需要注意的是,RUL 分布的求解与退化故障的定义密切相关。到目前为止,有几种不同的故障定义,如阈值命中时间 [82]、首次命中时间 [32]、最后逃逸时间 [83] 和平均到达时间 [84]。因此,可以根据与随机模型表征的退化过程相关的故障定义来解决 RUL 的概率分布。不同故障定义得出的 RUL 分布解之间的差异可以在 [83,84] 中找到。

    在当前基于随机退化模型的方法研究中,前两个组成部分的实现过程基本固定或很少改变。相反,用于表征系统退化过程的随机模型则存在显著的变体。特别是随机项    的变体很多,导致用于RUL预测的随机退化模型也不同。根据对    建模的不同,基于随机退化模型的方法主要包括随机效应回归模型、Gamma过程、逆高斯过程、Wiener过程,以及最近发展的Beta过程、Tweedie指数散度过程、Student-t过程等。与随机效应回归模型、Gamma过程、逆高斯过程和Wiener过程的重大进展相比,Beta过程[85]、Tweedie指数散度过程[86]和Student-t过程[87]在预测中的应用相对有限。此外,值得注意的是,这些模型的发展在表1列出的现有评论中已有部分讨论,尽管其中大多数是三年前发表的。因此,我们主要在下文中提供一些代表性模型的最新进展,例如随机系数回归模型、维纳过程、伽马过程和逆高斯过程。

    4.2 随机系数回归模型

    随机系数回归模型在退化建模和寿命预测中得到了广泛的应用。最常用的随机系数回归模型通常可以表示如下[82]:
      其中,  表示第  个系统在第个监测时刻的退化情况,  表示固定参数,  表征系统共同退化特征,  表示随机效应系数,描述同一类型不同系统之间的个体变异性,表示噪声项,通常假设为具有零均值和常数方差的正态分布随机变量。

    随机系数回归模型的优势在于,它们可以同时模拟群体中普遍存在的退化特征和不同个体中存在的差异性。自 [82] 的开创性工作以来,此类模型在 RUL 预测中得到了广泛的应用,如 [32] 所述。最近,Yan 等人 [55] 使用迭代更新随机系数回归模型来刻画轴承健康指标的退化趋势,并结合基于孟塞尔变换的关键点检测自适应方法,提高了 RUL 的预测性能。针对先验信息不完善的问题,Wang 等人 [88] 提出了一种基于非线性随机系数回归模型的 RUL 预测方法,并考虑了故障时间数据的融合。此外,Zhao 等 人[89] 提出了一种多状态健康模型来预测轴承故障,其中使用回归方法检测健康转变点,并使用具有贝叶斯更新过程的指数随机系数模型来推导故障时间分布。对于结构复杂的机器,Chen 等人 [90] 分别应用了两种成熟的期望回归模型(即线性和指数)来计算和更新系统的 RUL 分布。从这些进展中可以看出,当前随机系数回归模型的重点主要放在根据相关系统的具体要求应用或改进模型公式上。未来,如何继承同时建模退化过程中的共性和个性的一般思想,并开发更灵活的模型来表征退化过程中的时间变化性,值得我们付出更多的努力和关注。

    4.3 维纳过程

    维纳过程是一类由具有时变漂移性的布朗运动(Brownian Motion, BM)驱动的随机过程。需要说明的是,具有漂移性的BM最初在物理学中用来表示流体和空气中小颗粒随机游动的进程。由于漂移效应,这种随机游动具有趋势性,因此由BM驱动的模型适合于对具有增加或减少趋势的动态过程进行建模。形式上,如果随机过程    满足以下三个条件,则称该随机过程    为维纳过程:1)    为独立增量过程;2)    ,其中    为漂移函数;3)    是时间    的连续函数。可以看出,维纳过程是一种具有高斯噪声的随机过程,因此它是一个非单调过程。此外,噪声的方差是时间的函数,因此累积退化是无限可分的,正如任何物理退化过程所要求的那样[61]。

    由于其数学性质优良、概念清晰、与物理退化过程相似,能很好地描述系统的非单调退化特性,在退化建模和RUL预测中得到了广泛的应用。张等[34]专门综述了基于维纳过程的退化数据分析、RUL预测及其在PHM中的应用进展,强调了退化过程中的非线性、多源变异性、协变量和多变量。但值得注意的是,本综述中讨论的进展基于2018年以前的文献。近年来,文献中报道了一些新的进展。为了克服对数变换和时间尺度变换在处理非线性退化数据方面的局限性,一些新的变换技术已被开发出来,将非线性数据转换成近似线性数据,以促进退化建模和RUL预测[91,92]。例如,Si 等人[91]从Box-Cox变换(Box-Cox Transformation, BCT)的角度提出了一种非线性随机退化建模和RUL预测方法。在这项工作中,首先使用BCT将非线性退化数据转换为近似线性数据,然后利用具有随机漂移的维纳过程对转换数据的演变过程进行建模以进行预测。通过大量的实验结果和比较分析发现,BCT可以将许多现有的变换技术作为特例,具有强大的处理非线性数据和提高早期预测性能的能力。针对非线性退化过程难以转化为线性退化的情况,Cao 等人[93]建立了基于非线性维纳过程的随机退化模型,采用离线估计和实时更新相结合的方法估计了退化模型的参数,并推导出系统的RUL分布。Lu 等人[94]采用带有随机漂移参数的维纳过程模拟非均匀退化过程,并利用机组实时退化数据,动态更新漂移参数的后验分布,进一步根据在线监测数据更新系统的RUL分布。

    为了克服跟踪退化过程中的动态和多源变化的挑战,Wang 等人 [95] 提出了一种通用的时变维纳过程。在本文中,构建了一个状态空间模型来考虑非线性和三源变化,并引入了一个隐式变换模型来描述模型参数随时间的变化。实际系统的退化过程在很大程度上取决于外部运行环境,包括温度、工作负载等。动态环境对退化过程的影响是近年来 RUL 预测考虑的重要方面。针对动态环境下的预测问题,Zhang 等人 [96] 提出了一个具有随机时变协变量的非线性维纳过程模型。在本研究中,Ornstein-Uhlenbeck 过程用于建模动态协变量,并通过指数协变量效应函数将其与时变退化率相关联。Zhang 等人 [97]在前人工作[96]的基础上,充分考虑了退化过程中可测和不可测协变量因素的不确定性,利用维纳过程实现了考虑可测和不可观测外界影响的RUL预测。

    除以上两个方向外,具有多阶段退化特征的系统近年来也受到广泛关注。针对多阶段退化过程,Wang 等人[98]首次提出退化角的概念,以准确识别不同阶段之间的变点,从而可以使用维纳过程模型的不同漂移函数来匹配不同的退化阶段,提高预测性能。在所构建的模型基础上,根据退化角的定义和首次命中时间的概念,得到了多阶段 RUL 分布。[99] 提出了两种多阶段非线性维纳退化模型开展 RUL 预测研究,即带有时间尺度变换和纯时变漂移扩散过程的非线性退化模型。本文充分考虑了退化阶段变点处的状态转移概率,并基于首次命中时间的概念得到了 RUL 分布的解析表达式。从现有研究可以看出,基于维纳过程的模型下的 RUL 预测是一个活跃的研究方向,此类方法在预测中的应用将因其可解释性和在建模灵活性和数学便利性方面的优异特性而得到进一步促进。此类方法的一个发展方向是通过设计基于物理或领域知识的漂移和扩散函数来构建更复杂的模型,以实现针对特定应用环境的定制建模。此类方法的另一个挑战在于在维纳过程的非单调性质导致的非线性退化情况下找到 RUL 分布的精确解。

    4.4 Gamma 过程
    工程实践中,一些性能退化过程具有单调性,只朝一个方向发展,如磨损过程、疲劳裂纹扩展过程。在这些情况下,应用单调随机过程来模拟此类退化进程是一种很自然的选择,Gamma 过程就是这类随机过程的一个例子。与 Wiener 过程不同,Gamma 过程是一种具有非负增量的随机过程,因此可以用来描述严格单调的退化过程。一般而言,Gamma 过程记为    ,具有以下特点[100]:
    1)  ;2)  ,  为形函数,  为尺度参数,  为 Gamma 分布; 3)    ,相互独立
    Gamma 过程在退化数据分析和寿命预测中的应用历史悠久,表 2 中的许多现有综述或多或少地讨论了前期的进展。最近,Zhao 等人 [101] 提出了一种基于 Gamma 状态空间模型的隐式单调健康状态变化跟踪框架。该研究将时间不确定性、测量不确定性和个体异质性联合纳入退化模型,以准确预测功率器件的 RUL。为了解决充电电池的老化问题,Lin 等人 [57] 提出了一种固定变点的两阶段 Gamma 过程模型,用于模拟恒流条件下电池循环老化的电压-放电曲线。Zhang 等人 [102] 基于 Gamma 过程,获得了退化过程时间序列的关键经验参数信息和不同退化条件下的 RUL 分布。Wang 等 [103] 提出了一种基于 Gamma 过程模型的动态 RUL 预测和最佳维护时间确定方法。由于预处理数据呈现带有跳跃点的非线性递增退化趋势,因此采用具有非线性时间变换的Gamma过程作为RUL的预测模型,实验结果表明可以显著提高在线RUL预测的效率。为解决系统退化趋势的随机性,Esfahani 等人[104]基于物理模型和Gamma过程模型建立了加速退化模型,并将所建模型应用于涡扇发动机RUL的预测。[105]中,Hazra 等人提出了一种具有平稳增量的混合Gamma模型来表示管壁的退化过程,并提出了一种非似然近似贝叶斯计算方法,能够从噪声数据中有效地估计混合Gamma退化模型的参数。需要注意的是,尽管Gamma过程在预测方面有着悠久的历史和进展,但由于Gamma分布的复杂表达式,很难获得RUL分布的解析形式,同时利用在线监测数据更新模型参数也具有挑战性。因此,基于 RUL 预测的 Gamma 过程的最新重点主要在于开发先进的参数估计和更新方法,以使预测准确反映有关系统的当前退化状态。

    4.5 逆高斯过程

    逆高斯过程是另一类单调随机过程。因此,与Gamma过程类似,逆高斯过程适合描述一些具有单调退化特性的系统。逆高斯过程的数学定义如下[106]:1)    为独立增量过程;2)    ,    是时间    的单调增函数,    和    是控制退化速率和退化波动性的过程参数,    是参数为    和    的逆高斯分布。
    尽管与 Gamma 过程相比,将逆高斯过程应用于退化建模和 RUL 预测的历史并不太长,但是自从 [106] 中最早的研究以来,人们发现逆高斯过程在建模单调退化过程方面具有重要的潜力。Wang 和 Xu [106] 提出了逆高斯过程模型,并研究了一类针对具有对象间异质性和协变量信息的退化数据的逆高斯过程模型的最大似然估计。提供了模拟和激光数据以进行拟合优度检验和寿命预测。基于开创性的工作 [106],文献中已经报道了许多逆高斯过程的应用和改进。近年来,Sun 等人 [60] 提出了一种考虑随机效应和测量误差的改进的逆高斯过程模型来描述磨损退化,结果表明该模型可以提高液压柱塞泵磨损率的预测精度。在参考文献中。[107] 采用带有随机效应的逆高斯过程来表征系统的退化过程。本文首先使用期望最大化算法初始化模型参数,然后采用贝叶斯方法更新退化模型中的随机参数,使得预测的RUL可以根据新获得的退化数据实时更新。Huang 等人[108]提出了一种基于变漂移系数逆高斯过程的刀具磨损退化模型,以描述动态工作环境下刀具磨损过程中个体异质性的影响。Hu 等人[109]根据首次温度监测值超过首次预警阈值的失效原理,建立了基于逆高斯过程的风电轴承RUL预测模型。与Gamma过程的重大进展相比,逆高斯过程的发展具有很大的空间和机会,因为在许多应用中发现逆高斯过程和Gamma过程表现出相似的建模拟合和预测性能。此外,将逆高斯过程应用于多阶段退化或随机操作环境的系统的 RUL 预测的问题值得在未来深入研究。
    本节讨论了基于随机退化模型的RUL预测方法的基础以及四种代表性模型的进展。值得注意的是,还有其他模型,如马尔可夫模型[110]和随机滤波模型[111],其基本思想与上述模型相似,因此不再赘述。从以上讨论可以看出,基于随机退化模型的方法已经取得了很大进展,这类方法仍处于快速发展阶段。然而,未来仍有一些方向值得关注。首先是使用随机退化模型校准进行RUL预测。当前的研究通常采用随机模型来表征退化变量的演变过程。在这种情况下,应提前确定    的适当函数形式。然后,通过有关系统的退化数据估计或更新模型参数以进行模型校准。然而,选择    的函数形式本身就是一个具有挑战性的问题。更重要的是,当选取的退化模型函数形式不合适时,单纯通过更新模型参数来校准退化模型是困难且无效的,预测精度会受到影响。因此,如何实现退化模型函数形式和参数的同时校准,是提高预测精度、避免    选取困难的一个重要方向。其次是多退化变量系统的RUL预测。现有大多数研究的一个重要潜在前提是,所关注系统的健康状态可以简单地用单个性能退化变量来反映。单变量假设为RUL预测提供了极大的便利。然而,这种假设对于复杂系统并不实用,因为复杂系统的健康状态往往由与系统性能相关的多个变量共同决定,健康状态很少能用单个变量准确描述。在这种情况下,考虑多个性能变量是预测的必须。因此,未来应开发新的多退化变量RUL预测框架。三是进一步发展基于物理的随机退化模型,提高模型和预测结果的可解释性。当前基于随机退化模型的方法主要从客观物理现象的角度考虑单调性和趋势性来预测RUL,物理解释不足,需要进一步将鲁棒性、灵敏度、相关性等其他物理性质融入退化建模中。最后,当前方法适用于小样本数据的故障特征分析,缺乏强大的数据处理能力。通过深度学习从海量数据中提取退化特征,实现深度学习与随机退化模型的数据-模型联动,是大数据时代RUL预测的一个有前景的方向


    编辑:Tina
    校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、陈宇航、陈莹洁,王金
    该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

    来源:故障诊断与python学习
    ACTMechanicalSystem振动疲劳断裂非线性化学通用航空航天电力python海洋裂纹理论电机材料创新方法
    著作权归作者所有,欢迎分享,未经许可,不得转载
    首次发布时间:2025-02-09
    最近编辑:1月前
    故障诊断与python学习
    硕士 签名征集中
    获赞 77粉丝 93文章 179课程 0
    点赞
    收藏
    作者推荐

    综述 | 数字孪生智能故障诊断最新进展综述(下)

    本期给大家推荐胡昌华教授的数字孪生智能故障诊断最新进展综述(下)。随着工业4.0时代的到来,智能制造和数字技术迅速发展,对工业设备的稳定性、可靠性和安全性提出了更高的要求。最近,数字孪生为智能故障诊断提供了一种新的解决方案。本文将从概念、关键技术、应用场景和挑战展望等方面对数字孪生技术在智能故障诊断的发展应用进行综述。论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:A state of the art in digital twin for intelligent fault diagnosis论文期刊:Advanced Engineering Informatics论文日期:2025年论文链接:https://doi.org/10.1016/j.aei.2024.102963作者:Changhua Hu, Zeming Zhang, Chuanyang Li, Mingzhe Leng, Zhaoqiang Wang, Xinyi Wan, Chen Chen机构:Laboratory of Intelligent Control, PLA Rocket Force University of Engineering, Xi’an 710025, China通讯作者邮箱: li_chuanyang@yeah.net目录1 摘要2 引言 2.1 相关工作回顾 2.2 本文目的3 研究方法3.1 文献综述方法3.2 文献分类标准4 数字孪生的研究进展4.1 数字孪生的起源与概念4.2 数字孪生关键技术5 智能故障诊断研究进展 5.1 智能故障诊断定义及相关概念 5.2 智能故障诊断方法6 数字孪生在智能故障诊断中的应用 6.1 数字孪生在工业制造领域智能故障诊断中的应用 6.2 数字孪生在能源领域智能故障诊断中的应用 6.3 数字孪生在航空航天领域智能故障诊断中的应用 6.4 数字孪生在其他领域智能故障诊断中的应用7 建议与未来展望 7.1 面向数字孪生技术 7.2 面向智能故障诊断 7.3 面向数字孪生的智能故障诊断8 总结(以上标记章节为本文内容)1 摘要随着工业4.0时代的到来,智能制造和数字技术迅速发展,对工业设备的稳定性、可靠性和安全性提出了更高的要求。故障诊断(Fault Diagnosis, FD)是保证设备正常运行的关键步骤,其准确性和效率直接影响设备的稳定运行和经济效益。随着人工智能(Artificial Intelligence, AI)技术的进步,数据驱动的故障诊断方法在智能领域得到了发展,即智能故障诊断(Intelligent Fault Diagnosis, IFD)。最近,为IFD提供了一种新的解决方案。这就是数字孪生(Digital Twin, DT),一种连接物理世界和虚拟世界的桥梁技术。许多研究人员发表了关于使用DT技术进行设备IFD的研究。本文分析了2017年至2024年的260篇文章,系统地讨论了DT、IFD以及DT在IFD中的应用。首先,详细介绍了DT和IFD的概念、关键技术和应用场景;然后,重点介绍了DT技术在IFD领域的应用;最后,本文总结了存在的问题和挑战,提出了解决问题的建议,并对未来的发展进行了展望。这项工作有望为相关领域的研究人员提供有价值的参考和利用,并促进DT技术在IFD领域的进一步发展和应用。关键词:工业4.0,数字孪生,智能故障诊断,文献综述6 数字孪生在智能故障诊断中的应用前面提到的依赖历史数据和预定义故障模式的智能故障诊断方法,在应对未知故障、分析实时数据和适应复杂、动态变化的系统时,面临着重大挑战。这些方法通常难以准确建模设备的实时状态,从而限制了故障诊断的准确性和及时性。此外,它们在适应每台设备及其操作环境的独特特性方面也存在局限,阻碍了个性化和动态故障诊断的实现。相反,基于数字孪生的智能故障诊断有效地克服了这些问题,能够实现更准确、实时和适应性更强的故障诊断[199],[200]。一般来说,状态监测、故障诊断、健康状况评估、剩余使用寿命预测和维护策略决策是预测与健康管理(Prognostics and Health Management,PHM)或基于状态的监控(Condition-Based Maintenance, CBM)的关键技术。数字孪生技术通过集成实际传感器数据、虚拟原型、数学物理模型和仿真数据,提供了一种可靠的方式,以虚拟和可视化的形式实现可靠的PHM或CBM。在故障诊断的背景下,数字孪生作为一个综合平台,融合了设备或系统的虚拟和物理表示,旨在提高诊断准确性和预测可靠性。与传统的仅依赖历史数据或孤立模型的故障诊断方法不同,数字孪生通过实时传感器数据、先进的仿真模型和数据分析,建立了与物理资产同步的高保真数字模型,持续反映物理系统的运行状态,提供了一个适应性强、响应灵活的框架来诊断实时发生的故障。具体而言,数字孪生为智能故障诊断提供了以下关键支持:1)实时监控和适应性故障诊断:通过利用来自传感器和仿真模型的实时数据,数字孪生为动态监控设备运行状态提供了手段。这使得能够随着故障的发展及时发现异常和故障,从而实现及时诊断并减少级联故障的风险。数字孪生根据运行环境、条件和不同设备的特定需求动态调整其虚拟模型,通过持续的数据更新和反馈,实现高度适应性的故障诊断服务。这意味着该系统能够适应因磨损、环境条件或操作变化导致的机器行为变化,从而保持较高的诊断准确性,并为复杂环境下的设备故障诊断提供强大的数据支持。2)异构数据源的整合:数字孪生能够整合来自不同类型的数据,包括传感器提供的结构化数据、维护日志中的非结构化数据以及历史性能数据。通过综合数据融合,故障诊断过程得以丰富,提供了设备状态的全面视角,使得智能故障诊断系统能够基于完整的数据集做出更准确的决策。此外,数字孪生还根据设备的运行模式生成孪生数据,特别适用于模拟和分析在实际操作中难以捕捉或复 制的条件,这有助于支持诊断模型的训练和优化。3)个性化诊断和维护建议:数字孪生能够为特定设备量身定制,提供高度个性化的故障诊断和维护建议。通过考虑设备的具体特性,例如特定的磨损模式和使用历史,数字孪生促进了个性化的故障诊断方法,这对于复杂多样的机械设备至关重要。4)可视化和决策支持:通过数字孪生的虚拟表示,操作员和维护团队可以清楚地理解设备的健康状态和故障进展。退化趋势和风险评估的可视化支持知情决策,推动了从被动维护到主动维护的转变。这种交互式和可视化的特点提高了复杂数据的可访问性,使团队能够及时发现潜在问题。5)持续改进和学习:数字孪生利用机器学习和自适应算法,随着数据的积累不断改进诊断和预测能力。这一自适应学习机制使得数字孪生能够应对新出现的故障模式和无法预见的操作条件,这是对不断发展和日益复杂的系统至关重要的能力。总之,数字孪生技术通过集成实时监控、预测分析和个性化维护洞察,为智能故障诊断提供了一个先进的平台。物理资产与数字孪生之间的协同作用,提供了超越传统方法的诊断精度和适应性,从而为工业环境中的更可靠、高效、响应迅速的故障诊断系统奠定了基础。借助数字孪生,智能故障诊断系统在处理现代机械设备和动态操作环境中的复杂需求时得到了显著提升,最终有助于提高操作韧性并降低维护成本。近年来,随着数字孪生技术的日益重要,其在智能故障诊断中的应用逐步扩展,吸引了越来越多的研究人员和工程师寻求提升故障诊断的效率和准确性。从图1可以看出,2017到2024年间,相关研究的数量呈逐年增长的趋势。这不仅突出数字孪生技术在现代工业中的关键作用,还展示了其对故障诊断领域的革命性影响。进一步分析图1中的统计数据可以发现,工业制造、能源和航空航天是数字孪生技术在智能故障诊断中应用最多的三个行业。考虑到这些行业对设备可靠性、安全性和维护效率的高要求,本节将详细探讨数字孪生技术在这三个领域中的故障诊断应用,帮助读者深入理解这一技术的实践意义。图1 2017年至2024年的相关出版物数量6.1 数字孪生在智能故障诊断中的应用:工业制造在工业制造领域,基于数字孪生的智能故障诊断正成为一种革命性技术,允许企业通过与实时数据同步的高保真数字孪生模型,精确地监测和预测生产线设备的状态。这种方法提高了故障诊断的效率和准确性,能够预测潜在问题,减少停机时间,优化维护计划,从而显著提升生产过程的稳定性和经济效率。数字孪生技术的应用标志着工业制造向更智能、更高效的未来迈出了重要的一步。目前,数字孪生技术在工业制造中的应用主要集中在关键部件,如轴承、齿轮箱和电机。本节旨在总结这些应用,并为工业制造业的数字化转型提供参考。6.1.1 数字孪生在轴承故障诊断中的应用轴承是工业制造中最常见且至关重要的部件之一,通常需要在高转速、高温和高负荷等严苛条件下运行。其性能直接影响整个机械系统的稳定运行和生产效率。此外,研究表明,轴承故障是设备停机和生产损失的主要原因之一[201]。因此,开发更精确、高效的轴承故障诊断方法至关重要。为了应对故障数据和计算资源的不足,Xie等人[202]利用SolidWorks和Simulink开发了一个轴承数字孪生模型,结合各种智能算法进行精确的故障诊断和性能退化分析。同时,通过模拟故障数据和应用迁移学习,缓解了故障数据和计算资源有限的问题。Hu等人[203]提出了一种基于数字孪生的1D卷积自编码器,结合遮罩技术,赋能工业物联网,并应用于轴承故障诊断。Wang等人[204]开发了一种基于数字孪生和机器学习分类的在线轴承故障诊断方法。为了解决传统故障诊断方法中对非实时数据、严格安装环境要求和测试数据的需求,数字孪生技术作为解决方案被应用。通过使用成熟的动态模型创建虚拟模型,并通过在线学习确保其可靠性,利用仿真数据进行基于机器学习的故障分类和诊断。此外,该方法还能实时预测故障发生的可能性,并为调整和维护实际轴承的操作参数提供反馈。针对变工况下轴承的故障诊断问题,Ma等人[205]提出了一种基于数字孪生的增强元迁移学习方法,建立了一个基于ADAMS软件的轴承试验台数字孪生模型,并进行了参数识别和模态测试,建模精度达到95.685%。他们将领域适应和注意力机制集成到增强元迁移学习中,通过虚拟数据和实际实验数据的结合,解决了以最少标记数据进行故障诊断的问题,具有重要的理论和实践价值。Li等人[206]提出了一种新的轻量级故障诊断架构,通过构建轴承的数字孪生模型,增强了故障诊断性能,确保了轴承的安全、稳定运行。Shi等人[207]开发了一种将机械模型与实时传感器数据相结合的数字孪生新模型,通过信号逼近方法动态更新模型。该模型已被验证能够准确映射XJTU-SY数据集中的滚动轴承生命周期缺陷大小。Qin等人[208]引入了一种新方法,通过逆物理信息神经网络生成轴承故障数据,以解决样本数据不平衡的问题。Zhang等人[209]开发了一个高保真动态数字孪生轴承模型,用于模拟其运行状态并生成足够的故障数据集。他们进一步开发了基于Transformer的跨域深度神经网络,将诊断知识从仿真数据迁移到实际无标注数据,成功实现了滚动轴承的精准故障诊断。Feng等人[210]创建了一个详细精确的数字孪生轴承模型,能够模拟不同类型、严重程度和运行状态。然后,他们通过新开发的领域对抗图网络实现跨域故障诊断,以解决训练和测试数据分布不一致的问题。结合这些技术,提高了诊断可靠性,克服了传统领域适应方法的局限性,并减少了分析时间和精力。Li等人[211]提出了一种基于数字孪生的双重迁移故障诊断方法,将特征迁移和模型迁移思想结合,通过实际测量数据共同控制数字孪生模型的动态响应,实现场景诊断,克服了传统方法中样本数据匮乏的问题,提高了故障诊断的准确性和可靠性。为了解决传统增量学习方法在学习新类别时容易发生灾难性遗忘的问题,Huang等人[212]提出了一种基于数字双重驱动的多保真信息融合增量学习故障诊断方法,利用高保真图像更新和优化模型,同时使用低保真虚拟知识增强模型在物理空间中的增量健康状态表示。该多保真信息融合增量学习方法在数字孪生驱动的轴承故障诊断中取得了更好的结果。6.1.2 数字孪生在齿轮箱故障诊断中的应用齿轮箱是许多工业机器中至关重要的部件,负责传递动力并调整转速。其健康状况直接影响整个机械系统的稳定性和生产效率。然而,在高负荷和复杂环境下运行的齿轮箱容易受到磨损和疲劳的影响,增加故障的可能性。随着工业自动化和智能化的发展,数字孪生技术在齿轮箱故障诊断中的应用逐渐增多。针对齿轮箱在复杂条件下数据生成质量不均和过度依赖有限类型信息的问题,Yan等人[213]提出了一种创新的基于数字孪生辅助的不平衡故障诊断框架。通过分析齿轮箱的非线性动力学,并利用数字孪生技术创建动态仿真模型来生成高保真的故障仿真数据,这种方法有效解决了获取实际故障数据的挑战。此外,结合子域自适应机制和边缘感知正则化,增强了诊断模型识别特定故障状态的能力,提高了其在不平衡数据下的鲁棒性。Yu等人[214]利用虚拟原型和多体动力学软件基于赫兹理论和扩展有限元方法,开发了齿轮箱的数字物理模型,实现了动态监控和数字仿真,以增强可视化。通过融合实际和仿真信号来增强特征,并通过包络谱分析实现齿轮箱故障诊断。Xia等人[215]提出了一种基于物理-虚拟数据融合的数字孪生驱动方法,应用于汽车齿轮箱故障诊断。首先,他们使用CATIA和ADAMS软件创建了一个高保真的齿轮箱驱动系统数字孪生模型,并通过物理与虚拟数据的互动验证了模型的可靠性。随后,他们采用基于Wasserstein GAN的梯度惩罚物理-虚拟数据融合方法,提高了数字孪生数据的质量。通过对四种不同操作条件下轻型卡车驱动轴的实验验证,证明了该方法的有效性和优越性。6.1.3 数字孪生在电机故障诊断中的应用电机是工业制造中至关重要的部件,生产线、机械系统和加工单元大多数依赖其提供动力。因此,电机故障直接影响生产力、产品质量、设备安全性和经济效益。通过数字孪生模型,可以模拟和分析可能的电机故障。结合机器学习算法,可以从历史数据和实时数据中学习,识别故障模式,快速准确地诊断故障类型及其根本原因,缩短修复时间,提高生产效率。传统的电机健康监测方法依赖于电机电流特性,在强噪声干扰和变化的工作条件下表现不佳。为了解决这一问题,Hu等人[216]提出了一种名为“Ramanujan数字孪生”的新型架构,用于监测和检测感应电机中的周期性故障。通过实验验证了该模型在不同条件和噪声水平下识别常见故障(如断条和定子绕组)时的有效性和鲁棒性。Xia等人[217]使用多物理场仿真软件COMSOL Multiphysics,构建了感应电机的三相数字孪生模型。该模型通过将定子电流转换为新型相对比电流点图,并利用知识迁移和半监督学习方法将定子电流集成到虚拟空间,实现了电机故障诊断。通过将虚拟空间的数据应用到物理空间中的标记稀疏数据,采用监督学习方法来增强电机故障诊断。永磁同步电机(Permanent Magnet Synchronous Motor, PMSM)因其高效、高功率密度、优良的动态性能和长期稳定性,已成为现代工业制造中不可或缺的动力来源。初期的绕组间短路故障是PMSM中最常见且发展迅速的故障,如果未能及时诊断,可能会造成严重损坏。此外,传统诊断方法在提取故障特征时,受制于电机谐波的影响。为此,Chen等人[218]提出了一种基于数据驱动的数字孪生模型故障诊断方法,用于诊断PMSM中的初期绕组间短路故障。该方法通过分析PMSM中三相电流的残差,采用外部输入的非线性自回归网络,构建了健康状态下电机的数字孪生模型,通过比较实际和预测的三相电流来诊断初期故障。该方法不依赖故障数据,能够在显著谐波和固有不对称的影响下识别细微故障。Huang等人[219]考虑了PMSM的运行力学和物理属性,开发了数字孪生模型,结合3Dmax、Maya、ANSYS和ABAQUS等工具,利用数据交互实现了物理实体和虚拟模型的实时映射。同时,他们使用增强优化算法优化随机森林模型,用于故障诊断,验证了该方法在PMSM故障检测和三维可视化监控中的有效性。Kohtz等人[220]使用基于数字孪生的可靠性设计优化方法,在PMSM状态监测中优化传感器布局问题,为PMSM健康监测提供了一个鲁棒且抗噪声的故障检测解决方案。6.1.4 数字孪生在其他设备故障诊断中的应用目前,关于数字孪生技术在其他工业制造设备(或部件)中的故障诊断应用的文献如表2所示(由于原表中内容较多,此处无法充分展示,请转至原文阅读)。6.2 DT在能源领域的IFD应用在能源领域,DT技术在多个场景中逐渐被应用于IFD,提升了能源系统的智能化和效率。该技术通过构建能源系统或设备的虚拟副本来模拟和分析实际操作,从而实现对能源设备的实时监控、预测性维护和故障检测,而不干扰实际操作。这使得能源设备能够进行实时监控和故障预测,增强了能源系统的可靠性和安全性。6.2.1 电池系统电池系统,尤其是锂离子电池,容易受到过充、过放和热失控等安全隐患的影响,这可能导致电池性能退化、使用寿命缩短,甚至发生安全事故。基于DT的IFD能够实时监控电池的健康状态,预测电池性能退化和潜在故障,并及时发出警报。这对于提高电池系统的安全性和可靠性,以及推动新能源技术的发展至关重要。Yuan等人[235]利用COMSOL Multiphysics和Simulink构建了锂离子电池的热电耦合模型,通过交换温度、电压和电池充电状态数据,形成了一个高度可靠的热电耦合锂电池DT模型,并生成了电池故障数据。利用DT开发故障检测算法的优势,通过分析温度和电压响应来指导IFD算法的开发。Semeraro等人[236]提出了构建可靠、准确且有效的锂离子电池储能系统DT的指导方针,实现了实时监控、故障预测和系统优化。Sun等人[237]研究了质子交换膜燃料电池系统,利用模拟故障注入的高阶模型生成大量故障数据,并结合深度学习算法,成功诊断了九种典型故障,且不需要实际数据标签,在动态负载下取得了令人满意的结果。6.2.2 光伏系统光伏阵列是太阳能光伏发电系统的核心组件,其运行效率直接影响整个系统的能量输出。Hong等人[238]首先将DT、卷积混合器和LoRa通知系统相结合,用于光伏故障诊断。随后,他们提出了一种基于DT技术、平移窗口变换器和粒子群优化算法的光伏阵列故障检测、定位和分类的新方法,并通过实验验证了该方法的有效性[239]。Kaitouni等人[240]讨论了摩洛哥本盖里尔市太阳能村中安装的五个建筑附属光伏系统的DT,提出了一种基于DT技术的故障检测和诊断方法,以优化城市分布式光伏系统的运行和维护。该方法结合了三维建模工具和监测系统,取得了可靠的结果。Jain等人[241]设计并实施了一种基于DT的分布式光伏系统故障诊断方法。该DT技术能够实时估计光伏能量转换单元的特征输出,提高故障检测的准确性和效率,并与误差残差向量的生成与评估相结合,使故障检测和识别更加快速敏感。这为光伏系统的可靠性和维护提供了高效可靠的方法。6.2.3 其他能源领域的场景在能源领域的其他场景中,Nguyen等人[242]提出了一种直接贝叶斯推理框架,应用于核系统中的DT和故障检测,该方法能够从实时传感器读数直接推断系统故障的概率分布。Ma等人[243]开发了一种结合堆叠稀疏自编码器和迁移学习的DT模型,用于制冷系统的高效故障检测。他们采用DT技术、实时数据和三维动态可视化,并结合堆叠稀疏自编码器和迁移学习,提高了制冷系统的故障检测效率,提出了一种新的方法和技术。Xie等人[244]提出了一种综合性的DT方法,用于提高HVAC系统的故障检测性能。该方法侧重于利用最具信息的数据,支持动态资产管理,并解决了由冗余数据引起的过拟合和计算负担问题。Jing等人[245]结合DT技术和振动信号分析方法,建立了变压器绕组故障检测的新模型。通过独立成分分析和小波包变换提取振动信号的特征向量,利用概率神经网络进行高效、准确的故障检测。DT技术的应用不仅提高了变压器绕组故障检测的准确性,还增强了其实时性和预测能力。Xiong等人[246]开发了基于现场可编程门阵列的DT平台,提出了一种电力电子变压器的实时监控和诊断方法。该方法通过高并行性和低延迟的现场可编程门阵列技术,显著提高了故障检测的及时性和准确性,并显著提升了DT模型的计算效率和性能。6.3 DT在航空航天领域的IFD应用在航空航天领域,航空航天系统极为复杂,包含数千个组件和子系统。基于DT的IFD系统能够支持航天器和飞行器设计、制造、运营和维护的整个生命周期,并且在应用背景和价值上具有重要意义。6.3.1 高超音速飞行器高超音速飞行器长时间暴露在恶劣的工作环境中,导致性能退化和潜在故障。Dong等人[247]提供了一种高效的高超音速飞行器故障检测方法。通过构建高超音速飞行器的数学仿真,建立DT模型,用于模拟高超音速飞行器的多种故障状态,并生成接近实际系统状态的数据,从而克服在故障检测中获取可靠且足够的数据的挑战。同时,集成多尺度特征提取、利用残差自注意力机制的特征增强模块以及基于门控递归单元的特征融合模块,能够准确识别高超音速飞行器的故障状态。6.3.2 航空发动机航空发动机,尤其是在恶劣环境和极端条件下运行的发动机,必然会在服役过程中出现性能退化,从而导致异常、突发故障、性能下降等问题。这对发动机的可靠性和操作安全构成了严重威胁。Huang等人[248]提出了一种新的DT方法,利用深度多模态信息融合。该策略结合了基于物理的模型和数据驱动的模型,为在航空发动机DT框架中集成物理和虚拟仿真数据的挑战提供了解决方案,使得精准的实时监控和故障检测成为可能。Tadepalli等人[249]开发了一种新的DT方法,结合了地理迁移学习支持向量机用于燃气涡轮航空发动机的故障检测。首先,通过3D打印构建燃气涡轮航空发动机模型,随后从内置传感器和DT中收集数据。采用多模态数据分析,利用超切线二次最近邻和二次自适应合成采样技术进行数据预处理和平衡。随后,应用广义二参数Fisher评分进行特征处理。最后,使用所提出的方法进行故障检测,取得了高精度和高效率。6.4 DT在其他领域的IFD应用如表3所示,DT技术凭借其独特的优势,已广泛应用于其他领域的故障检测,如船舶海洋、交通运输等。(由于原表中内容较多,此处无法充分展示,请转至原文阅读)7 建议与未来展望智能故障诊断是数字孪生技术在服务与维护阶段的重要应用,展示了实时监测、预测及系统问题解决的巨大潜力。在前述章节中,我们总结了关于DT、IFD的研究进展以及DT技术在IFD中应用的三个研究方向。基于此,以下将针对这三个方向所面临的问题和挑战提出一些解决方案和建议,并对未来进行展望,深入探讨如何充分利用DT技术在IFD中的价值。这旨在优化现有流程,推动领域进步,确保DT技术在未来服务与维护中发挥更重要和有效的作用。7.1 针对数字孪生技术7.1.1 现存问题与挑战通过对DT概念、发展历程、关键技术和应用的介绍与总结,可以看出DT已在多个领域得到了广泛应用。尽管其前景广阔,但DT技术在实际应用中仍面临诸多挑战与局限。1)数据获取与质量问题DT技术中数据获取与质量问题主要集中在如何确保所收集数据的准确性和可靠性。高质量、可靠的实时数据获取是DT技术应用的基础。然而,在实际操作中,传感器覆盖范围、精度、故障或网络问题以及环境因素可能影响数据采集,导致数据不完整、噪声较多或某种程度上失真。此外,即使数据已被收集,不完善的数据清洗、预处理和验证机制仍可能降低数据质量,对依赖高质量输入以保证模型准确性和可靠性的DT系统构成重大挑战。这些问题影响了DT模型的构建与维护效率,限制了其在IFD及复杂系统决策支持中的潜力。2)高度复杂系统的集成问题DT技术在高度复杂系统中的集成问题主要涉及技术兼容性和集成成本。DT需要与现有的信息和物理系统(如PLM、SCADA、传感器、物联网设备、控制系统等)进行整合。这些系统和设备之间存在显著的技术差异,需要高灵活性和兼容性的DT平台实现无缝集成。此外,复杂系统的集成通常需要较高成本,包括硬件与软件投资、定制化及长期维护。这些挑战提高了DT实施的门槛,限制了其在复杂系统中的应用范围与效率。因此,解决集成问题对于DT技术的广泛应用至关重要。3)模型构建的准确性与实时更新问题DT技术在模型构建的准确性和实时更新方面面临的挑战主要在于如何确保模型能够准确反映物理实体的实时状态并随其变化动态更新。构建高精度DT模型需要复杂的算法及大量准确的实时数据,而这些在实践中可能难以获得,尤其是针对复杂操作环境或苛刻条件下的物理系统。因此,将数据处理、挖掘技术与数理物理模型相结合,以反映系统实时状态,尤其是在涉及油液、气体的复杂机电系统中,具有特别的挑战性。在小规模产品部件(如轴承、齿轮)中实现DT相对简单,而在大规模系统中应用时,复杂性显著增加。这些复杂系统是大多数工业产品与设备的典型特征。系统的高度复杂性使DT模型的构建与实时更新变得更为困难,从而增加了技术挑战和资源需求。此外,这还需要相关人员具备大量专业知识。即便初始模型准确,由于环境变化和系统磨损,模型可能会随着时间偏离实际状态,需持续进行实时更新以保持同步。然而,实时更新要求快速处理与分析大量数据,灵活适应新输入,并需要大量计算资源,这对大型系统而言尤为具有技术挑战性。这些问题与挑战需要通过技术创新与方法优化逐步解决。4)安全与隐私保护问题DT技术在安全与隐私保护方面的问题与挑战主要来自其对大量敏感数据的高度依赖。这些数据通常包括个人信息、商业机密和关键基础设施的运行数据,任何泄露或未经授权的访问都会带来严重后果。因此,随着数据量的增长,保护这些大数据集免受恶意攻击的难度不断增加。此外,DT系统的开放性和互联性虽然便于信息共享与集成,但也增加了攻击者入侵的风险。此外,隐私保护也是一大挑战,因为DT系统在处理和分析个人数据时需确保不侵犯隐私,这些问题在医疗等高度敏感领域尤为限制其应用。7.1.2 建议的解决方案1)针对数据获取与质量问题投资高质量传感器和先进的数据采集技术以提高数据的准确性与完整性。开发容错机制以应对潜在的采集问题。建立健全的数据管理框架,包括清洗、验证及融合策略以确保数据质量,并探索更准确的机器学习算法以识别和纠正异常值。2)针对系统集成的复杂性问题推进行业标准化,建立统一的接口与数据交换格式,以简化系统集成。采用中间件技术解决系统之间的兼容性问题,降低技术难度与成本。3)针对准确模型构建与实时更新的挑战特别是在复杂系统(如涉及油液和气体的机电系统)中应用DT时,需要开发更先进的动态更新机制,使DT模型能够实时准确反映物理实体的当前状态。在此类复杂系统中,实时模型更新对技术要求更高。因此,使用机器学习与人工智能技术自动化模型构建与更新流程,可以处理复杂的实时数据流并动态调整模型以适应物理实体的变化。尤其在大型系统中,计算资源的高效分配至关重要,通过整合云计算与边缘计算技术,可支持实时更新并确保模型性能的高效性。4)针对安全与隐私问题实施严格的数据安全措施,包括加密、访问控制与监控机制。同时,采用多层次安全策略,覆盖物理、网络与应用层安全,构建全面的防御体系。7.1.3 未来展望1)数据采集与质量保证随着物联网的快速发展及传感器技术的进步,未来将涌现更多高质量、低成本的传感器,显著提升数据采集的质量与效率。同时,人工智能和机器学习算法将使数据处理与质量保证方法更加智能化,能够自动识别与纠正数据质量问题,从而提高数据的准确性与可用性。2)系统集成与标准化随着标准化的广泛采用,模块化设计理念、开放接口及微服务架构将使系统集成更加灵活与简便。DT技术将与各种现有系统及新兴技术无缝集成,为用户提供更全面的洞察并促进高效协作。3)高保真模型与实时更新随着计算能力的提升与算法优化,未来DT模型将实现更高的保真度与更快的更新速度。通过采用先进建模技术与自适应学习算法,DT模型能够在复杂多变的环境中准确反映物理实体的状态,保持高度同步性与响应性。这将使DT模型广泛应用于更复杂的系统与行业中,为设计、运行与维护提供革命性解决方案。4)安全技术与隐私保护安全技术的进步和隐私保护意识的增强将促使未来DT系统中采用更先进与全面的安全措施。这包括使用加密技术、细粒度访问控制及遵守国际公认的数据保护标准。7.2 面向智能故障诊断7.2.1 存在的问题与挑战1)数据的可用性、完整性和质量问题完整、可用、高质量的数据是智能故障诊断的基础。然而,在一些环境或应用场景中(特别是在极端或复杂的运行条件下),往往难以获取足够数量和高质量的数据。这可能由于监测设备昂贵、技术限制或数据采集过程中存在物理障碍等因素导致。而数据的缺乏可能会导致模型训练不足,从而影响故障诊断系统的准确性和可靠性。数据在采集、传输或存储过程中可能会丢失或损坏,导致数据不足或不平衡(正常状态数据远多于故障状态数据),这为故障特征提取带来挑战,并可能导致无法提取关键特征或生成错误的诊断结果。此外,数据质量还受到传感器精度、环境干扰和不当数据处理等多种因素的影响。低质量数据可能包含噪声和偏差,直接影响故障诊断的准确性。2)模型的准确性和实时性问题模型的准确性受数据的质量和数量,以及模型设计和训练过程的限制,而实时性问题则来自对高速度数据处理和分析方法的需求,特别是在资源有限的环境中。与此同时,在变化的运行条件下保持模型的准确性,以及处理大量数据以提供实时反馈,需要高度优化的算法和充足的计算资源。这些问题需要在模型设计、数据处理和系统架构方面的创新,以确保智能故障诊断系统的准确性和响应性。此外,尽管已经开发出许多基于人工智能的方法用于智能故障诊断,但选择不同机器学习(ML)或深度学习(DL)方法的标准化过程仍是一大挑战。特别是对于基于深度学习的方法,超参数设置的标准化过程也是确保其实用性和可操作性的关键挑战。3)可持续诊断与泛化性问题现有的智能故障诊断模型在特定系统和条件下表现良好。然而,随着设备自身的老化、维护活动以及运行条件的变化,原有诊断模型可能失效,从而影响诊断的准确性和可靠性。此外,由于实际应用中可能出现的新故障模式或未遇到的故障情况,原有模型可能难以准确识别或发生灾难性遗忘问题,这对模型的泛化能力提出了挑战。因此,开发能够自我更新、适应新故障模式,同时在设备状态和运行条件变化下保持良好泛化性能的智能故障诊断方法,是当前的关键问题与挑战。7.2.2 建议的解决方案1)数据质量提升与多模态数据结合通过减少数据采集过程中外部干扰以提高数据可用性;通过清洗、插值、去噪等预处理方法提升数据完整性和质量。在数据有限的情况下,可采用数字孪生技术、数据增强等方法生成额外的训练样本。同时,结合多模态数据有助于增强故障特征的表征能力,提高模型的泛化能力和准确性。2)智能模型的优化与自动化选择或开发具备高准确性和快速响应能力的智能模型;采用在线学习方法,及时更新模型以适应新的数据分布;压缩和简化复杂模型,以减少计算量并提升速度,同时在资源受限环境中保持足够的准确性。此外,为应对模型选择和超参数调整的挑战,可探索开发标准化的工具和流程,用于自动选择最合适的机器学习或深度学习模型,并优化超参数。这将简化智能故障诊断的实施并提升模型的实用性与效率。3)增量学习与迁移学习集成增量学习机制,使模型能够连续学习并适应新数据,从而识别新出现的故障模式而不会遗忘旧知识;探索多任务学习与迁移学习策略,通过知识共享提升模型的泛化能力,使其能够处理不同类型的故障和变化的运行条件。7.2.3 未来展望1)丰富的数据来源与实时处理随着物联网技术的发展和智能传感器的普及,未来智能故障诊断系统将获得更丰富、更高质量的数据。边缘计算将进一步增强数据处理的实时性和准确性,即使在极端或复杂环境中也能确保数据完整性和质量。此外,预计未来会整合更多种类和来源的数据,为故障诊断提供更全面的视角。2)增量学习和图卷积网络的潜力在需要连续学习和适应新数据或环境变化的场景中,增量学习是一种非常有前景的学习策略。随着深度学习、迁移学习等技术的进步,模型将能够更好地从新数据中持续学习和适应,从而实现更高的诊断准确性和性能。此外,图卷积网络(GCN)在处理复杂网络和时空数据方面具有显著优势,特别适用于复杂拓扑结构的工业设备和系统的故障诊断。随着GCN理论与技术的进一步发展,其在智能故障诊断领域的应用将更加广泛和深入。3)通用化与跨领域融合未来的智能故障诊断系统将更加注重可持续性和泛化能力。开发更通用的故障诊断框架与标准,促进行业与领域之间的知识共享与技术转移,是重要方向。此外,跨学科融合(如心理学、人类行为学和语义信息等非传统领域的知识应用)可能为智能故障诊断带来新的方法与创新。7.3 面向数字孪生的智能故障诊断7.3.1 存在的问题与挑战首先,数据的复杂性和多样性对数据处理能力提出了很高的要求,包括高效处理和集成来自不同来源和格式的大规模数据集,以及确保数据质量和一致性。此外,高维和时空数据的处理也需要复杂的分析工具和算法;许多故障诊断系统需要处理具有明确时间和空间属性的数据,挑战在于模型中准确反映时间序列依赖性和空间关系。其次,建模非线性和动态系统行为,尤其是针对复杂机电设备及其众多组件和子系统的建模,构建精准可靠的数字孪生模型是一大难题。此外,确保数字孪生模型与物理系统之间的实时同步性对精度和计算效率提出了更高的要求。这些技术挑战不仅需要强大的计算资源,还需要通过先进算法进行跨学科技术创新。同时,数据安全与隐私保护、缺乏通用标准以及高部署成本也是基于数字孪生技术的智能故障诊断推广过程中需要克服的关键障碍。这些问题使得数字孪生技术的广泛应用和潜力最大化成为一项复杂的任务。7.3.2 建议的解决方案1)模块化建模通过模块化建模方法,将复杂机电设备分解为多个模块或子系统进行建模,以提高数字孪生模型的模块化程度和灵活性。模块化设计通过让每个模块专注于特定功能或组件,并通过接口与其他模块交互,简化了复杂系统的建模。这种灵活的架构能够更轻松地适应技术迭代和系统扩展。2)混合建模方法结合基于物理的建模和数据驱动建模的优势。物理模型可以捕获设备的基本工作原理,而数据驱动模型通过学习实际运行数据来提高模型的精确性和适应性。这两种方法的结合显著提高了模型的准确性。3)多模态学习采用多模态学习方法,通过整合来自不同来源的数据和知识,有效提升模型性能和泛化能力。7.3.3 未来展望数字孪生技术正处于快速发展阶段,在智能故障诊断、系统优化等领域有着广阔的应用前景。通过克服现存挑战并持续创新改进,数字孪生技术将成为推动工业4.0和智能制造发展的关键技术之一。未来的研究应集中在增强数字孪生技术的智能性、实时性能和应用广度,同时确保安全和隐私保护,以促进其在各领域的发展。1)技术集成与创新数字孪生应与人工智能、大数据、物联网等技术进行更深层次的融合,探索透明且可解释的智能故障诊断算法,显著提升诊断的准确性和可信度。2)跨学科研究与合作数字孪生技术的发展需要多学科的专业知识。未来应推动机械、计算机、数据分析等领域之间的合作,以促进数字孪生技术在智能故障诊断中的应用和发展。3)个性化与通用化应用随着数字孪生技术的成熟,可以为特定行业或企业定制个性化解决方案。同时,还可以开发通用化的建模解决方案,以降低复杂系统智能故障诊断的应用门槛。8 总结本文总结了260篇文献,对过去七年数字孪生(DT)、智能故障诊断(IFD),特别是DT在IFD中的应用进行了全面回顾,旨在揭示最新研究进展、关键技术、应用领域、挑战及未来发展方向。通过对DT技术与IFD方法的系统分析,深入理解了这两个领域如何相互促进,共同在工业制造、能源和航空航天等关键领域取得进展。主要研究发现总结如下:1)DT技术依赖于高效的数据采集与处理、精确的数值建模、深入的数据分析与挖掘、直观的可视化,以及灵活的持续模型迭代与更新。同时,这些技术为IFD中的DT应用提供了有力支持,实现了精确的故障预测与健康状态评估。2)IFD技术的发展集中在利用机器学习(ML)、深度学习(DL)和迁移学习(TL)方法提高诊断的准确性与效率。这些技术能够从大量复杂数据中学习故障模式,从而提升故障检测的准确性和可靠性。此外,研究表明,增量学习策略结合其他先进智能算法,为实现更智能、自适应和持续优化的故障诊断系统提供了关键支持,成为IFD研究的重要分支。3)DT技术在工业制造、能源、航空航天及海洋船舶领域的IFD应用中表现出显著优势。其在提升设备运行可靠性、降低维护成本、优化维护决策等方面的效果得到了验证。4)尽管DT和IFD技术取得了显著进展,但在数据采集与处理、模型构建、系统集成以及安全与隐私保护方面仍存在挑战。在未来研究中,应重点关注提高数据质量、提升模型实时性与准确性、加强系统集成性以及改进数据安全与隐私保护方面的问题。5)未来的研究需要集中解决现有技术和方法中的难点,探索新的数据处理技术,构建基于DT的模型和学习算法,以增强DT技术在IFD中的有效性。此外,跨学科合作在推动该领域发展中至关重要,尤其是在数据科学、机械工程和计算机科学之间的协作。综上所述,DT技术在IFD领域展现了显著的潜力和价值。通过对现有文献的系统回顾,本文揭示了研究进展、主要问题与挑战,以及未来展望和建议,为研究人员和工业实践者提供了宝贵的参考和指导。随着技术进步和跨学科合作的深化,DT与IFD技术的结合将在提高设备可靠性、优化维护策略、推动工业自动化方面发挥越来越重要的作用。未来,DT与IFD的结合有望在多个行业中得到广泛应用,开启智能制造与自动化维护的新篇章。编辑:任超校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、海洋、Tina、陈宇航、陈莹洁,王金该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除点击左下角阅读原文,即可在线阅读论文。来源:故障诊断与python学习

    未登录
    还没有评论
    课程
    培训
    服务
    行家
    VIP会员 学习计划 福利任务
    下载APP
    联系我们
    帮助与反馈