论文题目:
A review on physics-informed data-driven remaining useful life prediction: Challenges and opportunities
论文期刊:Mechanical Systems and Signal Processing
论文日期:2024年1月
论文链接:
https://doi.org/10.1016/j.ymssp.2024.111120
作者:Huiqin Li (a), Zhengxin Zhang (a), Tianmei Li (a), Xiaosheng Si (a)
机构:
a: Zhijian Laboratory, Rocket Force University of Engineering, Xi’an 710025, PR China
通讯作者邮箱:
zhengxinzhang@tsinghua.org.cn (Z. Zhang).
sixiaosheng@126.com (X. Si).
作者简介:
司小胜,火箭军工程大学教授、博士生导师。2014年博士毕业于火箭军工程大学控制科学与工程学科(与清华大学联合培养)。近年来,主要从事随机退化系统剩余寿命预测与健康管理方面理论及应用研究,在EJOR、RESS、IEEE汇刊等国内外重要期刊发表论文50余篇,2篇论文为IEEE可靠性汇刊/EJOR近20/10年被引最多论文,出版中英文专著各1部,谷歌学术引用6200余次。先后主持国家自然科学优秀青年基金1项,完成国家自然科学基金面上项目2项,获国家自然科学二等奖(2019,排名3)、教育部自然科学一等奖(2018,排名3)、CAA自然科学一等奖(2016,排名3)、CAA优秀博士论文等。目前担任中国自动化学会技术过程的故障诊断与安全性专业委员会及大数据专业委员会委员,国际权威期刊《Mechanical Systems and Signal Processsing》编委(Editorial Member)。
1 摘要
1.1 RUL预测的发展趋势
1.2 RUL预测的现有方法
1.3 与现有关于 RUL 预测综述论文的差异
1.4 本文的动机和贡献
2 物理信息驱动的 RUL 预测概述
2.1 物理模型和数据融合方法
2.2 基于随机退化模型的方法
2.3 基于 PIML 的方法
3 物理模型和数据融合的RUL 预测方法
3.1 通用物理模型
3.2 数据驱动的测量模型与物理模型的结合
3.3 数据驱动模型与物理模型的决策级融合
4 基于随机退化模型的 RUL 预测方法
4.1 基于随机退化模型的 RUL 预测方法基础
4.2 随机系数回归模型
4.3 维纳过程
4.4 Gamma 过程
4.5 逆高斯过程
(以上标记章节为本文内容)
5 基于 PIML 的 RUL 预测方法
6 挑战与机遇讨论
7 总结
剩余寿命(Remaining Useful Life, RUL)预测,长期以来一直被认为是预测和健康管理(Prognostics and Health Management, PHM)中的关键技术之一。对保障系统的安全性和可靠性,降低运行和管理成本至关重要。随着传感和状态监测技术的迅猛发展,数据驱动的RUL预测引起了人们的广泛关注,并研究了各种数据驱动的RUL预测方法。
关键词:预测,剩余寿命,物理信息,数据驱动,可解释性
随着第四次工业革命的重大进展和现代制造技术的不断提高,航空航天系统、工业机器人、风力发电系统、高速列车等大型复杂装备日益呈现出自动化、集成化、智能化的发展趋势。然而,由于各种内外因素的影响,包括机械磨损、疲劳、蠕变损伤、变载荷、动态运行环境、大扰动、外部冲击等,这些系统的性能在其生命周期内会随着运行时间的推移而下降。这种性能下降将损害系统的健康,最终导致系统失效,如果不采取措施,甚至会造成灾难性事故和重大经济损失。因此,主动健康管理技术对于确保这些关键系统的运行可靠性和安全性至关重要[1]。
为了确保关键系统运行可靠性和安全性,预测和健康管理(PHM)应运而生,作为一种系统故障排除技术,PHM通过诊断、预测和系统健康管理[2]等三个关键成分有效预防意外故障。其中,预测是通过监测系统健康状况,评估在预期使用条件下其健康状态的退化程度来预测系统的剩余寿命(RUL)的过程。基于预测信息,可以积极地做出与安全、状态维护、备件订购和寿命延长相关的健康管理决策,以提高工作效率,降低系统的运行风险和成本[3]。
在下文中,我们首先讨论了RUL预测的一般发展趋势和现有RUL预测方法的主要原理,然后阐明了本文与现有关于RUL预测综述论文的区别。最后,我们介绍了本文的动机和相关贡献。
在PHM中,RUL预测长期以来一直被认为是PHM中保障系统安全性和可靠性、降低运营和管理成本的关键技术之一[4]。近年来,RUL预测已成为研究热点,越来越受到学术界和工业界的关注。在学术研究方面,Web of Science数据库是一个国际公认的数据库,反映了科学研究的发展,包括各个领域的大部分研究论文。因此,我们选择Web of Science数据库来分析RUL预测领域的已发表论文。为了避免数据库更新的影响,所有出版物的收集都是在2022年12月完成的。为了确保数据的权威性和准确性,本文使用Web of Science Core collection作为主要数据来源,包括2003年至2022年的出版物。为确保检索到的文献与本研究密切相关,定义为“articles not related with the RUL prediction were excluded by checking titles and abstracts”,具体的纳入标准为[主题=(“remaining useful life” OR“residual useful life” OR“RUL”)] AND [发表类型=(文章)OR(综述)OR(论文集)] AND [语言=(英语)] AND [发表年份=(“2003-2022”)]。根据上述标准,本文统计了过去20年中关于RUL预测主题的出版物数量,如图1所示。
随着传感和状态监测技术的进步,可以更容易、更经济地获得与系统退化过程相关的监测数据,这些退化监测数据有望提供有关系统寿命的丰富信息。因此,如果可以适当地对这种退化数据进行建模,则可以相应地预测相关系统的RUL。这提供了一种经济可行的方法来缓解对物理知识完整性要求很高的基于物理的方法和具有足够故障时间数据的传统寿命数据拟合方法的局限性。基于监测数据,在过去的几十年里,人们对开发各种数据驱动的RUL预测方法进行了广泛的研究[23]。数据驱动的RUL预测的一般过程如图2所示。在这个过程中,首先通过各种传感器对退化系统进行监测,以获取传感信号来收集状态监测数据,然后通过适当的信号处理算法(如归一化和平滑)对监测数据进行预处理。利用预处理后的数据,提取退化特征,以表征相关系统的退化过程。最后,通过对系统的退化过程进行建模,可以根据退化处理超过预定义故障阈值或故障标签的时间来预测RUL。
图2 数据驱动的RUL预测流程图
目前,数据驱动的RUL预测方法主要包括统计数据驱动方法和基于机器学习(Machine Learning, ML)的方法。统计数据驱动方法的基本思想是利用随机模型来拟合退化指标的演变过程,然后将退化过程外推到定义的故障阈值,从而实现RUL预测,其中模型参数是基于监测数据估计的[24]。这种方法的主要优点在于能够提供退化过程的可视化形式,并通过获得RUL的概率分布来量化预后不确定性,这是RUL预测的基本要求,因为RUL预测对应于未来故障事件的预测,并且本质上具有不确定性。另一个优点是,模型参数在一定程度上具有可解释性,例如反映退化速度和时变动力学的参数,这种可解释的机制将有助于理解退化失效过程和预测结果。然而,随机退化模型的选择和退化建模统计假设的合理性是影响此类方法预测性能的重要方面。更重要的是,统计数据驱动方法的成功在很大程度上取决于退化指标的可用性,其趋势是增加还是减少。换句话说,这种退化指标的质量对统计数据驱动方法的预测准确性有固有的影响,但这种方法从监测数据中提取所需退化指标的能力相对有限。
随着工业4.0[25]、网络物理系统(Cyber-Physical System, CPS)[26]和物联网(Internet of Things , IoT)[27]的进步,随机退化系统的状态监测数据的可用性提高已成为现实,从而推动了RUL预测研究进入大数据时代。在大数据的背景下,基于机器学习的RUL预测,特别是深度学习(Deep Learning, DL),已成为预测领域的热点话题,并且已经进行了大量的研究来开发各种基于机器学习(ML)的RUL预测方法[28]。通常,基于机器学习的RUL预测方法是通过使用神经网络等机器学习模型建立从监测数据到RUL信息的映射关系来实现的。作为代表,DL方法已被证明是一种强大的工具,可以处理高维非线性的监测数据,从海量数据中自动提取深度退化特征,或实现端到端的预测,从而减少人为干预[29]。这种方法的主要优点在于,当无法完全掌握潜在的失效物理或领域知识时,模型拟合具有很强的灵活性和通用性。因此,在过去五年中,观察到基于机器学习或更精确地说基于深度学习的RUL预测研究的爆炸性增长并不奇怪。然而,众所周知,基于机器学习的方法以黑盒方式运行,并且缺乏透明度和可解释性[30]。尽管ML模型中的每个组件相对简单,但整个模型的结构仍然非常复杂,以至于其设计者和用户可能无法完全理解。因此,在实践中经常采用精度-可解释性权衡。此外,基于机器学习的方法的性能在很大程度上取决于监测数据的数量和质量,如果没有带标签的代表性数据,则无法保证这些方法的预后性能。特别是,很容易观察到,ML模型在训练/测试数据集上看起来很好(即使在交叉验证之后),但在可用的标记数据之外表现不佳,甚至产生物理上不可行/不一致的RUL预测结果。因此,如何提高基于机器学习的方法对未知数据的泛化能力仍然是一个非常具有挑战性的问题。最后但同样重要的是,在大多数基于机器学习的RUL预测研究中,尽管在某些应用中可以实现令人满意的精度预测结果,但由于机器学习模型的确定性结构,很难提供预测RUL的概率分布。因此,尽管RUL预测的不确定性量化是协助评估PHM应用中故障风险的关键问题,但通过基于ML的方法量化预后不确定性的能力是有限的。
从上述讨论中可以看出,纯物理方法和纯数据驱动方法在模型建立、模型假设、数据要求、可推广性、可解释性等不同方面都有各自的优缺点。在这种情况下,一个自然的想法是将这两种方法结合起来,利用基于物理的方法和数据驱动的方法的优点来提高RUL预测性能。因此,已经开发了结合基于物理和数据驱动方法的混合方法来预测RUL。Liao和Kottig[31]对故障预测的混合方法进行了全面的综述,并使用基于物理的数据驱动和方法的各种组合介绍四类混合方法。混合方法的主要优点是,随着这些方法的集成,预测的RUL对模型假设和数据选择策略等可能的影响具有鲁棒性。
结合上述讨论,当前的基于物理的方法、数据驱动的方法和混合方法在应用于RUL预测时各有优缺点。表1总结了四类现有RUL预测方法的优缺点。
1.3 与现有关于 RUL 预测综述论文的差异
在过去的十年中,许多学者综述了各种 RUL 预测方法,表 2 列出了一些具有代表性的 RUL 预测方法综述,这些综述具有不同的方法侧重点。具体而言,Si 等人 [32] 系统地回顾了依赖于现有监测数据和统计模型的统计数据驱动的 RUL 预测方法。Liao 和 Kottig [31] 全面回顾了混合方法驱动的 RUL 预测研究,并通过在电池退化案例中的应用说明了混合方法的潜在优势。Cubillo 等人 [33] 总结了旋转机械常见的故障模式和退化机制,重点讨论了基于物理的 RUL 预测模型及其在齿轮和轴承中的应用。Zhang 等人 [34] 重点介绍了基于维纳过程的退化数据分析和 RUL 预测方法的建模进展及其在 PHM 领域的应用。Lei 等人 [35] 系统地回顾了从数据采集到 RUL 预测的机械整个预测过程。Guo 等人 [36] 回顾了工程系统预测建模方法的进展和应用,并根据故障物理知识是否纳入 RUL 预测讨论了数据驱动、基于物理和混合方法的优势和局限性。Kordestani 等人 [37] 对数据驱动、基于物理和混合方法进行故障预测的研究进行了调查,并强调了相关的重要应用领域。Wang 等人 [38] 比较了用于锂离子电池 RUL 预测的深度学习算法的不同自适应数学模型。Ferreira 和 Gonçalves [39] 为基于 ML 的 RUL 预测过程提出了一个明确的通用过程分析框架,并讨论了最相关的 ML 方法的优缺点。Guo 等人 [40] 系统地回顾了通过基于物理的模型和数据驱动模型的不同组合方法进行电池寿命预测的“灰箱”寿命建模的进展。Wang等人 [41] 全面概述了数据驱动方法和相关的建模过程,并讨论了物理模型和数据驱动模型的结合及其在金属材料疲劳寿命预测中的应用。
表2 关于 RUL 预测的典型综述论文总结
虽然表 2 中的综述文章并未详尽收录文献中出现的所有综述论文,但无疑反映了 RUL 预测领域的重要性、繁荣和快速发展。然而,值得注意的是,现有的关于 RUL 预测的综述主要集中在数据驱动方法上,而没有强调物理知识的整合。此外,除了 [31,40,41] 之外,大多数综述只是从结合数据驱动和基于物理的方法的角度部分讨论了混合方法的进展,对物理知识整合的讨论不足。虽然 Liao 和 Kottig [31] 专注于系统地讨论混合方法,但由于该综述 [31] 发表已九年多,因此没有涵盖近年来混合方法的最新研究进展。最新的综述 [40,41] 包括了通过基于物理的模型和数据驱动模型的不同组合方法进行寿命预测的最新进展,但涉及的方法仅限于电池或金属材料的应用,因此不具有对其他应用的通用性。更重要的是,即使现有综述中经常讨论混合方法,但这些方法基本上是通过简单地组合不同的方法来实现的,因此预测性能将受到单一方法性能的限制。因此,物理知识是以浅层方式集成的,而不是以嵌入物理知识来指导数据驱动方法实施的深度集成方式。
1.4 本文的动机和贡献
图3 数据与知识的深度融合机制
值得注意的是,虽然图 3 中提出的本质思想与跨行业标准数据挖掘流程 ( Cross-Industry Standard Process for Data Mining, CRISP-DM) 方法论 [46] 在从数据中获取知识方面相似,但这里的主要区别在于,图 3 中的每个步骤在预测的背景下都是不可逆和不可或缺的,总体上形成了数据和知识集成的闭环,但 CRISP-DM 方法论中每个阶段的顺序并不固定,取决于前一阶段特定任务的输出是否是下一阶段的必要输入。另一个不同之处在于,除了表明基于数据挖掘分析可以从数据中获取知识外,图 3 还强调了使用物理知识帮助数据建模和预测实现数据和知识的深度融合的重要性,而这在 CRISP-DM 方法论中是缺失的。在图 3 所示的新范式中,引入物理知识可以有效缓解纯数据驱动模型带来的问题。通过专业机制支撑数据建模,有望减少模型训练所需的数据,提高预测结果的可靠性、鲁棒性和可解释性。此外,与混合方法中的浅层组合不同,将物理知识嵌入到数据驱动建模中实现深度集成,有望使已建立的预测模型生成物理一致的结果。因此,将物理或领域知识嵌入数据驱动方法、发展物理信息化的数据驱动方法,有望提高RUL预测结果的可解释性和效率,降低对数据量和质量的要求,已逐渐成为共识。在此背景下,物理信息化数据驱动的RUL预测已成为预测领域的一个新兴课题,近三年来物理信息化数据驱动的RUL预测研究呈急剧上升趋势。最近,Xu 等人 [47] 回顾了物理信息机器学习方法在可靠性和系统安全性应用中的最新进展,并指出此类方法在可靠性和系统安全性评估方面的快速发展。然而,很少有人关注物理信息机器学习技术在 RUL 预测任务中的应用。
在本部分中,我们尝试对本文讨论的物理信息数据驱动的 RUL 预测方法进行概述。广义上,根据所采用的表征退化现象的模型以及物理或领域知识与数据的集成机制,有三种实现物理信息数据驱动的 RUL 预测的思路。第一,基于底层故障机制建立物理模型,并通过融合监测数据来校准模型参数。第二,基于领域知识和历史监测数据建立可解释的随机退化模型。第三,将物理或领域知识集成到 ML 方法中,建立监测数据与 RUL 之间的映射关系以实现预测。因此,本文将现有的物理信息数据驱动的 RUL 预测方法分为三类,即物理模型和数据融合方法、基于随机退化模型的方法和基于物理信息机器学习 (PIML) 的方法。物理信息数据驱动的 RUL 预测方法的详细分类如图4所示。
图4 物理信息数据驱动的 RUL 预测方法的分类
图5 本文涉及的三种基于物理信息的数据驱动RUL预测方法的相关出版物
与图 1 中统计的与 RUL 预测整个领域相关的 10,000 多篇论文结果不同,图 5 统计了 106 篇与物理信息数据驱动的 RUL 预测研究密切相关的论文。但值得注意的是,关于物理信息数据驱动的 RUL 预测方法的详尽参考文献收集仍然难以实现,本文可能并未包括近年来的所有出版物。主要原因之一是物理信息数据驱动的 RUL 预测主题引起了越来越多的关注,并且有更多与该主题相关的研究论文正在涌现。尽管如此,图 5 中的统计结果仍然表明了每个类别的大致比例,并有望反映物理信息数据驱动的 RUL 预测的发展趋势。我们希望本文的观点和讨论能够促进开发新的物理信息数据驱动的预测方法。
在以下小节中,分别对三个类别进行简要概述,以了解每个类别的总体思想以及我们认为这些方法是物理信息数据驱动方法的原因。
工程实践中,动态环境和各种不确定因素引起失效物理的变化,由于对退化过程的认识有限或不完整以及退化过程的异质性较大,难以建立准确的退化系统物理模型。在此情况下,应用随机退化模型来表征退化过程,为描述不确定运行环境中的故障产生机制和特征提供灵活性。利用基于监测数据估计参数的随机退化模型,通过求解所表征的退化过程达到预定失效阈值的概率分布,可预测RUL。从物理退化现象来看,由于内部应力和外部环境的综合作用,系统性能退化是不可避免的,相关退化变量的监测数据将呈现增加或减少的趋势。这可以看作是从物理现象中归纳出来的领域知识。受这些领域知识的启发,各种随机模型被开发来描述这种退化现象,包括随机效应回归模型[55]、维纳过程模型[56]、伽马过程模型[57]、马尔可夫链模型[58]、随机滤波器模型[59]、逆高斯过程模型[60]等。此外,已经证明,随机模型能够描述物理退化过程的必要性质是数学中的无限可分性[61]。具有这种性质的代表性模型包括维纳过程模型、伽马过程模型、逆高斯过程模型等。例如,由于良好的数学性质和物理可解释性,维纳过程可以很好地描述退化过程的非单调动态特性,被广泛应用于滚动轴承、惯性陀螺和激光器的RUL预测。与维纳过程不同,Gamma 过程和逆高斯过程描述的是严格单调的退化过程,通常用于模拟疲劳裂纹扩展、腐蚀磨损等不可逆过程的退化。其中,Gamma过程为纯跳跃过程,退化轨迹不连续,因此,该模型可用于描述连续小冲击引起的缓慢退化过程和大冲击引起的严重损伤。随机冲击达到过程可以用泊松过程近似。在泊松过程中,每次冲击对系统造成的损伤都是微小的、随机的。因此,复合泊松过程可用于描述随机冲击及其相关损伤对系统退化的影响。Ye和Chen[62]证明了逆高斯过程是复合泊松过程的极限分布,这为系统在随机环境下运行的逆高斯退化建模提供了明确的物理解释。从以上对基于随机退化模型的方法的一般性讨论中可以看出,这些方法通常用随机退化模型代替物理模型来表示失效过程。然而,基于随机退化模型的方法的共同点在于,所采用的随机退化模型都是从物理现象中衍生出的领域知识中获取灵感。此外,随机退化模型的选择取决于退化监测数据的特征和模型的物理性质。基于所选的随机退化模型,可以根据历史退化数据估计模型参数,并根据在役系统的实时监测数据进行更新。
2.3 基于 PIML 的方法
近年来,由于机器学习方法具有快速前馈特性和强大的数据驱动能力,被广泛应用于复杂系统的RUL预测。一般而言,基于机器学习的RUL预测方法通过利用机器学习模型建立从监测数据到RUL信息的映射关系来进行RUL预测。然而,传统的基于机器学习的方法忽略了系统底层的退化机制,由于没有将领域特定知识考虑进建模过程,导致相关预测缺乏透明度和可解释性。为了解决传统基于机器学习方法中存在的问题,将物理或领域知识嵌入机器学习模型的开发中受到了研究界的广泛关注,即PIML。虽然PIML的理念提出不久,但由于其潜在的优势,已在流体力学[63]、生物医学[64]、断裂力学[65]、电力系统[66]、地球物理学[67]等多个科学领域得到迅速发展。一般而言,机器学习方法由数据、架构设计、优化和初始化四个关键组件组成。因此,根据物理知识融入上述四个组件的方式,PIML 方法的核心思想主要包括基于物理的数据增强、基于物理的架构设计、基于物理的初始化和基于物理的损失函数。此外,机器学习模型还可用于预测物理模型产生的误差,并将基于机器学习的预测误差模型与物理模型相结合,以提升最终的预测性能。本文将这种集成物理知识的实现过程称为基于物理的残差建模。基于上述思想,PIML 方法利用物理知识指导机器学习的数据增强、架构设计、功能优化和模型评估,从而充分发挥纯数据驱动方法和物理知识的优势。为此,PIML 方法有望具有许多优点,包括提高可解释性、物理上一致的结果、更好的泛化性、提高优化效率、降低对训练数据的数量和质量的要求等。目前,PIML 因其潜在的优势已成为 ML 领域越来越受欢迎的范例,并且将物理知识集成到 ML 方法中以开发基于 PIML 的 RUL 预测方法的研究趋势不可阻挡。因此,在本文中,我们将基于 PIML 的方法视为一种新兴但重要的物理信息数据驱动的 RUL 预测方法类别。
根据上述分类和讨论,我们将在以下三个部分中回顾每类物理信息数据驱动方法在 RUL 预测中的现状。但需要注意的是,即使不是从物理信息的角度进行的,许多现有评论也部分考虑了前两类,如表 2 所示。因此,本文简要讨论了这两类,重点介绍了最新进展。相反,由于目前还没有针对基于 PIML 的 RUL 预测方法的现有评论,因此本文将详细介绍基于 PIML 的 RUL 预测方法的进展。
3.1 通用物理模型
● 疲劳裂纹扩展模型
● 电池老化模型
锂电池老化可分为日历老化和循环老化。日历老化是当电池闲置时由于材料的热力学不稳定性产生的副作用。以日历老化为例,影响日历老化的三个因素是温度、充电状态和时间,如下式所示 [68]:
● 轴承动力学模型
实际上,磨损退化会影响轴承系统的动态响应,包括但不限于质量、阻尼系数、刚度和激励力。例如,从轴承表面去除的材料将通过减少或改变均匀分布来影响质量。表面缺陷会扰乱润滑膜的均匀性,并导致阻尼比发生一些变化。当出现凹痕或缺陷时,它会在表面上留下空间,从而改变刚度。当滚动体穿过有缺陷表面的边缘(即冲击区域)时,缺陷还会引入激励力。根据公式(3)中的动态模型,可以推导出反映退化状态的变形指数[69]。
上述模型只是用于表示不同环境下系统退化机制的物理模型的一些示例。值得注意的是,文献中还报道了许多其他物理模型,关于不同环境下物理模型的详细讨论可以在一些评论中找到,包括从电化学行为的角度分析电池的物理模型[40]、从机械的角度分析机械的物理模型[70]、从金属材料的角度分析金属模型[71]等。利用物理模型,可以使用相关变量的监测数据或测量值来识别未知的模型参数。这样,通过物理模型和监测数据的融合,可以根据故障的定义预测相关系统的 RUL。下面从两个角度讨论了用于 RUL 预测的物理模型和数据融合方法的一些发展:数据驱动的测量模型和物理模型的结合,以及决策级数据模型和物理模型的融合。
3.2 数据驱动的测量模型与物理模型的结合
发展基于物理模型和数据融合的 RUL 预测方法的另一个重要途径是分别基于物理模型和数据驱动模型进行 RUL 预测,然后通过某种融合方法集成基于物理和数据驱动模型的 RUL 预测结果,称为数据驱动模型和物理模型的决策级融合。沿着决策级融合的思路,Goebel 和 Eklund [79] 首先考虑系统的物理特性来模拟故障传播,然后利用实验数据和已知条件下的部件损伤程度来估计条件故障传播速率。最后,采用基于核的时间回归算法集成这两种预测方法的输出。Wen 等人 [80] 提出了一种数据级和决策级混合融合方法来预测 RUL。在本研究中,首次使用遗传规划将物理传感器源集成到复合健康指标中,并得到了一个显式的非线性数据级融合模型。然后,在可靠性理论框架下,采用决策级融合方法集成基于各种物理传感器和综合健康指标的RUL预测。Goebel等人[81]利用实验数据和部件损伤程度建立了估计条件故障传播速率的经验模型,并引入Dempster-Shafer (DS)证据组合方法实现决策级融合。实验结果表明,融合方法比单独使用任何一种方法都能产生更准确、更可靠的结果。值得注意的是,决策级融合途径的实现过程相对简单且独立,可以整合各种数据驱动和基于物理的方法的优势,以提高RUL预测结果的鲁棒性和准确性。然而,实现不同预测方法集成的决策级融合形式相对多样,融合方法有多种,包括算术平均、加权平均、几何平均、核回归、DS证据组合等,因此决策级融合机制的设计和选择具有上下文相关性且具有挑战性。此外,虽然RUL预测的鲁棒性可以得到一定程度的提高,但最终预测的性能会受到融合所采用的单一预测方法的制约。
从现有研究可以看出,物理模型与数据融合方法用于RUL预测的思路直接自然,可以实现基于物理的RUL预测,并且由于继承了基于物理和数据驱动方法的优势,可以提高预测性能和可解释性。因此,成功应用物理模型与数据融合方法的前提是获得准确可靠的物理模型和实时监测数据。然而,准确可靠的物理模型往往难以获得,或者掌握建模的失效机理成本高昂且耗时长。对于重要而复杂的系统尤其如此。因此,需要对复杂系统进行更多的物理化学和实验分析,以便有效地构建可靠的基于物理的模型。此外,由于物理模型与数据融合方法通常是通过组合多种算法来实现的,因此相关的计算复杂度通常很高。因此,开发更合理的融合框架将有助于提高计算效率。最后,对于多参数高度非线性的物理模型,模型中包含的大量参数将导致参数识别不准确和过拟合的问题,从而影响预测的准确性和效率。针对这一挑战,开发物理模型和数据融合方法的另一种方法是使用数据驱动的方法来预测物理模型中难以或不准确的中间参数,而不是数据驱动方法和物理模型之间的简单组合或浅层融合。通过将数据驱动的结果输入物理模型,这种深度集成的方法不仅会表现出更好的预测性能,而且还会修正现有物理模型中的不足,例如模型简化或假设。
本节首先介绍基于随机退化模型的 RUL 预测方法的一般原理和关键组成部分,然后讨论一些代表性随机退化模型应用于 RUL 预测的最新进展。通过这些讨论,可以得出现有研究的优点和局限性,从而为未来的新研究方向提供参考。
如2.2节所述,动态环境和各种不确定的内外部因素会引起故障物理的变化,实际系统的退化过程会表现出很大的异质性。基于随机退化模型的RUL预测方法具有反映退化过程的不确定性和随机性以及提供RUL的概率分布以量化预测不确定性的优势,因此取得了重大进展,因为这类方法可以自然地描述实际系统的随机故障产生机制和不确定运行环境的影响。基于随机退化模型的RUL预测方法的基本原理如图6所示。图6所示的原理是,基于退化系统的监测数据,通过拟合系统性能退化变量的演变过程并将其外推到预定义的故障阈值,可以基于随机模型预测系统的RUL [32]。在这个实现过程中,可以根据退化数据的特点和领域知识,确定刻画性能退化的随机退化模型,包括趋势性、单调性、鲁棒性等。
基于随机退化模型的方法的第二个部分是随机退化模型的参数估计。由于所采用的随机模型是根据所涉及系统的统计特征或领域知识选择的,因此模型参数是未知的。在这种情况下,为了进行预测,应首先基于监测退化数据估计所用随机模型的模型参数。广泛使用的参数估计方法包括最大似然估计法、贝叶斯方法、期望最大算法等。这类方法的第三个部分是求解 RUL 的概率分布。基于随机退化建模和相关参数估计,求解 RUL 的概率分布是预测的关键任务。需要注意的是,RUL 分布的求解与退化故障的定义密切相关。到目前为止,有几种不同的故障定义,如阈值命中时间 [82]、首次命中时间 [32]、最后逃逸时间 [83] 和平均到达时间 [84]。因此,可以根据与随机模型表征的退化过程相关的故障定义来解决 RUL 的概率分布。不同故障定义得出的 RUL 分布解之间的差异可以在 [83,84] 中找到。
在当前基于随机退化模型的方法研究中,前两个组成部分的实现过程基本固定或很少改变。相反,用于表征系统退化过程的随机模型则存在显著的变体。特别是随机项
随机系数回归模型的优势在于,它们可以同时模拟群体中普遍存在的退化特征和不同个体中存在的差异性。自 [82] 的开创性工作以来,此类模型在 RUL 预测中得到了广泛的应用,如 [32] 所述。最近,Yan 等人 [55] 使用迭代更新随机系数回归模型来刻画轴承健康指标的退化趋势,并结合基于孟塞尔变换的关键点检测自适应方法,提高了 RUL 的预测性能。针对先验信息不完善的问题,Wang 等人 [88] 提出了一种基于非线性随机系数回归模型的 RUL 预测方法,并考虑了故障时间数据的融合。此外,Zhao 等 人[89] 提出了一种多状态健康模型来预测轴承故障,其中使用回归方法检测健康转变点,并使用具有贝叶斯更新过程的指数随机系数模型来推导故障时间分布。对于结构复杂的机器,Chen 等人 [90] 分别应用了两种成熟的期望回归模型(即线性和指数)来计算和更新系统的 RUL 分布。从这些进展中可以看出,当前随机系数回归模型的重点主要放在根据相关系统的具体要求应用或改进模型公式上。未来,如何继承同时建模退化过程中的共性和个性的一般思想,并开发更灵活的模型来表征退化过程中的时间变化性,值得我们付出更多的努力和关注。
维纳过程是一类由具有时变漂移性的布朗运动(Brownian Motion, BM)驱动的随机过程。需要说明的是,具有漂移性的BM最初在物理学中用来表示流体和空气中小颗粒随机游动的进程。由于漂移效应,这种随机游动具有趋势性,因此由BM驱动的模型适合于对具有增加或减少趋势的动态过程进行建模。形式上,如果随机过程
由于其数学性质优良、概念清晰、与物理退化过程相似,能很好地描述系统的非单调退化特性,在退化建模和RUL预测中得到了广泛的应用。张等[34]专门综述了基于维纳过程的退化数据分析、RUL预测及其在PHM中的应用进展,强调了退化过程中的非线性、多源变异性、协变量和多变量。但值得注意的是,本综述中讨论的进展基于2018年以前的文献。近年来,文献中报道了一些新的进展。为了克服对数变换和时间尺度变换在处理非线性退化数据方面的局限性,一些新的变换技术已被开发出来,将非线性数据转换成近似线性数据,以促进退化建模和RUL预测[91,92]。例如,Si 等人[91]从Box-Cox变换(Box-Cox Transformation, BCT)的角度提出了一种非线性随机退化建模和RUL预测方法。在这项工作中,首先使用BCT将非线性退化数据转换为近似线性数据,然后利用具有随机漂移的维纳过程对转换数据的演变过程进行建模以进行预测。通过大量的实验结果和比较分析发现,BCT可以将许多现有的变换技术作为特例,具有强大的处理非线性数据和提高早期预测性能的能力。针对非线性退化过程难以转化为线性退化的情况,Cao 等人[93]建立了基于非线性维纳过程的随机退化模型,采用离线估计和实时更新相结合的方法估计了退化模型的参数,并推导出系统的RUL分布。Lu 等人[94]采用带有随机漂移参数的维纳过程模拟非均匀退化过程,并利用机组实时退化数据,动态更新漂移参数的后验分布,进一步根据在线监测数据更新系统的RUL分布。
为了克服跟踪退化过程中的动态和多源变化的挑战,Wang 等人 [95] 提出了一种通用的时变维纳过程。在本文中,构建了一个状态空间模型来考虑非线性和三源变化,并引入了一个隐式变换模型来描述模型参数随时间的变化。实际系统的退化过程在很大程度上取决于外部运行环境,包括温度、工作负载等。动态环境对退化过程的影响是近年来 RUL 预测考虑的重要方面。针对动态环境下的预测问题,Zhang 等人 [96] 提出了一个具有随机时变协变量的非线性维纳过程模型。在本研究中,Ornstein-Uhlenbeck 过程用于建模动态协变量,并通过指数协变量效应函数将其与时变退化率相关联。Zhang 等人 [97]在前人工作[96]的基础上,充分考虑了退化过程中可测和不可测协变量因素的不确定性,利用维纳过程实现了考虑可测和不可观测外界影响的RUL预测。
除以上两个方向外,具有多阶段退化特征的系统近年来也受到广泛关注。针对多阶段退化过程,Wang 等人[98]首次提出退化角的概念,以准确识别不同阶段之间的变点,从而可以使用维纳过程模型的不同漂移函数来匹配不同的退化阶段,提高预测性能。在所构建的模型基础上,根据退化角的定义和首次命中时间的概念,得到了多阶段 RUL 分布。[99] 提出了两种多阶段非线性维纳退化模型开展 RUL 预测研究,即带有时间尺度变换和纯时变漂移扩散过程的非线性退化模型。本文充分考虑了退化阶段变点处的状态转移概率,并基于首次命中时间的概念得到了 RUL 分布的解析表达式。从现有研究可以看出,基于维纳过程的模型下的 RUL 预测是一个活跃的研究方向,此类方法在预测中的应用将因其可解释性和在建模灵活性和数学便利性方面的优异特性而得到进一步促进。此类方法的一个发展方向是通过设计基于物理或领域知识的漂移和扩散函数来构建更复杂的模型,以实现针对特定应用环境的定制建模。此类方法的另一个挑战在于在维纳过程的非单调性质导致的非线性退化情况下找到 RUL 分布的精确解。