首页/文章/ 详情

SCI一区论文学习 | 一种基于片段数据的非参数退化建模剩余寿命预测方法

1月前浏览1164
 本期给大家推荐李乃鹏教授的一种基于片段数据的非参数退化建模剩余寿命预测方法。基于状态维修(CBM)通过预测设备剩余使用寿命(RUL),在设备发生故障前制定维修计划,是保证设备安全运行的有效手段。由于监测中断和/或传感器读数丢失会产生片段数据。而片段数据只记录了一个随机的退化过程,初始退化时间信息通常会丢失。因此,无法使用常用的时间相关建模框架对其进行建模。为解决这一问题,文章提出了一种基于片段数据的非参数退化建模方法用于RUL预测。该方法利用基于退化状态的函数定义剩余寿命。并提出了一种基于极大似然估计的主分析(PAMLE)算法来恢复故障单元的缺失数据。最后,通过疲劳裂纹扩展数据集和锂离子电池退化数据集验证了该方法的有效性。

论文链接:通过点击本文左下角阅读原文进行在线阅读及下载

论文基本信息

论文题目:

A nonparametric degradation moldeling method for remaining useful life prediction with fragment data

论文期刊:Reliability Engineering and System Safety

论文日期:2023年

论文链接:

https://doi.org/10.1016/j.ress.2024.110224

作者:

Naipeng Li (a), Mingyang Wang (a), Yaguo Lei (a), Xiaosheng Si (b), Bin Yang (a), Xiang Li (a)

机构:

a: Key Laboratory of  Education Ministry for Modern Design and Rotor-Bearing System, Xi'an Jiaotong University, Xi'an Shanxi 710049, PR China;

b: Zhijian Laboratory, Roket Force University of  Engineering, Xi'an  710025, PR China.

通讯作者邮箱:

yaguolei@mail.xjtu.edu.cn
作者简介:李乃鹏,西安交通大学副教授,入选第八届中国科协青年人才托举工程,2017-2019年在国家留学基金委资助下赴美国佐治亚理工学院进行联合培养,2019年9月获得西安交大工学博士学位。长期从事工业大数据与人工智能、高端装备数字孪生建模、机械装备寿命预测与智能运维方面研究工作。在Springer出版社出版英文专著1部,获国家科学技术出版基金资助,参与撰写Elsevier出版的英文专著1部,获第十七届输出版优秀图书奖;在《Mechanical Systems and Signal Processing》、《IEEE Transactions on Industrial Electronics》、《机械工程学报》等本领域权威期刊发表高质量学术论文40余篇,其中ESI热点论文4篇、ESI高被引论文5篇。参与制定国家标准4项,授权国家发明专利25项,其中10余项已在风电装备、工业机器人、汽车、地铁、国防装备等进行应用,取得了的一定社会经济效益。博士学位论文获陕西省优秀博士学位论文;研究成果获陕西省自然科学一等奖(第2完成人)、陕西高等学校科学技术一等奖(第2完成人)、中国华电集团科技进步一等奖(西安交大所有参与人中排名第1)等科技奖励。

目录

1 摘要
2 引言
3 利用FPCA进行退化建模
3.1 时变退化模型
3.2 片段数据描述中的时变退化模型问题
4 片段数据的非参数退化建模方法
4.1 状态依赖退化模型构建
4.2 失效单元的片段数据恢复
4.3 在役单元的RUL预测
5 验证实验
       5.1案例研究1:裂纹增长数据集
       5.2案例研究2:锂离子电池退化数据集
6 总结

1 摘要

基于状态维修(CBM)通过预测设备的剩余使用寿命(RUL)在设备发生故障前制定维修计划,是保障装备运行安全的重要手段。状态监测数据是健康状态评价和寿命预测的基础。在理想情况下,应该从健康阶段开始连续收集监控数据,直到生命周期结束。然而,在实际的工业情况下,由于监测中断和/或传感器读数丢失,经常存在片段数据。片段数据的主要特点是它们只记录了退化过程中的一个随机阶段。初始退化时间信息通常会丢失。因此,无法使用常用的时间相关建模框架对其进行建模。针对上述问题,本文提出了一种基于片段数据的RUL预测的非参数退化建模方法。该方法通过两步轴变换,构建了一种新的状态相关退化建模框架。它利用基于退化状态的函数来定义剩余寿命。基于函数型主成分分析(FPCA),提出了一种基于极大似然估计的主分析(PAMLE)算法来恢复故障单元的缺失数据。在此基础上,提出了一种基于片段数据的面向剩余寿命预测优化算法(POO)对在役装备的RUL进行预测。该方法既能处理数据恢复问题,又能处理剩余寿命预测问题。最后,通过疲劳裂纹扩展数据集和锂离子电池退化数据集验证了该方法的有效性。

关键词:剩余使用寿命预测,非参数退化模型,片段数据恢复,函数型主成分分析

2 引言

状态维护(CBM)是一种基于设备在线状态监测数据进行维护决策的健康管理方案。它是公认的保证工业设备安全的有效方法。CBM的主要过程是基于状态监测数据评估设备健康状态并预测剩余使用寿命(RUL)[1]。基于RUL预测结果,可以调度预测性维护决策。如何根据在线状态监测数据对设备退化行为进行建模和预测是CBM的一个重要问题。统计退化建模是解决这一问题的有效方法,它通过对历史数据的统计分析来描述数据的退化轨迹[2]。

在现有文献中发展了各种统计退化模型。它们可以分为两类:参数退化模型和非参数退化模型。参数化退化模型,顾名思义,使用包含未知模型参数的特定函数形式来描述退化过程。模型参数需要通过对历史数据的统计分析来估计。常用的参数化退化模型包括随机系数模型[4,5]、Wiener过程模型[6,7]、gamma过程模型[8-10]和逆高斯过程模型[11-13]。这四种参数化退化模型用一种时变函数来描述退化过程。通过选择合适的函数形式,如线性函数、指数函数和幂律函数,可以描述设备的整个退化趋势[14]。退化过程的不确定性是通过在状态观测函数或在特定模型参数中引入不同的随机噪声来确定的。在许多工业情况下,设备的退化过程是复杂和时变的,很难用特定的函数形式来精确描述。非参数建模技术被引入到退化建模的研究中。非参数退化建模的目的是通过对历史退化数据的分析自动构建模型。它不需要预先指定任何函数形式。因此,从理论上讲,它在处理复杂的退化过程时更加灵活。

一些常用的非参数退化建模技术包括高斯过程(GP)回归、样条函数回归、核回归、函数型主成分分析(FPCA)等。GP回归将退化过程定义为具有联合高斯分布的随机变量的集 合[15,16]。它通过适应不同的数据分布来捕捉复杂的非线性关系,具有很高的灵活性。然而,该方法需要选择合适的核函数,并且核函数的选择对建模结果的准确性有很大影响。样条函数回归用几种基函数的组合,如常用的正弦基和B样条基函数[17]来定义退化曲线。它能适应不规则数据形状,但容易发生过度拟合,并且需要仔细选择节点。另一方面,核回归通过使用核函数[18]评估每个训练单元和测试单元之间的相似性来预测训练单元的加权和。与线性回归不同,核回FPCA归不假设变量之间存在线性关系。它可以有效地对线性和非线性依赖关系进行建模。然而,该方法对核函数的选择也很敏感。FPCA是处理函数型数据的主成分分析的增强版本[19,20]。它是退化建模中应用最广泛的非参数技术之一。传统的基于FPCA的退化模型通过以下随时间变化的函数[21]来描述设备退化过程:

    
其中  为退化过程的平均趋势,  是由协方差函数分解出来的前  个函数主成分(FPCs)。  为第  个FPC对应的分数。线性组合   描述了每条退化轨迹与种群平均趋势的偏差。  是一个随机变量,在固定的  下服从正态分布  。与参数模型不同的是,式(1)中的均值函数和FPC并没有预先指定为特定的函数形式。它们是通过对历史数据的统计分析自动得出的。理论上,非参数退化模型在描述各种退化趋势方面更为灵活。
由以上介绍可知,常用的退化模型,包括参数模型和非参数模型,都将健康状态或代表健康状态的指标定义为基于时间变量的函数。应该注意的是,大多数工业产品一般都处于长期的健康阶段。从第一次退化时间(FDT)[22]开始计算退化过程。在实际应用中,状态监测系统通常采用高密度离散采样策略来获取监测数据。FDT可以通过检测退化轨迹的变化点来识别。然后,通过计算观测时间戳与FDT点之间的时间间隔,可以计算出每次观测的退化时间,如图1所示。退化时间      。其中      为每次观测的时间戳,      为FDT的时间戳。       表示状态级别达到失效阈值时的时间戳(EoL)[23]。然而,在某些工业情况下,由于数据传输中断和/或传感器读数丢失,状态监测过程经常中断。因此,只有一组片段数据可用。图1提供了片段数据的示例。片段数据的一个主要特征是在数据集中只记录生命周期内的随机观察片段。退化过程开始时的观测结果可能由于监测中断而丢失。在这种情况下,无法根据碎片数据检测FDT,导致退化时间不可用。因此,时间相关的退化建模方法在这种情况下不起作用。

图1 片段数据的一个示例

根据设备的退化阶段,可将片段数据源分为两类。第一类片段数据是由于严重损坏而导致失效或停止的设备的历史记录片段。在这种情况下,在这种情况下,只记录了部分退化过程和      。在不完全退化轨迹中丢失了一些重要的退化信息。恢复丢失的数据有助于进行准确的退化建模和失效分析[24,25]。第二类片段数据是从处于部分退化阶段的在役设备中捕获的。由于设备尚未达到故障级别,因此其EoL时间戳不可用。我们主要关注的是使用可用的片段数据来预测在线设备的剩余使用寿命(RUL)。综上所述,上述两种不同情况下的主要任务是不同的。在设备失效的情况下,任务是根据可用的片段数据恢复丢失的退化信息。对于在线设备的任务是根据片段数据预测剩余寿命。

图2 片段数据的说明和两步轴变换
针对上述两个问题,本文提出了一种新的非参数退化建模方法。考虑到在片段数据的情况下无法获得退化时间的信息,因此我们不制定依赖于退化时间的退化过程。相反,我们设计了一个新的依赖于状态的退化模型,其中RUL被描述为依赖于状态的函数。建模过程的基本思想如图2所示,可以从一般坐标系出发,通过两步轴变换展开。首先,通过X轴反向将退化时间转换为RUL变量。然后,通过轴向旋转交换X轴和Y轴。两步轴变换的动机解释如下。对于故障单元,它已在到达故障阈值失效。因此,EoL时间戳可以从历史记录中跟踪,可以将其表示为       。时间戳通常与每个状态观察同步记录      时刻的RUL可以表示为      。因此,在单元失效的情况下,通过轴的反向,片段数据的未知变量(退化时间)在 X 轴上变成了已知变量(RUL)。在服役单元的退化尚未达到失效阈值水平的情况下,RUL值是未知的,这实际上是我们需要预测的。唯一可用的数据集是一系列状态观测及其相应的时间戳。轴旋转步骤将RUL重新表述为状态相关函数。该转换将未知变量(RUL)重塑为因变量,将已知变量(退化状态)重塑为自变量。由于预测的主要目的是根据已知的状态观测来预测未知的RUL,因此对于预测任务来说,这个定义比依赖时间的模型更直接。此外,它还保证截断的退化信号在 X 轴上具有相同的尺度,这是FPCA应用中的基本要求[26,27]。经过两步轴变换后,变换后的片段数据可以很容易地利用FPCA技术进行建模。在非参数建模框架的基础上,提出了一种基于极大似然估计的主分析(PAMLE)算法来恢复故障单元的缺失数据。如图2右子图所示,通过轴的旋转,RUL预测问题转化为迭代优化问题。优化的目标是找到一个RUL值,该值可以提供片段数据与退化模型之间的最佳匹配关系。为了解决这一问题,提出了一种面向剩余寿命预测的优化算法来预测在役机组的RUL。在优化过程中,观测曲线在坐标系中的垂直位置不断变化。一旦确定了它的位置,在役机组的RUL也就确定了。因此,该方法既能处理故障单元的数据恢复任务,又能处理碎片数据情况下在用单元的RUL预测任务。本研究的主要贡献如下:
1) 针对片段数据的描述,构造了一种新的状态依赖退化模型。与常用的随时间变化的退化模型相比,该模型有两个明显的区别。使用RUL代替退化时间作为时间尺度变量,因为在片段数据的情况下,退化时间通常不可用。通过交换时间域和状态域,RUL被表述为退化状态的函数。这个公式对于RUL预测任务来说更直接。
2) 在此基础上,提出了一种非参数化建模方法。该方法利用FPCA技术对退化模型进行估计。提出了一种PAMLE算法来恢复失效单元的丢失数据,并提出了一种POO算法来预测在用单元的RUL。该方法的一个主要技术贡献是将RUL预测问题转化为迭代优化问题,这是对RUL预测研究的一种新的尝试,也是一种更灵活的策略,可以应用于片段数据场景。
本文的其余部分组织如下。第2节介绍了使用FPCA进行退化建模的一般框架,即本研究中我们提出的方法的基本理论。同时指出了它在处理片段数据方面存在的问题。第3节提出了一种基于轴变换的状态相关退化模型,并在此基础上提出了一种针对片段数据情况下的数据恢复和RUL预测的非参数退化建模方法。在第4节中,使用两个案例研究演示了所提出的方法,包括疲劳裂纹扩展数据集和锂离子(Li-ion)电池退化数据集。在第5节得出了一些结论。

3 利用FPCA进行退化建模

3.1 时变退化
我们假设不同单元的退化是相互独立的。根据传统的基于FPCA的退化建模框架,特定单元的退化过程可以表示为一下的时间相关函数[21]:
  
其中  是单元n在t时刻的状态值,  是退化过程的基本平均趋势,假设在不同单元之间是一致的。  描述了单元n与平均趋势之间的偏差,假设它是一个随机值,均值为 0 ,协方差为  。  是一个独立同分布噪声,在固定的t值下,均值为 0 ,方差为  。  和  是相互独立的。
考虑到偏差项  由于不同单位之间的差异而不易直接计算,我们将该随机项转换为一组相互正交的随机分量,以保留基本信息并减少信息冗余。根据Karhunen-Lo´eve定理[19,28],协方差可以分解为正交泛函主成分(FPCs)的线性组合
    
其中  是与有序非负特征值  相关的特征函数。
每个主成分实际上定义了偏差中最重要的变化模态,每个模态与前面步骤中定义的所有模态正交。有不同的方法来确定FPCs的数量,这些方法提供了无限维过程[19]的合理近似值,例如单曲线遗漏交叉验证,赤池信息准则(AIC)等。在这里,我们选择占解释的函数方差90%以上的前P个元素来近似无限展开形式。偏差项  可以投影到正交泛函基中:
  
其中为  FPC分数,是均值为0,方差为  的独立随机变量。  表示单元n的偏差在第p个主成分量上的投影。将式(4)带入式(2)中,退化模型重新表述为:
       

3.2 片段数据描述中的时变退化模型问题

上述时间相关退化模型为统一时间间隔内不同单元退化数据的统计分析提供了有效的解决方案[21]。然而,在处理片段数据时,它受到以下两个主要问题的限制。

(1) 时间依赖模型在没有退化时间信息的情况下,无法对片段数据建模。
如图1所示,片段数据仅涉及生命周期内观察的随机切片。每个数据段从随机退化状态开始记录。当退化过程开始时,没有依据可以追踪FDT。由于退化时间等于  ,其中  为每次观测的时间戳,因此如果没有重要信息  ,我们就无法获得退化时间。时间相关退化模型将状态状态定义为时间变量的函数。如果没有退化时间信息,就对片段数据进行建模。
(2) 时间依赖模型要求所有单元必须共享相同的观测时间尺度。
由式(5)中的定义可知,该模型对同一时域[0,T]内各单元的退化数据进行分解。它要求所有单位必须共享相同的观测时FPCA间尺度。这一源自传统的基于FPCA的模型,其中X轴上的变量必须共享相同的比例。然而,在大多数工业情况下,一旦设备的退化数据达到预定的故障阈值,就应该立即关闭设备,这是一个严格的要求。因此,在故障阈值之外无法观察到任何结果。这类数据被命名为截断的退化数据[3]。如果使用FPCA技术直接对截断的退化数据进行建模,则观测值的偏倚选择将导致对均值和协方差的偏倚估计,从而导致对退化过程的不准确估计。文献[26]系统地讨论了这个问题,提出了一种新的轴旋转策略来处理这个问题。借助轴的旋转,将时间变量变为Y轴,将状态级别重塑为X轴。每个单元的退化过程可以在相同的状态区间内表示    ,其中为    初始状态值,    为失效阈值。
通过以上分析,可以得出传统的随时间变化的退化模型不适用于片段数据的情况。针对上述问题,采用两步变换策略对碎片数据进行重构。在此基础上,建立了一种新的状态相关退化模型。在此基础上,提出了数据恢复算法和RUL预测算法

4 片段数据的非参数退化建模

所提出的非参数退化建模方法流程图如图3所示,该方法由状态依赖模型构建、失效单元片段数据恢复在役单元RUL预测三个模块组成。在第一个模块中,首先使用两步轴变换策略对训练单元的退化数据进行变换。然后,利用FPCA技术对转换后的数据进行分析,建立状态相关的退化模型。第二个模块的目的是恢复故障单元的丢失数据。在该模块中,首先使用PAMLE算法根据片段数据估计FPC分数。然后,根据估计的FPC分数恢复缺失数据的分布。第三个模块是基于片段数据对在役单元RUL进行预测。开发了一种POO算法来寻找最优RUL值,该值在片段数据的观测值和估估值之间提供最佳匹配。


图3 提出的非参数退化建模方法流程图  

4.1 状态依赖退化模型构建

我们考虑在实践中常用的离散采样策略,其中在一系列时间内监视每个单元的健康状态。单位n的数据段记录为  ,并带有相关的时间戳  ,其中  表示来自单位n的数据个数。如果该单元已达到故障阈值,则其EoL时间戳  可从事件记录中追溯到。为了将片段数据与状态相关的模型拟合,首先使用以下两步轴转换对它们进行重塑。
(1)X轴反变换
记录片段数据中的退化过程,从随机退化阶段开始。我们无法从数据集中追踪退化过程的初始时间。然而,退化过程的结束时间一般是记录的。与每个观测值相关的RUL可以使用逆函数  来计算。之后,当  时,用新的坐标值  记录所有数据段。通过上述X轴反变换,使每个单元的退化轨迹与RUL变量保持对齐。
(2)轴向旋转变换
在工业情况下,原始退化数据在失效阈值处被截断。X轴上的寿命在不同的单位之间是不同的。为了将截断的退化数据与FPCA技术匹配,进一步采用轴向旋转策略[26]对数据进行变换。该策略交换了X轴和Y轴上的变量。例如,将退化状态放在X轴上,将RUL变量放在Y轴上。换句话说,退化轨迹表征了RUL在状态层面上的演变。由于各单元的状态尺度在同一区间    内,因此变换后的数据更适合用FPCA进行建模。此外,由于预测的主要目的是根据可用的退化数据预测RUL,因此将RUL作为状态级别的函数来制定预测任务更为直接。
经过上述两步轴变换后,变换后的数据使用以下状态相关退化模型描述:
  
其中,  表示状态s下单元n的RUL,  表示总体的基本平均趋势,  表示与平均趋势的偏差,  是一个独立的同分布噪声项,在固定t值下均值为0,方差为  ,它与  相互独立。需要说明的是,上述状态相关模型仅在原始退化曲线为单调时才存在。在有噪声的退化数据中,由于一个状态可能对应多个时间点,这是不现实的。为了满足单调性,可以在轴变换前用单调基函数对噪声数据进行平滑处理。
式(6)中的状态依赖模型与式(2)相似,但又有所不同。式(2)表述了退化状态随时间的演变。式(6)描述了RUL随退化状态的变化。通过对偏差项  的分解,将式(6)重新表述为:
  
其中  是从协方差  中分解的正交FPCs。  是相应的FPC分数。
均值函数  和协方差函数  可以根据可用的片段数据,利用局部线性平滑度进行估计[19,27]。  的估计值通过最小化以下加权平方和来定义:
  
其中N为失效单元的数量,  是带宽为  的核函数,  的估计值  。
令  。由于偏差项  和噪声项  相互独立,则有  ,其中  为狄拉克测度,即如果  则  ,否则为0。对角线元素包含测量噪声的方差。为了消除测量噪声的干扰,对角线元素被去除。当  时,用  的剩余元素来估计协方差,  的估计值通过最小化以下准则来定义:
  
其中  是带宽为的二元核函数。  的估计值  。
如果将  的对角线元素也输入到式(9)中,则估计的对角线曲线为  ,其中  为  的对角线曲线。因此,方差  的估计可以近似为:
  
其中  是常用的激活函数,如果  等于1,否则等于0。
本征函数和本征值可通过求解以下方程来估计:
  
其中,对于  是与有序非负特征值  相关的特征函数。在这里,我们选择占解释的函数方差90%以上的前P个元素来近似无限展开形式。
到目前为止,状态相关退化模型的基本组成部分,包括均值函数、FPCs和方差,都是基于可用的片段数据进行估计的。基于所构建的模型,将在以下小节中讨论两个实际问题:(1)如何使用故障单元的片段数据恢复其丢失的数据,(2)如何使用其片段数据预测在役单元的RUL。
4.2 失效单元的片段数据恢复
如果只计算每个单元对应的FPC分数,则可以使用式(7)中构建的模型来表示每个单元的退化轨迹。FPC分数的解析解为:  。对于从  到  有足够观测值的失效单元,FPC分数的数值近似可以用  来计算。然而,片段数据仅涉及部分观测,不足以提供准确的FPC评分估计。为了获得部分可用数据的可接受的FPC分数估计,通过最大似然估计(PAMLE)算法进行如下主成分分析。
我们考虑一个失效单元,其部分退化数据和EoL时间戳被观察到。观测时间戳为  对应的状态值为  。单位的EoL时间戳记录为  。因此RUL值  很容易计算出  。令  ,  ,  。根据式(7),在相应的状态  上,RUL值  ,服从多维正态分布  ,其中  是一个  阶的单位矩阵。FPC分数  的对数似然函数取决于  ,表示为:
令  ,对  的估计求解如下:
  
根据FPC分数的估计,退化状态s下退化轨迹的预期RUL值可由下式恢复:
  
  的置信区间  (CI)可近似为
  
式中    为标准正态分布的    百分位数。
4.3 在役单元的RUL预测
我们进一步考虑一个仅部分退化的在役单元。片段数据集记录状态观测  和时间戳  。由上面的分析可以看出,只有根据现有数据计算FPC分数,才能恢复机组的退化过程。然而,在使用情况下,实际的RUL值是不可用的,这实际上是我们预测性维护的主要关注点。因此,FPC分数不能通过式(13)来估计。为了解决片段数据情况下的RUL预测问题,我们开发了以下POO算法,其流程图如图3所示。
已知对于  ,时间方程总是存在  。因此,每个时间点的RUL与最后一个时间点的RUL是线性连接的。
    
令    代入式(13)。对    的估计表示为    的函数。
    
将上述方程进一步输入到式(12)中。对数似然函数变为剩余寿命相关函数。因此,将RUL预测问题转化为优化问题,目的是寻找最优的RUL值,使    与估计的    最匹配。相应的目标函数可简化为:
    
最优RUL值可采用梯度下降法求解,迭代方案如下:
    
其中
    
初始值    设置为0。如果    迭代步长      ,则迭代过程可以停止,其中为给定收敛精度,默认值为1e-6, 为最大迭代步长,默认值为1e4目标函数    可以迭代最小化。可得到一个最优RUL值。然后,将RUL值输入到式(17)中,得到FPC分数的估计值。各状态下RUL的期望可由式(14)计算,100(1−α)%置信区间由式(15)计算。在接下来的时间步长    中,当有新的观测值    时,将RUL序列    、平均函数    和FPCs     扩展为新的状态观测值。为了减少迭代步骤,将最后时刻优化后的RUL    作为下一次迭代过程的初始值。通过进行式(19)中的迭代过程来优化RUL。因此,RUL预测结果会随着运行时间一起更新。

5 实验验证

为了说明所提出方法的工作过程,并证明其在处理片段数据恢复和RUL预测方面的有效性,本节使用了两个基准实验数据集,包括裂缝增长数据集[29]和锂离子电池退化数据集[30]。

5.1 案例研究1:裂纹增长数据集

(1)  裂缝增长数据导入和片段数据生成

该数据集由68块相同的2024-T3铝合金[29]中心裂纹板组成。每块板的疲劳裂纹从初始裂纹长度为9.0 mm开始,一直延伸到最终裂纹长度为49.8 mm。在测试面板上施加了重复的负载循环。连续监测裂纹长度和循环次数,并在9.0 ~ 36.2 mm范围内,每0.2 mm间隔记录裂纹扩展,在36.2 ~ 44.2 mm范围内,每0.4 mm间隔记录裂纹扩展,在44.2 ~ 49.8 mm范围内,每0.8 mm间隔记录裂纹扩展。因此,每个小组总共产生164项观察结果。68个单元的裂纹退化观察结果如图4(a)所示。可以看出,该数据集是一个典型的截断样本,其中状态观测值在故障阈值水平49.8 mm处被截断。

68个单元被分为两组:用于退化模型估计的训练组和用于预测性能评估的测试组。

(1)训练组由从数据集中随机选择的58个单元组成,这些单元的EoL是可用的。为了模拟片段数据问题,从每个训练单元的随机时间序列中删除一个数据段。为了研究不同观测缺失率的影响,将删除数据长度的百分位数从5%改为45%,间隔为10%。缺失百分位数为35%的训练单元的观测结果如图4(b)所示。

(2)试验组由剩余的10台机组组成,按部分退化过程在役机组处理。如图4(c)所示,将前半部分数据视为历史数据。每个测试单元的RUL从历史数据的最后一个时间点开始预测,并随着新的在线数据的可用性而更新。为了模拟片段数据问题,删除每个测试单元的初始n个观测值,其中n为[0,25]内的随机数。即各试验单元的历史数据均从区间[9.0 mm, 14.0 mm]内的随机裂缝长度开始。

接下来,我们将尝试恢复训练单元的缺失数据,并使用我们提出的方法预测测试单元的RUL。

 图4 68个测试单元的裂缝增长数据:(a)原始观测值,(b)训练单元观测值,缺失百分位数35%,(c)测试单元观测值

(2)  状态依赖模型构建

为了便于状态相关模型的构建,使用3.1节中的两步轴变换对原始数据进行了重塑。训练组和测试组的变换后的数据分别如图5(a)和(b)所示。通过变换,x轴变换为裂缝长度,y轴变换为面板的RUL。

在下面的分析中,使用58个训练单元的转换数据构建状态依赖模型。我们以35%的缺失百分位数为例。均值函数的估计曲线如图5(a)所示。从结果可以看出,我们的方法在碎片数据的情况下提供了准确的均值函数估计,这表明轴变换策略在减少数据缺失和数据截断的干扰方面是有效的。协方差函数的估计面如图6所示,由于缺少数据,估计面有些失真。计算了协方差函数的特征值和特征函数。前四条FPC曲线如图7所示,其百分比占变化量。可以看出,第一个FPC呈现逐渐退化的趋势,这与协方差函数主对角线的轮廓高度一致。它也占解释的功能变异的80.85%,这意味着第一个FPC定义了方差的主导模式。根据我们的预规范,前三个FPC函数占解释的函数方差的90%以上,作为每个退化轨迹的正交分解的基函数。

 图5 变换后的裂纹扩展数据:(a)训练组,(b)试验组

 图6 估计协方差函数  

 图7 FPC的前四个函数

(3)  失效单元的片段数据恢复

在模型构建完成后,我们将尝试使用3.2中提出的方法来恢复每个训练单元的缺失数据。根据可用的片段数据,使用PAMLE算法计算每个单元的FPC分数。在缺失状态水平下,RUL的期望和95% CI得到恢复。我们还以35%的缺失百分位数为例,选取两个缺失数据处于不同退化阶段的单位。第一个单元有一个缺失数据片段,第二个单元有两个缺失数据片段。两个单元的数据恢复结果如图8所示,为了突出恢复性能,图8放大了局部细节。恢复结果的期望值称为“恢复数据”。结果表明,恢复的数据曲线与丢失的数据吻合较好。所有缺失的数据点都被估计的95% CI所覆盖。结果表明,该方法能够有效地恢复丢失的数据信息,有助于跟踪失效部件的历史退化轨迹,揭示其完整的使用寿命。

‍‍‍‍图8 两个单元在35%缺失百分位数下的数据恢复结果:(a)测试单元1,(b)测试单元2 ‍‍‍‍

为了定量分析该方法在数据恢复方面的性能,对每个单位计算恢复期望与实际观测值之间的误差均方根(RMSE)。为了可视化缺失率对数据恢复性能的影响,图9给出了随缺失百分位数从5%增加到45%的RMSE的箱线图。很明显,恢复误差随着缺失百分位数的增加而增加

图9 恢复数据随缺失数据百分位数变化的均方根误差

这是合理的,因为丢失的退化数据越多,可用的退化信息就越少。RMSE的最高平均值出现在45%以下,小于0.05 × 10e5周期。而训练单元的RUL观测值在图5所示的约2.5 ×10e5周期的尺度水平内。因此,与实际RUL观测值相比,RMSE足够小。这意味着我们提出的非参数退化建模方法即使在高丢失数据率的情况下也能准确地恢复失效单元的丢失数据。为了进一步分析碎片位置对模型性能的影响,我们在缺失百分位数35%下随机选取一个单位进行演示。图10显示了RMSE随片段切片位置变化的情况。从结果可以看出,我们的方法的RMSE在片段切片的不同位置下都保持在一个稳定的水平。结果均小于0.05 × 10e5个循环。与实际RUL观测值相比,RMSE足够小,表明我们的方法对片段切片的不同位置具有鲁棒性。

图10 随单元位置变化恢复数据的均方根误差

(4)  在役机组RUL预测

数据恢复后,根据在役单元的片段数据,重点进行下一个任务RUL预测。为了可视化RUL预测过程,以测试单元1在第一个预测时间点的RUL迭代优化过程为例,如图11所示。

图11 POO工作过程示意图:(a) RUL迭代优化过程,(b)目标函数曲线

该图中有三条不同的数据曲线:(1)实际观测数据,称为“地面真值曲线”;(2)不含RUL信息的部分观测数据,其位置由迭代过程优化后的RUL值确定,称为“观测到的RUL曲线”;(3)将式(17)得到的FPC分数输入到式(14)中计算得到的估计曲线,称为“估计的RUL曲线”。从优化过程中可以看出,实测RUL曲线和估计RUL曲线都逐渐向地面真值曲线靠拢。在迭代过程的开始,估计的RUL曲线的形状与观察到的RUL曲线不同。随着迭代步长的增加,估计的RUL曲线与观测的RUL曲线越来越吻合。这种现象实际上表明了POO算法的工作过程,它试图通过搜索最优RUL值来匹配观察到的RUL曲线和估计的RUL曲线。

利用本文提出的方法预测了10个测试单元的RUL。为了证明我们的方法在处理片段数据方面的优越性,我们还使用了另外两个比较方法来预测剩余寿命。我们的方法被指定为方法1。方法2是基于FPCA[26]的另一种非参数退化建模方法。它还将退化过程表述为状态依赖模型。但是,该方法在片段数据情况下仍然使用原始退化时间作为时间尺度,没有考虑其不可用性。方法3是一种最先进的参数化退化建模方法[31],其中应预先指定与时间相关的退化模型。为了与图4所示裂纹扩展数据的非线性退化趋势相一致,本研究对方法3采用幂函数。由于FDT信息丢失,因此使用第一个观测时间戳作为这两个比较方法的FDT。

我们仍然以缺失的35%为例。使用这种情况下的训练数据来估计退化模型。三种方法的RUL预测结果如图12所示。需要说明的是,10个测试单元的时间尺度均按RUL尺度对齐,便于比较。很明显,我们的方法在三个竞争者中获得了最准确的预测结果。随着观测值的积累,其预测结果逐渐收敛于实际RUL曲线。相反,其他两个比较方法受到退化数据丢失的严重影响。方法2的预测结果在大部分预测过程中与实际值偏差较大,仅在生命周期结束时收敛于实际RUL。这是因为该方法描述的是原始时间尺度下的退化过程。由于FDT的损失,观测到的时间不是实际的退化时间,这在退化建模过程中引入了偏差。方法3在三个方法中表现最差。在10个测试单元中,其预测结果与实际RUL相差甚远。该方法基于时间相关的退化建模框架。它的性能高度依赖于退化时间信息的准确性。然而,每个测试单元的历史数据都是从随机退化水平开始的。由于FDT信息不可用,降低了该方法的退化建模和RUL预测的精度。

 

图12 10个试验单元采用不同方法的RUL预测结果:(a)方法1(提出的方法),(b)方法2,(c)方法3

采用一种常用的预测指标,即累积相对准确度(CRA)[23],对三种方法进行定量比较。为了进一步分析缺失率对RUL预测精度的影响,我们计算了10个测试单元在不同缺失数据百分位数下的CRA得分均值和方差,如图13所示。此外,为了评估所提出的方法在不同数据集下的稳健性,我们进行了三轮交叉验证,每轮选择10个不同的测试单元。从结果可以看出,在每一轮验证中,我们的方法在三个对比方法中获得了最高的平均值和最低的方差,这意味着我们的方法在十个测试单元中给出了最准确可靠的RUL预测。此外,在不同的百分位数下,我们的方法的CAR分数保持在一个稳定的水平,这表明我们的方法对不同的缺失率和不同的测试单元具有鲁棒性。三种方法中排名第二的是方法2,随着缺失百分位数的增加,方法2的CRA均值减小,CRA方差增大。这种现象说明方法2对训练数据的缺失率比较敏感。高的缺失率会降低该方法在模型估计和RUL预测中的性能。方法3获得最差的CRA分数,即CRA的最低平均值和最高方差。方法3作为一种时变退化建模方法,其性能在很大程度上取决于退化时间信息的准确性。由于失去了初始退化阶段,方法3在本案例中获得了最差的RUL预测结果。

图13 三种方法预测RUL的比较:(a)第一轮CRA均值,(b)第2轮CRA均值,(c)第3轮CRA均值,(d)第1轮CRA方差,(e)第2轮CRA方差,(f)第3轮CRA方差

为了分析数据严重缺失时模型预测的准确性和稳定性,我们以训练单元中缺失百分位数最严重的45%为例。我们分析了测试单元中不同缺失百分位数对预测结果准确性的影响。将删除的历史数据长度的百分位数从0%更改为90%,间隔为10%。在裂缝长度为25.2 mm,即数据的中点处,显示了每个单元的相对精度(RA)分数。不同缺失百分位数的测试单元观测结果如图14所示。

图15给出了RA随缺失百分位数从0%增加到90%的箱形图。从结果可以看出,我们提出的方法在0 ~ 60%的缺失百分位数范围内保持了相对稳定和较高的准确率。然而,从缺失百分位数的70%开始,准确率随着缺失百分位数的增长而下降。这是合理的,因为测试单元中大量的历史数据缺失导致观察曲线中非常有限的退化信息。这种限制导致在迭代优化过程中无法优化实际规则的精确位置。

图14 10个试验单元的裂纹扩展数据:(a)缺失百分位数10%的观测值,(b)缺失百分位数50%的观测值,(c)缺失百分位数90%的观测值

图15 裂缝长度为25.2 mm时的RA随历史数据缺失百分位数的变化

5.2 案例研究2:锂离子电池退化数据集

(1)  锂离子电池退化数据集的引入和片段数据的生成
该数据集由麻省理工学院和斯坦福大学发布,包括从商用磷酸锂离子(LFP)/石墨电池收集的数据,标称容量为1.1 Ah,标称电压为3.3 V。将所有电池置于固定温度为30    的腔室中,并在快速充电条件下循环。我们选择标记为“2018-04-12″”的批次来验证我们提出的方法。该批次的所有电池都使用“C1(Q1)−C2”格式定义的两步充电策略进行循环,其中C1和C2为充电电流值,Q1为切换电流时的充电状态(SOC)水平。放电以4.4 A的恒流进行。由于实验程序不当,一些电池在设定的失效阈值之前被终止。我们删除了这批有异常的电池数据,保留了符合实际情况的电池数据。去除异常数据后,剩下的25个单元如图16所示。可以看出,该数据集也是一个典型的截断样本,其中状态观测值在故障阈值水平0.88Ah处被截断,即标称容量的80%。

图16 25台锂离子电池退化数据

这25个单元被分为两组:用于退化模型估计的训练组和用于预测性能评估的测试组。训练组由从数据集中随机选择的20个单元组成。删除的数据长度的百分位数从5%更改为45%,间隔为10%。试验组由剩余的5台机组组成,作为部分退化的在役机组处理。为了模拟片段数据问题,每个测试单元的历史数据从间隔[1.04 Ah, 1.06 Ah]的随机放电容量开始。

(2)  失效单元碎片数据恢复

为了定量分析所提出的方法在数据恢复方面的性能,对每个单元计算恢复的期望值与实际观测值之间的RMSE。图17给出了RMSE的箱形图,缺失的百分位数从5%增加到45%。丢失数据百分比的增加显然与恢复错误的增加有关。这种相关性是合乎逻辑的,因为丢失更多的退化数据会导致关于退化过程的信息更少。

图17 恢复数据随缺失数据百分位数变化的均方根误差

RMSE的最大平均值出现在45%以下,小于40个周期。然而,训练单位的RUL观测扩展到超过400个周期的尺度水平,如图16所示。因此,与实际RUL观测值相比,RMSE值相对较小,这表明我们提出的非参数退化建模方法即使在高丢失率的情况下也能准确地恢复故障单元的丢失数据。

(3)  在役机组RUL预测

为了进行对比,本文还采用案例研究1中介绍的方法1、方法 2、方法 3三种方法对5个试验机组的RUL进行了预测。我们仍然以缺失的35%为例。预测结果如图18所示。与其他两个方法相比,我们的方法获得了最准确的预测结果。随着观测值的积累,我们方法的预测逐渐收敛于实际RUL。相比之下,方法2和方法3受到退化数据丢失的显著影响。在大多数预测过程中,他们的预测结果与实际值偏差很大,只有在接近寿命结束时才收敛到实际RUL,因为由于没有FDT,观察到的时间不是实际的退化时间。FDT信息的缺失降低了这些方法的退化建模和RUL预测的准确性。

图18 五个测试单元使用不同方法的RUL预测结果:(a)方法1(建议方法),(b)方法2,(c)方法3

为了进一步分析缺失率对RUL预测精度的影响,我们计算了5个测试单元在不同缺失数据百分位数下的CRA得分均值和方差,如图19所示。从结果可以看出,我们的方法在三个竞争者中获得了最高的平均值和最低的方差,这意味着我们的方法在五个测试单元中给出了最准确可靠的RUL预测。然而,在这种情况下,我们提出的方法的CRA分数随着缺失百分位数的增加而降低。这是由于训练单元的数量相对较少,并且缺失百分位数的增加导致训练单元中退化信息的丢失。

图19 三种方法RUL预测的比较:(a) CRA得分均值,(b) CAR得分方差

然而,与其他两个方法相比,我们提出的方法在CRA分数上呈现出较小的下降趋势,这表明对于缺失百分位数的增加具有相对更好的稳健性。方法2和方法3的CRA均值随缺失百分位数的增加而减小,方差随缺失百分位数的增加而增大。这一观察结果表明,这些方法对训练数据中缺失的百分位数有响应。较高的缺失百分位数会对这些方法在模型估计和RUL预测中的性能产生不利影响。

6 总结

由于传感器读数的丢失和监控系统的中断,RUL片段数据在工业实践中普遍存在。针对片段数据情况下的数据恢复和RUL预测问题,提出了一种非参数退化建模方法。与常用的随时间变化的退化建模方法相比,该方法的主要新颖之处如下。构建了一个状态相关的退化模型,将RUL表述为依赖于退化状态的函数。由于该模型描述的是RUL时间尺度下的退化过程,因此不需要退化时间信息的可用性。因此,更适合处理退化时间未知的片段数据。此外,对于预测任务,该定义比时间依赖模型更直接,其主要目的是根据状态观测预测未知的RUL在建立状态依赖模型的基础上,提出了一种非参数方法来恢复训练单元的缺失数据并预测在役单元的RUL。RUL预测问题被重新表述为一个优化问题,试图匹配观察到的RUL曲线和估计的RUL曲线。通过两个基准实验数据集,证明了该方法比另一种状态依赖的非参数退化建模方法[26]和最新的时间依赖的退化建模方法[31]更有效地处理碎片数据。本文提出的方法的应用范围不仅限于疲劳裂纹和电池。该方法也可应用于其他工程设备中数据缺失的数据恢复和预测问题,如轴承、齿轮箱等。由于所提出的方法是非参数的,用户在应用过程中不需要对参数进行微调或预先定义模型,便于实际应用。

该方法的一个主要缺点是仍然需要一批训练单元来构建模型的基函数,包括均值函数和FPC函数。然而,积累足够的故障单元用于模型训练通常是不现实的,因为出于安全考虑,大多数工业系统不允许运行到故障状态[32]。当训练单元和测试单元之间的退化轨迹通常不同时,很难在不同的测试单元中保持训练模型的鲁棒性。在没有足够的训练单元的情况下,利用碎片数据进行规则学习的预测是一个棘手的问题。一个自我数据驱动的策略将被应用于增强我们提出的建模框架和处理这个问题。此外,我们的方法仅基于单个变量来建模退化过程,要求该变量真实地反映设备的健康状态。然而,在实际工程中,通过单个变量完全捕获设备的状态信息是具有挑战性的。受文献[33]等多变量退化建模研究的启发,我们将尝试在未来从多变量退化过程的角度扩展我们的非参数建模框架。

编辑:Tian

校核:李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、陈宇航、海洋

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

点击左下角阅读原文,即可在线阅读论文。


来源:故障诊断与python学习
ACTMechanicalSystem振动疲劳非线性旋转机械航空汽车ANSApython海洋声学裂纹理论电机机器人数字孪生人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-12-05
最近编辑:1月前
故障诊断与python学习
硕士 签名征集中
获赞 77粉丝 77文章 155课程 0
点赞
收藏
作者推荐

综述 | 设备状态监测中处理工业数据分布不平衡的重采样技术(下)

本期给大家推荐魏建安教授的设备状态监测中处理工业数据分布不平衡的重采样技术综述(下)。在工业生产中,机器设备大部分时间处于正常运行状态,故障发生的时间极为短暂,导致故障数据稀缺,数据集普遍存在不平衡问题。随着制造业的快速发展,复杂设备的故障数据往往伴随噪声和多重不平衡现象,给故障诊断带来巨大挑战。本文将从数据预处理、特征提取和分类器改进三个方面,系统分析当前不平衡数据分类的主要方法,并探讨这些方法在工业场景中的应用及未来研究方向。论文链接:通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目:Review of resampling techniques for the treatment of imbalanced industrial data classification in equipment condition monitoring论文期刊:Engineering Applications of Artificial Intelligence论文日期:2023年8月论文链接:https://doi.org/10.1016/j.engappai.2023.106911作者:Yage Yuan , Jianan Wei , Haisong Huang机构:Key Laboratory of Advanced Manufacturing Technology, Ministry of Education, Guizhou University, Guiyang, Guizhou 550025, China作者邮箱:gs.ygyuan22@gzu.edu.cnjawei@gau.edu.cnhshuang@gzu.edu.cn作者简介:魏建安,工学博士,贵州大学特聘教授,硕导,贵州省“产业技术创新副总”,研究方向为制造大数据与制造信息系统、航空航天领域关键零部件智能制造与运维、医工领域数据与图像处理等。主持国家级、省部级课题4项;发表相关领域论文近30篇,其中一作或通信发表SCI 1区Top论文8篇、2区论文1篇(综述),单篇最高被引150余次;科学出版社出版工业大数据与智能运维领域学术专著1部;授权国家发明专利3项;担任《航空动力学报》(EI)、《工业工程》、《数据采集与处理》、《中国测试》等领域知名期刊的青年编委;担任中国图学学会(CGS)可视化与认知计算专委会委员、中国图学学会(CGS)青年工作委员会委员、中国机械工程学会(CMES)工业大数据与智能系统分会专委会委员、中国图形图像学会(CSIG)遥感图像专委会委员、中国自动化学会(CAA)动态学习与智能医学专委会(筹)专委会委员、全国材料与器件科学家智库-电子信息材料与器件专家委员会常务委员等学术兼 职。黄海松,工学博士、教授,博士生导师,贵州大学现代制造技术教育部重点实验室常务副主任、贵州省百层次创新人才,贵州省省管专家,贵州省科技拔尖人才、重庆市“巴渝学者讲座教授”,中国机械工程学会工业大数据与智能系统分会专委会委员、中国计算机学会工业控制专委会委员、《计算机集成制造系统》理事会理事、中国图学学会数字孪生专委会委员,以第一完成人或者主要完成人获得省部级科技进步奖一、二、三等奖励5项。目录1 摘要2 引言3 复杂不平衡数据的特性分析3.1 小样本不平衡下的噪声3.2 小样本下的类内类间不平衡3.3 小样本下的多类不平衡3.4 时间序列下的小样本4 不平衡数据分类方法及其在工业不平衡数据处理中的应用4.1 重采样技术 4.1.1 欠采样技术 4.1.2 过采样技术 4.1.3 混合采样技术4.2 生成对抗网络4.3 特征选取4.4 分类器改进 4.4.1 代价敏感法 4.4.2 单类学习法 4.4.3 集成学习法5 重采样技术在工业不平衡数据处理中的应用6 工业不平衡异常监测中的困难和挑战问题7 总结8 附录(以上标记章节为本文内容)1 摘要在实际工业场景中,机器大多数时间都处于正常工作状态,而故障状态下的时间则非常短。因此,收集到的故障数据非常有限,这导致了故障诊断数据集的不平衡,故障样本的数量远少于正常样本。此外,随着制造业的快速发展,机器设备变得越来越复杂,这使得收集的故障数据中存在噪声、类重叠、类内和类间不平衡、多类不平衡以及时间序列不平衡等问题。因此,解决这些问题已成为故障诊断领域的研究热点和难点,并出现了许多解决方法。本文将从数据预处理、特征提取以及分类器改进三个方面进行全面梳理。同时,还描述了不平衡数据分类方法在工业场景中的应用。最后,总结了不平衡数据分类研究领域面临的挑战,并提出了未来可能的研究方向。 关键词:故障诊断;不平衡分类问题;小样本问题;重采样技术2 重采样技术在工业不平衡数据处理中的应用随着科技的快速发展以及生产实际的要求提升,各种机械设备的结构变得越发复杂以适应各种复杂恶劣工况。在这种环境下,机械系统关键零部件由于各种内因(如,自身磨损等因素)或者外因(如,高温高压、超大载荷、外部冲击等因素)的共同作用下,其性能以及健康状态会逐渐发生退化,甚至最终完全失效。一旦机械系统关键零部件发生异常,轻则影响产品质量、设备停产,重则造成人员伤亡等无法挽回的重大安全事故。因此,对机械设备(系统)关键零部件进行预测性维护研究的意义重大。如图16所示,机械设备的故障诊断是一个数据采集、特征提取加模式识别的过程,即,人们利用部署在机械设备上的力学、温度、振动、加速度等传感器,采集关键零部件的状态信息,然后,对其进行手动或者自动特征提取,最后,将特征空间数据输入数据分类、回归模型,继而,实现关键零部件的故障预测以及寿命预测,为决策者制定维护策略提供重要的支撑。图16 机械设备故障诊断流程目前,基于上述三种层面上的不均衡数据处理算法在实际工业场景中的应用仍然相对较少,尤其是在深度学习领域的研究[179]–[181]。这主要是因为大多数机械设备状态监测和预测研究都假设数据是均衡的[182]–[187]。然而,实际工业中的设备状态监测、诊断和预测通常面临典型的不均衡分类问题。表3 重采样技术在工业故障诊断中的应用值得庆幸的是,近年来,部分研究人员已经将注意力转向不均衡数据处理,尤其是在重采样技术领域取得了一些有价值的成果。表3展示了不同重采样方法在工业场景中的应用。2014年,Karabadji等人[188]结合特征选择和数据采样技术,解决了决策树构建过程中的过拟合及复杂性问题,并将其应用于旋转机械故障诊断。2017年,Xu等人[189]提出了一种新的污水处理厂数据不平衡预处理方法,通过快速相关向量机(Fast RVM)减少多数类样本,并使用SMOTE方法合成少数类样本。Prusty等人[190]在SMOTE基础上改进,提出了加权过采样方法(WSMOTE),根据特定少数数据样本与其他少数类样本的欧几里德距离分配权重,最终应用于钠冷快堆中。2018年,为了提高水下推进器健康诊断的分类精度,Chan等人[191]提出了改进的ADASYN方法,使用余弦相似性代替欧几里德距离寻找最近邻,并避免了噪声样本过采样和对远离大多数样本的重要点不采样等复杂情况。新加坡国立大学的Mathew等人[192]提出了一种基于多类SVM的高压电动机电气故障诊断方法,使用加权核的SMOTE过采样技术(WK-SMOTE)来均衡诊断数据集。Zhang等人[178]针对旋转机械中的数据不平衡问题,提出了三阶段故障诊断方法:首先使用加权过采样技术(WMO)合成少数类样本;其次利用深度自动编码器自动选择有用特征;最后使用C4.5决策树识别学习的特征。2019年,Fan等人[193]将主成分分析(PCA)、SMOTE及支持向量机等技术结合,用于离心式冷却故障检测和诊断的知识迁移至螺杆式冷却器。北京邮电大学的Wu等人[194]提出了一种新型加权过采样技术(基于期望最大化(EM)的局部加权少数类过采样技术)与基准回归、分类算法结合的故障预测与诊断方法,并在风力发电机冻结故障预测及工业设备故障监测中取得了较好结果。南京航空航天大学的Chen等人[195]开发了一种基于ROS的随机离散时间序列深度卷积神经网络方法,以及具有多个SDCNN的渐进方法,提高了航空电子设备在数据不均衡状态下的诊断性能。2020年,北京航空航天大学的Shi等人[196]提出了一种基于线性判别分析和使用灰狼优化算法调整阈值的新型欠采样技术,并将其与支持向量机结合,用于自动驾驶汽车转向执行器的故障诊断,取得了良好效果。2021年,Zhou等人[197]提出了一种主成分分析-合成少数类过采样技术,以解决可变制冷剂流量系统故障检测中的数据不平衡问题。由于SMOTE及其改进方法在合成样本时未考虑少数类样本与邻居样本之间的相对混乱水平,Zhou等人[198]提出了一个通用框架,通过计算待插入样本与其邻居样本之间的混乱水平确定合成样本的位置,再利用SMOTE及其变体进行合成,并在水流预测数据集中验证了其性能。Lopes等人[199]使用SMOTE方法丰富数据集,然后利用深度神经网络分类器对电力变压器进行早期故障诊断。Chen等人[200]为解决数据不平衡条件下人工智能诊断方法泛化能力受影响的问题,提出了一种密度加权少数过采样技术,并将其应用于高压短路器的故障诊断。华东理工大学和同济大学的Yi等人[201]提出了一种少数样本聚类SMOTE算法以提升不均衡分类性能,风力涡轮机叶片结冰的实验结果表明其优于经典SMOTE算法。2022年,Xing等人[37]提出了一种数据重采样与集成学习算法相结合的方法,解决了轨道电路故障诊断任务中监测数据类别不平衡导致的决策边界偏移以及数据量巨大导致训练速度慢的问题。Swana等人[202]将SMOTE与Tomek Link方法结合,以解决旋转电机故障诊断中的数据不平衡问题。Liu等人[203]将基于聚类的欠采样技术与深度Siamese自注意力网络相结合,通过聚类减少正常训练样本的数量,增强故障特征的提取能力,从而解决传统深度神经网络在故障诊断中漏诊率高的问题,并在燃气轮机的实际数据中验证了其性能。针对变压器故障样本类别不平衡及模型诊断精度低的问题,Liu等人[204]首先使用自适应综合过采样技术增加多数类样本,然后通过深度置信网络对平衡后的样本进行特征提取,最后将特征向量输入到XGBoost进行故障诊断。生成对抗网络(GAN)作为一种创新的过采样技术,因其强大的生成能力在解决工业场景中的不均衡分类问题中得到了广泛应用。为应对非平稳工况下行星齿轮数据易受噪声干扰及早期故障特征提取困难的问题,Wang等人[205]提出了一种结合GAN和堆叠降噪自编码器(SDAE)的新型故障诊断方法。该方法利用GAN的生成器从行星齿轮箱振动信号中生成与原始样本分布相似的新样本,并将生成的样本与原始样本一同输入到鉴别器中。SDAE作为GAN的判别器,能够自动提取有效的故障特征并判断样本的真实性及故障类别。通过对抗性学习机制,优化生成器和判别器的性能,以提升生成样本的质量和故障模式分类能力。Yan等人[206]提出了一种基于变分自编码器(VAE)和梯度惩罚的条件Wasserstein GAN(CWGAN-GP-VAE)框架,用于生成合成训练样本,从而丰富基于机器学习的故障诊断方法的训练数据集,并应用于冷水机组的故障诊断。针对训练数据稀少和标签信息不足时传统模型失效的问题,He等人[207]提出了一种基于深度卷积生成对抗网络(DCGAN)的轴向柱塞泵智能故障诊断方法。该方法首先使用连续小波变换(CWT)增强故障特征,并通过DCGAN扩展数据集。接着,根据标记样本的数量,使用DCGAN和半监督GAN(SGAN)提取图像域的深层特征,并利用聚类算法对提取的特征进行分类,实现轴向柱塞泵轴承的故障诊断。随着环境问题和绿色能源需求的增加,风电场已成为全球可再生能源的重要来源之一。针对风机电组中样本不足和数据不平衡的问题,Liu等人[208]提出了一种基于条件变分生成对抗网络(CVAE-GAN)的迁移学习方法。Zhang等人[209]在此基础上利用CVAE-GAN模型结合多源信号融合进行多类风力涡轮机轴承故障诊断。该方法将多源一维振动信号转换为二维信号,并通过小波变换进行融合。CVAE-GAN模型结合了变分自动编码器(VAE)与生成对抗网络(GAN),引入VAE编码器作为GAN生成器的前端,并将样本标签作为模型输入,以提高训练效率。最终,这些样本用于训练CVAE-GAN模型中的编码器、生成器和判别器,从而补充故障样本的数量。最近,Du等人[210]提出了一种基于深度学习的生成对抗网络与增量学习支持向量机(SVM)模型相结合的方法,用于诊断数据中心空调系统的常见故障。不均衡数据处理在实际工业场景下的故障诊断中具有重要价值,其好处包括以下几个方面:1. 提高故障检测率:在工业领域中,少数类别通常代表故障或异常情况,而多数类别则代表正常操作或状态。通过处理不平衡数据,可以改善故障检测的准确性和灵敏度,使得模型更容易捕捉到潜在的故障信号,从而提高故障检测率。2. 减少误报率:处理不平衡数据可以降低模型对正常样本的误报率。由于正常样本在不平衡数据集中数量较多,模型容易将正常样本错误地分类为异常或故障,导致误报。通过采用合适的算法和策略,可以降低误报率,提高故障诊断的可靠性。3. 提高故障分类准确性:不平衡数据处理方法可以帮助提高故障分类的准确性。通过平衡数据集中各个类别的样本数量,使得模型更加关注少数类别的特征和模式,从而提高对故障类别的分类准确性。这有助于工程师或技术人员更准确地识别和解决实际工业场景中的故障问题。4. 提高预防性维护效果:处理不平衡数据有助于发现隐藏在数据中的潜在故障模式和趋势。通过分析和识别少数类别的故障样本,可以预测和预防未来的故障事件。这使得预防性维护更加精确和高效,有助于提高设备的可靠性和生产效率。重采样技术能够有效地改善不均衡数据带来的问题,提高机械设备故障诊断的准确性和可靠性。然而,尽管重采样技术在工业故障诊断中有一定的应用优势,但也存在一些缺陷和不足之处,包括:1. 数据失真:重采样技术可能导致数据的失真或过度修改,从而改变原始数据的分布和特征。这可能会影响模型的泛化能力,并导致对新样本的预测效果下降。2. 过拟合和欠拟合:不恰当的重采样方法可能导致模型过拟合或欠拟合。过拟合指模型过度学习训练数据的细节和噪音,导致在新数据上表现不佳。欠拟合则表示模型未能充分捕捉数据的特征和模式,导致预测能力不足。3. 信息丢失:在一些重采样技术中,由于减少了少数类样本或增加了多数类样本,可能会导致少数类样本中的重要信息丢失或被稀释。这可能导致对少数类故障情况的识别能力下降。4. 样本不平衡变化:重采样技术可能会改变数据集的样本分布,使得在训练和测试阶段的数据分布不一致。这可能导致在实际应用中的效果与实验结果存在一定差异。5. 处理时间和计算复杂性:某些重采样技术可能需要较长的处理时间和计算复杂性,特别是在处理大规模数据集时。这可能会限制其在实时或高效的工业环境中的应用。因此,为了弥补重采样技术的缺陷,许多研究人员将重采样与特征提取、分类器改进方法结合使用[178],代表性成果如下:表4 故障诊断的各种方法3 工业不平衡异常监测中的困难和挑战问题基于上述分析,我们认为在处理这四种问题时,未来工业不平衡监测和数据处理领域的研究重点应包括以下几个方面:(1)小样本异质不平衡故障监测数据建模问题:在工业监测中,关键组件(如轴承和其他高端设备)的服务条件具有复杂性和变异性。收集环境恶劣,传感器种类繁多且各异。因此,收集到的运行和维护数据表现出混合特性,包括噪声不平衡、类内不平衡、多类不平衡和时间序列不平衡。在这种条件下开发高端设备的故障监测模型面临重大挑战。然而,大多数现有研究仅关注上述挑战问题中的一个或少数几个问题,未探讨这些异质特征之间的内在影响机制。因此,均衡处理的有效性受到限制,存在盲点。此外,从有限样本中提取有意义信息的能力也受到制约。因此,全面理解不同异质特征之间的相互作用,并充分利用异质小样本数据集中的故障样本信息,是工业故障监测领域的一个重要研究方向。(2)动态不平衡操作和维护(O&M)数据处理协同模型调整问题:智能操作和维护高端设备的数字孪生过程正在快速推进,使其更接近实际工程场景,并要求高度准确的监测模型。在数字孪生背景下,工业不平衡故障预测建模面临新的挑战——动态不平衡操作和维护数据处理的协同校正。在这个阶段,需要不仅考虑操作和维护数据的异质特征,还需要准确感知因工作条件和环境因素变化而导致的数据变化。因此,需要相应地调整采样平衡方法。此外,操作和维护数据的时间特征变得尤为突出,常常表现出特征不平衡。因此,故障特征的提取、组合和校正成为新的挑战。因此,建立“工作条件 - 故障特征提取- 异质形式”之间的清晰映射关系,采用无监督和高效的故障特征提取方法,以准确感知操作和维护数据中的实时异质和不平衡变化,同时持续校正采样平衡模型,是至关重要的任务。(3)不平衡异常检测模型的可解释性和可信度问题:基于深度学习的工业异常检测方法缺乏可解释性,被认为是黑箱,因此无法从根本上解释故障或异常的“为什么”。此外,这些方法基于大规模数据,可能与高端设备的实际运行条件不匹配。另一方面,传统的基于机器学习的工业异常检测方法在分类模型方面具有更强的可解释性。然而,由于对特征提取的人工专业知识的高度依赖,它们可能无法捕捉故障数据中的隐含特征,从而影响模型的可靠性。因此,不平衡异常检测模型的可解释性和可信度问题可能成为新的挑战。因此,以不平衡故障检测为例,提升跨领域和工作条件下故障检测模型的可解释性和可信度,考虑故障机制、物理模型和数据模型等方面,涉及故障机制的可解释性、特征提取的可解释性、采样的可解释性、分类模型的可解释性以及多模型集成决策的可信度等方面。这种综合和系统化的方法是一个具有挑战性的问题。(4)解决极端不平衡问题的协同评估方法:由于一些异常数据难以收集,有时无法获得有用数据,导致从高端设备长期运行中积累了大量正常数据。这两个因素共同导致在大数据背景下的零样本学习问题,这对工业异常检测至关重要。这是因为传统的基于人工智能的监测方法假设可以提前获得异常数据,且训练和监测数据应属于相同分布。此外,缺乏异常样本用于模型评估也是有害的。因此,处理工业数据中极端不平衡问题的协同评估方法面临新的挑战。因此,探索如何在工业故障检测中获得高端设备关键组件的故障机制模型,生成足够的异常状态数据,利用迁移学习获取源领域模型,并研究适当的评估方案进行不平衡异常检测,具有重要意义。(5)高端设备异常机制、物理模型和数据模型的协同研究:以故障监测为例,单一的故障机制模型可能不适用于复杂多样的工作条件。同样,单一的数据模型的可解释性和可信度也可能得不到保障,特别是在处理异质和不平衡的操作与维护数据时。因此,未来我们认为高端设备的“故障机制-物理模型-数据模型”协同研究是至关重要的。这项研究应致力于开发能够适应跨领域和跨工作条件场景的机制模型和物理模型,以及用于异质和不平衡故障分类的诊断模型。只有通过这些方面的协调与整合,我们才能从根本上解决极端不平衡工业异常监测中的挑战。4 总结制造业中机器和设备的复杂性给故障数据收集带来了新的挑战,包括噪声、类内不平衡、多类不平衡和时间序列不平衡。本研究全面总结了这些挑战,并强调了它们在故障诊断领域的重要性,同时介绍了针对这些问题的众多解决方案,重点关注数据预处理、特征提取和分类器改进。此外,本文提供了这些解决方案的综合概述,包括纯重采样技术以及将重采样算法与特征提取和分类器改进相结合的采样技术,特别是针对工业场景设计的技术。基于对当前不平衡分类方法局限性的分析,我们总结了工业不平衡异常检测中的挑战和困难。这些挑战包括小样本异质和不平衡故障监测数据建模的难度、动态变化的操作和维护数据处理、确保不平衡异常检测模型的可解释性和可信度,以及开发协同评估方法以应对极端不平衡场景。基于这些挑战,我们提出了未来工业高端设备异常检测的宝贵研究方向。这些研究方向旨在通过探索迁移学习与特征工程的融合、解决数据异质性、改进评估方法、增强模型协作与校正能力,并深入理解高端设备中的异常机制,以应对挑战并提高异常检测的有效性。这些研究努力旨在推动该领域的发展,为工业高端设备的异常检测提供准确可靠的支持。总之,通过对设备故障诊断中不平衡数据所带来的问题和挑战进行详细分析和描述,读者可以获得全面的理解,并深入研究这一领域。5 附录1)TTWD车刀磨损数据集 TTWD数据集是我们课题组自己采集的数据,以AISI 201高强度不锈钢棒料的切削过程为验证实例,其中,加工对象的长度为200mm,直径为80mm的圆柱棒料;车削刀具为硬质合金刀具,材料为M30,AlTiN涂层厚度为5μm。实验车床采用重庆二机生产的C2-6136HK数控车床,切削速度为Vc=120 m/min,进给速度为f=0.15 mm/r,切削深度为ap=1.5 mm,机床主轴转速为500rmp。另外,利用DASP-V11振动信号采集仪来采集刀具车削时的X、Y、Z轴的三个方向上的振动信号,采样频率为4016Hz。实验以车刀车削棒料走完一刀为一组数据,并取下刀具,利用显微观测刀具副后刀面的最大磨损值VBmax,重复实验直至刀具达到磨钝,记录刀具的全生命周期。切削实例共进行200次循环,工件表面粗糙度已经不能符合加工工艺的要求,且刀具副后刀面最大磨损值(VBmax)已达250μm,故此时刀具已经到达最大使用寿命,停止采集数据。其实验装置如图17所示。数据集获取可通过以下链接:Mad Net (mad-net.cn) 图17 TTWD刀具全生命周期故障实验 2)IMS轴承数据集 IMS轴承数据由辛辛那提大学的智能维护系统中心提供,其实验装置如图18所示。IMS数据集(采样率20KHz,轴转速2000 rpm,径向载荷6000 lbs)描述了3种不同的“测试至失败”的全生命周期实验,最后系统内的轴承具有内圈故障、滚动体故障或内圈故障等失效形式。具体地,在第1组实验结束时(2003.10.22 12:06:24~2003.11.2523:39:56),轴承3的内圈和轴承4的滚动体被破坏。在第3组实验结束时(2004.03.04 09:27:46~2004.04.1802:42: 55),轴承3的外圈被破坏。数据集获取可通过以下链接:https://www.kaggle.com/datasets/vinayak123tyagi/bearing-dataset 图18 IMS轴承全生命周期故障实验 3)PHM 2010铣刀磨损数据集 PHM 2010铣刀数据由美国纽约PHM学会提供,其实验装置如图19所示。铣削试验重复进行6次全生命周期试验。端面铣削材料为正方形,每次走刀端面铣的长度为108mm且走刀时间相等,每次走刀后测量后刀面磨损量。该数据集收集了3向铣削力信号、3向铣削振动信号以及声发射均方根值,但仅有C1、C4、C6提供了磨损值标签。数据集获取可通过以下链接:https://www.kaggle.com/datasets/rabahba/phm-data-challenge-2010 图19 PHM 2010铣刀全生命周期磨损实验 4)CWRU轴承数据集 CWRU轴承数据源于美国凯斯西储大学电气工程实验室,如图20所示,CWRU轴承数据是通过安装在感应电机输出轴的支撑轴承上端机壳上的振动加速度传感器(采样频率为12KHz,时长1s)收集的,其包含4种情况下的振动状态:正常状态(Normal);内圈发生故障状态(Inner);外圈发生故障状态(Ball);滚动体发生故障状态(Outer)。且每种故障包含3种故障程度,即:轻度损伤(故障尺寸为0.1778mm);中度损伤(故障尺寸为0.3556mm);重度损伤(故障尺寸为0.5334mm)。数据集获取可通过以下方式:https://www.kaggle.com/datasets/javadseraj/cwru-bearing-fault-data-set 图20 CWRU轴承故障实验 编辑:李正平校核:陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈