SCI一区开源代码推荐 | 基于张量表示的机器RUL可迁移性分析和选择性迁移学习

9月前浏览9181

本篇研究论文是针对数据分布和故障演化特征差异很大的不同机器的剩余寿命预测问题，提出了新的选择性迁移学习方法，用于跨机器的剩余寿命预测。适合于迁移学习、剩余寿命预测研究领域者学习者。

代码链接：https://github.com/unikz22/Selective-transfer-learning-based-on-tensor-representation

1 论文基本信息

论文题目：Tensor Representation-based Transferability Analytics and Selective Transfer Learning of Prognostic Knowledge for Remaining Useful Life Prediction Across Machines

论文期刊：Reliability Engineering and System ,Safety

论文时间：February 2024

作者：Wentao Mao(a,b) , Wen Zhang(a), Ke Feng(c,*), Michael Beer(d,e,f) and Chunsheng Yang(g)

机构:

(a)School of Computer and Information Engineering, Henan Normal University, Xinxiang, China, Xinxiang, 453007, China

(b)Engineering Lab of Intelligence Business & Internet of Things of Henan Province, Xinxiang, 453007, China

(c)Department of Industrial Systems Engineering and Management, National University of Singapore, 117576, Singapore

(d)Institute for Risk and Reliability, Leibniz University Hannover, Callinstr. 34, Hannover, 30167, Germany

(e)Institute for Risk and Uncertainty, University of Liverpool, Peach Street, Liverpool, L69 7ZF, United Kingdom

(f)Department of Civil Engineering, Tsinghua University, Beijing, 100190, China

(g)Institute of Artificia lIntelligence ,Guangzho uUniversity ,Guangzhou ,510006 ,China

2 摘要

近年来，深度迁移学习技术已成功应用于解决不同工作条件下的剩余寿命预测（Remaining Useful Life Prediction，RUL）问题。然而，对于数据分布和故障演化特征差异很大的不同机器的RUL预测，预测知识的提取和迁移变得更具挑战性。即使故障模式信息有助于知识迁移，在具有复合或未知故障的目标机器上也不可避免地存在模型偏差。为了从可迁移性的角度解决这个问题，本文提出了一种新的选择性迁移学习方法，用于跨机器的RUL预测。首先，本文利用张量表示来构建每个故障模式的元退化趋势，并通过一个新的跨机器迁移度指标（Machine Transfer Degree Indicator，M-TDI）来评估源域数据从故障模式和退化特征的可迁移性。其次，利用M-TDI提出了一种基于长短期记忆（Long Short-Term Memory，LSTM）的选择性迁移策略。本文设计了一种具有交替优化方案的训练算法，以寻求最优张量分解和知识迁移效果。理论分析表明，该方法显著降低了预测误差的上限。此外，在三个基准数据集上的实验结果证明了该方法的有效性。

关键词：剩余使用寿命预测；迁移学习；可迁移性分析；张量分解

3 目录

1 论文基本信息

2 摘要

3 目录

4 引言

5 方法框架

6 实验验证

6.1 实验设置

6.2 验证结果

6.3 实验对比

7 结论

注：本文只选中原论文部分进行简要分享，若想拜读，请下载原论文进行细读。

4 引言

机器故障时间的评估，即剩余使用寿命（RUL），一直是预测和健康管理领域的一个引人注目的研究课题[1]。在过去的十年里，随着机器学习的快速发展，各种算法被用于模型构建，包括浅层模型，如支持向量机（SVM）[2]、高斯过程回归（GPR）[1]，以及深度神经网络，如深度信念网（DBN）[3]、长短期记忆（LSTM）[4]和卷积神经网络（CNN）[5]。

最近，已经引入了迁移学习技术来解决不同工作条件下的RUL预测问题，也称为RUL迁移预测[6,7]。有关详细调查，请参阅第2节。为了评估源域数据中的预测知识对目标域任务的益处，可迁移性正成为RUL迁移预测中的一个关键问题。然而，与故障诊断不同，RUL预测的可迁移性分析有着独特的要求。具体而言，时间退化特征比判别特征更显著，在提取预测知识时，应减少退化过程中随机性的负面影响。现有方法[5,7]，假设具有相同制造规格的机器在不同的工作条件下运行时具有相似的退化过程。这一假设带来了更大的挑战，因为与不同工作条件下的退化特性相比，退化特性存在更大的差异。例如，对于像盾构机或高速列车这样的复杂机器，收集实际的运行故障数据并不容易。制造商通常在工厂或实验室收集测试机器的全寿命数据，以评估性能。然而，由于测试机器在边界条件和模型方面是对真实世界机器的简化，因此它们的退化过程可能在数据规模和退化特性方面存在显著差异。因此，评估不同机器之间的可迁移性正成为一个重要的问题。

尽管之前的一些论文[8,9]试图通过从监测数据中获得退化特征（如几何形状和趋势）来解决这个问题，但他们没有考虑固有的退化机制，如故障模式信息。如图1(a)所示，不同的故障模式可能具有相似的分级趋势，但它们的基本预测知识会有所不同。此外，这是利用故障模式信息来改进RUL预测的研究[10]，但它不适用于目标机器可能具有混合或未知故障模式的机器之间的RUL预测。此外，由于工作条件的改变，相同的故障模式可能导致形状明显不同的退化过程，如图1(b)所示。因此，仅使用故障模式作为可迁移性度量可能导致负迁移，从而导致知识迁移的偏差。

图1 不同机器之间的RUL迁移预测示意图，其中(a)和(b)分别是具有相似形状但不同故障模式和具有相同故障模式但不同形状的退化过程；(c) 是本文提出的选择性知识迁移的示意图。本文以XJTU-SY滚动轴承数据集为例。

基于上述分析，RUL跨机器迁移预测的主要挑战可以概括为：

1）如何评估分布差异较大的数据的可迁移性；

2）当目标机器的故障模式未知时，如何建立知识迁移通道。

为了应对这些挑战，本文从退化特性和故障模式两个方面对其可迁移性进行了评估。然后构建一个选择性迁移学习模型，使用可迁移性分析来迁移预测知识，如图1(c)所示。

具体地，引入张量表示技术来促进可迁移性分析。张量-塔克分解能够从原始数据中提取固有信息，这有助于表示每个故障模式的共同退化趋势，以元退化趋势命名。还可以计算两个域的退化序列之间的几何结构和趋势相似性，以评估可迁移性。所提出的选择性迁移学习模型使用加权初始化和自适应冻结来自适应地迁移预测知识。理论分析表明，该模型可以显著降低目标任务预测误差的上限。

为了验证我们的方法，以滚动轴承为测试对象，使用三个基准数据集设置了一系列跨机器预测任务：XJTU-SY轴承数据集、IEEE PHMChallenge 2012轴承数据集（简称PHM）和新南威尔士大学轴承数据集（简称UNSW）。这三个数据集都是运行到失效的实验，其中提供了XJTU-SY和UNSW中的故障模式，而PHM中的故障模型是未知的。实验结果证明了所提出的可迁移性度量的合理性和所提出的方法的有效性。我们方法的实现代码可以在GitHub上找到(https://github.com/unikz22/Selective-transfer-learning-based-on-tensor-representation)。

本研究工作的主要新颖性和贡献可概括如下：

本文介绍了一种新的度量M-TDI，用于评估基于张量表示的RUL预测的可迁移性。与现有方法不同，M-TDI在交替优化的背景下对预测知识的相关性进行了动态评估。值得注意的是，该度量在处理退化随机性方面表现出稳健的性能。据我们所知，这是在RUL预测领域内探索可迁移性分析的开创性工作。

本文介绍了一种预测不同机器间RUL迁移的创新方法。利用可迁移性评估，所提出的方法可以有效地迁移知识，尽管数据分布存在显著差异。值得注意的是，即使在面对目标机器的故障模式不存在的情况时，这种方法也表现出色，突出了其在实际应用和部署中的巨大潜力。

本文为所提出的方法建立了预测误差的上限。这个上限是该方法将提高RUL迁移学习可靠性的理论保证。此外，这一界限为具有微调的回归迁移学习背后的原理提供了有力的支持。据我们所知，本研究对RUL迁移学习的可靠性进行理论分析的初步尝试。

5 方法框架

目前对RUL预测的研究存在几个局限性。

首先，大多数方法无法处理不同机器之间的显著分布差异，并且它们在目标域中也缺乏故障模式信息。

其次，目前的可迁移性分析方法主要关注特征相似性、分布对齐和参数显著性，但它们并不足以表示特定迁移学习任务所要迁移的领域知识。

最后，在没有与预测任务联合分析的情况下，独立评估可迁移性，这可能导致知识迁移有偏差，降低迁移的可靠性。

本文试图从理论和实践两个方面来解决这些局限性。

从理论上讲，本文利用张量优化来寻找本质的退化信息和有效的迁移通道，这可以建立一种新的可迁移性分析研究范式，即将静态可迁移性度量转换为动态可迁移性，然后用预测任务对其进行优化。

从实践角度来看，本文设计了一种选择性迁移策略，即使目标任务中的故障模式信息不可用，该策略也有助于评估数据分布差异较大的RUL值。

本节所提出的一种新的跨不同机器的RUL迁移预测方法，如图2所示。该方法由三部分组成：

(1) 基于张量表示的元退化趋势提取；

(2) 基于故障模式和退化特征构建可迁移性度量；

(3) 选择性迁移学习网络与基于交替优化的训练算法。

图2 拟提出方法的流程图

注：相关方法理论、训练算法和公式推导细节过程大家可获取原文仔细阅读。

6 实验验证

选择滚动轴承作为验证对象，在PHM、XJTU-SY和UNSW三个基准数据集上进行了实验验证。编程环境为Matlab2014a和Python3.7，计算机配置i7-4790处理器和16G内存。

6.1 实验设置

图3 本文中使用的试验台，(a)用于PHM数据集的PRONOTIA平台[31]，(b)XJTU-SY平台[32]，(c)UNSW数据集平台[33]

图3显示了滚动轴承运行到失效实验的三个数据集的测试平台。

PHM数据集包含三种工况，电机转速分别为1800rpm、1650rpm和1500rpm，负载分别为4000N、4200N和5000N。采样频率为25.6kHz，采样间隔为10秒。

XJTU-SY数据集还包含三种工况，电机转速分别为2100 rpm、2250 rpm、2400 rpm，负载分别为12kN、11kN和10kN。采样频率为25.6k Hz，采样间隔为1分钟。

UNSW数据集包含四个轴承，这些轴承进行了从运行至失效实验，命名为测试1-4。电机转速为6000转/分。在试验1和试验3-4中，在试验轴承上施加10.5kN的径向载荷，在试验2中，载荷为7kN。采样频率为51.2kHz。采样间隔在初始阶段设置为50000个循环，当剥落开始增加，采样间隔减少到20000个循环。

表1 不同数据集的RUL迁移预测的任务设置轴承名称中的第一个数字表示工况，第二个数字表示索引

PHM数据集中的故障模式是未知的，而XJTU-SY和UNSW数据集中的故障模式已经给出。因此，通过将XJTU-SY数据集设置为源域，将PHM和UNSW数据集分别设置为目标域，构建了两组跨机器的迁移预测任务。

如表1所示，PHM数据集中的两个轴承（B2_1和B2_2）被随机选择作为测试轴承，交替构建两个特定的任务。值得注意的是，只有快速退化数据用于模型训练。任务1中的目标轴承B2_2和B2_6分别具有55个和18个处于快速退化状态的样本。在任务2中，目标轴承B2_1具有41个样本用于模型训练。尽管轴承B2_1、B2_2和B2_6可能具有不同的分布，但它们仍然在相同的工作条件下运行，并且它们的退化特性具有较小的发散性。与第二工况下的其他轴承相比，轴承B2_1和B2_2都具有更长的退化过程。因此，将这两个轴承分别设置为任务1和任务2中的目标轴承，有望提高更好的可视化效果。

通过参考文献[34]中的状态评估方法，可以首先确定早期故障发生的位置。然后可以选择快速退化数据进行训练。在参考文献[15,34]的基础上，我们对每个轴承的早期故障位置到结束点之间的时期进行线性归一化，使其在1到0的比例范围内，作为剩余使用寿命（RUL）的标签。具体的故障结束点可以通过不同的阈值确定。例如，在XJTU-SY数据集中，终止条件被设定为10Ah [32]。其中Ah是正常状态下的最高振幅。对于所有数据，对原始信号进行希尔伯特-黄变换（HHT）[35]，以计算边缘谱：

。HHT特征尺寸设定为2558。HHT特征最初被输入DAE编码器，DAE编码器的结构设置为2558、1024、512、128、50。然后张量-塔克分解。对50维隐藏特征进行分解，得到具有3阶和25维特征的核心张量。核心张量被进一步馈送到LSTM网络中，LSTM网络的隐藏神经元数被设置为100，学习率被设置为0.001。对于表1中列出的测试轴承，我们还确定了退化状态的起点，并在退化期对原始信号进行HHT，以获得测试样本。然后将具有HHT特征的测试样本输入到经过训练的预测模型中，以预测其RUL值。

6.2 验证结果

图4 (a)任务1和(b)任务2冻结不同层的RUL预测结果

图5 冻结不同层的损失下降方框图，其中(a)-(d)在任务1上，(e)-(h)在任务2上。

任务1和任务2主要用于验证和性能评估。图4和图5显示了不同冻结层的RUL预测结果和损失下降的方框图。根据T-Weight值（见图8），建议冻结两个任务的两个或更多层。从图4中可以看出，冻结两层的结果要好于冻结不同层的结果。从图5中可以看出，冻结的收敛速度两层也比其他层快。结果表明，冻结适当的层可以提高迁移预测性能。结果也证明了自适应冻结策略的有效性。

图6 对任务1和任务2的T-Weight的详细计算。由于T-Weight的最大值与最小值之间的差异大于1/4，建议根据式(8)冻结两个或更多层

图7 对应于不同度量的特征分布，其中(a)-(c)在Task1上，(d)-(f)在Task2上

注：下列所提及等式可点击阅读原文跳转进行对应查看。

等式(6)由两部分组成（分子和分母）。分别使用分子和分母设计了两个新的度量（命名为故障概率和退化特性）。图6显示了这三个度量的值，图7显示了相应的特征分布。当仅使用故障模式时，目标域数据被分类为外部竞争故障（任务1为78.11%，任务2为79.08%）。但如果使用退化特征，目标域数据在几何形状和趋势方面与源域中的保持架故障数据更相似。相反，所提出的度量M-TDI，如T-Weight所反映的，可以利用故障模式信息和退化特性，从而提供可迁移性的综合评估。数值结果可以由图7精确反映。当仅使用故障概率时，目标域数据的特征分布接近源域外圈故障数据的分布，如蓝线上的紫色线所示（外圈故障）。在图7(b)和(d)中，紫色线转向绿色线（保持架故障），表明目标域数据在退化特征上与保持架故障数据具有更好的相似性。矛盾的结果与图6中的结果相同。无论使用哪种度量，预测结果都不令人满意。M-TDI（T-Weight）可以在这两个指标之间进行权衡，并促进预测知识的迁移。

图8 消融实验的RUL预测结果，其中(a)在任务1上，(b)在任务2上。

除了式(6)之外，提出的方法还包括张量优化。进行了以下消融实验：

1) 没有张量优化；

2) 没有退化特征的度量；

3) 没有故障概率的度量；

4) 没有M-TDl，即仅使用目标域数据微调预测模型。

消融实验的结果如图8所示。没有张量优化的结果显著减小，这表明高质量的特征表示可以有助于知识迁移。然而，紫色线显示了最差的预测效果，表明需要适当的迁移策略。此外，没有劣化特性的迁移（深绿色线）不能实现良好的性能。这意味着只有传递故障模式信息才会使知识发生偏差。无故障概率的迁移也有类似的效果。相比之下，所提出的方法可以从这两个方面利用可迁移性，并获得有利的迁移效果。

图9 式(9)中不同参数设置对MAE和RMSE的灵敏度，其中(a)-(c)执行任务1，(d)-(f)执行任务2。

进一步检查式(9)中三个关键超参数

,和

的灵敏度。

设置在

上，而

和

分别设置在

和

上。这三个参数用于控制DAE重建误差、源域/目标域LSTM预测误差和张量重建误差之间的权衡。具体来说，这三个参数依次由

，

和

设置，并用另一个参数的不同值测试预测性能。30次重复试验的平均值计算为最终结果，如图9所示。请注意，图9中的曲线不够平滑，这是由噪声引起的。较小的

值会降低初始DAE功能的质量，而较大的可能会导致过拟合。当

和

变大时，该模型倾向于寻求LSTM网络的较低训练误差，相对忽略张量表示的充分性，反之亦然。

和

的比值也可以影响来自源域和目标域的预测知识的重要性。这三个超参数可以通过交叉验证来确定。在我们的实验中，将参数

,和

分别设置为1、0.01和0.1。

图10 不同网络设置对MAE和RMSE预测误差的敏感性评价，其中(a)-(c)为Task1， (d)-(f)为Task2。

还评估了三个关键超参数的灵敏度：学习率α、DAE和LSTM的隐藏特征维度。具体来说，依次对三个参数中的两个进行固定，然后将30次重复试验的平均值计算为最终结果，如图10所示。从子图(a)和(d)中可以看出，除了值太大或太小之外，该模型对学习率不敏感。此外，DAE的隐藏特征维数对预测结果有一定的影响。DAE的维度太小可能会忽略基本信息，而维度太大则会包含冗余信息，这两种信息都会通过张量分解对元退化趋势进行影响。由于随机初始化，图10(b)和(e)不可避免地具有一些功能。对于LSTM的隐藏特征维度，较大的值也会产生冗余信息，而较小的值可能会阻碍提取预测信息。根据图10，在我们的实验中，参数被设置为-0.001，DAE和LSTM的隐藏特征维度，分别为50和100。

图11 任务2的预测结果，其中(a)轴承样本的不同比例，(b)分离的DAE和(c)误差方框图

图12 PHM数据集中目标轴承B2_1的DAE特征(左列)及其第一个主序列(右列)。这里PCA用于一维可视化

表2 任务2的不同比例轴承样本和分离DAE模型的实验设置
试验1的设置与本文中使用的设置相同

为了评估DAE模型偏差的影响，在修订稿中设计了以下两个实验：

1）训练样本的不平衡比例不同；

2）两个领域中分离的DAE模型。

这里只修改了DAE部分，而所提出方法的其余部分保持不变。表2中列出了实验设置。预测结果和相应的DAE特征分别如图11和图12所示。所提出的方法中的DAE模型对不同的样本比例不太敏感。不同样本比例的预测结果是相似的，而目标轴承B21上的特征序列显示出相对相同的退化趋势。这些结果表明DAE模型致力于降维。此外，当用于训练的样本量较小时，模型变得更加不稳定。一旦DAE训练仅使用两个目标轴承(B2_1和B2_6)，MAE误差偏差将达到最大值(见图11(c))。相反，无论是S:T=5:2还是S:T=5:0，误差偏差都要小得多。这一现象表明，该方法中的DAE模型对整个训练数据量的敏感性大于对训练样本不平衡的敏感性。

此外，从图11中，我们观察到，与仅使用一个DAE相比，使用分离的DAE运行可以带来类似但更不稳定的预测结果。更多要优化的DAE模型可能会增加模型的复杂性。

同时，训练分离的DAE会增加额外的计算成本。由于DAE模型只是用于降维，因此所提出的方法更倾向于采用一个DAE模型，而不是使用来自源域和目标域的所有样本直接训练的分离DAE。我们相信，这种设计不会降低目标域中的特征提取和预测性能，同时元退化趋势的提取也不会受到负面影响。

6.3 实验对比

表3 14种经典方法的对比说明

为了进行对比，选择了14种典型的RUL预测方法，如表3所示。方法8-14可以被视为最先进的（SOTA）RUL迁移预测方法。具体而言，方法8-11和13-14被设计用于跨工作条件的预测。方法12是RUL迁移预测的可解释性分析工作，但它仍然测试了机器之间的RUL迁移预测并提供了结果。对于浅层模型的方法（方法4-7），首先采用DAE提取25维特征，并利用交叉验证的网格搜索来确定最优参数。使用50次重复试验的平均值作为最终结果，如图15所示。相应的数值比较如图16和表4所示。这里，选择均方根误差(

)、平均绝对误差

和Score进行性能评估

，其中

和

从表4中可以看出，所提出的方法具有最小的RMSE-MAE和最高的分数。

表4 所有15种方法预测效果的数值结果。RMSE和MAE越低，得分越高，表示预测性能越好。

对于任务1和任务2，由于具有较少代表性能力的特征，方法4-7得到的结果比所提出的方法差得多。对于分布差异较大的数据，将数据映射到同一特征空间以迁移预测知识并不容易。尽管方法1-3采用了能够更好地反映退化特性的深度学习技术，但它们仍然不如所提出的方法。一个有趣的现象是，这三种方法的预测效果与方法8和10-11的预测效果接近。这表明，一旦特征表示足够好，仅仅进行微调或域自适应就不能显著提高预测性能。需要一种更合理的迁移策略，方法9采用了子空间自适应加微调的策略进行了验证。对于方法12-14，它们的结果优于方法8和方法10-11，这表明退化知识的选择性迁移更有利于数据分布差异较大的目标任务。然而，它们的预测性能仍然比我们的差，因为这些方法没有进行全面的信息提取和表示。基于样本显著性的可解释性分析，方法12实现了预测知识的有效迁移，提高了迁移效果。但它的结果仍然比我们的差，因为这种方法没有集成故障模式信息，而故障模式信息对跨机器的RUL预测至关重要。

图13 总共13种方法的RUL预测结果，其中(a)-(c)在任务1上，(d)-(f)在任务2上，(g)-(i)在任务3上

尽管UNSW数据集是在实验室收集的，但它主要涉及模拟真实世界运行条件下的轴承故障（剥落）严重程度评估。同时，与其他数据集相比，其退化过程表现出更多的随机性和噪声干扰。所有方法对任务3的预测性能都明显恶化。在所有14种方法中，只有方法12和方法13两种方法能达到一定的预测效果。其他11种方法都失败了，要么导致大的函数(方法4，9-10)，要么导致明显失真的预测值（方法1-3，5-7，8，11，14）。特别是对于后者，有些方法基本上保持不变或功能较小，这是完全没有意义的。这种比较效应源于数据分布差异大，对复杂退化数据的特征提取较少。方法8和10-11的结果表明，只有微调或域自适应不能处理具有大分布偏差的预测任务。尽管在PHM数据集上表现良好，但方法14仍然得到了更差的结果，这确实让我们感到惊讶。由于方法14利用鉴别器输出来实现加权预测和微调，其迁移策略无法支持复杂退化过程的知识迁移。由于选择性或集成迁移策略，方法12-13的结果优于其他深度迁移学习方法。然而，他们的结果仍然比我们的结果差，因为他们没有集成故障模式信息，这对于跨机器的RUL预测至关重要。相反，所提出的方法不仅分析了源域数据的可迁移性，而且使用可迁移性度量来促进知识迁移。然后可以实现有针对性的知识迁移，以提高迁移学习的效果。合理的可迁移性分析被认为在跨机器的RUL迁移预测中发挥着关键作用。

图14：总共15个方法的RMSE和MAE，其中（a）在Task1上，（b）在Task2上，（c）在Task3上

观察到的性能差异也可以归因于对数据规模的依赖。深度学习方法通常需要大量数据来从退化过程中的噪声和其他随机干扰中提取退化知识。相反，所提出的具有可迁移性分析的知识迁移机制可以显著提高迁移效率，减少对高数据量的需求，其优点如下：

1) 采用核心张量来明确表示退化知识，减少退化过程中的随机干扰；
2) 使用核心张量作为LSTM的输入还可以提高初始特征质量，避免噪声干扰；
3) 所设计的交替优化方案有利于确定最优张量表示和知识迁移效果，避免了特征退化，降低了小规模数据的过拟合风险；
4) 基于M-TDI的迁移策略能够通过选择性冻结和微调有效地迁移预测知识，这进一步避免了对大规模数据的需求。

在这个实验中，一个方位的训练数据只是几十到一千个样本。在这个数据尺度上，我们的方法比其他深度学习方法的预测误差低得多。

我们用错误的故障概率进一步检验了所提出方法的可靠性。在表1中列出的三个任务中，只有任务3（UNSW）在目标域中具有已知的故障模式。因此，我们使用任务3进行验证。通过CNN分类器，我们可以得到目标域数据的故障概率值：0.8313（外圈故障）、0.0293（内圈故障）、0.0545（保持架故障）、0.0849（复合故障），其中分类结果与真实信息保持一致。我们进一步将概率值修改为不正确的值，如表5中所示。预测结果和收敛性能如图15-16所示。以外圈故障为例，图15还说明了T-Weight值的变化。

表5 Task3上不同故障概率的设置。第一次试验Prob1与本文中使用的设置完全相同。真实故障模式是外圈故障。

图15 具有不同故障概率值的Task3上的RUL预测性能，其中(a)和(b)分别是测试轴承Test2上的预测RUL值和相应的预测误差，(c)是训练轴承Test1上外圈故障的T-Weight值。

图16 具有不同故障概率值的任务3的损失下降方框图

显而易见，具有错误故障概率的预测结果比所提出的方法更有偏差，在训练过程中收敛不稳定。然而，与表4相比，它们的预测误差仍然低于其他比较方法（方法1-14）。我们还从图15（c）中观察到一个非常有趣的现象。即使外圈故障的初始概率值设置得很小，相应的T-Weight值仍然可以随着训练而攀升到更高的值。这一结果有效地证明了所提出的方法的自修复能力，或者说可靠性。尽管存在错误的故障概率，但该方法可以通过引入退化特征信息自适应地识别有用的预测知识，并通过交替优化方案实现有效的知识迁移。结果，可以尽可能地保证迁移效果以及RUL预测性能。

7 结论

在本文中，提出了一种新的跨机器RUL预测的选择性迁移学习方法，该方法利用基于张量表示的可迁移性分析。所提出的方法证明了通过使用张量表示来减少退化随机性和噪声干扰的负面影响的能力。此外，该方法利用核心张量基于故障模式信息和退化特征来确定源域数据的可迁移性。通过量化源域数据的可迁移程度，可以迁移更多的预测知识，提高迁移学习效果。值得注意的是，所提出的方法不需要目标域中故障模式信息的可用性，这表明有更好的部署能力。

本文提出的方法是在源域数据包含明确故障信息的假设下操作的。然而，值得注意的是，这种假设并不总是必要的。在源域中的故障类别未知的情况下，可以使用聚类或时频信号分析方法来大致识别潜在的故障模式。应该强调的是，所提出的方法的主要思想是从源域数据中选择性地提取迁移退化知识，并且它不依赖于关于故障模式的特定信息。

可迁移性分析的引入可以实现预测知识的有针对性的迁移，这提高了迁移过程的可靠性，并已在理论上得到证明。由于M-TDI和建模算法可以根据实际需求用新的相似性度量和回归算法代替，因此所提出的方法可以作为迁移学习框架。该框架是普遍适用的，也可以解决不同工作条件下的RUL预测。在未来的工作中，将研究在线场景中的RUL迁移预测。在实际应用中，优选使用连续收集的在线数据来提取预测知识。

编辑：董浩杰

审核、校对：李正平、张勇、王畅、陈凯歌、赵栓栓、曹希铭

该文资料(RUL选择性迁移学习)搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除。

来源：故障诊断与python学习

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2024-02-01