首页/文章/ 详情

论文学习｜综述-机器学习在机器故障诊断中的应用: -未来：使用迁移学习理论的智能故障诊断

故障诊断与python学习

1年前浏览581

论文学习

非常尊重并感谢科研人员做出的辛勤贡献！若有侵权，烦请联系处理！

若有翻译不当之处，恳请批评指正！

本篇综述详细阐述了机器学习在机器故障诊断方向的发展过程及研究成果，分为过去、现在、未来三个部分，很有广度，值得初学者阅读学习和思考。其未来趋势部分迁移学习对写论文方向很有指导性意义。其写作陈述话术也很值得借鉴。

本篇将介绍第3节：未来：使用迁移学习理论的智能故障诊断

论文信息

论文题目：Applications of machine learning to machine fault diagnosis:

A review and roadmap

期刊、年份：Mechanical Systems and Signal Processing，2019

作者：Yaguo Lei(a*), Bin Yang(a), Xinwei Jiang(a), Feng Jia(a), Naipeng Li(a), Asoke K. Nandi(b)

机构：(a): Key Laboratory of Education Ministry for Modern Design and Rotor-Bearing System, Xi’an Jiaotong University, Xi’an 710049, China

(b): Department of Electronic and Computer Engineering, Brunel University London, Uxbridge UB8 3PH, United Kingdom

1. 引言

2. 过去：用传统机器学习理论进行智能故障诊断

2.1 概述

2.2 第1步：数据收集

2.3 第2步：人工特征提取

2.3.1 特征提取

2.3.2 特征选择

2.4 第3步：健康状态识别

2.4.1 基于专家系统的方法

2.4.2 基于ANN的方法

2.4.3 基于SVM的方法

2.4.4 其他方法

2.5 结语

3. 现在：用深度学习理论进行智能故障诊断

3.1 概述

3.2 第1步：大数据收集

3.3 第2步：基于深度学习的故障诊断

3.3.1 基于堆叠自编码器(Stacked AE)的方法

3.3.2 基于深度置信网络(DBN)的方法

3.3.3 基于卷积神经网络(CNN)的方法

3.3.4 基于ResNet的方法

3.4 结语

4. 未来：用迁移学习进行智能故障诊断

4.1 在工程应用场景用迁移学习进行智能故障诊断的动机

4.2 智能故障诊断中迁移学习的定义

4.2.1 智能故障诊断中迁移难点

4.2.2 智能故障诊断中的迁移场景

4.3 智能故障诊断中基于迁移学习的方法种类

4.3.1 基于特征的方法

4.3.2 基于生成对抗神经网络(GAN)的方法

4.3.3 基于实例方法

4.3.4 基于参数的方法

4.4 结语

5. 讨论：智能故障诊断的未来挑战和路线图

5.1 如何未基于机器学习的故障诊断模型训练提供大量高质量的数据

5.2 如何在大数据革命中针对特殊问题构建基于深度学习的故障诊断模型

5.3 如何保护迁移学习在实际工程应用中不受负迁移的影响

5.4 如何提高基于深度学习的故障诊断模型可解释性

6. 总结

摘要

智能故障诊断(IFD)是指机器学习理论在机器故障诊断中的应用。这是一种解放人类劳动很有前途的方式，并能自动识别机器的健康状态，因此在过去的二三十年中备受关注。虽然IFD已经取得了相当多的成功，但在系统地涵盖IFD从摇篮到开花结果的发展方面，仍然存在空白，很少为未来的发展提供可能的指导方针。为了弥补这一差距，本文根据机器学习理论的进展，对IFD的发展进行了综述和路线图，并给出了未来的展望。过去，传统的机器学习理论开始弱化人类劳动，将人工智能时代带入机器故障诊断。近年来，深度学习理论的出现对IFD进行了改革，自2010年代以来，IFD进一步解放了人工劳动，鼓励构建端到端诊断流程。它意味着直接连接日益增长的监测数据和机器的健康状态之间的关系。在未来，迁移学习理论试图将诊断知识从一个或多个诊断任务转移到其他相关任务中，这有望克服IFD在工程场景中应用的障碍。最后，结合该领域的挑战，绘制IFD的路线图，以显示潜在的研究趋势。

关键词: 机器，智能故障诊断，机器学习，深度学习，迁移学习，综述和路线图

Ⅳ 未来：使用迁移学习理论的智能故障诊断

本节预测了未来最有潜力的研究前景之一，即迁移学习在机械故障诊断中的应用。本节包含三个部分：

1)为什么要迁移学习；

2)什么是迁移学习；

3)如何进行迁移学习。

第一部分重点讨论迁移学习在未来IFD成为一个很有前途研究课题的动机是什么。在第二部分中，我们对IFD中的迁移学习进行了定义。第三部分根据迁移学习的不同类别，对一些研究成果进行了回顾总结。

4.1 将迁移学习应用到工程场景的动机

IFD的成功主要依赖于足够的标注数据来训练基于机器学习的诊断模型。然而，重新收集足够的数据并进一步标记它们需要花费大量成本，这对于工程场景中的机器来说是不切实际的。如果这些诊断知识能够在多台相关机器之间相互使用，那么就可以解决上述问题。例如，在实验轴承上得到的故障诊断知识能够帮助识别实际工程场景中轴承的健康状态。在这种情况下，可以模拟不同的故障，并从实验室使用的轴承中收集足够的标记数据。如果诊断知识能够被重新利用，那么训练出来的诊断模型也可以用于工程场景下的轴承故障诊断。迁移学习能够达到上述目的，即从一个或多个诊断任务中获取的知识可以用到其他相关但不同的任务中。在迁移学习理论的帮助下，我们无需收集足够多的标记数据，因此这从基于机器学习的训练诊断模型的一般假设中解放出来了。基于此动机，IFD预计将从学术研究延伸到工程场景中。

4.2 迁移学习在IFD中的定义

在本小节中，我们试图结合迁移学习的基本定义来定义IFD中的迁移问题和迁移场景

4.2.1 在IFD中的迁移问题

对于IFD中的迁移学习，期望将诊断知识从一个或多个诊断任务(source domain, 源域)在其他相关但不同的诊断任务(target domain, 目标域)能够被再次使用，这里涉及到了域(domain)和任务(task)的概念。域表示为一对，其包括数据集和它的边缘概率分布。诊断任务包括标签空间和诊断模型。该任务通过观察标签空间中的运行状况状态来诊断机器的运行状况。诊断模型能够由标签数据训练。然后，进一步赋予模型诊断知识，即输入数据与其对应的机器健康状态之间的关系。

假设源域为，目标域为，诊断任务为和，在IFD中，迁移问题的目的是将源域的任务中学到的诊断知识应用到目标域，提高诊断模型的性能。值得注意的是。具体而言，源域和目标域详细介绍如下[26,27]。

源域被认为是一对，提供来自一个或多个源域诊断任务中诊断知识。源域数据集包含个带标签的样本，其边缘概率分布为。假设标签空间，有种机械健康状态，源域中的标签空间服从条件
目标域将其视为一对，使用源域的诊断知识进行故障诊断。不同于源域的样本，目标域的数据集包含个样本，但它们只有少部分有标签。甚至更严重的是，目标域内没有标记的样本。这些样本服从边缘概率分布，并且。
为了保证诊断知识跨域迁移的成功，源域的标签空间必须与目标域的标签空间重叠，比如。实例说明了将电机诊断知识用于发电机故障诊断是不现实的。

4.2.2 IFD中的迁移场景

IFD中的传输场景可以分为两类，即在同一机器(Tansfer in the identical machine, TIM)中传输和跨不同机器(Transfer across different machine, TDM)传输，如表4所示。这两个类别都遵循一个共同的假设，即源域数据有标签，而目标域中只有少数标记数据，甚至没有标记数据。1)在TIM场景中，源域和目标域数据采集自同一台机器，但在不同的运行条件下，如不同的速度和负载，或不同的工作环境[416]。这些因素改变了采集到数据的分布，使得用源域数据训练的诊断模型不能直接作用于目标域。2)在TDM场景下，源域和目标域的数据从不同但相关的机器上采集的，就像马达和发电机这样的。这些数据涉及比TIM更复杂的因素，如不同的机器规格、不同的结构等[26,35,417]。这些因素也导致了源域和目标域之间数据分布的严重差异。因此，迁移学习希望构建IFD在迁移场景中对上述因素具有鲁棒性的诊断模型。

表4 CNN在机器故障诊断中的应用综述

4.3 IFD中基于迁移学习方法的种类

少数研究者利用迁移学习理论对IFD进行了探索性研究，如表5所示。我们进一步将其分为四类，即基于特征的方法、基于GAN的方法、基于实例的方法和基于参数的方法。其中，基于特征的方法的研究占比最大。此外，大多数研究集中在TIM场景，只有4篇论文针对TDM场景。

4.3.1 基于特征的迁移学习

基于特征的方法在迁移学习中得到了广泛的研究，因为它能够纠正严重的跨领域差异[33]，例如TDM场景。如图15所示，这些方法通常可以分为四个步骤[26]。首先，使用特征映射函数将跨域数据映射到公共特征空间。然后，利用距离度量方法来度量特征的分布差异。然后将结果反向传播，采用最小优化策略更新特征映射参数，减少特征分布差异。最后，利用源域样本训练的域共享分类器，根据相似分布的特征对目标域进行分类。

4.3.1.1 TCA和JDA

TCA是一种典型的基于特征的方法[29]。该方法试图找到一个低维特征空间，使得跨域之间的数据分布差异较小。然后，将学到的特征用于训练域共享分类器，这些分类器大多是由传统机器学习理论构建的。TCA的优化目标为：

（14）

其中为输入跨域样本的核矩阵，，将跨域样本从空间映射到维空间，，是用来平衡分布适应性贡献和模型复杂性的权衡参数，为中心矩阵。可由以下公式计算：

（15）

最优特征映射通过求解Eq.(14)得到的可以进一步用于计算跨域特征，服从相似分布。

很少有研究者引入TCA来减少IFD中跨领域数据的分布差异。Chen等[418]利用TCA提取不同工况下滚动轴承采集到的数据可迁移特征。Xie等[419]采用TCA和SVM分类器对不同工况下的齿轮箱进行故障诊断。

TCA只适应了输入跨域数据的边缘概率分布，忽略了特征空间到目标类的条件概率分布。因此，进一步提出JDA来解决这个问题，定义如下[30]：

（16）

其中，并且，当。否则的元素是

（17）

其中子域和是源域中属于类的样本集。类似于TCA解决方法，跨域特征可以通过式(17)中所示的函数进行优化得到。

在故障诊断方面，Tong等[420,421]利用JDA分别完成了电机和带式输送机托辊部轴承的诊断任务，诊断准确率高于基于TCA的诊断模型。基于TCA和JDA的诊断模型使用简单的非线性映射来提取特征，难以适应复杂的数据分布。因此，由于源域和目标域的校正偏差，诊断模型在目标域上的迁移效果较差。

4.3.1.2 深度学习和AdaBN

深度学习的出现用深层次结构取代了TCA和JDA中简单的非线性映射。一些文献仅仅通过基于深度学习的诊断模型解决了TIM场景。Zhang等[416]针对电机轴承在不同运行条件和不同噪声环境下的故障诊断，构建了基于深度CNN的故障诊断模型。Peng等[414]采用了基于ResNet的机动轴承故障诊断模型，对不同的运行条件和附加的噪声具有良好的鲁棒性。在参考文献[422,423]，采用自适应批量归一化(Adaptive batch normalization, AdaBN)[441]来提高轴承在不同工况下基于CNN的模型诊断性能。

基于深度学习的诊断模型通过提取深层次特征[33]来减少跨域差异。然而，在某些诊断场景中，它们无法适应严重的跨域差异，例如TDM。

4.3.1.3 深度迁移学习

为了纠正严重的跨域差异，深度迁移学习通过最小化分布差异的距离度量来对深度学习模型的参数进行约束。最大平均偏差(Maximum mean difference, MMD)是一种常用的非参数分布差异距离度量方法，定义如下：

（18）

其中是输入总量的最大值，代表再生核希尔伯特空间(reproduced kernel Hilbert space, RKHS), 是原始空间到RKHS的非线性映射, 将学到的跨域特征的MMD作为深度学习诊断模型优化目标的正则化项。如文献[424,425,431]采用MMD对堆叠的基于自编码器(AE)的诊断模型的优化目标进行正则化，表达式为:

（19）

其中为跨域样本。在Eq.(19)中，第二项得到稀疏特征，第三项使所表示的跨域特征的分布差异最小化。通过贪婪分层预训练，堆叠自编码器能够提取具有相似分布的深层特征，进而实现电机轴承[424,425]、齿轮[424]、虚拟汽车车身侧生产线[431]的迁移场景。MMD的正则化项也可以用于训练CNN构建端到端诊断模型[426,427]。其中，Yang等[26]将多层MMD引入到基于CNN的诊断模型优化中，实现了将诊断知识从实验电机轴承迁移到机车轴承的TDM转移场景，这是该场景最早的工作之一。提出的基于CNN的诊断模型通过

（20）

当第一项被标记的源域样本用来训练一个域共享分类器时，第二项希望能最小化目标域预测标签和伪标签之间的误差，通过减小学习到的特征的类间距离来提高目标域的诊断精度，最后一项是用来适应多层特征的分布，无论是在卷积层还是全连接层。考虑到高斯核参数确定困难，Yang等[417]将多核MMD引入到基于CNN的诊断模型优化中，可以通过求解一个凸优化问题对其进行训练

（21）

其中，使用学习到的特征U-kernel MMD和进行加权来估计跨域差异。考虑到高斯的缺点，Yang等[443]进一步提出了多项式内核诱导MMD来改善基于深度学习模型的迁移性能，与常规的高斯核诱发MMD相比，诊断结果对核参数具有更高的鲁棒性。除MMD外，还使用其他距离度量来构建基于深度迁移学习的诊断模型。Qian等[429]使用高阶Kullback-Leibler散度(KL散度)来度量分布差异，并进一步训练了基于稀疏滤波的齿轮诊断模型。文献[428]通过减小中心距离来调整学习到的跨域特征的分布，并对不同运行条件下的电机轴承进行故障诊断尝试。Wang等[430]提出了一种基于深度迁移学习的电厂热力系统诊断模型，该模型使用CORAL对跨域特征的协方差进行对齐。

基于深度迁移学习的诊断模型有助于纠正严重的跨领域差异，这在IFD迁移场景中受到广泛关注。在这些模型中，传递结果与距离度量与分布差异有关。如果距离不能很好地描述差异，诊断模型在目标域上的迁移效果会很差。

4.3.1.4 其它方法

在文献[432]中，作者通过迁移因子分析发现了一个低维潜在空间，这有助于选择差异较小的跨域特征。Zhang等[433]通过主成分分析将跨域样本映射到二维子空间中，并对子空间进行对齐以最小化跨域差异。Zheng等[434]提出了一种轴承故障诊断模型，该模型融合了来自多个工况的诊断知识，并进一步完成了另一工况的诊断任务。

4.3.2 基于GAN的迁移学习

一般来说，GAN(Generative adversarial network)由生成模型和判别器模型组成[442]。前者获取目标域样本的分布信息，当输入随机噪声或源域样本时生成模型生成与目标域样本分布相似的假样本。后者的重点是训练生成模型的参数，使生成的假样本与目标域的实际样本难以区分。生成模型和判别模型在GAN中相互博弈，定义为：

（22）

在IFD领域，Xie等[435]提出了用于轴承在不同工况下故障诊断的周期一致GAN，该GAN根据来自其他工况的样本生成假样本。Li等[436]构建了多个生成模型用于轴承在不同工况下的故障诊断，由一个故障样本生成假样本。Han等[437]为机器从一个工况到另一个工况提出了一个深度对抗CNN。Guo等人[35]提出了基于对抗学习的故障诊断模型，用于不同轴承之间的故障诊断，这是最早针对TDM场景的工作之一。他们构建了一个包括状态识别和领域适应的诊断模型，并通过以下优化目标对该模型进行训练：

（23）

基于GAN的方法能够生成与目标域中的实际数据相似的假标签样本。这些假样本能够帮助训练出目标域的可靠诊断模型。因此，这类方法不受目标域内是否有标签样本这个条件的影响，预计它们可以同时适用于TIM场景和TDM场景。

4.3.3 基于实例的方法

在基于实例的方法中，假设在目标域中只有少数样本被标记，这对于训练可靠的诊断模型是不够的。因此，基于实例方法的目的在于利用源域中的相关样本来提高诊断模型在目标域中的性能。TrAdaboost[31]是一种典型的基于实例的方法，它源于Adaboost算法。该方法对源域样本和目标域样本进行加权，平衡其对诊断模型训练的贡献，如图14所示。如果给定的诊断模型对目标域的样本进行错误分类，则该样本的权重将得到提高。此外，错误分类的样本在源域中的权重也会降低。因此，决策边界将朝着正确分类目标域样本的方向执行。

Shen等[36]在TrAdaboost架构的基础上利用跨域特征，通过TrAdaboost算法训练一组基于kNN的诊断模型，帮助识别轴承在不同工况下的健康状态。该方法首先利用奇异值分解从电机轴承监测数据中提取故障特征。在此基础上，设计了向量角余弦的度量，以选择跨域差异较小的特征。最后，TrAdaboost算法利用源域和目标域的特征训练出基于kNN的诊断模型。结果表明，训练后的诊断模型能够正确识别目标域内的未标记样本，尽管目标域内有少量标记样本。基于实例的方法在传输场景中很容易实现。然而，它们的传输性能与目标域样本的数量有关。此外，它们能够纠正TIM场景中的差异，但无法实现具有严重差异的传输场景，如TDM场景，因为这些方法可能缺乏强大的数据拟合能力。

图 14 TrAdaboost算法说明:(a)直接使用源和目标域样本训练诊断模型，(b)使用TrAdaboost算法训练诊断模型。

4.3.4 基于参数的迁移学习

与基于实例的方法类似，基于参数的方法也假设在目标域[27]中有少数带标签的样本。该方法利用源域样本对诊断模型参数进行预训练。然后，保存预训练的诊断模型的参数，并将其重新分配到目标域的诊断模型中。最后，利用目标域内的少量标记样本对目标诊断模型进行微调。

研究人员开发了基于参数的迁移方案。Zhang等[438]和Hasan等[37]针对不同工况下的电机轴承转移场景，其中预训练的诊断模型通过目标域工况下的样本进行微调，与只使用少量目标域样本训练的诊断模型相比，经过微调的诊断模型具有更快的收敛速度和更高的诊断准确率。此外，一些研究者利用预训练的图像识别模型来执行机器的故障诊断任务。Cao等[439]提出了一种基于深度CNN的齿轮箱故障诊断模型，作者构建了一个24层的CNN模型，并用来自知名数据集ImageNet的标记图像对其进行预训练。然后，利用训练好的参数初始化另一个与预训练模型具有相同的架构的CNN诊断模型。最后将采集到的振动数据转换为二维图像，对诊断模型进行训练。Shao等[440]提出了一种基于参数的电机轴承和齿轮箱故障诊断方法。在该方法中，我们期望利用著名的VGG-16网络来完成不同工况下机器的诊断任务。首先将采集到的振动数据通过小波变换转换为二维时频图像。然后，利用图像格式的振动数据对预训练后的VGG-16网络进行微调，其中底部的三个卷积层被冻结了。

基于参数的诊断方法是将微调后的预训练诊断模型用于目标域的故障诊断任务，在处理海量数据时消耗较少的计算资源。然而，这些方法的传输性能在很大程度上取决于目标域内被标记样本的数量。

4.4 结语

迁移学习有望将IFD从学术研究延伸到工程领域。本节首先定义IFD的迁移问题，将迁移场景进一步分为TIM和TDM。针对迁移诊断场景，探索性研究分为基于特征的方法、基于GAN的方法、基于实例的方法和基于参数的方法。其中，基于特征的方法和基于GAN的方法因能够实现在TDM这样跨领域差异严重的场景下的迁移学习而受到广泛关注。相比之下，基于实例的方法和基于参数的方法很容易实现，并且主要集中在受轻微跨领域差异影响的TIM场景中。此外，这些方法的传输性能可能与目标区域内被标记样本的数量有关。

注明

1、由于本文翻译篇幅过大，本篇到此结束，下一篇将介绍IFD中未来挑战和路线图。

2、若需引用本文的公式、专业术语等内容建议再细读原论文核实；若本文对您的论文idea有帮助，建议引用原论文～

参考文献

[1]Y. Lei, B. Yang, X. Jiang, F. Jia, N. Li, and A. K. Nandi, "Applications of machine learning to machine fault diagnosis: A review and roadmap," Mechanical systems and signal processing, vol. 138, p. 106587, 2020-01-01 2020.

翻译：张泽明、李正平

编辑：张泽明、李正平

如需转载，请后台联系小编

说明：部分图片来源网络，若有侵权，烦请联系处理

来源：故障诊断与python学习

Mechanical System 振动非线性汽车理论电机人工智能

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2023-06-22