首页/文章/ 详情

论文学习｜综述-机器学习在机器故障诊断中的应用: -现在：使用深度学习理论进行智能故障诊断

故障诊断与python学习

10月前浏览480

论文学习

非常尊重并感谢科研人员做出的辛勤贡献！若有侵权，烦请联系处理！

若有翻译不当之处，恳请批评指正！

本篇综述详细阐述了机器学习在机器故障诊断方向的发展过程及研究成果，分为过去、现在、未来三个部分，很有广度，值得初学者阅读学习和思考。其未来趋势部分迁移学习对写论文方向很有指导性意义。其写作陈述话术也很值得借鉴。

本篇将介绍第3节：现在：使用深度学习理论的智能故障诊断

论文信息

论文题目：Applications of machine learning to machine fault diagnosis:

A review and roadmap

期刊、年份：Mechanical Systems and Signal Processing，2019

作者：Yaguo Lei(a*), Bin Yang(a), Xinwei Jiang(a), Feng Jia(a), Naipeng Li(a), Asoke K. Nandi(b)

机构：(a): Key Laboratory of Education Ministry for Modern Design and Rotor-Bearing System, Xi’an Jiaotong University, Xi’an 710049, China

(b): Department of Electronic and Computer Engineering, Brunel University London, Uxbridge UB8 3PH, United Kingdom

1. 引言

2. 过去：用传统机器学习理论进行智能故障诊断

2.1 概述

2.2 第1步：数据收集

2.3 第2步：人工特征提取

2.3.1 特征提取

2.3.2 特征选择

2.4 第3步：健康状态识别

2.4.1 基于专家系统的方法

2.4.2 基于ANN的方法

2.4.3 基于SVM的方法

2.4.4 其他方法

2.5 结语

3. 现在：用深度学习理论进行智能故障诊断

3.1 概述

3.2 第1步：大数据收集

3.3 第2步：基于深度学习的故障诊断

3.3.1 基于堆叠自编码器(Stacked AE)的方法

3.3.2 基于深度置信网络(DBN)的方法

3.3.3 基于卷积神经网络(CNN)的方法

3.3.4 基于ResNet的方法

3.4 结语

4. 未来：用迁移学习进行智能故障诊断

4.1 在工程应用场景用迁移学习进行智能故障诊断的动机

4.2 智能故障诊断中迁移学习的定义

4.2.1 智能故障诊断中迁移难点

4.2.2 智能故障诊断中的迁移场景

4.3 智能故障诊断中基于迁移学习的方法种类

4.3.1 基于特征的方法

4.3.2 基于生成对抗神经网络(GAN)的方法

4.3.3 基于实例方法

4.3.4 基于参数的方法

4.4 结语

5. 讨论：智能故障诊断的未来挑战和路线图

5.1 如何未基于机器学习的故障诊断模型训练提供大量高质量的数据

5.2 如何在大数据革命中针对特殊问题构建基于深度学习的故障诊断模型

5.3 如何保护迁移学习在实际工程应用中不受负迁移的影响

5.4 如何提高基于深度学习的故障诊断模型可解释性

6. 总结

摘要

智能故障诊断(IFD)是指机器学习理论在机器故障诊断中的应用。这是一种解放人类劳动很有前途的方式，并能自动识别机器的健康状态，因此在过去的二三十年中备受关注。虽然IFD已经取得了相当多的成功，但在系统地涵盖IFD从摇篮到开花结果的发展方面，仍然存在空白，很少为未来的发展提供可能的指导方针。为了弥补这一差距，本文根据机器学习理论的进展，对IFD的发展进行了综述和路线图，并给出了未来的展望。过去，传统的机器学习理论开始弱化人类劳动，将人工智能时代带入机器故障诊断。近年来，深度学习理论的出现对IFD进行了改革，自2010年代以来，IFD进一步解放了人工劳动，鼓励构建端到端诊断流程。它意味着直接连接日益增长的监测数据和机器的健康状态之间的关系。在未来，迁移学习理论试图将诊断知识从一个或多个诊断任务转移到其他相关任务中，这有望克服IFD在工程场景中应用的障碍。最后，结合该领域的挑战，绘制IFD的路线图，以显示潜在的研究趋势。

关键词: 机器，智能故障诊断，机器学习，深度学习，迁移学习，综述和路线图

Ⅲ 现在：使用深度学习理论的智能故障诊断

本节总结了深度学习在机器故障诊断中的应用。首先，介绍了运用深度学习理论进行IFD过程。其次，回顾了基于深度学习方法的研究成果。

3.1 综述

随着互联网技术和物联网(IoT)的快速发展，收集到的数据量比以往任何时候都要高。日益增长的数据为机器故障诊断提供了更充分的信息，从而更有可能提供准确的诊断结果。不幸的是，过去基于传统机器学习理论的故障诊断并不适合这样的大数据场景。有必要发展一些先进的IFD方法。

深度学习源于神经网络的研究[18,23]，利用深层次结构自动表示抽象特征，并进一步直接建立学习到的特征与目标输出之间的关系。基于深度学习的诊断过程如图1所示，包括大数据采集和基于深度学习的诊断两个步骤[311]。下面的小节详细介绍了每个步骤。

3.2 第一步：大数据收集

大数据已经成为现代工业和其他应用场景的流行术语。一般来说，大数据包括容量、速度、多样性和准确性四个特征[312]。相比之下，监视机器的大数据具有这些特征，并进一步扩展到非常特殊化的数据。其特点概括如下。

◆体积庞大。在机器长期运行的过程中，收集到的数据量持续增长，特别是对于大型机组的机器，如风力站点的风力发电机。

◆价值密度低。收集到的大数据中存在不完整的健康信息。此外，在海量数据中混杂了一部分质量较差的数据[313]。

◆数据结构多源异构。多源数据是指数据是由不同类型的传感器收集。此外，由于数据存储结构是不同的，因此数据是异构的

◆数据流监控。高速传输通道能够迅速从机器上获取数据。

这些特征是由以下情况贡献的[314-316]。

1)在现代工业中，大多数生产活动是由一组机器来完成的。因此，故障诊断往往集中在机器组上。例如，一个风力站的监测系统需要监测数百个风力发电机。在这些机器长期运行的过程中，监控系统不断地采集数据。特别是采集采样频率高的数据，如齿轮箱的振动数据，因为健康信息大多隐藏在高频频段。因此，收集的数据量有增加的趋势。

2)虽然监控系统可以获得大量的数据，但只有少数数据是有价值的。首先，健康状态占机器长期运行的大部分，很少发生故障。因此，收集健康的数据比收集故障的数据更容易。其次，采集的数据质量并不总是令人满意的，因为有些数据可能会遇到突发事件，如传输中断、测量设备异常等。

3)为了收集足够的机器健康信息，机器上有很多监视点。此外，多源传感器用于采集不同类型的数据。收集到的数据以不同的数据结构存储。例如，风力发电机组的监测数据不仅包括来自工况监测系统(Condition monitoring system, CMS)的振动和转速数据，还包括来自监测控制和数据采集系统(Supervisory control and data acquisition, SCADA)的控制参数。

4)传感器技术和数据传输的蓬勃发展。尤其是物联网和高速互联网的出现，促进了大量包含实时信息数据的收集。此外，边缘计算和GPU应用等先进技术的出现，有助于有效地应对数据流监控。

图1 用深度学习理论进行IFD诊断

3.3 第二步：基于深度学习的诊断

基于深度学习的诊断模型自动从输入的监测数据中学习特征，并根据学习到的特征同时识别机器的健康状态。它们主要包括特征提取层和分类层。模型首先采用层次化网络，如SAE(堆叠自编码器)、DBN(深度置信网络)、CNN(卷积神经网络)、ResNet(残差网络)，逐层学习抽象特征。输出层放在最后一层提取层之后进行健康状态识别，通常采用基于ANN的分类器，因为ANN的多类分类能力强。在训练过程中，利用BP(反向传播)算法更新诊断模型的训练参数，最大限度地减少了实际输出与目标之间的误差。本小节将回顾四种典型的深度学习方法及其在机器故障诊断中的应用。

3.3.1 基于堆叠自编码器(SAE)的方法

3.3.1.1 AE和SAE简介

图2 AE结构图

如图2所示，AE由编码器网络和解码器网络[21]组成。给定数据集与个样本，表示的特征定义为

(1)

其中为编码器网络的激活函数，是编码器网络的训练参数。通过解码器网络可以得到重构样本表示为:

(2)

其中为解码器网络的激活函数，表示解码器网络的训练参数。为了尽可能重构原始输入，AE的优化目标集中在使输入样本与重构样本之间的误差最小，表示为

(3)

堆叠AE可以将输入数据中包含的信息进行堆叠，从而得到更深层次的有限元图，如图3所示。第个AE的表征特征可计算为

(4)

其中为第个AE的训练参数，为给定样本的第一个AE所表征的特征。对第个AE进行预训练后，可以得到深度特征。这些特征被映射到一个单独的分类层的目标类别，输出是。

图3 贪婪分层预训练的SAE

3.3.1.2 AE在机械故障诊断中的应用

文献[310,317-330]将AE及其常见变种引入到机械故障诊断中。其中，Jia等人[310]利用SAE自动从频域数据中学习特征，进而完成滚动轴承和齿轮的诊断任务，是最早的堆叠AE应用研究之一。所构建的诊断模型包含3个堆叠的AE，能够自动分离无用的健康信息并压缩有用信息，而不是像传统的IFD那样手工提取统计特征。结果表明，该方法能够处理大量监测数据，获得较高的诊断准确性。此外，Liu等[317]和Lu等[319]分别采用堆叠稀疏自编码器和堆叠去噪自编码进行轴承故障诊断，研究结果比SVM和ANN等其他方法诊断准确率更高。

为了提高基于AE的诊断模型的性能，研究人员进一步研究了AE的优化算法。它们主要是在常见AE的基础上，涉及到一些特殊的AE变种。例如，Jia[11] 等人[331]提出了一种归一化稀疏自编码器，从输入的振动数据中自动学习有意义的和不同的特征，这是最早构建端到端诊断模型的工作之一。针对原始振动数据的位移变特性，他们进一步提出通过归一化稀疏自编码局部连接网络构建端到端网络，鼓励直接将原始监测数据与机器健康状态之间的关系架起桥梁。文献[332]提出了一种基于AE的机械故障诊断模型，该模型采用最大相关性对AE优化对象进行重新设计，采用人工鱼温(Artificial fish warm)算法对AE参数进行优化。Liu等人[333]利用AE构建了用于电机轴承故障诊断的递归神经网络。Ma等人[334]提出了一种深度耦合AE，可以在高水平上融合多源数据的学习特征。Shao等人[335]讨论了激活函数对基于AE模型诊断性能的影响，并使用高斯小波函数作为激活函数设计小波AE。他们进一步整合了一组堆叠自编码器的诊断结果，这些AE具有不同的激活功能[336]。文献[337,338]分别引入收缩AE和卷积AE构建旋转机械故障诊断模型。文献[339]提出了一种联合多次重构AE，从多尺度信号中联合学习判别性和鲁棒性特征。此外，研究人员希望结合AE等方法开发混合诊断模型。例如，使用极限学习机构建基于AE的诊断模型，其中参数是随机确定的，而不是采用BP算法。该训练策略提高了传统基于AE模型的泛化性能和收敛速度，混合诊断模型已成功用于电机轴承[340,341]和风力发电机[342]的故障诊断。DBN是另一种构建堆叠自编码器的混合诊断模型的方法[343,344]。在诊断模型中，采用堆叠AE从输入的监测数据中学习特征，DBN根据学习到的特征识别机器的健康状态。文献[345]中，作者在堆叠自编码器中引入了批归一化层，解决了训练多层网络时的内协变量偏移问题，加快了收敛速度。Saufi等人[346]利用RProp算法和差分进化算法对基于AE的诊断模型进行了性能优化。

基于堆叠自编码器的多层诊断模型能够自动表示输入监测数据的健康信息，在特征提取方面不需要太多的专家知识。堆叠自编码器作为一种无监督学习方法，不能直接用于识别机器的健康状态。因此，通常在模型体系结构的顶部添加一个分类层，构建的诊断模型需要使用足够的标记样本进行训练。

3.3.2 基于DBN的方法

3.3.2.1 RBM和DBN简介

如图4所示，RBM是一种特殊类型的生成性随机神经网络，包括可见单元和隐藏单元 [22]。注意，所有单元都是二进制的，即。作为基于能量的模型，变量和服从如下的联合配置。

(6)

其中表示RBM的参数。在此之后，可视单元的边际分布可以计算为

(7)

其中代表配分函数。可见单元和隐藏单元的激活条件定义如下

(8)

其中为Sigmoid的激活函数。利用最大似然估计得到RBM的参数，计算公式如下 (9)

其中表示具有个样本的输入数据集。为了简化Eq.(15)所示的解，采用对比散度算法[22]来加速计算，进一步得到估计参数。

与堆叠AE中的预训练类似，DBN是通过堆叠一组RBMs构建的，其中DBN中上一层的隐藏单元也被视为下一层[23]的可见单元。训练第L次RBM后，可以将深层所表示的特征映射到目标类中，主要通过添加Softmax分类层为

,....., (10)

其中

，为第个样本在第L层所代表的特征，表示预测的一个热点标签，为分类层的训练参数。

图4 RBM结构

3.3.2.2 DBN在机器故障诊断中的应用

DBN已成为IFD研究的一种有效方法。对于滚动轴承的故障诊断，文献[347]提出了一种基于单高斯RBM的诊断模型。Jiang等[348]和Han等[349]将多个RBM进行堆叠，构建基于DBN的诊断模型，其诊断准确率高于传统的诊断模型。为了提高诊断性能，研究者进一步研究了基于DBN的模型的优化算法。文献[350,351]采用Nesterov动量去自适应优化基于DBN的诊断模型的训练，其诊断准确率高于标准DBN。Shao等[352]构建了一个自适应DBN，使用自适应学习速率和动量算法进行训练。他们还试图通过使用粒子暖化算法(particle warm)[353]自适应地确定基于DBN的诊断模型的结构。文献[354,355]， Shao等进一步提出了一种用于轴承故障诊断的卷积DBN，利用指数移动平均技术提高了诊断模型的性能。此外，DBN还被用于其他对象的故障诊断。例如Tamilselvan等[356]将DBN用于飞机发动机的故障诊断，是该领域最早的研究之一。Sun等[357]提出了一种叫Tilear电机故障诊断模型，该模型通过DBN进行重构。Tran等[358]提出了一种基于DBN的往复式压缩机阀门诊断模型，该模型用高斯-伯努利RBM进行层次结构堆叠。Qiu等人在文献[359]中构建了基于DBN和隐马尔可夫模型的压缩机机组预警诊断模型。同样，Gao等[360]在DBN的顶层添加了量子启发神经网络，用于飞机燃油系统的故障诊断。文献[361]将DBN应用于高速列车车载设备的自动诊断，其诊断性能优于kNN和ANN。He等[362]利用DBN对齿轮传动链进行故障诊断，并进一步利用遗传算法对DBN结构进行优化。对于转子系统[363]和液压设备[364]的故障诊断，考虑DBN构建的诊断模型比传统方法具有更高的诊断精度。对于空调系统，Guo等[365]利用DBN构建诊断模型，识别四通阀、室外机、制冷剂充注的故障。Yu等[366]提出了一种基于数据驱动的风电机组故障诊断模型，该模型也是通过DBN实现。

与堆叠自编码器不同，基于DBN的诊断模型可以通过预先训练一组堆叠的RBM，从输入数据中自动学习特征，解决了BP算法微调深层网络时的梯度消失问题。为了识别机器的健康状态，DBN通过添加分类层将学习到的特征映射到标签空间中。为了获得可靠的诊断结果，需要使用足够的标注数据对所构建的诊断模型进行训练。

3.3.3 基于CNN的方法

3.3.3.1 CNN简介

CNN作为一种有监督的深度学习方法，在语音识别、图像识别、目标跟踪等方面都取得了优异的成绩[367]。CNN通常由卷积层、池化层和全连接层[24]组成。卷积层和池化层的基本原理如图5所示。在卷积层中，过滤器卷积核被用来对层的输入向量做卷积运算，其中是卷积核的高度，和分别为卷积核的长度和深度。得到第层的输出特征映射如下 (11)

其中为整流线性单元(ReLU)激活函数[368]。在池化层中，采用下采样来有效减少训练参数的数量，克服过拟合，如图5(b)所示。常用的下采样形式有最大池化和均值池化。合并后的特征映射进一步表示为 (12)

其中为下采样函数，分别包括，，池化层中的过滤器。通过堆叠卷积层和池化层，CNN能够从输入数据中学习深层特征。然后，这些特性被平展成一维向量，作为全连接层的输入。通过多层神经网络，进一步映射到目标类中。全连接层的输出表示为：

(13)

其中为全连接层的输入，表示全连接层的训练参数。

图5 卷积和池化过程：

(a) 利用卷积核进行卷积处理;

(b) 通过使用过滤器进行池化处理

3.3.3.2 CNN在机器故障诊断中的应用

CNN在机器故障诊断中的应用如表1所示。根据CNN的架构，可以分为二维(2D)CNN诊断模型和一维(1D)CNN诊断模型。最初，2D CNN作为图像识别的标准版本，其中输入的图像是2D数据。但对于机器的故障诊断，2D CNN无法处理振动数据等1D信号。为了构建基于CNN的诊断模型并获得高性能，研究者们采用了一些有效的方法，归纳起来有三种。首先，信号处理方法，如小波包(369 - 371)，连续小波变换[372，373]，二元树复数小波变换[374，375]，同步压缩变换[376]，这些是用来预处理输入的一维数据，能够将信号从时域转换到频域。之后，CNN能够处理二维时频频谱的监测数据。其次，文献[377-382]手动重塑了输入数据的维数，使其适合于基于CNN的诊断模型。在这些成果中，数据预处理大多来源于一些简单巧妙的操作，而不是先进的信号处理，几乎摆脱了专家知识的帮助，开发了用于机器故障诊断的图像数据，如灰度图像[383,384]和红外热图像[385,386]。因此，基于CNN的诊断模型可以直接很好地工作，就像图像识别的分类任务一样。此外，1D CNN开始处理移变特性的振动数据，成功构建了滚动轴承[387-391]、齿轮[392-398]、电机[399]、液压泵[400]的端到端诊断模型。其中，诊断模型的输入是未经预处理的原始数据。

表1 CNN在机器故障诊断中的应用综述

与堆叠AE和DBN相比，基于CNN的诊断模型能够直接从原始监测数据中学习特征，而无需进行频域变换等预处理，因为CNN能够捕获输入数据的变化特性。此外，通过共享权重减少了诊断模型中训练参数的数量，可以加快收敛速度，抑制过拟合。与其它基于深度学习的模型一样，基于CNN的诊断模型的诊断性能需要经过足够的标记样本的训练。

3.3.4 基于ResNet的方法

3.3.4.1 ResNet简介

ResNet在神经网络的研究中发挥了巧妙而成功的作用，它通过将多个残差块[25]叠加来构建深度学习模型。残差块由前向通道和快捷连接组成，如图6所示。残差块的前向通道最初是通过堆叠一些卷积层来构建的。例如，用两个卷积层来处理输入特征

(14)

其中为第个残差块中的训练参数。注意到，因为它们通过卷积层的运算，因此卷积运算要进行零填充处理的，以保持特征的维度。快捷方式被引入来计算前向通道的输出和输入特征的总和，残差模块的输出表达式为:

(15)

深层特征是通过堆叠多个残差块得到的，前一个残差块的输出就是下一个残差块的输入。最终通过全连接层将学到的特征映射到目标类别中。

图6 残差块的结构

3.3.4.2 ResNet在机器故障诊断中的应用

研究人员开展了有关ResNet应用的研究。Zhang等人[410]结合ResNet构建了滚动轴承的诊断模型，直接利用原始振动数据训练诊断模型。对比结果表明，与基于CNN的诊断模型相比，诊断准确率更高。Zhao等人[411]开发了动态加权小波系数，提高了基于ResNet的诊断模型的性能，在严重噪声环境下的行星齿轮箱故障诊断精度高于其他基于深度学习的方法。他们进一步为基于ResNet的诊断模型提出了两种多小波系数融合方法[412]，这有助于从输入数据中学习到比标准的ResNet的模型中更容易区分的特征。Ma等人[413]提出了一种数据驱动、时频分析与ResNet相结合的行星齿轮箱故障诊断模型。对于高速列车的关键部件，Peng等人[414]利用ResNet对轮对轴承的健康状态进行识别，Su等人[415]构建了基于ResNet的转向架故障诊断模型。两个文献的实验结果都显示出了基于ResNet的诊断模型比其他深度学习方法的优越性。

ResNet是用来在CNN架构的基础上开发出的一个泛化性能更高的架构。因此，基于ResNet的诊断模型继承了基于CNN的诊断模型的优点，有可能获得较高的诊断精度，特别是对于变速、变负载等这样的复杂工况。

3.4 结语

本节回顾了目前深度学习在机器故障诊断中的应用，并对诊断过程划分为数据采集和基于深度学习的诊断。希望构建这样端到端诊断模型架构可以直接将原始监控数据和机器的运行状态相连接起来。虽然取得了一些成功，但它们大多受制于一个共同的假设：所标记的数据是足够多的，并且关于机器[35]的运行状况状态的信息也是完整的。然而在实际工程中，这种假设是不现实的，因为从真实案例收集的数据有两个特点[26]：

1)这些数据难以包含足够的信息来反映完整的各类健康状态。事实上，机器大多在健康状态下工作，而很少发生故障。因此，它更容易收集健康数据相对故障数据。所以造成了收集到的数据严重不平衡。

2)收集的大部分数据没有标记。由于经常停止机器并检查健康状态造成的巨大的经济损失是不现实的。

基于上述两个特点，因此为工程系统创建可靠的诊断模型是十分必要的。

注明

1、由于本文翻译篇幅过大，本篇到此结束，下一篇将介绍机器学习在故障诊断的未来阶段发展。

参考文献

[1]Y. Lei, B. Yang, X. Jiang, F. Jia, N. Li, and A. K. Nandi, "Applications of machine learning to machine fault diagnosis: A review and roadmap," Mechanical systems and signal processing, vol. 138, p. 106587, 2020-01-01 2020.

翻译：张泽明、李正平

编辑：张泽明

如需转载，请后台联系小编

说明：部分图片来源网络，若有侵权，烦请联系处理

来源：故障诊断与python学习