首页/文章/ 详情

故障诊断学习|论文学习 第1篇 下

1年前浏览424

论文学习


- 第1篇 下 -

若想下载本篇论文,请在后台回复“论文”


上一篇第3节介绍了CNN理论背景,包括卷积层,池化层及随机梯度下降的理论及公式。

第4节详细介绍论文搭建的CNN模型,即调用了Alexnet模型,在该模型上改变最后一个全连接层,做本方法的迁移模型进行故障分类,可以缩短训练时间。


本篇将介绍以下内容

第5节说明了该模型的超参数设置,并做了两个实验来验证该方法的有效性,第6节总结。

论文信息

论文题目A Deep Learning Method for Bearing Fault Diagnosis Based on Time-frequency Image

期刊、年份IEEE Acess (SCI 2区,简称Q2),2017

作者Jianyu Wang, Zhenling Mo, Heng Zhang, Qiang Miao*

机构四川大学航空航天学院航空航天信息处理与应用中心,成都

内容概括:用8种时频图片分别作为CNN模型的输入,从5%-90%不同比例的训练集数据分别进行训练得到的结果进行展示比较。在CWRU等两个数据集进行了实验。


Ⅴ 实验验证

(该段要总结性说明自己实验做了哪些工作。)

本节将做两个实验来阐述所提方法的有效性。选取了两个不同负载和速度的轴承数据集,预先从每个数据集中生成8种时频图。

在训练过程中使用SGDM(SGD with Momentum)优化器。在训练过程中,合理选择学习率有助于模型取得良好的性能,学习率高或学习率小会阻碍优化,陷入局部最优。然而,如何选择最优学习率的理论方法尚未形成。基于CNN训练提出的先验知识[24],本研究选择学习率(learning rate)为0.001动量因子(momentum factor)为0.9,可以减少振荡,加速训练过程。在用SGDM优化器的训练过程中,每个阶段都会随机抽取一些样本参与训练过程。接下来,在我们的实验中比较了不同的小批次(mini-batch size) 分别为10、30、50的性能。同样,迭代次数(iterative epoch)在训练中也起着重要的作用。如果它太大,它将消耗更多的时间,而当它太小时,将发生欠拟合。因此,在保证精度的前提下,迭代次数的选取要尽可能小。本论文使用了不同的迭代次数,如10、30和50。最后,我们选择了批次为50和迭代次数为10,因为它们可以用更少的训练时间来确保更高的准确性。该方法的性能还取决于训练样本的质量和数量。本研究还分析了8种不同的时频方法对图像质量的影响,以及训练数据数量从5%到90%的影响。CNN的学习过程在过去的几年里曾经是一个黑盒子,人们很难理解学习过程。在深度学习中应用的t-SNE方法[49] (一种可视化方法,介绍见参考资料2)有助于将分类过程可视化本研究还应用了特征可视化技术,将不同层的激活特征与原始图像进行对比。


5.1 实验1

(该节介绍实验数据和实验结果,实验数据只要说清实验工况信息即可。重点是在实验结果说明上,实验结果不仅仅要给出表格图片,重要的是要对结果进行归纳说明,要让别人知道说明了什么问题,得出了什么结论。)

图5所示的试验台上对不同工况下的多故障尺寸轴承进行实验。测试轴承的轴由两个轴承座支承,通过联轴器与电机连接。力加载装置通过调节机械加载结构来控制径向力。在本实验中,采用焊条切割的方法分别在滚子、内滚道和外滚道上模拟不同尺寸的故障点。径向载荷范围为0kN-3kN,电机转速一般在1045转/分左右。振动信号采集系统包括一个连接在轴承座上的加速度计(PCB621B40 ICP)和采样率为10 kHz的数据采集单元(NI PXI-4462)。每次实验总共抽样60万个点,每个故障大小有5次实验。使用的测试轴承为6205-2RS SKF,实验的详细信息如表1所示。最后,使用数据增强技术将所有数据集划分为4800组每一种故障类别有1200组每组数据的长度为50000

       

图 5 实验1轴承故障实验台


表 1 实验1轴承工况参数

       

首先,采用8种时频方法分别处理了所有的时间序列。每一种时频方法共获取了4800幅彩色图像,每张图像大小为224×224×3。如图6所示为8种时频方法图像,分别对应径向载荷3kN和故障尺寸为0.6 mm内圈故障。图像的质量不仅取决于采样点的个数,而且还受所保存图像的大小的影响。同样,同一样本图像的显示分辨率在不同的方法中也是不同的。直观上,CQCF、IF、CWT、FST图像能更清晰地表达频率随时间的变化。交叉项出现在WVD的图像中,因为信号中存在多个分量。FK和EMD的图像并不清晰,因为它们依赖于分解层次的数量。STFT图像比CQCF图像具有更多的噪声。深度学习可以从这些图片中提取更抽象的特征进行分类。然而,人们根据这些图片很难对它们进行故障分类,尤其是大量的图像。

       

图 6 内圈故障大小为0.6mm的8种时频图


表 2 不同时频方法在不同训练样本数下的分类正确

       

(后面这些是对实验结果的阐述和总结,自己看别人论文看的最多的就是别人的结果,所以同时自己写论文时也要把结果写的客观、清晰明了)

训练前,将准备好的图像随机打乱,以模拟真实环境的不确定性。一般来说,训练集的数量会影响CNN模型的性能,如表2所示。一旦选择了训练样本,剩余的图像作为验证集。从表2中可以看出,除了FK和HHT外,其他6种方法即使只训练了5%的图像,也能达到98%以上的准确率。

另外,随着训练样本的增加,每种方法的准确率也相应增加如图7所示。HHT的准确度由92.57%递增至99.79%。当训练样本数达到90%(约4320个样本)时,除WVD和HHT外,其他方法的准确率均达到100%。为了比较不同训练样本验证集的准确性,可视化柱状图如图8所示。因此,CWT和FST即使在小样本训练下也能达到99.2%以上的准确率。STFT、CQCF和IF的区别如图6所示。然而,在本文方法中,这三种方法的精度差异非常小。虽然CQCF和IF在直观上过于相似,但它们可以比STFT获得更高的性能。FK的性能取决于样本的数量和分解水平,因为每个相同颜色的波段都是中心频率的近似。在我们的研究中选择了八个分解层次。交叉项的存在会影响WVD的分类结果。HHT由于依赖EMD,分类效果最差。

       

图 7 实验2正确分类结果折线图(The broken line graph)

       

图 8 实验2正确分类结果柱状图(The bar graph)

(由于训练过程可视化本人了解的少,翻译的可能有些生硬)

随着可视化技术的发展,t-SNE可视化被用于深度学习(t-SNE见参考资料2),以观察模型由4800幅图像中的50%进行训练,仅使用最后一层全连接层的输出值进行聚类。从图9 (a)可以看出,对原始数据进行聚类比较困难。这些样本经过预训练好的CWT模型处理后,实现了图9 (b)中良好的聚类性能。不难想象,其他层的聚类过程(本文未显示)也在从图9 (a)逐渐演变到(b)。此外,可视化技术还涉及到每一层的激活过程。学习的过程是从初始图像中提取特征。图10 (a)为内圈故障经过CWT的图像。此外,可视化技术涉及到每一层的激活过程。学习的过程是从初始图像中提取特征。

       

图 9 所提方法的不同层不同特征的二维聚类表示,其中(a)表示原始数据的结果,(b)表示F3层的结果。

图10 (a)为内圈故障CWT图像。通过第一个卷积层(C1)和第一个最大池化层(P1)后得到的图片分别如图10 (b)和图10 (c)所示。第一卷积层共有96个通道,可以从原始图像中提取不同的特征。最大池化层是用来减少最后一层数量,与图10 (b)相比,图10 (c)变成更模糊更黑。在图10 (a)每个通道中白色像素代表在这个位置被激活,黑色像素则表示激活被抑制。一些灰色通道表示原始图像上位置没有激活。一方面,了解不同层的卷积图像目的之一是为了说明深度学习的学习过程特征变得越来越抽象,如图10(d)-(h)所示。另一方面, 训练好的CWT模型利用在不同通道学习到的特征,逐步对图像进行分类。局部特征提取区域如图10(i)-(m)所示。前几层滤波器的特征提取区域较小,其特征很模糊。随着层越深,局部特征提取区域越大,特征就能被提取出来。

       

图 10 不同层学习到的激活过程和特征,

其中(a)为初始图像;

(b)(c)分别来自C1层和P1层激活的图像;

(d)(h)对应于卷积层C1到C5的一个通道特征;

迁移模型从C1到C5学习到的局部特征如(i)(m)所示


5.2 实验2

美国凯斯西储大学(CWRU)的滚动轴承数据通常用来验证新提出诊断方法的有效性。实验采用2马力的电机,通过驱动端(Drive)加速度计(DE)、风扇端(Fan)(翻译成风扇端,是因为不知道如何翻译更确切)加速度计(FE)和基座(Baseline)加速度计(BA)采集3个通道的故障数据。

       

图 11 实验2 CWRU轴承故障实验台

驱动端轴承6205-2RS JEM SKF分别在内圈、滚子和外圈上模拟直径从0.007到0.040英寸的故障尺寸。负载包括0,1,2,和3马力,转速范围从1797至1720rpm。更多信息可以在本公 众号推文中看到。在本研究中,驱动端、风扇端和基座加速度计数据分别为内圈故障、滚动体故障和外圈故障,采样频率为12kHz。由于外圈故障没有0.028英寸的尺寸,为了保持样品平衡,只选择0.007,0.014和0.021英尺。此外,在3点钟、6点钟和12点钟3个不同位置采集了3个通道的外圈故障数据,本论文选择3点钟的数据。在大多数时候,轴承运行正常。因此,正常轴承数据也被视为分类的样本类型。正常轴承数据量小于故障轴承数据量,幸运的是,数据增强技术可以弥补这一不足。最后,将所有样本分为3840组,每组5000个点,每种故障类别有960组。本试验台的详细信息见表3

表 3 实验2轴承实验工况信息

       

与实验1类似,将所有3840组数据转换成8幅不同的时频图像,这些图像的大小控制为224×224×3。分类结果如表4所示,CWT和FST在这些方法中具有同样优秀的性能。而WVD和STFT也表现良好,当训练样本达到80%时,准确率可以达到100%。虽然交叉项和固定分辨率问题确实存在,但它们可能对深度学习的影响不大。

表 4 不同时频方法在不同训练样本数下的分类正确

       

与实验1相反,CQCF和IF在本实验中比STFT的性能更差,虽然这三种方法有非常相似的效果。由于样品长度和分解层数的影响,HHT和FK在这种情况下表现不佳。同样的,实验2分类性能如图12所示。每一层的聚类和激活过程类似于实验1,在本节中没有显示。

       

图 12 实验2结果折线图


Ⅵ、结论

(该节算是最容易写的了,要精练总结该论文实验的结果及意义,最好是可以分点说明。可以再加以一些研究不足及展望)

在机械系统故障诊断中,轴承一直是一个非常重要的问题。深度学习的出现可以在不需要先验知识的情况下从复杂目标中提取特征,再根据这些特征进行分类。迁移学习的应用从通常需要花费大量时间和精力才能建立的成功模型中继承了优良的结构和参数。因此,该方法几乎不需要任何先验知识,只需要调整输出层神经元的数量即可。基于本文方法中8种时频方法的分类结果,可以得出如下结论:

(1)它可以将不同长度的原始数据转换成相同大小的图像,以满足该方法的需要

(2) CWT和FST是本方法最好的轴承诊断方法,因为它们在两种情况下都有很好的泛化结果

(3)由于STFT和WVD的性能较好,尤其是在实验2,因此该方法可能对固定的时频分辨率和交叉项不敏感CQCF和IF的图像质量较高,但性能与STFT相似

(4)保证FK可靠性的关键是尽可能多的选择数据点和分解层,如案例1所示。然而,HHT在这两种情况下的表现都很差。


此外,该方法还存在一些局限性今后还需进一步研究。模型的输入应该考虑多个尺寸的图像,而不是手动调整统一的尺寸。与传统机器学习方法相比,本文提出的方法仍然需要进行训练,随着训练集数量的增加,训练时间会越来越长。将迁移学习与其他方法相结合,可以提取更鲁棒的特征,加快训练过程。该方法在齿轮故障、转子故障等其他领域的有效性还有待进一步研究。

注明

论文由本人翻译并润色,在此过程中,有一些专业名词,由于本人水平有限,翻译之处若会有些生硬或偏离原作者思想,恳请读者不吝批评指正!

若你也想对故障诊断、深度学习、信号处理、寿命预测等方向学习分享,欢迎加入我们!


参考文献

[1] Wang, Jianyu, et al. "A deep learning method for bearing fault diagnosis based on time-frequency image." IEEE Access 7 (2019): 42373-42383.

[2] https://zhuanlan.zhihu.com/p/327699974

作者:小平

如需转载,请后台联系作者

说明:部分图片来源网络,若有侵权,烦请联系处理

来源:故障诊断与python学习
振动航空航天理论电机控制试验
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2023-06-22
最近编辑:1年前
故障诊断与python学习
硕士 签名征集中
获赞 67粉丝 66文章 141课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈