针对故障诊断领域开源代码较少,小编整理搜集了一些开源代码与大家进行分享。本期分享的是华中科技大学何艺鸣博士提出的一种基于多通道信号Transformer(MSiT)的数控机床主轴电机故障诊断方法 。该论文是2023年发表在SCI一区IEEE Transactions on Reliablity期刊上的,并提供有该网络的开源代码,Transformer开源代码较少 ,且为多通道信号输入,因此这篇开源代码适合参考借鉴并在上面进行改进学习,适合具备一定的深度学习基础知识的学习者。 该方法是用电机 整机 数据 进行跨设备 、复合故障 智能诊断,很贴合实际工程应用场景,非常值得阅读!
1 论文基本信息 论文题目 : MSiT: A Cross-Machine Fault Diagnosis Model for Machine-Level CNC Spindle Motors论文期刊 :IEEE Transactions on ReliablityDoi :10.1109/TR.2023.3322417
作者 :Yiming He and Weiming Shen , Fellow, IEEEState Key Laboratory of Digital Manufacturing Equipment and Technology, Huazhong University of Science and Technology 第一作者简介: 何艺鸣 ,目前在华中科技大学机械科学与工程学院攻读机械工程博士学位,师从沈卫明教授。主要研究方向为深度学习及其在机器设备(如工业机器人和电机)智能故障诊断中的应用。
通讯作者简介 :沈卫明 ,(Fellow, IEEE) 1983年和1986年分别在北京交通大学获得学士和硕士学位,1996年在法国贡比涅工业大学获得博士学位。沈老师目前是华中科技大学的教授,以及加拿大西安大略大学的兼 职教授。主要研究方向为智能软件代理、无线传感器网络、物联网、大数据及其在工业中的应用。沈教授是加拿大工程院和加拿大工程学院的院士,同时也是加拿大安大略省注册工程师。
2 摘要 现代智能制造系统的复杂装备跨机器故障诊断是有必要的。制造和装配误差会导致数控机床(CNC) 主轴电机中固有存在的个体差异,导致故障诊断更具挑战性。跨机器故障诊断(Cross machine fault diagnosis, CMFD)任务 的验证对于确保机器级诊断的可靠性和有效性至关重要,但在当前的数据驱动方法中经常被忽略。最新的Transformer架构,以其出色的全局特征提取能力而闻名,是一个理想的解决方案,但尚未应用于该场景。针对数控机床主轴电机的CMFD任务,提出了一种新的多通道信号Transformer(Multichannel signal transformer, MSiT)方法 。具体来说,本文提出了一种适合处理多通道信号作为Transformer输入的特殊时间标记器(tokenizer) ,即单向补丁 (Unidirectional patch, UDP)。它在所有通道上执行以捕获通道相关特征 ,而不需要额外的转换。详细分析了结构超参数对故障诊断性能的影响,以供工程参考。用实际工业电机信号与基准模型和一些最新方法进行了比较,验证了该方法的优越性。此外,基于t-SNE和热图揭示了MSiT的双向决策机制。 关键词 :复合故障诊断,跨机器故障诊断 (CMFD),主轴电机,Transformer3 目录 注:本文只选中原论文部分进行分享,若想拜读,请下载原论文进行细读。 4 引言 跨机器故障诊断是一种特殊的工业需求,特别是在机器级机械设备中。根据电机厂家的检验报告和专家知识,即使是同一批次生产的同一型号 ,由于不可避免的制造和装配差异造成的单个电机之间的固有差异 也是常见的 。机器电机的个体差异导致数据分布的差异 ,这一点往往被学者们所忽视。在上述大多数基于深度学习的研究中,用于模型性能评估的训练样本、验证样本和测试样本都来自同一设备单元,数据分布相同。这些基于传统评估框架的实验结论 可能无法保证 基于深度学习的模型移植到真实工业场景中的有效性 。在实际工程中,由于数据分布的不同,不考虑个体差异的模型设计和验证可能导致模型泛化不足,导致诊断结果不正确。因此,开发一种针对机器主轴电机的跨机器诊断算法 至关重要。 根据上述分析,目前上述研究的方法局限性如下 :
1) 大多数研究的对象是实验室零件级部件 ,如无噪声干扰的滚动轴承和齿轮箱,其信号复杂性低于数控机床主轴电机。因此,以往的方法对数控主轴电机的特征提取和泛化能力不足,可能无法得到正确的结果。 2) 机器级机械设备的复合故障诊断与定位的研究很少 ,特别是考虑个体差异的跨机器故障诊断(CMFD)。机器级复合故障的解耦和定位还没有得到充分的研究。 近年来,Transformer被提出 并补充了 卷积神经网络(CNN)和递归神经网络在全局特征提取方面的不足 ,在自然语言处理(NLP)领域掀起了一场革命,并得到了大量成功的实践应用,如 目前著名的ChatGPT [25]。同时,改进Transformer在计算机视觉(CV)中的应用也逐渐增多[26]。近年来,学者们开始对Transformer 的部分部件级故障诊断进行探索,并表现出优异的类内紧密性和类间可分性 [27],[28]。Transformer作为一种以全局特征提取著称的深度学习模型 ,是一种非常 理想的适应对个体差异的全局特征进行跨机器诊断的结构 。不幸的是,据我们所知,没有Transformer变体已开发用于机器级数控主轴电机,特别是考虑到个体差异的CMFD任务。
针对数控主轴电机的CMFD问题 ,提出了多通道信号Transformer(MSiT)模型 。考虑到复合故障耦合和多模态振荡导致的非规则振动,采集了多个传感器的振动信号 ,以获取综合信息。设计了一种 特殊的单向补丁 (Unidirectional patch, UDP )来适应二维格式的多通道信号 。该算法对原始信号进行处理,不进行任何额外的信号滤波和形状重构,既保留了原始的时空特征,又减少了额外的计算成本。与Vision Transformer(ViT)的空间补丁不同,UDP 将处理所有输入通道,仅在时间方向上分割信号 。在通道方向上增加注意力分割可能没有意义,并且可能失去不同振动方向之间的相关特征。随后的实验验证 了该算法在多个电机的复合故障( 包括机械故障 和装配故障)的有效性 。此外,还通过可视化揭示了双向决策机制具有较高的CMFD泛化性 。
综上所述,本文的贡献总结如下:
1) 针对数控机床 (不限于实验室零件)的主轴电机 ,提出了一种新的CMFD方法。该方法能够有效降低个体差异,提供可靠的复合故障原位诊断 (in-situ diagnosis,即可以在现场进行诊断),并在实际工业生产线的数控主轴电机上进行了评价。
2) MSiT的设计考虑到了全局注意力模块与个体差异的全局特征相匹配。为适应多通道传感器的工业信号特征提取,设计了一种特殊的基于UDP和外部位置编码(Interexternal position coding, IEPC)的时间标记器。其特殊的结构改进了Transformer对多通道长窄信号的训练逻辑,能够应对新的CMFD任务。
3) 基于t-SNE和热图揭示了MSiT的双向决策机制。综合实验证明了机器级电机的个体差异 ,验证了所提出的MSiT在新的CMFD评价基准下的优越性。
本文的其余部分组织如下。第二部分介绍了基于MSiT的框架和算法理论。第三节给出了实验步骤和结果。最后,第四部分对本文进行总结。
5 所提方法 CMFD系统的诊断框架如图1所示。考虑到不同主轴电机个体之间的固有差异,增加了CMFD的离线验证。这可以看作是对实际应用案例的初步验证。确保原位诊断的可靠性和有效性至关重要,但这往往被忽视。提出的框架的诊断步骤如下: 1) 采用 多个振动传感器采集 数控主轴电机的振动信号;
2) 根据 传统 的深度学习 框架 对样本进行划分。对建立的模型进行训练、验证和测试,获得 源域精度 (Source domain accuracy, SDA );
3) 将第2步 训练好的DL模型 直接 应用于 来自 其他电机 的信号,以获得 跨机精度 (Cross machine accuracy, CMA );
4) 基于SDA和CMA 选择 MSiT的 最终超参数和结构 ;
5) 将深度学习模型 应用于工业生产线中 ,诊断数控机床电机的健康状态和故障位置。
图1 基于MSiT的诊断框架
本节详细阐述了所提出的MSiT ,其结构如图2所示。网络架构主要由 专用的UDP时间标记器 (tokenizer)、Transformer编码器 和分类器 模块组成 。
1) 多传感器信号输入 :主轴电机复杂的多模态振荡导致其振动分布不规则[1]。由多个传感器采集不同位置的振动信息,并进行标准化处理,初步减少了极端脉冲的影响。每个样品的预处理操作如下: 式(1)
其中 是第 个通道的原始数据样本, 是标准化数据样本, ; 和 分别是训练集的平均值和标准差, 是每个通道中的信号点总数, 。由于 ,模型输入是狭长形状。
2) 带UDP的时间标记器 :原始Transformer[29]通过字典查询使用时间标记器处理一维时间块序列(token sequence)。ViT使用补丁(patch)映射来处理图像格式。然而,多通道信号是窄长的二维数据格式。分割通道维度(如ViT)似乎没有意义,因为没有空间信息的通道是无序的。因此,带有UDP(Unidirectional patch, 单向补丁) 的时间标记器是 专门为适应多通道信号而设计的 。 具体来说多通道信号在时间方向上被分割成N个2-D块以获得序列 ,其中 , 是每个补丁的通道长度。值得注意的是,所有通道都是同时分段的。因此,将补丁定义为UDP类型。每个UDP沿信道被展平,并通过一个共享的线性变换矩阵映射到高维嵌入空间,该变换矩阵公式如下: 式(2)
式(3)
其中 是一个可学习矩阵, 是信号嵌入的维度; 是相应的可学习偏差。
3) 类别时间标记器和位置编码 :类似于BERT[30],一个初始化的可训练嵌入 被添加到UDP时间块序列的开头 。因此,得到了长度为 的一个嵌入序列。这个类别标记器经后续Transformer编码器处理后的输出作为数控主轴电机的特征表示。位置信息被注入到UDP嵌入序列 中,以利用时间序列顺序。ViT框架[26]引入了1-D和2-D两种位置编码格式。二维位置编码将输入作为一个二维补丁网格。UDP输入仅在时间方向上分段,因此二维位置编码不适合。加入一维可学习位置编码,提取绝对位置信息和相对位置信息 ,可以表示为: 式(4)
其中 是一个随机初始化的可学习矩阵。它可以同时对时间标记器之间和内部位置信息进行编码,被命名为IEPC。另一种一维编码 ,即外部位置编码 (EPC) ,仅考虑时间标记器之间的位置信息,从向量广播,即 。最后的实验证明了这两种编码的性能。
4) Transformer块 :将多个Transformer基本块堆叠在一起进行特征提取和表征。我们尽可能地遵循原来的Transformer。这种故意简单设置的一个优点是,NLP和CV的一些改进模型几乎可以开箱即用。其基本形式主要包括多层交替自注意力模块和多层感知器块(MLP) 。每个Transformer块前采用层归一化 (Layer normalization, LN),每个块后加入残余结构 ,如图2所示。带位置信息的多通道信号UDPs用LN处理,LN计算公式如下:
式(5)
其中 是逐元素乘积运算; 和 是可学习参数。
通过相似度计算,利用尺度点积注意力进行注意力评价。分别计算输入向量的查询矩阵 、键矩阵 和值矩阵 式(6)
其中 , , 是可学习参数; 、 和 是查询、键和值的维度。然后,计算 和 的点积,并除以缩放因子来表征序列的相似性。其输出通过 函数和 运算以0.1的速率归一化,并乘以值矩阵 得到最终的自注意力模块的输出 式(7)
将 个不同的自注意力机制的整合再次投射形成多头自注意力机制,其输出被添加到UDP输入作为最终的MSA输出:
式(8)
其中 ; 为串联多头的线性投影。
在Transformer块上增加 了具有高斯误差线性单元(GELU)激活函数和 残余连接的MLP模块 。将MSA的输出归一化,然后进行两次MLP非线性变换。两层MLP的神经元分别等于信号嵌入维数 和 。注意,UDPs没有被展平,只是内部的非线性映射。设置为0.01的 被添加到每个非线性映射。GELU用于MLP中的非线性激活,而不是整流线性单元,其描述如下: 式(9)
在上述分析的基础上,通过MSA获得全局信息,通过MLP提取局部信息进行后续分类。Transformer块的迭代过程为:
式(10)
式(11)
式中, 为Transformer块的数量。对第 块的最终输出进行展平和非线性处理,其随机损失率设为0.01并作为最终的特征表示。后续实验将 和 两层的神经元分别设置为300和100。本文提出的方法是针对 基于多标签 分类的复合故障诊断 ,因此在分类器中使用 激活函数代替 函数 ,其描述如下:
式(12)
式(13)
其中 , ; 是故障类别的数量。
MSiT的训练遵循通用DL方案,使用Adam优化器 。多标签分类采用二元交叉熵损失函数 [31]。详细的MSiT步骤见算法1。 算法1 基于MSiT故障诊断算法
6 实验 为了评估MSiT方法设计的有效性和探索CMFD的必要性,进行了全面的实验。这些模型的代码是在intel (R) Core (TM) i7 10700 CPU的计算机上使用Python 3.7和TensorFlow 2.6 编写的。 实验装置包括18台数控机床主轴电机整机 ,一个NI cDAQ-9189底盘,相应的NI 9231数据采集卡和4个DYTRAN 3055D6传感器。这些故障电机 是不合格产品 和用户自行修理的 。四个传感器 安装在前后滚动轴承 (前:驱动端, 后:风扇端)附近采集振动信号 ,如图3所示。采样频率 设置为25600Hz 。由同一个伺服系统驱动 的电动机每分钟运行1000转 。根据厂家的拆卸诊断报告,已知的故障细节如表1所示 。
图3 11号电机的现场采集和频率分析
表1 电机数据集详细
与零件级部件明显的故障频率不同,经典的包络分析对多个通道上的数据进行分析,对于完整电机 ,复合故障难以定位 。能够通过包络谱找到故障特征频率的故障部件很少 ,以11号电机 进行包络分析为例 ,如图3所示。红色虚线 是故障特征频率,对应风扇端 FAG-6208-C-2Z轴承的故障特征频率 ,但仅在第三通道能够找到 故障特征频率。在大多数弱故障电机 中,包络谱中只能找到旋转频率 ,但却未找到了相应的故障特征频率。因此,端到端诊断方法似乎是理想的解决方案。 表2 MSiT推荐的超参数设置
6.2 MSiT模型选择与验证 在本节中,对电机数据集使用具有不同超参数的MSiT模型。具体而言,1-14号电机用于基于传统DL框架训练和测试 ,而15-18号电机将 直接用作跨机器诊断测试集 ,以获得跨机器诊断准确率(Cross machine accuracy, CMA)。根据CMFD框架选择最终结构和超参数,如表2所示。 为UDP通道数 ,与输入信号通道数相同 。 为输入信号各通道下的信号长度 , 为每个UDP的长度 , 为单个UDP的长度占 输入信号总长度的比例 。 、 、 分别 表示Transformer块数 、每个多头自注意机制的头数 、信号嵌入维数 。 如图4和表3所示,探讨了这些超参数对模型尺寸和泛化性能的影响,以供工程参考。A-F代表六个任务组,与表3的任务组相对应。第二个参数代表与base不同的变量,第三个参数代表一个特定的值。例如,A- -1表示任务组A中 的模型与基准模型的UDP通道数C不同 ,其中 。每个电机信号拿1000个样本用于模型训练和验证 。每个样本包含四个通道信号,其长度为5120个数据点 ,以保证电机旋转至少三个周期以获得足够的诊断信息。学习率设为0.001,训练epoch数为20。训练阶段的批大小设置为64。 表3 超参数对模型性能的影响
可以看出,MSiT的尺度和泛化性能受到超参数的影响。注意,各参数下的SDA均达到100% ,但反映泛化能力 和应用潜力的CMA有所下降 。使用推荐超参数作为对比的基础模型,CMA达到了最高的94.53%。 在A组的对比 中,没有使用UDP 对信号通道维度进行分段,类似于ViT。CMA的下降意味着通道划分可能导致模型提取与实际故障无关的特征,这证明了UDP设计的必要性和合理性 。B组对比了UDP的长度和比例 。UDP太短可能导致每个注意力模块内全局信息不足,而UDP太长可能导致补丁数量不足,无法提供足够的注意力,并且会增加每个UDP内的线性投影参数。根据实验结果,推荐 为10% 。Transformer块中 、多头自注意机制的头数 、信号嵌入维数 越大,则模型的规模越大。小规模模型 可能无法提供 足够的全局特征提取 。相反,大模型会导致网络的过度参数化 。不合理的超参数选择不仅会降低CMA的应用,还会增大标准差,使网络性能更加不稳定。应根据CMA结果确定适当的超参数 。此外 ,还探讨了不同的位置编码模型。可以看出,位置编码提高了泛化能力 ,并且由于额外的内部编码 可以作为特征过滤机制,IEPC获得了更高的性能。 6.3 可视化与分析 本节揭示了一种新的双向决策机制 ,并分析了其对CMFD泛化性的影响。基于t-SNE和特征热图进行可视化,如图5和图6所示。从图5(a) 中可以看出,即使是正常的电机 也表现出明显的类内聚类 ,反映出明显的个体差异 。在第4个 Transformer块的MSA层中,大多数正常电机 个体的样本已经聚类 。在第8个 MSA层中,可以分离大多数类 。类内聚类现象仍然存在,但随着层数的加深 ,MSiT逐渐 关注并抑制这些与故障无关的特征 ,以提高类内紧密度 。如图5(f)所示,这个问题在第10块中得到了极大的改善 ,这表明MSiT过滤了与个体相关的特征 。由于复合故障的多标签分类,部分共享标签的类别重叠,如电机3号、4号、7号、9号。
图5 部分MSiT层的t-SNE可视化 (a)原始 输入 (b)第2个 transformer块的MSA层 (c)第4个 transformer块的MSA (d)第6个 transformer块的MSA层 (e)第8个 transformer块的MSA层 (f)第10个 transformer块的MSA层
为了进一步探索决策过程 ,我们将分类层的特征输入可视化 ,然后叠加热图权重,如图6所示。对于决策权重,颜色越深 ,权重值越高 。相反,较浅的颜色表示较小的权重值,甚至是负数。最终输出概率由所有决策特征和决策权重的乘积和得到。 当相应的决策权重大于零 时,特征增强,如红色箭头所示 。当决策权重为负时 ,大型决策特征实际上会对最终结果产生负面影响,如绿色箭头所示 。可以看出,MSiT的决策 不仅通过增强相关特征 来实现,而且通过抑制不相关特征来实现 。在图6(a)中,对于样本(0,1,1,0),大部分特征在前轴承(驱动端轴承)的决策权重下被抑制。在图6(b)中,与后轴承(风扇端轴承)相关的三个主要故障特征在后轴承标签的决策权重下得到增强,而一些无关的特征被抑制。这表明MSiT模型将输出该样本前轴承故障标签的概率较低 ,后轴承故障标签的概率较高 。由 函数提供的双向决策权值对复合故障诊断框架具有重要意义。
图6 双向决策机制可视化 (a) (0,1,1,0)的前轴承权重(0,1,1,0) (b)后轴承权重 (c) (0,1,1,0)的装配权重(d) (0,1,1,0)的正常权重 (e) (0,0,0,1)的正常权重 (f) (1,1,0,0)的前轴承权重
此外,从图6(e)中 可以看出,代表单一类别的样本(0,0,0,1)提取的特征中还包含一些不相关的特征,这些特征被决策权值所抑制。这意味着,以固有个体差异 和工业噪声为代表的干扰特征可能会进入决策层 ,因为它们足够明显,足以影响类间可分性 。所提出的MSiT模型具有良好的全局特征提取能力 ,在决策过程中更关注这些不相关的特征 ,从而抑制了这些特征 ,提高了类内紧密度,正如之前用t-SNE分析的那样。相反,如果模型没有足够的全局特征提取能力 ,则可能难以区分和抑制这些与故障无关的特征,这将使决策特征与故障本质没有真正的关联 ,从而导致 过拟合现象和跨机诊断的泛化性能差 。 6.4 对比实验 在本节中,我们使用了几种最先进的深度学习故障诊断模型进行比较,包括Zhang的具有第一层宽卷积核的深度CNN(WDCNN)[32]和具有训练干扰的深度CNN(TICNN) [10], Zhi的CNN-LSTM [33], Zhuang的堆叠残差扩张卷积(SRDCNN)[34], He的MSRFCNN[1]。所有DL模型都在CMFD框架下使用CNC电机数据集进行训练,验证和测试。利用t-SNE对这些模型的决策层进行可视化,如图7所示。表4、图8、图9总结了10次实验中5个最高结果的平均值。 表4 对比实验结果
图8 对比模型的CMA箱线图
图9 对比模型的SDA和CMA
如图8 所示,所有先进模型 的SDA都很容易达到100% ,但 作为测试真实情况下初步应用的CMA ,表现出不同程度的下降 。只使用源域进行验证不能保证实际工程的可靠性,特别是对于具有内在个体差异性的机器设备。TICNN和WDCNN的性能不稳定,标准差较高,CMA分别仅为67.27%和72.71%。LSTM-CNN和SRDCNN在滚动轴承上取得了优异的泛化能力,但在电机诊断上的CMA分别仅为82.45%和82.73%。与其他基于CNN的模型相比,MSRFCNN是专门为电机检测而设计的,性能更高更稳定,CMA准确率达到88.85%。在CMFD要求下,MSiT 对复合故障解耦和定位的诊断性能最佳且稳定,CMA为94.53% 。这一结果进一步证明了所提出的MSiT方法的优越性。 如图7 所示,类内聚类出现在这些基于CNN的对比模型 中。个体差异被提取为决策特征 ,导致模型的跨机器诊断泛化性能较低。如图7(f) 所示,所提出的MSiT降低了类内聚类,这意味着MSiT成功地识别了个体差异并对其进行了筛选 ,以获得更高的CMA。注意t-SNE中的类间距离 通常用于 评估单个故障标签 的分类,而不能代表复合故障标签 的诊断性能。具有相同子类别 的电机样本应接近甚至重叠 。如图7(a) 中的WDCNN,类间距离过远 ,表明提取的特征 包含额外的干扰因素(如之前分析的个体差异),而不是与故障相关 ,这再次验证了我们的假设。 图7 决策层的t-SNE可视化 (a)WDCNN (b) TICNN (c) CNN-LSTM (d) SRDCNN (e) MSRFCNN (f) MSiT
7 总结 本文重点研究 了一种新的数控机床主轴电机故障诊断 框架——CMFD。设计了一种新的带UDP的MSiT模型 ,增强了个体泛化和复合故障解耦能力 。利用实际工业电机数据集在CMFD诊断框架上对该模型进行了验证。通过实验验证,提出了超参数选择原则,供工程参考。此外,基于t-SNE和热图的可视化揭示了 具有高泛化性能 的MSiT的双向决策机制。最后,与先进的基于CNN模型进行对比实验,进一步证明了该模型的优越性。所提出的MSiT达到最高的CMA为94.53%。其他机器部件的分类是我们未来工作的重要组成部分,有助于建立全面的机器级工程数据集,进一步促进故障诊断在工业中的应用。此外,Transformer模型仍有很大的改进空间,以解决各种工业问题。 8 README.md This is the original Tensorflow code for MSiT model, which comes from a paper of IEEE Transactions on Reliablity. This is a transformer example of application for fault diagnosis on multi-channel time-domain signals. Title: MSiT: A Cross-Machine Fault Diagnosis Model for Machine-Level CNC Spindle Motors
编辑:李正平
校核:何艺鸣、张泽明、张勇、王畅、陈凯歌、赵栓栓、董浩杰
该文资料(MSiT)搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除。