首页/文章/ 详情

一种基于多通道信号Transformer(MSiT)的数控机床主轴电机故障诊断方法

故障诊断与python学习

5月前浏览5880

针对故障诊断领域开源代码较少，小编整理搜集了一些开源代码与大家进行分享。本期分享的是华中科技大学何艺鸣博士提出的一种基于多通道信号Transformer(MSiT)的数控机床主轴电机故障诊断方法。该论文是2023年发表在SCI一区IEEE Transactions on Reliablity期刊上的，并提供有该网络的开源代码，Transformer开源代码较少，且为多通道信号输入，因此这篇开源代码适合参考借鉴并在上面进行改进学习，适合具备一定的深度学习基础知识的学习者。

该方法是用电机整机数据进行跨设备、复合故障智能诊断，很贴合实际工程应用场景，非常值得阅读！

1 论文基本信息

论文题目：MSiT: A Cross-Machine Fault Diagnosis Model for Machine-Level CNC Spindle Motors

论文期刊：IEEE Transactions on Reliablity

Doi：10.1109/TR.2023.3322417

论文时间：2023年

作者：Yiming He and Weiming Shen , Fellow, IEEE

机构：

State Key Laboratory of Digital Manufacturing Equipment and Technology, Huazhong University of Science and Technology

第一作者简介：何艺鸣，目前在华中科技大学机械科学与工程学院攻读机械工程博士学位，师从沈卫明教授。主要研究方向为深度学习及其在机器设备(如工业机器人和电机)智能故障诊断中的应用。

通讯作者简介：沈卫明，(Fellow, IEEE) 1983年和1986年分别在北京交通大学获得学士和硕士学位，1996年在法国贡比涅工业大学获得博士学位。沈老师目前是华中科技大学的教授，以及加拿大西安大略大学的兼职教授。主要研究方向为智能软件代理、无线传感器网络、物联网、大数据及其在工业中的应用。沈教授是加拿大工程院和加拿大工程学院的院士，同时也是加拿大安大略省注册工程师。

2 摘要

现代智能制造系统的复杂装备跨机器故障诊断是有必要的。制造和装配误差会导致数控机床(CNC) 主轴电机中固有存在的个体差异，导致故障诊断更具挑战性。跨机器故障诊断(Cross machine fault diagnosis, CMFD)任务的验证对于确保机器级诊断的可靠性和有效性至关重要，但在当前的数据驱动方法中经常被忽略。最新的Transformer架构，以其出色的全局特征提取能力而闻名，是一个理想的解决方案，但尚未应用于该场景。针对数控机床主轴电机的CMFD任务，提出了一种新的多通道信号Transformer(Multichannel signal transformer, MSiT)方法。具体来说，本文提出了一种适合处理多通道信号作为Transformer输入的特殊时间标记器(tokenizer)，即单向补丁(Unidirectional patch, UDP)。它在所有通道上执行以捕获通道相关特征，而不需要额外的转换。详细分析了结构超参数对故障诊断性能的影响，以供工程参考。用实际工业电机信号与基准模型和一些最新方法进行了比较，验证了该方法的优越性。此外，基于t-SNE和热图揭示了MSiT的双向决策机制。

关键词：复合故障诊断，跨机器故障诊断 (CMFD)，主轴电机，Transformer

3 目录

1 论文基本信息

2 摘要

3 目录

4 引言

5 所提方法

5.1 所提诊断框架

5.2 MSiT模型的结构

5.3 可视化与分析

5.4 对比实验

6 总结

7 README.md

注：本文只选中原论文部分进行分享，若想拜读，请下载原论文进行细读。

小编能力有限，如有翻译不恰之处，请多多指正~

4 引言

跨机器故障诊断是一种特殊的工业需求，特别是在机器级机械设备中。根据电机厂家的检验报告和专家知识，即使是同一批次生产的同一型号，由于不可避免的制造和装配差异造成的单个电机之间的固有差异也是常见的。机器电机的个体差异导致数据分布的差异，这一点往往被学者们所忽视。在上述大多数基于深度学习的研究中，用于模型性能评估的训练样本、验证样本和测试样本都来自同一设备单元，数据分布相同。这些基于传统评估框架的实验结论可能无法保证基于深度学习的模型移植到真实工业场景中的有效性。在实际工程中，由于数据分布的不同，不考虑个体差异的模型设计和验证可能导致模型泛化不足，导致诊断结果不正确。因此，开发一种针对机器主轴电机的跨机器诊断算法至关重要。

根据上述分析，目前上述研究的方法局限性如下：

1) 大多数研究的对象是实验室零件级部件，如无噪声干扰的滚动轴承和齿轮箱，其信号复杂性低于数控机床主轴电机。因此，以往的方法对数控主轴电机的特征提取和泛化能力不足，可能无法得到正确的结果。

2) 机器级机械设备的复合故障诊断与定位的研究很少，特别是考虑个体差异的跨机器故障诊断(CMFD)。机器级复合故障的解耦和定位还没有得到充分的研究。

近年来，Transformer被提出并补充了卷积神经网络(CNN)和递归神经网络在全局特征提取方面的不足，在自然语言处理(NLP)领域掀起了一场革命，并得到了大量成功的实践应用，如目前著名的ChatGPT[25]。同时，改进Transformer在计算机视觉(CV)中的应用也逐渐增多[26]。近年来，学者们开始对Transformer的部分部件级故障诊断进行探索，并表现出优异的类内紧密性和类间可分性[27]，[28]。Transformer作为一种以全局特征提取著称的深度学习模型，是一种非常理想的适应对个体差异的全局特征进行跨机器诊断的结构。不幸的是，据我们所知，没有Transformer变体已开发用于机器级数控主轴电机，特别是考虑到个体差异的CMFD任务。

针对数控主轴电机的CMFD问题，提出了多通道信号Transformer(MSiT)模型。考虑到复合故障耦合和多模态振荡导致的非规则振动，采集了多个传感器的振动信号，以获取综合信息。设计了一种特殊的单向补丁(Unidirectional patch, UDP)来适应二维格式的多通道信号。该算法对原始信号进行处理，不进行任何额外的信号滤波和形状重构，既保留了原始的时空特征，又减少了额外的计算成本。与Vision Transformer(ViT)的空间补丁不同，UDP将处理所有输入通道，仅在时间方向上分割信号。在通道方向上增加注意力分割可能没有意义，并且可能失去不同振动方向之间的相关特征。随后的实验验证了该算法在多个电机的复合故障(包括机械故障和装配故障)的有效性。此外，还通过可视化揭示了双向决策机制具有较高的CMFD泛化性。

综上所述，本文的贡献总结如下：

1) 针对数控机床(不限于实验室零件)的主轴电机，提出了一种新的CMFD方法。该方法能够有效降低个体差异，提供可靠的复合故障原位诊断(in-situ diagnosis，即可以在现场进行诊断)，并在实际工业生产线的数控主轴电机上进行了评价。

2) MSiT的设计考虑到了全局注意力模块与个体差异的全局特征相匹配。为适应多通道传感器的工业信号特征提取，设计了一种特殊的基于UDP和外部位置编码(Interexternal position coding, IEPC)的时间标记器。其特殊的结构改进了Transformer对多通道长窄信号的训练逻辑，能够应对新的CMFD任务。

3) 基于t-SNE和热图揭示了MSiT的双向决策机制。综合实验证明了机器级电机的个体差异，验证了所提出的MSiT在新的CMFD评价基准下的优越性。

本文的其余部分组织如下。第二部分介绍了基于MSiT的框架和算法理论。第三节给出了实验步骤和结果。最后，第四部分对本文进行总结。

5 所提方法

5.1 所提诊断框架

CMFD系统的诊断框架如图1所示。考虑到不同主轴电机个体之间的固有差异，增加了CMFD的离线验证。这可以看作是对实际应用案例的初步验证。确保原位诊断的可靠性和有效性至关重要，但这往往被忽视。提出的框架的诊断步骤如下：

1) 采用多个振动传感器采集数控主轴电机的振动信号；

2) 根据传统的深度学习框架对样本进行划分。对建立的模型进行训练、验证和测试，获得源域精度(Source domain accuracy, SDA)；

3) 将第2步训练好的DL模型直接应用于来自其他电机的信号，以获得跨机精度(Cross machine accuracy, CMA)；

4) 基于SDA和CMA选择MSiT的最终超参数和结构；

5) 将深度学习模型应用于工业生产线中，诊断数控机床电机的健康状态和故障位置。

图1 基于MSiT的诊断框架

5.2 MSiT模型的结构

本节详细阐述了所提出的MSiT，其结构如图2所示。网络架构主要由专用的UDP时间标记器(tokenizer)、Transformer编码器和分类器模块组成。

图2 MSiT的结构

1) 多传感器信号输入：主轴电机复杂的多模态振荡导致其振动分布不规则[1]。由多个传感器采集不同位置的振动信息，并进行标准化处理，初步减少了极端脉冲的影响。每个样品的预处理操作如下：

式(1)

其中是第个通道的原始数据样本，是标准化数据样本，；和分别是训练集的平均值和标准差，是每个通道中的信号点总数，。由于，模型输入是狭长形状。

2) 带UDP的时间标记器：原始Transformer[29]通过字典查询使用时间标记器处理一维时间块序列(token sequence)。ViT使用补丁(patch)映射来处理图像格式。然而，多通道信号是窄长的二维数据格式。分割通道维度(如ViT)似乎没有意义，因为没有空间信息的通道是无序的。因此，带有UDP(Unidirectional patch, 单向补丁)的时间标记器是专门为适应多通道信号而设计的。具体来说多通道信号在时间方向上被分割成N个2-D块以获得序列

，其中

，

是每个补丁的通道长度。值得注意的是，所有通道都是同时分段的。因此，将补丁定义为UDP类型。每个UDP沿信道被展平，并通过一个共享的线性变换矩阵映射到高维嵌入空间，该变换矩阵公式如下:

式(2)

式(3)

其中是一个可学习矩阵，是信号嵌入的维度；是相应的可学习偏差。

3) 类别时间标记器和位置编码：类似于BERT[30]，一个初始化的可训练嵌入

被添加到UDP时间块序列的开头。因此，得到了长度为

的一个嵌入序列。这个类别标记器经后续Transformer编码器处理后的输出作为数控主轴电机的特征表示。

位置信息被注入到UDP嵌入序列中，以利用时间序列顺序。ViT框架[26]引入了1-D和2-D两种位置编码格式。二维位置编码将输入作为一个二维补丁网格。UDP输入仅在时间方向上分段，因此二维位置编码不适合。加入一维可学习位置编码，提取绝对位置信息和相对位置信息，可以表示为:

式(4)

其中是一个随机初始化的可学习矩阵。它可以同时对时间标记器之间和内部位置信息进行编码，被命名为IEPC。另一种一维编码，即外部位置编码 (EPC) ，仅考虑时间标记器之间的位置信息，从向量广播，即。最后的实验证明了这两种编码的性能。

4) Transformer块：将多个Transformer基本块堆叠在一起进行特征提取和表征。我们尽可能地遵循原来的Transformer。这种故意简单设置的一个优点是，NLP和CV的一些改进模型几乎可以开箱即用。其基本形式主要包括多层交替自注意力模块和多层感知器块(MLP)。每个Transformer块前采用层归一化(Layer normalization, LN)，每个块后加入残余结构，如图2所示。

带位置信息的多通道信号UDPs用LN处理，LN计算公式如下:

式(5)

其中是逐元素乘积运算；和是可学习参数。

通过相似度计算，利用尺度点积注意力进行注意力评价。分别计算输入向量的查询矩阵

、键矩阵

和值矩阵

式(6)

其中

，

是可学习参数；

、

和

是查询、键和值的维度。然后，计算

和

的点积，并除以缩放因子来表征序列的相似性。其输出通过

函数和

运算以0.1的速率归一化，并乘以值矩阵

得到最终的自注意力模块的输出

式(7)

将个不同的自注意力机制的整合再次投射形成多头自注意力机制，其输出被添加到UDP输入作为最终的MSA输出：

式(8)

其中；为串联多头的线性投影。

在Transformer块上增加了具有高斯误差线性单元(GELU)激活函数和残余连接的MLP模块。将MSA的输出归一化，然后进行两次MLP非线性变换。两层MLP的神经元分别等于信号嵌入维数

和

。注意，UDPs没有被展平，只是内部的非线性映射。设置为0.01的

被添加到每个非线性映射。GELU用于MLP中的非线性激活，而不是整流线性单元，其描述如下:

式(9)

在上述分析的基础上，通过MSA获得全局信息，通过MLP提取局部信息进行后续分类。Transformer块的迭代过程为：

式(10)

式(11)

式中，为Transformer块的数量。对第块的最终输出进行展平和非线性处理，其随机损失率设为0.01并作为最终的特征表示。后续实验将和两层的神经元分别设置为300和100。本文提出的方法是针对基于多标签分类的复合故障诊断，因此在分类器中使用激活函数代替函数，其描述如下：

式(12)

式(13)

其中，；是故障类别的数量。

MSiT的训练遵循通用DL方案，使用Adam优化器。多标签分类采用二元交叉熵损失函数[31]。详细的MSiT步骤见算法1。

算法1 基于MSiT故障诊断算法

6 实验

为了评估MSiT方法设计的有效性和探索CMFD的必要性，进行了全面的实验。这些模型的代码是在intel (R) Core (TM) i7 10700 CPU的计算机上使用Python 3.7和TensorFlow 2.6编写的。

6.1 实验装置和频率分析

实验装置包括18台数控机床主轴电机整机，一个NI cDAQ-9189底盘，相应的NI 9231数据采集卡和4个DYTRAN 3055D6传感器。这些故障电机是不合格产品和用户自行修理的。四个传感器安装在前后滚动轴承(前：驱动端, 后：风扇端)附近采集振动信号，如图3所示。采样频率设置为25600Hz。由同一个伺服系统驱动的电动机每分钟运行1000转。根据厂家的拆卸诊断报告，已知的故障细节如表1所示。

图3 11号电机的现场采集和频率分析

表1 电机数据集详细

与零件级部件明显的故障频率不同，经典的包络分析对多个通道上的数据进行分析，对于完整电机，复合故障难以定位。能够通过包络谱找到故障特征频率的故障部件很少，以11号电机进行包络分析为例，如图3所示。红色虚线是故障特征频率，对应风扇端FAG-6208-C-2Z轴承的故障特征频率，但仅在第三通道能够找到故障特征频率。在大多数弱故障电机中，包络谱中只能找到旋转频率，但却未找到了相应的故障特征频率。因此，端到端诊断方法似乎是理想的解决方案。

表2 MSiT推荐的超参数设置

6.2 MSiT模型选择与验证

在本节中，对电机数据集使用具有不同超参数的MSiT模型。具体而言，1-14号电机用于基于传统DL框架训练和测试，而15-18号电机将直接用作跨机器诊断测试集，以获得跨机器诊断准确率(Cross machine accuracy, CMA)。根据CMFD框架选择最终结构和超参数，如表2所示。

为UDP通道数，与输入信号通道数相同。

为输入信号各通道下的信号长度，

为每个UDP的长度，

为单个UDP的长度占输入信号总长度的比例。

、

分别表示Transformer块数、每个多头自注意机制的头数、信号嵌入维数。

如图4和表3所示，探讨了这些超参数对模型尺寸和泛化性能的影响，以供工程参考。A-F代表六个任务组，与表3的任务组相对应。第二个参数代表与base不同的变量，第三个参数代表一个特定的值。例如，A-

-1表示任务组A中的模型与基准模型的UDP通道数C不同，其中

。每个电机信号拿1000个样本用于模型训练和验证。每个样本包含四个通道信号，其长度为5120个数据点，以保证电机旋转至少三个周期以获得足够的诊断信息。学习率设为0.001，训练epoch数为20。训练阶段的批大小设置为64。

表3 超参数对模型性能的影响

可以看出，MSiT的尺度和泛化性能受到超参数的影响。注意，各参数下的SDA均达到100%，但反映泛化能力和应用潜力的CMA有所下降。使用推荐超参数作为对比的基础模型，CMA达到了最高的94.53%。

在A组的对比中，没有使用UDP对信号通道维度进行分段，类似于ViT。CMA的下降意味着通道划分可能导致模型提取与实际故障无关的特征，这证明了UDP设计的必要性和合理性。

B组对比了UDP的长度和比例。UDP太短可能导致每个注意力模块内全局信息不足，而UDP太长可能导致补丁数量不足，无法提供足够的注意力，并且会增加每个UDP内的线性投影参数。根据实验结果，推荐

为10%。Transformer块中

、多头自注意机制的头数

、信号嵌入维数

越大，则模型的规模越大。小规模模型可能无法提供足够的全局特征提取。相反，大模型会导致网络的过度参数化。不合理的超参数选择不仅会降低CMA的应用，还会增大标准差，使网络性能更加不稳定。应根据CMA结果确定适当的超参数。

此外，还探讨了不同的位置编码模型。可以看出，位置编码提高了泛化能力，并且由于额外的内部编码可以作为特征过滤机制，IEPC获得了更高的性能。

6.3 可视化与分析

本节揭示了一种新的双向决策机制，并分析了其对CMFD泛化性的影响。基于t-SNE和特征热图进行可视化，如图5和图6所示。

从图5(a)中可以看出，即使是正常的电机也表现出明显的类内聚类，反映出明显的个体差异。在第4个Transformer块的MSA层中，大多数正常电机个体的样本已经聚类。在第8个MSA层中，可以分离大多数类。类内聚类现象仍然存在，但随着层数的加深，MSiT逐渐关注并抑制这些与故障无关的特征，以提高类内紧密度。如图5(f)所示，这个问题在第10块中得到了极大的改善，这表明MSiT过滤了与个体相关的特征。由于复合故障的多标签分类，部分共享标签的类别重叠，如电机3号、4号、7号、9号。

图5 部分MSiT层的t-SNE可视化 (a)原始输入 (b)第2个transformer块的MSA层 (c)第4个transformer块的MSA (d)第6个transformer块的MSA层 (e)第8个transformer块的MSA层 (f)第10个transformer块的MSA层

为了进一步探索决策过程，我们将分类层的特征输入可视化，然后叠加热图权重，如图6所示。对于决策权重，颜色越深，权重值越高。相反，较浅的颜色表示较小的权重值，甚至是负数。最终输出概率由所有决策特征和决策权重的乘积和得到。

当相应的决策权重大于零时，特征增强，如红色箭头所示。当决策权重为负时，大型决策特征实际上会对最终结果产生负面影响，如绿色箭头所示。可以看出，MSiT的决策不仅通过增强相关特征来实现，而且通过抑制不相关特征来实现。在图6(a)中，对于样本(0,1,1,0)，大部分特征在前轴承(驱动端轴承)的决策权重下被抑制。在图6(b)中，与后轴承(风扇端轴承)相关的三个主要故障特征在后轴承标签的决策权重下得到增强，而一些无关的特征被抑制。这表明MSiT模型将输出该样本前轴承故障标签的概率较低，后轴承故障标签的概率较高。由

函数提供的双向决策权值对复合故障诊断框架具有重要意义。

图6 双向决策机制可视化 (a) (0,1,1,0)的前轴承权重(0,1,1,0) (b)后轴承权重 (c) (0,1,1,0)的装配权重(d) (0,1,1,0)的正常权重 (e) (0,0,0,1)的正常权重 (f) (1,1,0,0)的前轴承权重

此外，从图6(e)中可以看出，代表单一类别的样本(0,0,0,1)提取的特征中还包含一些不相关的特征，这些特征被决策权值所抑制。这意味着，以固有个体差异和工业噪声为代表的干扰特征可能会进入决策层，因为它们足够明显，足以影响类间可分性。所提出的MSiT模型具有良好的全局特征提取能力，在决策过程中更关注这些不相关的特征，从而抑制了这些特征，提高了类内紧密度，正如之前用t-SNE分析的那样。相反，如果模型没有足够的全局特征提取能力，则可能难以区分和抑制这些与故障无关的特征，这将使决策特征与故障本质没有真正的关联，从而导致过拟合现象和跨机诊断的泛化性能差。

6.4 对比实验

在本节中，我们使用了几种最先进的深度学习故障诊断模型进行比较，包括Zhang的具有第一层宽卷积核的深度CNN(WDCNN)[32]和具有训练干扰的深度CNN(TICNN) [10]， Zhi的CNN-LSTM [33]， Zhuang的堆叠残差扩张卷积(SRDCNN)[34]， He的MSRFCNN[1]。所有DL模型都在CMFD框架下使用CNC电机数据集进行训练，验证和测试。利用t-SNE对这些模型的决策层进行可视化，如图7所示。表4、图8、图9总结了10次实验中5个最高结果的平均值。

表4 对比实验结果

图8 对比模型的CMA箱线图

图9 对比模型的SDA和CMA

如图8所示，所有先进模型的SDA都很容易达到100%，但作为测试真实情况下初步应用的CMA，表现出不同程度的下降。只使用源域进行验证不能保证实际工程的可靠性，特别是对于具有内在个体差异性的机器设备。TICNN和WDCNN的性能不稳定，标准差较高，CMA分别仅为67.27%和72.71%。LSTM-CNN和SRDCNN在滚动轴承上取得了优异的泛化能力，但在电机诊断上的CMA分别仅为82.45%和82.73%。与其他基于CNN的模型相比，MSRFCNN是专门为电机检测而设计的，性能更高更稳定，CMA准确率达到88.85%。在CMFD要求下，MSiT对复合故障解耦和定位的诊断性能最佳且稳定，CMA为94.53%。这一结果进一步证明了所提出的MSiT方法的优越性。

如图7所示，类内聚类出现在这些基于CNN的对比模型中。个体差异被提取为决策特征，导致模型的跨机器诊断泛化性能较低。如图7(f)所示，所提出的MSiT降低了类内聚类，这意味着MSiT成功地识别了个体差异并对其进行了筛选，以获得更高的CMA。注意t-SNE中的类间距离通常用于评估单个故障标签的分类，而不能代表复合故障标签的诊断性能。具有相同子类别的电机样本应接近甚至重叠。如图7(a)中的WDCNN，类间距离过远，表明提取的特征包含额外的干扰因素(如之前分析的个体差异)，而不是与故障相关，这再次验证了我们的假设。

图7 决策层的t-SNE可视化 (a)WDCNN (b) TICNN (c) CNN-LSTM (d) SRDCNN (e) MSRFCNN (f) MSiT

7 总结

本文重点研究了一种新的数控机床主轴电机故障诊断框架——CMFD。设计了一种新的带UDP的MSiT模型，增强了个体泛化和复合故障解耦能力。利用实际工业电机数据集在CMFD诊断框架上对该模型进行了验证。通过实验验证，提出了超参数选择原则，供工程参考。此外，基于t-SNE和热图的可视化揭示了具有高泛化性能的MSiT的双向决策机制。最后，与先进的基于CNN模型进行对比实验，进一步证明了该模型的优越性。所提出的MSiT达到最高的CMA为94.53%。其他机器部件的分类是我们未来工作的重要组成部分，有助于建立全面的机器级工程数据集，进一步促进故障诊断在工业中的应用。此外，Transformer模型仍有很大的改进空间，以解决各种工业问题。

8 README.md

This is the original Tensorflow code for MSiT model, which comes from a paper of IEEE Transactions on Reliablity. This is a transformer example of application for fault diagnosis on multi-channel time-domain signals.

Title: MSiT: A Cross-Machine Fault Diagnosis Model for Machine-Level CNC Spindle Motors

编辑：李正平

校核：何艺鸣、张泽明、张勇、王畅、陈凯歌、赵栓栓、董浩杰

该文资料(MSiT)搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除。

来源：故障诊断与python学习