3min创新点Get!| 高速列车牵引电机跨机器诊断的一阶段可解释可微分STFT领域自适应网络
欢迎关注我们的新专题文章——“3min创新点Get!”。本专题我们将按照“问题来源——解决途径——创新点——局限性分析及未来发展”的结构帮助读者了解文章结构并快速捕捉创新点。本期关键词:跨机器迁移学习,可解释性,STFT,标签平滑化论文基本信息
论文题目:
IDSN: A one-stage interpretable and differentiable STFT domain adaptation network for traction motor of high-speed trains cross-machine diagnosis
论文期刊:Mechanical Systems and Signal Processing
论文日期:2023.10
论文链接:
https://doi.org/10.1016/j.ymssp.2023.110846
作者:
Chao He, Hongmei Shi, Jianbo Li
作者邮箱: chaohe@bjtu.edu.cn
摘要
为保证牵引电机系统的安全运行,提出了一种新的迁移故障诊断技术。然而,现有的研究高度依赖于源域中故障数据的可用性,而源域中的故障数据由于需要定期维护,在实际应用中很少见。幸运的是,自建试验台提供了一个容易获得故障数据的机会,我们假设可以使用模拟数据通过跨机器诊断方法来监测真实的牵引电机系统。此外,现有的基于深度学习的跨机器故障诊断方法存在物理可解释性差、超参数选取麻烦等问题。针对上述问题,提出了一种一阶段可解释可微分的STFT跨机双驱动自适应网络(one-stage Interpretable and Differentiable STFT cross-machine dual-driven adaptation Network, IDSN)。在IDSN中,提出了一种可解释可微分的STFT层,通过引入一个可导系数,利用梯度下降法调整STFT的关键参数,如窗口长度。它是一个即插即用的模块,可以无冲突地嵌入到任意的典型网络中。此外,提出了一种新的自适应权衡系数,用于解决领域差异度量的权重匹配问题。最后,为了保证跨机器诊断的可靠性和有效性,提出了一种简洁有效的平滑的联合最大均值差异算法,该算法同时提高了类内的紧致性和类间的可分性。实验表明,本文提出的IDSN比现有的其他模型具有更好的性能。
以下内容为编辑的个人理解,但小编水平有限,如有不对之处,请联我系,并欢迎多多指正~问题来源
在跨机器的迁移学习故障诊断中,由于不同机器的源域和目标域数据之间分布差异很大导致诊断准确率较低。
解决途径
研究现状:
对基于微调、基于领域差异、基于领域对抗和基于领域泛化的方法进行了初步研究。
当前研究局限性:
现有的数据驱动模型忽视了基于可微分信号处理的可解释的知识在领域适应中的积极作用;
数据驱动的模型对数据集的数量和质量过于敏感,导致不同数据集的结果差异很大;
在迁移学习的过程中,考虑到源域中难免会出现一些错误标记样本,而过度信任源域中的错误标签,会导致当目标域样本的特征将落在决策边界时分类器分类错误。
创新点
作者通过双驱动方法解决上述提到的第1、2个研究局限性。双驱动方法由于它的可呈现性,可解释性和强大的分析能力已经达到了新的高度。在这方面,高速列车牵引电机轴承的基于知识和数据双驱动跨机器迁移网络方法中,需要最少的专家知识。双驱动的方法中,基于知识的方法指的是差分STFT,而基于数据驱动方法指的是DAN。针对第3个研究局限性,作者提出使用标签平滑化与领域适应方法结合。
如图1所示,窗函数的长度直接决定了频谱图的时间分辨率和频率分辨率。由于时间和频率之间的博弈,适当的权衡将提供有利于跨机器领域适应的特征表示。窗口长度和分辨率之间的关系可以表示为[39]: 指的是信号长度; 指的是跳跃长度; 指的是窗口函数的长度,我们通过梯度下降的方法来自适应地调整窗口函数的长度; 表示四舍五入到最接近的整数。但由于原始信号中的窗口函数执行的是不可导的循环滑动操作,因此原始的STFT是不可微的,这也导致它在神经网络中的使用受到限制。本文引入了一个可导的系数 ,建立系数和窗口长度两个参数之间的线性关系,使得可导系数可以参与到反向传播过程中,从而间接通过反向传播优化窗长和跳跃长度。因此,可微STFT使任意损失函数优化窗函数的长度,其定义为: 指的是采样位置, 是以第 个样本为中心的窗口函数 指的是在时刻 ,频率 的STFT的结果, 指的是单位虚数。在优化过程中,该工作采用相同的窗口函数和固定的跳跃/窗口大小比 , 是跳跃系数,其中 可微系数的显著性质 采用梯度反向传播算法和链式法则进行优化,进而优化窗口大小 和跳数大小 。总的来说,具有自适应调整窗长的可微STFT仅需要可学习参数 的真实值来促使时间和频率之间的折衷。作者认为,标签平滑化去除了类内相关信息,有利于区分领域自适应中的相似故障特征。对于标签平滑,削弱类内相关性信息的现象可以迫使相似但不同类的聚类中心彼此远离,即,在领域自适应过程中,扩大这些聚类中心之间的距离,使同一故障聚类更加紧密,从而迫使目标域中不同故障的样本彼此远离。源域的交叉熵损失 可以表示为: 其中, 是源域中标签的真实分布, 是对应的独热标签。对于标签为 的 ,考虑标签分布 和平滑因子 , 被替换为: 因此,平滑化后源域的交叉熵损失可以表示为: 局限性分析及未来发展
- 虽然在这项工作中已经建立了窗口函数和可导系数之间的线性关系,但进一步研究更复杂的关系,如指数和三角关系,可能会产生更有希望的结果。
- 虽然目前的研究主要集中在固定的窗口长度,研究利用可变的窗口长度可能会扩展其应用程序更复杂的轴承迁移故障诊断的情况下,例如速度波动,从而超越纯粹的数据驱动的领域自适应方法。
- 连续小波变换和同步压缩变换作为著名的信号处理算法,值得研究,使其成为可微分形式。
- 目前的研究仅限于闭集,而关于真子集和开集的跨机研究在故障诊断中还不多见,也是一个值得突破的研究点。知识和数据双驱动模型可能会提供最佳解决方案。
- 可微分信号处理需要人工确认,例如为窗口大小设置近似值。