3min创新点Get!| 基于可解释物理知识的跨机器迁移诊断领域自适应范式(附开源代码) 欢迎关注我们的新专题文章—— “3min创新点Get!” 。本专题我们将按照“ 问题来源——解决途径——创新点——局限性分析及未来发展 ”的结构帮助读者了解文章结构并快速捕捉创新点 。 论文基本信息 论文题目:
Interpretable physics-informed domain adaptation paradigm for cross-machine transfer diagnosis (高被引+热点论文 )
论文期刊: Knowledge-Based Systems
论文日期: 2024.2
论文链接:
https://doi.org/10.1016/j.knosys.2024.111499
作者:
Chao He, Hongmei Shi, Xiaorong Liu, Jianbo Li
作者邮箱: chaohe@bjtu.edu.cn
摘要 虽然基于迁移学习的智能诊断已经取得了重大突破,但由于来自不同机器的源域和目标域数据之间的分布差异越来越大,现有已知方法的性能仍然需要迫切改进。为了解决这个问题,我们深入研究信号处理和领域适应之间的相互作用。受小波技术和权重初始化的启发,巧妙地设计了一个端到端、简洁且high-performance physics-informed wavelet domain adaptation network(WIDAN, 高性能的物理信息小波领域自适应网络),它将可解释的小波知识集成到具有独立权重的双流卷积层中,以处理极具挑战性的跨机器诊断任务。具体而言,CNN的第一层权重使用优化的和包含信息的拉普拉斯或Morlet权重进行更新。这种方法简化了超参数选择,其中具有特定物理解释的缩放和平移因子受到卷积核参数的约束。此外,引入平滑缩放因子以确保与神经网络权重的一致性。此外,双流bottleneck层的设计,学习合理的权重,以预转换不同的领域数据到一个统一的公共空间。这可以促进WIDAN提取领域不变特征。实验证实:WIDAN在多个任务中的性能优于最先进的模型,这表明具有优化小波权重初始化的宽第一层内核可以增强领域可迁移性,从而有效地促进跨机器迁移诊断。 以下内容为编辑的个人理解,但小编水平有限,如有不对之处,请联系我,并欢迎多多指正~ 问题来源 在跨机器的迁移学习故障诊断中,由于不同机器的源域和目标域数据之间分布差异很大导致诊断效率较低。 解决途径 研究现状: 针对上述问题,目前的研究多数在于设置 领域差异统计指标 或 精心设计网络架构 。
当前 研究局限性: 大多数纯数据驱动算法的性能可能取决于数据的质量和数量,使得在不满足这些条件时训练鲁棒模型具有挑战性。此外,许多算法的统计度量增加了计算复杂度,并引入了额外的超参数。
创新点 考虑到信号处理辅助可以缓解上述局限性,作者深入研究信号处理 和领域适应 之间的关联,并受到小波技术 和权重初始化 的启发,设计了一个端到端的 Wavelet-Informed Domain Adaptation Network(WIDAN,小波信息领域自适应网络)。据我们所知,该项工作是 第一次 将小波权重初始化与其他权重的可解释性和一致性应用于更具挑战性的跨机器诊断场景。 图1 WIDAN框架:①将源域和目标域分别送入特征提取层,提取具有领域不变性和区分性的故障特征表示。②利用Smooth-augmented Wavelet Kernel(SWK,平滑增广小波核) 完成源域和目标域到同一特征空间的转换过程,无需共享权值,同时度量损失可以选择任意度量函数。③在测试过程中,将未知的轴承信号输入到训练好的目标域模型中,以产生最终的诊断精度。 表1 小波卷积核 与平滑增广小波核 的参数比较,其中,时间 、缩放因子 、平移因子 、采样频率 、平滑因子 。
作者所提出的WIDAN模型中的Smooth-augmented Wavelet Kernel(SWK,平滑增广小波核 ) 是Wave Kernel Net的通用变体,旨在解决小波卷积核 的局限性。如表1所示,Wavelet convolution kernel(WCK,小波卷积核 ) 根据经验将参数设置为固定值,这不仅忽略了不同数据集之间采样频率的差异,而且还切断了与卷积核的相关性。SWK避免了这些限制,实现了一系列突破性的改进。 具体来说,作者通过将 关联,建立了时间步长 和卷积核大小 之间的相关性,将卷积核大小与物理上可解释的时间含义结合起来。除此之外,作者将 更新为 , 更新同理。通过这种方式,缩放因子 和平移因子 的对准进一步与输出通道 相关联,以加强与卷积核的相关性。 作者提出了一种鲁棒的权重初始化方法,试图在一定程度上减轻不同机器故障数据中存在的域间偏移。通常,我们将第一个卷积层的输出 表示为 。作者将原始第一个卷积层中原始权重 修改为小波权重 ; 。 局限性分析及未来发展 未来的研究不仅应该优先考虑内在的可解释性,还应该考虑其与神经网络优化过程的联合,考虑梯度,激活函数和归一化等因素。 平滑因子 基于恒定转速的方法表现良好,但转速急剧波动的情况下仍然值得探索,特别是设计一个专门的初始化方法的权重。 相关基础知识补充 将来自 设备A 的历史的含标签数据 迁 移到设备B 的未标签数据,以评估设备B的工作状态。然而,与跨转速、跨传感器和跨负载任务相比,跨机器诊断是一项 极具挑战性 的任务。因为不同机械设备的数据集之间的分布变化更大。 通过 量化 源域和目标域数据分布的差异,来优化模型的迁移效果。例如 , Ensemble Weighting Maximum Mean Discrepancy ( 集成 加权最大平均差异) , Multiple Kernel Local Maximum Mean Discrep ancy (多核局 部最大平均差异),embedded joint maximum mean discrepancy(嵌入式联合最大平均差异)和maximum mean square discrepancy(最大均方差异)等 。