首页/文章/ 详情

3min创新点Get!| 基于注意力嵌入二阶神经网络的高效可解释轴承故障诊断方法(附开源代码)

3小时前浏览1

欢迎关注我们的专题文章——“3min创新点Get!”。本专题我们将按照“问题来源——解决途径——创新点”的结构帮助读者了解文章结构并快速捕捉创新点(投稿方式点击这)

本期关键词:注意力机制,可解释性,二阶卷积神经网络

如因网络及权限问题无法获取原文及代码,通过点击本文左下角阅读原文进行在线阅读及下载

论文基本信息

论文题目:
Attention-Embedded Quadratic Network (Qttention) for Effective and Interpretable Bearing Fault Diagnosis
论文期刊:
IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT
论文日期:2023年
论文链接: 
10.1109/TIM.2023.3259031
开源代码:
https://github.com/asdvfghg/QCNN_for_bearing_diagnosis
作者:
Jing-Xiao Liao, Hang-Cheng Dong, Zhi-Qi Sun, Jinwei Sun, Shiping Zhang and Feng-Lei Fan
机构:
(a) School of Instrumentation Science and Engineering, Harbin

Institute of Technology, Harbin 150001, China

(b) Weill Cornell Medicine, Cornell University, Ithaca, NY 14850 USA
作者简介:
廖敬骁, 现为哈尔滨工业大学和香港理工大学双学位博士生。曾获香港理工大学研究生奖学金,哈尔滨工业大学特殊奖学金等荣誉。研究方向为机械故障诊断,非平稳信号处理,非线性神经网络等,在IEEE TII,MSSP,IEEE TIM,IEEE TAI,IEEE JBHI等期刊等国际著名学术期刊发表研究论文10余篇(ESI高被引论文1篇),公开授权国家发明专利1项。

摘要 

轴承故障诊断对于降低旋转机械的损坏风险从而提高经济效益具有重要意义。近年来,以深度学习为代表的机器学习在轴承故障诊断方面取得了很大进展。然而,将深度学习应用于此类任务仍面临着有效性和可解释性等重大挑战:1)当轴承信号受到噪声的严重破坏时,深度学习模型的性能会大幅下降; 2)深度学习是黑箱模型,即很难知道一个模型是如何对正常信号和故障信号进行分类。为了解决这些问题,首先,我们使用二阶神经元来建立卷积网络的原型。由于二阶神经元具有较强的特征表示能力,该网络能够有效地滤除含噪轴承数据。此外,我们通过将学习到的二阶函数分解成与注意力类似的形式,独立推导出了二阶神经元的注意机制,称为qttention,从而使得由二阶神经元构成的模型具有内在的可解释性。实验结果表明,本文提出的神经网络能够有效地进行轴承故障诊断。

关键词:轴承故障诊断,深度学习,二阶卷积神经网络(Quadratic Convolutional Neural Network, QCNN),二阶神经元诱导注意力模块(Attention-Embedded Quadratic Network, qttention)

1 问题来源 

基于信号处理的方法通常利用傅里叶变换、短时傅里叶变换、希尔伯特-黄变换等将信号序列变换到频域或时频域。然后,进行频谱分析以捕获故障轴承的功能。尽管这些方法在理论上是合理的,但它们存在以下缺点:

1)由于轴承总是安装在复杂的机械系统中,因此测量信号中充满了来自其他机械部件的干扰和来自测量设备的背景噪声。这要求从业者仔细地设计复杂的去噪模型以从复杂的噪声环境中提取各种故障特征;

2)因为不同的轴承结构和直径导致故障的不同特征频率,所以在执行基于信号处理的方法时需要手动确定的参数以最大化它们的诊断性能,由于工业领域的复杂性,其既不智能也不可扩展。

2 解决途径 

2.1 研究现状

为了克服上述弱点,在过去的几年里已经开发了各种深度学习模型。Wen等人将一维时域信号折叠成二维图像,然后使用LeNet-5作为骨干对这些图像进行分类。同时,很多研究直接使用1D-CNN模型对1D时域信号进行研究。例如,WDCNN(Deep Convolutional Neural Networks with Wide first-layer kernels)在第一层中采用宽卷积核作为一维信号的信号提取器,并在几个轴承故障上取得了令人满意的结果。此外,注意力机制有助于网络关注故障特征并进一步增强特征提取能力,因此广泛研究在轴承故障诊断中引入了注意力模块。这样不仅提高了网络的分类精度,而且使网络具有可解释性。

2.2 当前研究局限性

尽管深度学习模型在轴承故障检测方面取得了很大的进步,但仍然存在需要解决的挑战:

1)有效性:目前,深度学习模型可以表现出色,即,当信号干净或经过调试后,准确率超过90%。然而,当信号被噪声严重破坏时,深度学习该模型的性能会大幅下降。如果想要在工业领域中实现深度学习模型,则应该解决该问题; 

2)可解释性:深度学习等一系列非线性或递归操作,是黑盒模型。由于模型缺乏可解释性,因此很难知道模型提取故障信号的物理原理。

3 创新点 

3.1 二阶卷积神经网络

图1 所提出的QCNN框架

受生物神经系统中神经元多样性的启发,提出了一种称为二阶神经元的新型神经元,以促进深度学习中的神经元多样性。二阶神经元是对输入信号计算两个线性卷积的乘积再加上输入信号平方的卷积。根据神经元的多样性,我们将所提出网络分为两个部分:神经元设计和结构设计。图1展示了提出的二阶卷积神经网络(Quadratic Convolutional Neural Network, QCNN)。在神经元设计中,我们采用二阶神经元,希望借由其强大的特征表示能力用于轴承诊断。具体地说,QCNN在卷积层中用二阶卷积运算代替传统的卷积。在结构设计上,QCNN继承了WDCNN的结构作为所提出模型的结构。因为,WDCNN是一个成熟的模型,其设计已被许多后续研究所考虑。这种结构堆叠了六个CNN块和一个全连接层。

二阶神经元在表示能力方面在本质上有所提高,这种提高并非来源于所增加的参数量而是由于所涉及的非线性计算。首先,传统神经元的非线性映射仅由激活函数提供,而二阶神经元从二阶聚集函数获得额外的非线性映射。因此,单个二阶神经元可以实现传统神经元无法实现的异或逻辑。其次,二阶神经元不等同于三个传统神经元的组合或总和。假设激活函数是ReLU,常规神经元的组合只能是分段线性函数,但二阶神经元是分段多项式函数。多项式函数比线性函数更适合于逼近复杂函数

3.2 二阶神经元诱导注意力模块

图2 在卷积运算的框架中为整个信号建立qttention映射的工作流程

注意力模块最初是为自然语言处理等序列任务而衍生的。如缩放点积注意力机制等在Transformer模型中被广泛采用。同时,通道和空间注意力模块被用来增强CNN。然而,注意力机制的关键在于引入了一个关于输入重要性的映射,即(𝑾𝒙) · 𝒙,从而促使网络有区别地利用输入信息。 基于上述观察,我们发现二阶神经元也包含一个注意机制,称为qttention,通过分解学习的二阶函数模拟注意力。在卷积层中,qttention与卷积运算紧密耦合。图2展示了为整个信号建立qttention图的工作流程。每个卷积核被认为是单个神经元,卷积运算是以恒定步长在输入上移动核。在每个感受野,卷积核的计算并生成一个qttention图。通过连接局部感受野处的所有qttention图来导出整个信号的最终qttention图。当步幅小于感受野的长度时,两个相邻的感受野重叠。然后,我们对重叠位置的注意力得分求平均值。

与传统的全局注意力模块相比,该注意力模块是局部的。qttention的局部性更适用于轴承故障诊断。通常,在将信号划分为若干个小块之后应用注意力模块。然后,将注意力得分分配给每个小块,并且注意力图针对整个信号。相反,注意力与卷积有关,卷积出现在每个局部感受野。由于故障信号在时域中会表现为周期性的瞬态脉冲,因此qttention的局部性更适合于提取故障特征。

编辑:曹希铭

校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除

点击左下角阅读原文,即可在线阅读论文。

来源:故障诊断与python学习
ACT非线性旋转机械ANSA海洋UM理论电机
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-04-24
最近编辑:3小时前
故障诊断与python学习
硕士 签名征集中
获赞 77粉丝 105文章 186课程 0
点赞
收藏
作者推荐

EAAI开源代码推荐 | 基于平衡域自适应的种子替换深度迁移回归方法

本期给大家推荐的文章是《基于平衡域自适应的种子替换深度迁移回归方法》。本文提出了一种用于设备健康预测的深度迁移回归模型,作者使用了私有、公开数据集进行验证,证明所提出框架的有效性和优越性。作者写作思路清晰,实验丰富,结果分析详实非常适合于研究回归模型和迁移学习方法融合的学习者,小编建议阅读公 众号简介推文后对全文仔细研究。如因网络及权限问题无法获取原文及代码,通过点击本文左下角的阅读原文进行在线阅读及下载论文基本信息论文题目:A deep transfer regression method based on seed replacement considering balanced domain adaptation论文期刊:Engineering Applications of Artificial Intelligence论文日期:2022年论文链接:https://doi.org/10.1016/j.engappai.2022.105238代码链接:https://github.com/ZhangTeng-Hust/DTRSR/tree/main作者:Teng Zhang (a), Hao Sun (a), Fangyu Peng (b), Shengqiang Zhao (a), Rong Yan (a)机构:a: The National NC System Engineering Research Center, School of Mechanical Science and Engineering, Huazhong University of Science and Technology, Wuhan, Chinab: The State Key Laboratory of Digital Manufacturing Equipment and Technology, School of Mechanical Science and Engineering, Huazhong University of Science and Technology, Wuhan, China作者简介:张腾,机械科学与工程学院机械工程专业2020级博士研究生,中共党员,师从彭芳瑜教授,研究方向为大型复杂零件机器人加工精度控制,现任数控工程中心博士生党支部书记。 华中科技大学2023-2024学年度“三好学生标兵(研究生)”获得者。曾获优秀学生干部、三好研究生、一等学业奖学金、潍柴动力奖学金、无锡惠山太湖奖学金等荣誉与奖励。在RCIM、EAAI等机器人加工与智能制造顶级期刊中发表SCI论文9篇,其中一作6篇,EI论文8篇,授权发明专利7项。作为骨干深度参与国家重点研发计划项目、国家自然科学基金联合基金项目等数十项国家及省部级项目,主持中央高校基本科研业务费专项资金资助(研究生创新基金)重点项目一项。率队开展“喻竹计划”科技服务项目,服务地方企业科技发展。(信息摘自网页,如有错误或侵权可后台联系)目录1 摘要2 引言3 相关工作:表征学习4 方法4.1 问题描述4.2 平衡分布自适应方法框架4.3 种子替换4.4 所提出方法框架 4.4.1 结构冻结与参数迁移 4.4.2 融合损失函数 4.4.3 模型微调5 实验结果与分析5.1 数据描述和迁移任务定义 5.1.1 刀具磨损 5.1.2 电池容量5.2 对比方法 5.2.1 与其他方法的对比 5.2.2 参数设置5.3 模型预测结果6 结论1 摘要随着深度迁移学习的发展,模型在相似场景下的泛化能力显著提升。然而,针对回归任务,现有方法往往忽略边缘分布或条件分布的适配性。此外,由于过度依赖损失函数自动学习,领域知识的表征与学习过程缺乏主动性。本文提出一种基于种子替换的深度迁移回归方法(Deep Transfer Regression Method based on Seed Replacement, DTRSR)。DTRSR由四部分组成:结构冻结与参数迁移、深度特征提取、种子替换以及融合损失函数。先通过结构冻结和参数迁移在模型层面获得领域知识,然后在数据层面利用种子替换进行源域与目标域的知识学习,最后构建基于平衡分布适应的融合损失函数。此外,种子替换提升了知识学习的主动性,不再只依赖损失函数自动学习。研究在刀具磨损、电池容量数据集上,使用所提出的DTRSR与九种对比方法进行实验验证。结果表明,该方法在多数任务中性能优异,证实了其在回归任务中的有效性与应用潜力。关键词:深度迁移学习,回归,种子替换,平衡域自适应2 引言模型泛化性能差与数据需求量大是智能学习算法面临的两大核心挑战。针对上述问题,迁移学习应运而生。与传统智能算法不同,该方法充分考虑领域分布差异特性。根据目标域数据的可用性,迁移学习可分为两类:域适应和域生成。域适应更常用于实际应用场景,其通过少量目标域标注样本,实现源域知识向目标域的迁移。迁移学习主要应用于分类任务领域,近年来,由于工程领域对数值预测需求的增长,越来越多的研究聚焦于迁移学习在回归任务中的应用。该方法在频率响应预测、刀具磨损预测等回归任务中取得显著成效。然而,针对数据分布差异问题,现有方法通常假设边缘分布差异与条件分布差异中的某一项相似,而仅关注另一项的适配。例如,Wang等人在铣削力预测中通过关注边缘分布差异实现适配,Liu等人在设备健康预测中针对条件分布差异进行建模,根据以上讨论,将研究差距归纳如下:现有回归任务的研究未同时关注边缘分布与条件分布,导致领域知识学习不充分。模型训练仅依赖损失函数,对领域知识学习与表征缺乏主动探索。针对上述研究,本文提出基于种子替换的深度迁移回归方法(Deep Transfer Regression Method based on Seed Replacement, DTRSR),构建面向回归任务的平衡分布适应损失函数,实现领域知识的充分学习,通过种子替换结合聚类技术实现领域知识的主动表征与学习。主要的贡献如下:通过平衡域适应损失函数同步度量边缘分布差异与条件分布差异,实现领域知识的充分学习。采用种子替换技术,以聚类结构与聚类中心形式融合源域—目标域知识,实现领域知识的主动学习。提出DTRSR方法,从模型架构、数据表征和损失函数三方面构建充分且主动的回归任务学习框架。全文其余部分具体安排如下:第2节,综述迁移学习与回归任务领域相关研究。第3节,详述域适应理论、种子替换技术及DTRSR方法实现流程。第4节,基于三组数据集的实验设计与结果展示。第5节,实验结果分析与讨论。第6节,总结研究结论并展望未来方向。3 相关工作:表征学习随着迁移学习的发展,学术界日益关注什么是迁移和知识是如何呈现的两个问题。知识表征不局限于特征选择与神经网络自动提取,新的方法有:从数据结构的视角来表示领域知识成为新兴范式。基于图的域适应方法利用图结构的拓扑特性实现知识表征与学习,以及通过标签函数谱理论,实现图形式跨域知识迁移。 除了上述方法外,还有许多基于聚类的知识表示和学习方法,该方法不是关注单个样本,而是应用聚类来研究整个数据集,通过基于聚类的全局分析以及聚类结构实现知识表征与存储,并通过聚类中心匹配与局部流形自学习,获得目标域特征。为提升知识学习主动性,突破传统损失函数依赖,本文提出基于聚类的知识表征方法,通过聚类结构实现从被动优化到主动知识构建的范式转变,融合全局聚类模式与局部流形特征的多粒度知识表达。4 方法4.1 问题描述迁移学习定义:在迁移学习中,通常定义源域与目标域两组数据,而非传统的训练集/测试集划分。源域数学公式表示为: 其中, 为源域样本特征向量, 为对应标签, 为样本数量,所有样本均带标签,且数量充足(可训练鲁棒模型)。目标域数学公式表示为: 其中,含 个带标签样本,其余为无标签样本。所研究问题的挑战在于,有标记样本太少而无法训练鲁棒模型,并且目标域和源域在边际分布和条件分布方面存在差异,这在工程领域是常见的。分布满足: 和 。4.2 平衡分布自适应方法框架本文研究了两个域之间边缘分布和条件分布不同的问题。为了同时考虑边缘分布差异和条件分布差异,将分类任务中的策略应用于回归任务,计算和的加权 和 表达式如下: 其中, 是平衡因子,用来控制两类分布差异的权重。当 →1时, 则应更多地关注边缘分布差异。当 →0时,则域之间的边缘分布差异几乎可以忽略不计,但条件分布差异占主导地位,应更多地关注条件分布差异。 可以通过在 [0,1] 区间内以 0.1 的间隔采样来确定。此外它还可以通过随机猜测或最大最小平均法确定。4.3 种子替换 图1 种子置换过程(以C1-C4迁移任务为例): (a)源样本和标记的目标样本;(b)第一部分:聚类;(c)第二部分:匹配;(d)第三部分:替换。种子样本是目标域中少量带标签的样本,用于引导迁移过程,公式可以表示为: 种子替换是DTRSR算法的一部分。以刀具磨损数据集中的C1-C4任务为例进行数据分布可视化,描述种子替换的过程,使用t-SNE在3D特征空间降维。图1(a)中红色圆点为源域数据,蓝色圆点为带标签目标样本。在该实现中,首先通过k_means++将源域聚类到多个类中,其中多个类是标记的目标样本的数量,如图1(b)所示。聚类中心为 ,距离矩阵可以表示为: 接下来对距离矩阵按列进行最小化操作。当前聚类中心与已标记目标样本之间的对应关系通过下式确定: 其中, 表示欧氏距离,已标记目标样本与聚类中心的对应关系可表示为: 随后,计算每个源域样本与其对应聚类中心的偏差,得到: ,构造一个与源域数据 ,同态的零矩阵 ,并根据对应关系,将 叠加到对应的目标数据上。种子替换的伪代码详见算法1。算法1 种子替换 4.4 所提出方法框架 图2 拟定方法的流程图:(a)结构冻结和参数传递;(b)深度特征提取;(c)种子替换;(d)融合损失函数本节提出深度迁移回归种子替换方法。图2展示了DTRSR的流程图。从结构上看,该方法包含四个核心模块:(a)结构冻结与参数迁移,(b)深度特征提取,(c)种子替换以及(d)融合损失函数。由于深度特征提取模块仅用于从原始传感器数据中提取高维特征。其余三个模块的具体实现如下所述。 4.4.1 结构冻结与参数迁移在深度神经网络中,浅层网络负责通用特征提取,深层网络则与任务相关特征相关联。DTRSR框架中,浅层对应卷积块,深层对应附加在卷积块上的全连接层。 采用预训练与微调策略将知识从源域迁移至目标域。具体而言,源域预训练模型中卷积块的参数在模型训练过程中被冻结并保持固定,而源域模型全连接层的参数将作为目标模型的初始参数,如图2(a)所示。 4.4.2 融合损失函数完成结构冻结与参数迁移后,全连接层参数可通过微调策略进行学习。然而,本文研究的原始数据为传感器测量的时间序列信号,需通过卷积块提取通用特征,如图2(b)所示。本文选取第一个全连接层后的中间输出作为提取的特征数据,并对其应用种子替换操作如图2(c)所示。 本文损失函数由三部分组成。第一部分为标记目标样本与种子替换后新数据集的均方误(MAE)回归损失,其表达式为: 其中, 表示从提取特征到标签的映射函数。将种子替换后新数据集的回归损失纳入损失函数的原因是:新数据集既包含以聚类结构形式存在的源域知识,又包含以聚类中心形式存在的目标域知识。因此,该部分回归损失可使模型有效融合两域特征,更充分地继承源域与目标域的知识。此外,为对齐新数据集与标记目标样本间的边际分布差异,量化边际分布差异损失: 类似地,为对齐标记目标样本与未标记目标样本间的条件分布差异,量化条件分布差异损失: 通过上式,目标域中的标记样本可以准确表示所有目标域样本的分布。对边际分布差异和条件分布差异损失进行加权,得到整体平衡域适应损失: 综上所述,融合损失函数可表示为: 它由三个部分组成,即回归损失、平衡域适应损失和 L2 正则化,后者用于防止过拟合。 和 是权衡参数,用于调整回归损失和平衡域适应损失之间的大小关系,以防止模型训练朝着数值过大的方向发展; 是正则化系数。4.4.3 融合损失函数 在模型微调过程中,按照上述描述,卷积块 𝐶𝑜𝑛𝑣𝑆 的参数被冻结并迁移到目标模型。只有全连接层的参数从 𝐹𝑐𝑆 更新到 𝐹𝑐𝑇,通过最小化融合损失函数来实现,如公式 所示。DTRSR 的伪代码在算法 II 中给出。算法2 DTRSR 5 实验结果5.1 数据描述和迁移任务定义5.1.1 刀具磨损刀具磨损数据集来自2010年PHM挑战赛。提供了加工过程中六种不同刀具的原始数据,但只有三种刀具被标记,即C1、C4和C6。原始数据集中的传感信号以50 kHz的频率采样,包括铣削力信号x、y和z方向的振动信号以及加工过程中的声发射信号。在本文中,三个方向的铣削力信号被用作模型的输入,每个刀具的三个刀片的平均磨损值被选作输出,以构建迁移任务。5.1.2 电池容量电池容量数据集由NASA Ames研究中心的卓越预测中心构建,所有电池老化都是通过在室温下对电池进行多周期充放电实验来加速的。在电池运行过程中,收集了电压、电流和电池容量随时间变化等传感数据。选择NO.5,NO.6和NO.7电池放电阶段的电压传感数据作为输入,电池容量作为输出,以构建迁移任务。表1 本文所完成的迁移任务摘要 图3 两个公开数据集的分布差异矩阵。 (a)工具磨损数据集的边际分布差异;(b)工具磨损数据集的条件分布差异; (c)工具磨损数据集的边际分布差异和条件分布差异总和;(d)电池容量数据集的边际分布差异; (e)电池容量数据集的条件分布差异;(f)电池容量数据集的边际分布差和条件分布差之和两个研究的数据集构建了12个迁移任务,如表1所示。每个数据集的输入和标签及其维度也在表1中进行了总结。这12个迁移任务用于比较各种方法的性能。近似计算每个数据集中任务的边缘分布差异和条件分布差异,分布差异矩阵如图3所示。每个方格代表两个对应任务之间的分布差异。由于分布差异的存在,非对角线的单元格以不同的颜色显示。若一个方块的颜色不是蓝色,则两个对应任务之间存在分布差异,且该差异与具体数值无关。因此可以得出结论:所研究的三个数据集在边际分布和条件分布方面均存在差异。必须同时考虑边际分布差异和条件分布差异。5.2 对比方法5.2.1 与其他方法的对比为客观、准确地评估DTRSR的性能,选取了九种方法进行对比。这些方法可分为三类:一种基准方法、五种消融实验方法以及三种最先进的方法。具体描述如下:直接预测(Predict directly, PD)指直接使用训练好的源模型对目标任务进行预测,该方法被定义为基准方法。五种消融实验定义如下:(1)重新训练模型(Re-training the model, RT):选取目标域中少量标注样本从头训练新的回归模型。(2)微调全连接层(Fully Connected Layers, FC):迁移训练好的源模型参数,并基于少量目标域标注数据微调全连接层参数,仅考虑回归损失。(3)边缘分布适配:在微调全连接层时,仅将边缘分布差异加入损失函数。(4)条件分布适配:在微调全连接层时,仅将条件分布差异加入损失函数。(5)平衡分布适配:在微调全连接层时,对边缘分布差异和条件分布差异进行加权后加入最终损失函数。三种最先进的方法描述如下:迁移成分分析:基于最大均值差异进行高维特征映射,随后使用传统机器学习方法预测目标域任务。深度适配网络(Deep Adaptation Network, DAN):在全连接层采用多核MMD技术,以适配不同域间的分布差异。两阶段TrAdaBoost.R2:通过自适应样本权重更新策略和基于Boosting的算法学习目标域知识。通过五项消融实验与基线方法对比,验证各模块有效性。这三种SOTA方法分别涵盖:基于特征的迁移学习,基于模型的迁移学习,基于样本的迁移学习,用于验证DTRSR方法的性能。对于无法处理原始数据的模型,论文采用预训练模型卷积块提取的高维特征。采用以下指标评估方法性能:使用目标域预测任务的平均绝对误差,平均绝对百分比误差,均方根误差,决定系数。当R²越接近1,MAE/MAPE/RMSE值越小表示性能越优。当R²小于0时,预测结果劣于均值预测。5.2.2 参数设置表2 每个数据集的预训练模型的结构由于不同数据集的数据特征不同,我们分别定义了不同的模型结构(如表2所示)。同一数据集中的不同任务采用相同模型结构,以确保结果的可比性。除了结构差异外,超参数设置对所有方法的性能至关重要。针对本文研究的数据集:边际分布核函数通过搜索最优σ值(在[0.5,1.5]范围内以0.1为步长)选定为 ,其中核函数形式为 ,条件分布核函数采用 ; 参数统一设置为1;学习率在预训练阶段分别设为2e−2、2e−3和2e−2,微调阶段设为2e−3、2e−4和2e−3;正则化系数 分别设为1e−4、1e−4和1e−5;训练轮数统一设为100;超参数 、 、 分别通过[0.1,1]、[100,1000]和[0,1]区间搜索确定, 取1、0.9、0.3(步长0.1), 取200、300、500(步长100), 取0.1、0.2、0.2(步长0.1),最终选用Adam优化器最小化融合损失函数。5.3 模型预测结果 表3 DTRSR在18项任务中的平均结果为验证DTRSR在回归任务中的有效性,每个任务通过随机选取不同标记目标样本进行10次实验。表3展示了DTRSR的平均结果(最优结果以粗体标注)。 图4.不同方法对18项任务的平均MAE,包括(a)工具磨损、(b)电池容量 此外,图4对比了所有方法在12个任务上的平均MAE(平均绝对误差)。6 结论本文提出了一种基于种子替换的深度迁移回归方法DTRSR,该方法采用平衡域适应策略。首先,通过结构冻结和参数传递,在模型级将源域的知识传递到目标域。其次,通过种子替换在数据级主动继承源域和目标域的知识。最后,在融合损失函数中加入考虑边缘分布差异和条件分布差异的均衡分布自适应,在损失函数层面实现了对领域知识更充分的学习。总之,领域知识是积极和充分的学习,通过DTRSR在模型,数据和损失函数的水平。DTRSR已在两个公共数据集(刀具磨损和电池容量)上进行了验证,并在12个任务中的大多数任务上实现了最佳性能,这验证了其在回归任务中的有效性和巨大潜力。此外,对结果的分析表明,DTRSR在性能稳定性和效果显著性方面具有很大的优势,预示着DTRSR在相关工程领域应用的巨大可能性和前景。然而,DTRSR在模型时间消耗和噪声数据鲁棒性方面存在一些局限性。在未来的研究中,我们将对DTRR的结构进行优化,以减少训练时间,并分析噪声对模型性能的影响。此外,我们将继续探索更多领域知识学习方法的可能性。编辑:曹希铭校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、海洋、冯珽婷、陈宇航、陈莹洁、王金、赵诚、肖鑫鑫该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈