首页/文章/ 详情

EAAI开源代码推荐 | 基于平衡域自适应的种子替换深度迁移回归方法

5小时前浏览7

本期给大家推荐的文章是《基于平衡域自适应的种子替换深度迁移回归方法》。本文提出了一种用设备健康预测深度迁移回归模型,作者使用了私有、公开数据集进行验证,证明所提出框架的有效性和优越性。作者写作思路清晰实验丰富结果分析详实非常适合于研究回归模型迁移学习方法融合的学习者,小编建议阅读公 众号简介推文后对全文仔细研究。

如因网络及权限问题无法获取原文及代码,通过点击本文左下角阅读原文进行在线阅读及下载

论文基本信息

论文题目:A deep transfer regression method based on seed replacement considering balanced domain adaptation

论文期刊:Engineering Applications of Artificial Intelligence

论文日期:2022年

论文链接:

https://doi.org/10.1016/j.engappai.2022.105238

代码链接:

https://github.com/ZhangTeng-Hust/DTRSR/tree/main

作者:

Teng Zhang (a), Hao Sun (a), Fangyu Peng (b), Shengqiang Zhao (a), Rong Yan (a)
机构:
a: The National NC System Engineering Research Center, School of Mechanical Science and Engineering, Huazhong University of Science and Technology, Wuhan, China
b: The State Key Laboratory of Digital Manufacturing Equipment and Technology, School of Mechanical Science and Engineering, Huazhong University of Science and Technology, Wuhan, China
作者简介:

张腾,机械科学与工程学院机械工程专业2020级博士研究生,中共党员,师从彭芳瑜教授,研究方向为大型复杂零件机器人加工精度控制,现任数控工程中心博士生党支部书记。 华中科技大学2023-2024学年度“三好学生标兵(研究生)”获得者。曾获优秀学生干部、三好研究生、一等学业奖学金、潍柴动力奖学金、无锡惠山太湖奖学金等荣誉与奖励。在RCIM、EAAI等机器人加工与智能制造顶级期刊中发表SCI论文9篇,其中一作6篇,EI论文8篇,授权发明专利7项。作为骨干深度参与国家重点研发计划项目、国家自然科学基金联合基金项目等数十项国家及省部级项目,主持中央高校基本科研业务费专项资金资助(研究生创新基金)重点项目一项。率队开展“喻竹计划”科技服务项目,服务地方企业科技发展。(信息摘自网页,如有错误或侵权可后台联系)

目录

1 摘要
2 引言
3 相关工作:表征学习
4 方法
4.1 问题描述
4.2 平衡分布自适应方法框架
4.3 种子替换
4.4 所提出方法框架
      4.4.1 结构冻结与参数迁移
      4.4.2 融合损失函数
      4.4.3 模型微调
5 实验结果与分析
5.1 数据描述和迁移任务定义
      5.1.1 刀具磨损
      5.1.2 电池容量
5.2 对比方法
      5.2.1 与其他方法的对比
      5.2.2 参数设置
5.3 模型预测结果
6 结论

1 摘要

随着深度迁移学习的发展,模型在相似场景下的泛化能力显著提升。然而,针对回归任务,现有方法往往忽略边缘分布或条件分布的适配性。此外,由于过度依赖损失函数自动学习,领域知识的表征与学习过程缺乏主动性。本文提出一种基于种子替换的深度迁移回归方法(Deep Transfer Regression Method based on Seed Replacement, DTRSR)。DTRSR由四部分组成:结构冻结与参数迁移、深度特征提取、种子替换以及融合损失函数。先通过结构冻结和参数迁移在模型层面获得领域知识,然后在数据层面利用种子替换进行源域与目标域的知识学习,最后构建基于平衡分布适应的融合损失函数。此外,种子替换提升了知识学习的主动性,不再只依赖损失函数自动学习。研究在刀具磨损、电池容量数据集上,使用所提出的DTRSR与九种对比方法进行实验验证。结果表明,该方法在多数任务中性能优异,证实了其在回归任务中的有效性与应用潜力。

关键词:深度迁移学习,回归,种子替换,平衡域自适应

2 引言

模型泛化性能差与数据需求量大是智能学习算法面临的两大核心挑战。针对上述问题,迁移学习应运而生。与传统智能算法不同,该方法充分考虑领域分布差异特性。根据目标域数据的可用性,迁移学习可分为两类:域适应和域生成。域适应更常用于实际应用场景,其通过少量目标域标注样本,实现源域知识向目标域的迁移。迁移学习主要应用于分类任务领域,近年来,由于工程领域对数值预测需求的增长,越来越多的研究聚焦于迁移学习在回归任务中的应用。该方法在频率响应预测、刀具磨损预测等回归任务中取得显著成效。

然而,针对数据分布差异问题,现有方法通常假设边缘分布差异与条件分布差异中的某一项相似,而仅关注另一项的适配。例如,Wang等人在铣削力预测中通过关注边缘分布差异实现适配,Liu等人在设备健康预测中针对条件分布差异进行建模,根据以上讨论,将研究差距归纳如下:

  • 现有回归任务的研究未同时关注边缘分布与条件分布,导致领域知识学习不充分。

  • 模型训练仅依赖损失函数,对领域知识学习与表征缺乏主动探索。

针对上述研究,本文提出基于种子替换的深度迁移回归方法(Deep Transfer Regression Method based on Seed Replacement, DTRSR),构建面向回归任务的平衡分布适应损失函数,实现领域知识的充分学习,通过种子替换结合聚类技术实现领域知识的主动表征与学习。主要的贡献如下:

  • 通过平衡域适应损失函数同步度量边缘分布差异与条件分布差异,实现领域知识的充分学习。

  • 采用种子替换技术,以聚类结构与聚类中心形式融合源域—目标域知识,实现领域知识的主动学习。

  • 提出DTRSR方法,从模型架构、数据表征和损失函数三方面构建充分且主动的回归任务学习框架。

全文其余部分具体安排如下:第2节,综述迁移学习与回归任务领域相关研究。第3节,详述域适应理论、种子替换技术及DTRSR方法实现流程。第4节,基于三组数据集的实验设计与结果展示。第5节,实验结果分析与讨论。第6节,总结研究结论并展望未来方向。

3 相关工作:表征学习

随着迁移学习的发展,学术界日益关注什么是迁移知识是如何呈现的两个问题。知识表征不局限于特征选择与神经网络自动提取,新的方法有:从数据结构的视角来表示领域知识成为新兴范式。基于图的域适应方法利用图结构的拓扑特性实现知识表征与学习,以及通过标签函数谱理论,实现图形式跨域知识迁移。 除了上述方法外,还有许多基于聚类的知识表示和学习方法,该方法不是关注单个样本,而是应用聚类来研究整个数据集,通过基于聚类的全局分析以及聚类结构实现知识表征与存储,并通过聚类中心匹配与局部流形自学习,获得目标域特征。为提升知识学习主动性,突破传统损失函数依赖,本文提出基于聚类的知识表征方法,通过聚类结构实现从被动优化到主动知识构建的范式转变,融合全局聚类模式与局部流形特征的多粒度知识表达。

4 方法

4.1 问题描述

迁移学习定义:在迁移学习中,通常定义源域与目标域两组数据,而非传统的训练集/测试集划分。源域数学公式表示为:

 
 

其中,    为源域样本特征向量,    为对应标签,    为样本数量,所有样本均带标签,且数量充足(可训练鲁棒模型)。目标域数学公式表示为:

 
 

其中,含    个带标签样本,其余为无标签样本。所研究问题的挑战在于,有标记样本太少而无法训练鲁棒模型,并且目标域和源域在边际分布和条件分布方面存在差异,这在工程领域是常见的。分布满足:         。

4.2 平衡分布自适应方法框架

本文研究了两个域之间边缘分布和条件分布不同的问题。为了同时考虑边缘分布差异和条件分布差异,将分类任务中的策略应用于回归任务,计算和的加权        表达式如下:

 
 

其中,    是平衡因子,用来控制两类分布差异的权重。当     →1时, 则应更多地关注边缘分布差异。当    →0时,则域之间的边缘分布差异几乎可以忽略不计,但条件分布差异占主导地位,应更多地关注条件分布差异。    可以通过在 [0,1] 区间内以 0.1 的间隔采样来确定。此外它还可以通过随机猜测或最大最小平均法确定。

4.3 种子替换

 

图1 种子置换过程(以C1-C4迁移任务为例):    

(a)源样本和标记的目标样本;(b)第一部分:聚类;(c)第二部分:匹配;(d)第三部分:替换。

种子样本是目标域中少量带标签的样本,用于引导迁移过程,公式可以表示为:

   
 

种子替换是DTRSR算法的一部分。以刀具磨损数据集中的C1-C4任务为例进行数据分布可视化,描述种子替换的过程,使用t-SNE在3D特征空间降维。图1(a)中红色圆点为源域数据,蓝色圆点为带标签目标样本。

在该实现中,首先通过k_means++将源域聚类到多个类中,其中多个类是标记的目标样本的数量,如图1(b)所示。聚类中心为      ,距离矩阵可以表示为:

   
 

接下来对距离矩阵按列进行最小化操作。当前聚类中心与已标记目标样本之间的对应关系通过下式确定:

   
 

其中,      表示欧氏距离,已标记目标样本与聚类中心的对应关系可表示为:

   
 

随后,计算每个源域样本与其对应聚类中心的偏差,得到:      ,构造一个与源域数据      ,同态的零矩阵      ,并根据对应关系,将      叠加到对应的目标数据上。种子替换的伪代码详见算法1。

算法1 种子替换

 

4.4 所提出方法框架

 

图2 拟定方法的流程图:(a)结构冻结和参数传递;(b)深度特征提取;(c)种子替换;(d)融合损失函数

本节提出深度迁移回归种子替换方法。图2展示了DTRSR的流程图。从结构上看,该方法包含四个核心模块:(a)结构冻结与参数迁移,(b)深度特征提取,(c)种子替换以及(d)融合损失函数。由于深度特征提取模块仅用于从原始传感器数据中提取高维特征。其余三个模块的具体实现如下所述。  

4.4.1 结构冻结与参数迁移

在深度神经网络中,浅层网络负责通用特征提取,深层网络则与任务相关特征相关联。DTRSR框架中,浅层对应卷积块,深层对应附加在卷积块上的全连接层。  

采用预训练与微调策略将知识从源域迁移至目标域。具体而言,源域预训练模型中卷积块的参数在模型训练过程中被冻结并保持固定,而源域模型全连接层的参数将作为目标模型的初始参数,如图2(a)所示。  

4.4.2 融合损失函数

完成结构冻结与参数迁移后,全连接层参数可通过微调策略进行学习。然而,本文研究的原始数据为传感器测量的时间序列信号,需通过卷积块提取通用特征,如图2(b)所示。本文选取第一个全连接层后的中间输出作为提取的特征数据,并对其应用种子替换操作如图2(c)所示。 本文损失函数由三部分组成。第一部分为标记目标样本与种子替换后新数据集的均方误(MAE)回归损失,其表达式为:

 

其中,    表示从提取特征到标签的映射函数。

将种子替换后新数据集的回归损失纳入损失函数的原因是:新数据集既包含以聚类结构形式存在的源域知识,又包含以聚类中心形式存在的目标域知识。因此,该部分回归损失可使模型有效融合两域特征,更充分地继承源域与目标域的知识。

此外,为对齐新数据集与标记目标样本间的边际分布差异,量化边际分布差异损失:

 

类似地,为对齐标记目标样本与未标记目标样本间的条件分布差异,量化条件分布差异损失:

 

通过上式,目标域中的标记样本可以准确表示所有目标域样本的分布。对边际分布差异和条件分布差异损失进行加权,得到整体平衡域适应损失:

 

综上所述,融合损失函数可表示为:

 

它由三个部分组成,即回归损失、平衡域适应损失和 L2 正则化,后者用于防止过拟合。        是权衡参数,用于调整回归损失和平衡域适应损失之间的大小关系,以防止模型训练朝着数值过大的方向发展;    是正则化系数。

4.4.3 融合损失函数  

在模型微调过程中,按照上述描述,卷积块 𝐶𝑜𝑛𝑣𝑆 的参数被冻结并迁移到目标模型。只有全连接层的参数从 𝐹𝑐𝑆 更新到 𝐹𝑐𝑇,通过最小化融合损失函数来实现,如公式    所示。DTRSR 的伪代码在算法 II 中给出。

算法2 DTRSR

5 实验结果

5.1 数据描述和迁移任务定义
5.1.1 刀具磨损

刀具磨损数据集来自2010年PHM挑战赛。提供了加工过程中六种不同刀具的原始数据,但只有三种刀具被标记,即C1、C4和C6。原始数据集中的传感信号以50 kHz的频率采样,包括铣削力信号x、y和z方向的振动信号以及加工过程中的声发射信号。在本文中,三个方向的铣削力信号被用作模型的输入,每个刀具的三个刀片的平均磨损值被选作输出,以构建迁移任务。

5.1.2 电池容量

电池容量数据集由NASA Ames研究中心的卓越预测中心构建,所有电池老化都是通过在室温下对电池进行多周期充放电实验来加速的。在电池运行过程中,收集了电压、电流和电池容量随时间变化等传感数据。选择NO.5,NO.6和NO.7电池放电阶段的电压传感数据作为输入,电池容量作为输出,以构建迁移任务。

表1 本文所完成的迁移任务摘要

 
 

图3 两个公开数据集的分布差异矩阵。    

(a)工具磨损数据集的边际分布差异;

(b)工具磨损数据集的条件分布差异;    

(c)工具磨损数据集的边际分布差异和条件分布差异总和;

(d)电池容量数据集的边际分布差异;    

(e)电池容量数据集的条件分布差异;

(f)电池容量数据集的边际分布差和条件分布差之和

两个研究的数据集构建了12个迁移任务,如表1所示。每个数据集的输入和标签及其维度也在表1中进行了总结。这12个迁移任务用于比较各种方法的性能。近似计算每个数据集中任务的边缘分布差异和条件分布差异,分布差异矩阵如图3所示。每个方格代表两个对应任务之间的分布差异。由于分布差异的存在,非对角线的单元格以不同的颜色显示。

若一个方块的颜色不是蓝色,则两个对应任务之间存在分布差异,且该差异与具体数值无关。因此可以得出结论:所研究的三个数据集在边际分布和条件分布方面均存在差异。必须同时考虑边际分布差异和条件分布差异。

5.2 对比方法
5.2.1 与其他方法的对比

为客观、准确地评估DTRSR的性能,选取了九种方法进行对比。这些方法可分为三类:一种基准方法、五种消融实验方法以及三种最先进的方法。具体描述如下:

直接预测(Predict directly, PD)指直接使用训练好的源模型对目标任务进行预测,该方法被定义为基准方法。

五种消融实验定义如下:

(1)重新训练模型(Re-training the model, RT):选取目标域中少量标注样本从头训练新的回归模型。

(2)微调全连接层(Fully Connected Layers, FC):迁移训练好的源模型参数,并基于少量目标域标注数据微调全连接层参数,仅考虑回归损失。

(3)边缘分布适配:在微调全连接层时,仅将边缘分布差异加入损失函数。

(4)条件分布适配:在微调全连接层时,仅将条件分布差异加入损失函数。

(5)平衡分布适配:在微调全连接层时,对边缘分布差异和条件分布差异进行加权后加入最终损失函数。

三种最先进的方法描述如下:

迁移成分分析:基于最大均值差异进行高维特征映射,随后使用传统机器学习方法预测目标域任务。

深度适配网络(Deep Adaptation Network, DAN):在全连接层采用多核MMD技术,以适配不同域间的分布差异。

两阶段TrAdaBoost.R2:通过自适应样本权重更新策略和基于Boosting的算法学习目标域知识。

通过五项消融实验与基线方法对比,验证各模块有效性。这三种SOTA方法分别涵盖:基于特征的迁移学习,基于模型的迁移学习,基于样本的迁移学习,用于验证DTRSR方法的性能。对于无法处理原始数据的模型,论文采用预训练模型卷积块提取的高维特征。采用以下指

标评估方法性能:使用目标域预测任务的平均绝对误差,平均绝对百分比误差,均方根误差,决定系数。当R²越接近1,MAE/MAPE/RMSE值越小表示性能越优。当R²小于0时,预测结果劣于均值预测。

5.2.2 参数设置

表2 每个数据集的预训练模型的结构

由于不同数据集的数据特征不同,我们分别定义了不同的模型结构(如表2所示)。同一数据集中的不同任务采用相同模型结构,以确保结果的可比性。除了结构差异外,超参数设置对所有方法的性能至关重要。针对本文研究的数据集:

边际分布核函数通过搜索最优σ值(在[0.5,1.5]范围内以0.1为步长)选定为    ,其中核函数形式为    ,条件分布核函数采用        参数统一设置为1;学习率在预训练阶段分别设为2e−2、2e−3和2e−2,微调阶段设为2e−3、2e−4和2e−3;正则化系数    分别设为1e−4、1e−4和1e−5;训练轮数统一设为100;超参数            分别通过[0.1,1]、[100,1000]和[0,1]区间搜索确定,    取1、0.9、0.3(步长0.1),    取200、300、500(步长100),    取0.1、0.2、0.2(步长0.1),最终选用Adam优化器最小化融合损失函数。

5.3 模型预测结果 

表3 DTRSR在18项任务中的平均结果

为验证DTRSR在回归任务中的有效性,每个任务通过随机选取不同标记目标样本进行10次实验。表3展示了DTRSR的平均结果(最优结果以粗体标注)

图4.不同方法对18项任务的平均MAE,

包括(a)工具磨损、(b)电池容量

 此外,图4对比了所有方法在12个任务上的平均MAE(平均绝对误差)。

6 结论

本文提出了一种基于种子替换的深度迁移回归方法DTRSR,该方法采用平衡域适应策略。首先,通过结构冻结和参数传递,在模型级将源域的知识传递到目标域。其次,通过种子替换在数据级主动继承源域和目标域的知识。最后,在融合损失函数中加入考虑边缘分布差异和条件分布差异的均衡分布自适应,在损失函数层面实现了对领域知识更充分的学习。总之,领域知识是积极和充分的学习,通过DTRSR在模型,数据和损失函数的水平。

DTRSR已在两个公共数据集(刀具磨损和电池容量)上进行了验证,并在12个任务中的大多数任务上实现了最佳性能,这验证了其在回归任务中的有效性和巨大潜力。此外,对结果的分析表明,DTRSR在性能稳定性和效果显著性方面具有很大的优势,预示着DTRSR在相关工程领域应用的巨大可能性和前景。

然而,DTRSR在模型时间消耗和噪声数据鲁棒性方面存在一些局限性。在未来的研究中,我们将对DTRR的结构进行优化,以减少训练时间,并分析噪声对模型性能的影响。此外,我们将继续探索更多领域知识学习方法的可能性。



编辑:曹希铭

校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、海洋、冯珽婷、陈宇航、陈莹洁、王金、赵诚、肖鑫鑫

该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除


来源:故障诊断与python学习
ACTMechanicalSystem振动通用海洋理论电机机器人数字孪生控制人工智能数控DAP
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-03-12
最近编辑:5小时前
故障诊断与python学习
硕士 签名征集中
获赞 77粉丝 93文章 180课程 0
点赞
收藏
作者推荐

论文学习 | SCI一区-一种用于柔性制造系统预测的基于潜在合作关系识别的联邦学习策略

这篇论文是针对工业用户建模预测为获取大而全的数据集进而寻求合作时如何提高合作收益而开展的研究。针对数据隐私带来的利益冲突,联邦学习的引入可以使用户协同训练模型而不需要共享各自数据。然而,工业用户却无法判断合作是否可以带来增益,这导致了联邦可信合作难的问题。因此,提出一种基于潜在合作关系识别的联邦学习策略的模型训练框架。适合于机器学习、联邦学习、故障诊断研究领域学习者,特别是对使用联邦学习进行建模故障诊断思路的感兴趣学者。论文链接:通过点击最左下角的阅读原文进行在线阅读及下载。1 论文基本信息论文题目:Federated Learning with Potential Partnership Identification for Accurate Prediction in Flexible Manufacturing System论文期刊:IEEE Transactions on ReliabilityDOI:10.1109/TR.2024.3427813论文时间:2024年作者:Chao Ren, Bin Jiang, Ningyun Lu机构:the College of Automation Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, PR China2 摘要近年来,智能制造融合了工业数据和人工智能技术,已成为制造业广泛关注的发展方向。工业数据完整性是智能制造成功实施的关键因素。然而,在多品种、小批量的柔性制造系统中,很难从所有工作条件下收集生产数据。实际上,为了进行状态监测,对复杂机械部件进行数据采集和注释也是耗时耗力的,需要专业领域知识的帮助。面对数据数量和质量不完整的挑战,联邦学习是一种有前景的协作建模范式,它确保了数据隐私,并充分利用了来自不同工业用户的分布式数据信息。然而,由于工业用户之间数据的异质性,合作收益无法满足所有工业用户的需求。本文提出了一种新的联邦学习合作框架,以指导参与者选择合适的联盟,提高参与者的利益。在这个框架中,自组织增量神经网络被用来生成原型样本,这些原型样本可以有效地捕捉原始数据的分布特征,从而使工业用户不必提供原始数据和标签。框架通过评估这些原型样本之间的相似性,为工业用户提供促进协作的建议。通过刀具磨损协同预测实验证明了该框架在工业数据上的有效性。关键词:联邦学习,柔性制造系统,智能制造,潜在合作关系3 目录1 论文基本信息2 摘要3 目录4 引言5 问题定义6 方法介绍 6.1 数据预处理 6.2 数据压缩与重构 6.3 聚类分析 6.4 形成联盟 6.5 模型训练7 验证实验 7.1 实验数据描述 7.2 数据处理 7.3 方法比较8 结论注:本文只选中原论文部分进行分享,若想进一步拜读,请下载原论文进行细读。小编能力有限,如有翻译不恰之处,请多多指正~4 引言由于人工智能、大数据、云边技术的快速发展,越来越多的企业投入智能制造,主动优化管理生产过程和产品。向智能制造转型过程中,制造商采用两种主要的技术方法。一是控制和优化技术,二是预测性监测和维护技术。控制和优化技术用于库存优化、资源优化和过程控制等任务。预测性监测和维护技术则通常是用于产品质量监控、设备维护和预测产量。设备维护是智能制造的基础,通过数据驱动的预测性维护和优化,确保设备稳定高效运行。随着对设备运行维护的重视程度的不断提高,人工智能技术的不断进步,预测与健康管理(Prognostics and Health Management,PHM)已成为学术界和工业界的热门研究领域,例如对旋转部件的故障检测[1]、退化系统的剩余使用寿命预测[2][3][4]。大而全的数据是实施有效 PHM 的关键。然而,在柔性制造系统中,很难获得完整的数据。许多问题可能会限制建模样本数量。首先,在机器设备上安装传感器有一定挑战性,尤其是数控(Computer Numerical Control, CNC)机床等高端设备,因为很难在不损害设备可靠性和安全性的情况下做到这一点。在这种情况下,公司通常会改装一台试验机器。数据采集实验的条件有限,导致采集到的数据不能反映机器的全部工况。其次,复杂机械部件的数据采集耗时耗力,高质量的数据标注也需要专业领域知识的辅助。以刀具磨损量的测量为例,需要对工件进行一次完整的加工过程才能获得样本[5],采集并标注所有工况的样本是不现实的。综上所述,单个工业用户很难收集到全面的数据集。为了获得足够数据进行建模,一种新思路是让拥有相似生产线的工业用户进行协作。工业用户共享其不完整的数据,以组成一个相对全面的训练数据集,以提高训练出的模型性能。然而,由于利益冲突,即使工业用户拥有功能和结构相似的机器,他们也不愿意共享在生产线上采集的数据,这导致了现实工业中的“数据孤岛”问题。联邦学习(Federated Learning,FL)是一种协作机器学习框架 [6],它允许多个参与者在不共享数据的情况下联合训练模型,充分利用分布式数据。目前已有研究将联邦学习范式应用于实际状态监测应用中。例如,Li等人[7]将对抗学习纳入 联邦学习框架,解决轴承故障诊断中的域迁移问题。Qin等人[8]采用列车转向架数据进行分布式建模,识别空气弹簧、横向减振器和防偏航减振器的故障。Lu等人[9]提出一种用于海上风力发电机故障诊断的协作训练范式,其中包括事件触发机制,以减少本地模型参数传输阶段的通信成本和计算工作量。Chung等人[10]提出一个旨在增强模型泛化的联邦分析框架,专门解决模型适应新客户端时遗忘旧知识的挑战。由于联邦学习的优势,它有可能通过聚合来自工业用户的数据来解决工业小样本不足的问题。然而联邦学习并不能保证为合作的工业用户带来理想的收益,因为联邦学习在数据异构的情况下无法保证训练效果。不考虑工业用户手中数据质量的合作很可能因负迁移[11]而导致适得其反的后果。更重要的是,现实中一旦合作开始,在合作协议结束前很难轻易终止,如果合作伙伴不合适,那么工业用户在数据采集、计算资源和通信资源上投入的成本就会被浪费。现实中,在达成合作协议之前,用户通常会考虑潜在合作伙伴的条件,而数据质量是联邦学习范式中最重要的考虑因素之一。对于用户 R 来说,我们将用户 R 的潜在合作伙伴定义为在达成正式合作之前愿意合作并可以为用户 R 的利益做出贡献的用户。在决策阶段提前识别潜在的伙伴关系可以增强用户合作的信心和收益。据我们所知,联邦学习的研究大多侧重于提升性能,例如客户端选择技术[12]、模型训练和优化方法[13-15]、模型更新策略[16]等。上述研究都有一个潜在假设是参与者已经开始合作。本文重点研究用户决策阶段参与者的合作不确定性问题,提出了一种基于潜在合作伙伴识别的联邦学习(Federated Learning with Potential Partnership Identification,FLPPI)框架。该框架的核心是在参与者合作前识别潜在的合作关系,以便他们尽可能地选择合适的合作伙伴,并过滤掉不合适的参与者。主要贡献总结如下:1)考虑联邦学习之前的决策阶段,尊重工业用户的合作意愿,当前文献关注较少。基于一个基本事实,用户开始合作就需要投入成本,该方法从用户角度出发,在合作前关注他们潜在合作伙伴的选择。2)提出的框架在保护用户数据隐私的同时评估用户数据的相似性,可方便快捷地向用户推荐潜在的合作联盟。该框架使具有相似同质数据的参与者能够形成联盟。3)自组织增量神经网络在同一样本空间中为每个用户生成少量原型样本,通过样本空间中原型样本的相似性来评估原始数据的相似性。4)本研究阐述的核心概念具有一定的应用潜力,可推动工业用户在不同工业环境中的协作任务,例如关键部件寿命监测和机械部件故障诊断。5 问题定义假设有 N 个工业用户,每个用户都有自己的数据 。每个用户都可以基于本地数据学习一个模型 , 是模型 的参数。为了提高模型的泛化能力,工业用户积极寻求合作,以充分利用他人的数据。在经典的联邦学习设置 [6]下,用户首先在第 t 轮从中央服务器下载模型 。然后,在本地数据中训练模型: 其中,L 为模型推理结果与训练样本标签值之间的损失。 为模型更新的学习率。在完成指定数量的模型训练迭代后,每个用户将自己的模型参数 上传到中央服务器。然后,中央服务器对每个用户上传的模型参数进行加权, 其中 表示第 a 个用户的数据大小,n 表示总数据量。模型 等待用户在下一轮下载。经过 T 轮后,每个用户得到最终模型 。图1阐述了联邦学习框架的总体结构。图 1 联邦学习经典架构柔性制造下,由于生产加工参数差异,各个工业用户的数据呈现异构分布。一方面,当所有参与者都参与联邦学习时,用户数据分布不均会导致更多的局部训练轮次和通信轮次,从而导致每个用户的成本更高;另一方面,对于每个用户来说,合作一旦开始就无法轻易终止,不合适的合作会导致前期成本浪费。因此可以预见,当工业用户主动选择合适的合作伙伴而不是被动接受合作时,可以筛选出不合适的合作伙伴,更有可能获得满意的收益,同时避免不必要的成本。图 2 展示了单个用户的联邦合作流程图。用户参与联邦学习通常包括两个关键阶段:决策阶段和合作阶段。现有文献主要集中在与合作阶段相关的研究,往往忽略了用户在决策阶段的参与意愿。在红色高亮框中,我们评估合作伙伴的数据质量并选择合适的合作伙伴,旨在帮助用户在合作前做出明智的决策,从而帮助他们避免资源浪费。图 2 联邦合作框架流程如何定义潜在的合作伙伴关系?根据文献[17],联邦学习包含一个隐含的假设,即训练后的全局模型可以同时拟合所有客户端的数据分布。因此,在本文中,数据分布相似的工业用户被视为合适的合作者。在实施联邦学习之前,由于数据隐私问题,用户无法访问其他用户持有的数据,因此评估数据质量具有一定挑战性。本文旨在在保护用户数据隐私的同时评估用户数据的分布,然后为用户推荐合适的合作伙伴。6 方法介绍在所提框架中,有 N 个有合作意愿的工业用户,每个用户持有数据 。工业用户默认拥有的数据是通过工业传感器采集的一维信号,例如振动信号、电流信号等。6.1 第一步:数据预处理通过由 S 个采样点组成的不重叠滑动窗口。每个用户获取数据 。6.2 第二步:数据压缩与重构为了保护数据隐私,对原始数据进行压缩重构,压缩重构后的数据保留了原始数据潜在的全局结构信息和局部邻域信息。由于工业过程是时变的[27],因此在处理数据时,需要考虑数据的动态性。基于以上考虑,本文引入了自组织增量神经网络(the Self-Organizing Incremental Neural Network,SOINN)。采用SOINN的优势体现在几个方面。首先,SOINN 通过创建一组有限的原型样本来表示原始数据,这保护了数据隐私。其次,SOINN 可以自主处理来自各个用户的原始数据,无需用户先验知识。用户在共享的样本实例空间内生成自己的原型样本,确保后续的相似度测量是合理的。最后,SOINN 通过增量学习生成原型样本。随着原型样本的逐渐扩大,距离信息得到充分保留,使原型样本能够捕捉时变数据固有的非平稳特性。对于第 a 个用户,从 中随机选取两个样本,形成初始原型集 。之后原型样本的数值和数量会动态更新。具体来说,输入第 i 个样本 后,在原型集 合 中找出两个最相似的原型: 其中 c 表示原型集 合 中的一个原型样本。两个原型样本节点被激活,建立邻域关系 。当两个原型节点在一定时间后没有同时被激活,则删除连接。原型节点的距离阈值 T 通常取类内最大距离或类间最小距离。例如,计算原型节点 的距离阈值 。若 有邻居集 , 否则, 是否更新原型集 取决于新样本与激活的原型节点之间的距离。如果 或 , 否则,激活的原型节点将被更新: 其中 表示更新过程的步长。通过动态调整原型样本,原型样本集将构建到输入数据的空间有序映射。重复上述过程,N 个工业用户可以生成各自的原型集 ,其中 表示第 a 个用户的原型样本集。原型集 P 的个数为 其中 为原型集 的个数。在这一步中,我们将用户的原始样本集替换为原型样本集,这样可以有效保护工业用户的数据隐私。一方面,重构后的原型样本相对于原始样本数量较少。另一方面,对于监督学习任务来说,标签是必不可少的,原型样本没有对应的标签。6.3 第三步:聚类分析工业用户在选择合适的合作伙伴建立联盟时,其数据应该呈现出相似的分布。K 均值聚类提供了一种便捷的方法来评估数据相似性。从原型集 P 中随机选择 K 个原型样本 ,并计算每个原型样本 所属的类别: 其中 。接下来,继续更新原型样本聚类中心: 迭代(11)和(12),直到达到收敛。所有原型样本形成 K 类 。每个聚类都是不同原型样本的集 合。需要注意的是,在提出的框架下,K 值是使用Silhouettes方法[28]确定的。使用不同的 K 值进行实验,并计算每个原型簇 的 Silhouette 得分 F: 其中 表示原型点 与其所属簇中其他点之间的平均距离, 表示原型点 与其他簇中点之间的最小平均距离。 其中 是包含 的原型集, 表示两个原型之间的距离测量,通常取欧式距离。值得注意的是,K-means 并不是聚类分析中唯一的选择。在应用所提出的框架时,聚类方法的选择需要考虑数据的特征、噪声水平、计算效率的需求以及结果可解释性的要求。6.4 第四步:形成联盟对于第 a 个行业用户,对原型样本集 所属的类别进行投票,获得原型多数票的类别被视为该用户的最佳联盟: 属于同一联盟的用户被视为潜在合适的合作伙伴。在本框架下,构建的联盟数量小于或等于集群内的集群数量,因为可能存在部分集群未被任何用户选择的情况。6.5 第五步:模型训练联盟成立后,联盟成员按照联邦学习范式进行协作。图3展示了 FLPPI 框架的架构。当多个工业用户表示愿意参与合作时,会创建本地原型样本,然后与第三方共享。第三方将评估所有原型样本的相似性,并向用户推荐合适的联盟。随后,用户进入合作阶段。图 3 FLPPI 架构7 实验验证7.1 实验数据本研究的实验数据来自南京航空航天大学 Ideahouse 团队[30]的德马吉加工中心。使用九把硬质合金立铣刀加工钛合金工件的凹槽。加工过程采用圆形刀具路径,从内向外移动。加工过程如图4所示。图 4 钛合金工件的加工过程本实验中,振动信号由加速度传感器采集。主轴功率信号由机床内部可编程逻辑控制器 (Programmable Logic Controller,PLC) 寄存器实时采集,使用 OPC UA (OLE for Process Control Unified Architecture)通信协议。具体地,我们选取了两个通道的振动信号、主轴电流和主轴功率,共计四组信号用于建模。刀具磨损标签值是通过测量特定间隔的侧面磨损区域的最大宽度来确定的,采用精度为 0.01 毫米的 XK-T600V 显微镜。磨损值范围为 0 至 0.3 毫米。所用工件材料为 TC4 钛合金。切削过程包含九种不同的工况,每种工况均基于不同的参数配置,包括每齿进给量、主轴转速和轴向切削深度。工况情况在表1中有详细说明。假设有9个工业用户,它们各自的生产线上均生产类似的产品,各工业用户分别拥有与上述工况对应的数据。表1 实验工况描述 7.2 数据处理由于实验过程中显微镜对磨损标签的记录是离散值,存储的信号数据是时间数据,因此需要对磨损标签进行插值处理。本实验采用线性插值法,每900个数据点切取一个样本,并对样本进行标记。提取时域和频域特征,以提高模型训练的效率,避免维度灾难问题,如表2所示。表2 特征提取情况7.3 方法比较实验基于联邦学习框架,模型选择方面,将刀具磨损机理[32]引入数据驱动模型: 其中 VB 表示刀具背面的最大磨损带宽, t 表示磨损时间。常数a、b、 和 需要优化。具体来说,引入物理信息神经网络(Physics-Informed Neural Network,PINN)[33]来融合数据驱动模型和机理模型。所有比较方案均以 PINN 模型为基础模型。PINN中的损失函数由两部分组成:物理损失和数据驱动损失。数据驱动损失取模型预测值与真实刀具磨损值之间的 MSE 损失的平均值。物理引导损失以公式(20)中的刀具磨损机制作为正则化项: 其中 表示模型预测的刀具磨损值关于磨损时间的偏微分。选取了三种经典的联邦学习框架 FederatedAveraging (FedAvg) 、FedProx 、FedDyn 进行对比。其中,FedProx 是一个联邦学习框架,它加入了近端项来增强模型收敛性,并解决了参与客户端之间的数据异构性问题。FedDyn 是一个联邦学习框架,它动态调整通信轮次和局部模型更新,以提高联邦学习模型的收敛速度和鲁棒性。表3展示了在不同框架下在刀具磨损数据集上实现的模型性能。表中对三个经典框架的比较结果表明,使用 FedAvg 训练的模型在 W3、W6 和 W8 上表现非常出色,而使用 FedProx 训练的模型在 W1、W4、W7 和 W9 上表现出色。此外,使用 FedDyn 训练的模型在 W2 和 W5 中表现出色。这些结果表明,在刀具磨损回归任务中,在三个框架下训练的模型的预测能力非常相似。值得注意的是,我们提出的框架在7个用户的刀具磨损任务中表现优于其他框架,在W6和W8的刀具磨损预测任务中,其性能仅落后于FedAvg。这是因为在我们的实验中,用户所持有的数据异构性并不显著,这导致模型的性能受到建模样本数量的影响。在所提出的框架下建立联盟后,用于建模的样本数量会减少。在现实中,多个工业用户加工不同规格产品所造成的数据异构性会大于加工参数细微变化所造成的数据异构性,因为在加工不同规格产品时,加工参数的设置会有显著的不同。在我们提出的方案中,数据的异构性越大,通过建立联盟进行联邦学习的效果就越显著。所提出的解决方案将在现实的联邦合作场景中产生显著的改进效果。综上所述,在我们提出的框架下训练的模型在刀具磨损预测方面表现出优于其他方案的性能。图5展示了不同模型在部分用户数据上的具体预测性能。显然,在提出的框架下,训练出的模型在刀具磨损预测任务上的拟合度更高。表3 不同框架训练模型的刀具磨损预测结果 图5 不同框架训练的模型在刀具磨损预测任务中的表现(a)在 FedAvg 下训练的模型在 W1、W8、W9 上的预测性能(b)在 FedProx 下训练的模型在 W1、W8、W9 上的预测性能(c)在 FedDyn 下训练的模型在 W1、W8、W9 上的预测性能(d)在 FLPPI 下训练的模型在 W1、W8、W9 上的预测性能8 结论本研究针对参与联邦学习的工业用户之间合作的不确定性,提出了一种基于潜在合作伙伴识别的联邦协作框架。该框架在保证数据隐私的前提下,评估用户手中数据的相似性,为用户推荐潜在合作伙伴,使每个联盟下的用户获得更好的收益。刀具磨损预测实验表明,在该框架下训练的模型具有优异的预测性能。目前仍有一些挑战点有待研究。所提框架对所有原型样本进行聚类,以确定联盟的数量。联盟的构建与原型样本的分布高度相关。现实中,为了提高合作效率和效果,在寻找潜在合作伙伴时,还需要考虑用户所拥有的计算和通信资源。我们将进一步考虑上述因素,并考虑通过博弈论[36]形成更合适的联盟。此外,在评估用户数据质量时,自组织增量神经网络的相似度阈值会影响原型样本的数量。如何自适应地设置相似度阈值也是一个具有挑战性的任务。编辑:任超校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、曹希铭、海洋、冯珽婷、陈宇航、陈莹洁、王金、赵诚该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除。来源:故障诊断与python学习

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈