温州大学向家伟/吕东祯：电池累计寿命预测，成功搭建实验场景研究与现实场景应用之间的桥梁

1月前浏览2103

本期受文章作者投稿给大家分享一个电池退化数据集。如果有故障诊断相关方向研究人员希望宣传自己研究成果，欢迎大家在公众号后台与小编联系投稿，大家一起交流学习。

最近，由温州大学的向家伟和吕东祯团队，与南卡罗来纳大学的Bin Zhang团队以及巴黎矿校的Enrico Zio团队在《Cell》子刊上发表了一项开创性的电池寿命预测技术，展示了在电池累计寿命预测领域的重大进展。这一技术创新引入了“累积使用寿命”的概念。该预测方法简化了模型中多种影响因素的耦合，使其能在不同的应用场景中迁移使用显著，提升了实验室研究与实际应用的衔接。

在大规模迁移测试中，该方法不仅稳定提高了早期寿命预测的准确性（误差降至5%以下），还能在便携式设备上实现毫秒级的实时预测，显示出卓越的工程实用性。

论文链接：通过点击本文左下角的阅读原文进行在线阅读及下载。

论文基本信息

论文题目：Battery cumulative life time prognostics to bridge laboratory and real-life scenarios

论文期刊：Cell Reports(SCI一区Top)

论文日期：2024.07

论文链接: https://doi.org/10.1016/j.xcrp.2024.102164

作者：Dongzhen Lyu(1, 5), Bin Zhang(2), Enrico Zio(3, 4), Jiawei Xiang(1),

机构：

1 College of Mechanical and Electrical Engineering, Wenzhou University, Wenzhou, Zhejiang 325035, China

2 College of Engineering and Computing, University of South Carolina, Columbia, SC 29208, USA

3 MINES Paris, PSL University, 75272 Paris, France

4 Energy Department, Politecnico di Milano, 20156 Milano, Italy

通讯作者邮箱：lvdongzhen@hrbeu.edu.cn

作者简介：吕东祯博士在锂电池寿命预测领域深耕近十年，自2020年起针对实车工况寿命预测中的技术瓶颈和应用难点进行了深入研究，开发了一系列工程方法，申请/授权7项中国专利、1项PCT国际专利、1项美国发明专利。专利技术曾被国内外多家研究机构采用近百台电动公交车进行示范性应用。针对实车场景下电池寿命预测研究的应用瓶颈，国内外多家研究机构于2023年12月开展合作，开发了一种基于累计里程量的寿命预测方法，成功采用60台电动公交车进行示范性应用。该方法采用累计里程量作为寿命指标来开发寿命预测方法，与吕东祯博士早在2021年7月15日提交的中国专利202110798763.5中的核心技术理念（其中权利要求1）保持一致。该示范性应用由北京理工大学、国家电动汽车工程研究中心，德国亚琛工业大学，尤利希-亚琛联合研究中心，明斯特亥姆霍兹研究所共同主导。同时受到了中国国家重点研发、中国自然科学基金联合重点项目、德国联邦政府和北莱茵州的共同资助。

1 背景介绍

随着科技的不断进步，电池作为能源存储的重要组成部分，其寿命和性能预测成为了关键课题。传统的电池寿命预测方法多依赖于实验室条件下的测试，这些方法虽然精确，但在实际应用中往往难以反映电池在真实环境中的表现。因此，如何将实验室研究成果有效地转化为实际应用，成为了电池技术研究中的一大挑战。

针对这一应用瓶颈问题，宁德时代新能源科技股份有限公司曾于2024年6月面向全球发布技术榜单：“基于实验条件下的电芯循环寿命预测已有不少研究，但是针对于实车工况下，真实使用场景、不同环境温度等影响因子的使用寿命预测，还缺乏真正的工程方法”。吕东祯博士在在该领域深耕数年，早在2020年10月份起就开始设计实施实车工况锂电池性能退化实验，针对这一技术瓶颈和应用难点进行了深入研究，面向实车工况开发了一系列工程方法并申请/授权7项中国专利、1项PCT国际专利、1项美国发明专利，有效应对了这一瓶颈问题。专利技术曾被国内外多家研究机构采用近百台电动公交车进行示范性应用。

2 研究出发点

测试并收集300个电池单体在实验室场景与现实应用场景下的性能退化数据。考虑了随机充放电电流、频率、深度以及多电池成组、环境温度的影响。
该方法在建模过程中简化了多种影响因素的耦合作用，但反而却能够在多种应用场景之间实现相互迁移。
在进行大规模迁移测试时，展示了持续稳定提升的早期寿命预测效果（最低误差低至5%）。
在便携笔记本上实现了毫秒级的实时寿命预测能力，具有非常出色的工程实用性。

3 文章解析

3.1 全球规模最大、周期最长的性能退化实验

实验过程共采用了两种类型的磷酸铁锂电池进行性能退化测试，分为A型和B型两种。其中A型电池具有1Ah的标称容量，共采用了150个A型电池。从中挑选了6个A型电池组成了两个3Ah的并联电池组。B型电池的标称容量为0.8Ah，共采用了150个B型电池。从中挑选了76个B型电池单体构成了18个电池组。其中包括2个1.6Ah的电池组，10个2.4Ah的电池组，8个4Ah的电池组。

表 I. 不同电池单体和电池组的退化测试模式设定

所有的电池单体和电池组均进行了性能退化测试，在标准模式、复杂模式或随机模式下进行了测试。表I详细列出了每种模式下的电池和电池组的具体数量。

标准模式包括交替的完全充放电循环，使用额定的充放电设置；
复杂模式用于模拟运行工况的复杂性；
随机模式用于模拟运行工况的随机性。

其中，随机模式在所有模式中占比最大，几乎所有处于随机模式的电池都有个性化的配置，使它们彼此不同。

出于安全考虑，待测电池被放置在一个铝制的安全箱中，该安全箱没有进行隔热处理。这意味着昼夜温差和季节性温差会影响实验结果。因此，测试过程中还记录了实验期间的季节性温度变化，用以充分反映昼夜温度变化以及四季温度变化对电池性能的影响。

图1. 电池单体及电池组的容量变化

这项实验研究采用了大量的电池，每个电池分别经历了 500 次到 10000 次以上的充放电循环，全部电池单体和电池组的充放电循环次数的总和超过了 54.6 万次，测试时长的总和则超过 2600 万分钟。这项实验研究生成了超过200GB的退化实验数据，并且测试周期持续了 4 年（2020-2023 年），是目前世界上规模最大，最贴近实际运行工况，持续时间最长的电池退化实验，可以用于深入研究诸如日历老化和季节性温度影响等问题。

在对实验结果进行分析后，图1展示了不同电池个体和电池组的测量容量与充放电循环次数的比较。其中不同的颜色用于区分不同的电池个体或电池组，很明显不同电池个体或电池组的数据是相互重叠的，充分展示它们之间的复杂差异。

图2. 不同电池和电池组在不同测试模式下的容量变化

虽然图2中展示了电池容量随充放循环次数的变化趋势，但很难从中发掘出清晰的规律。这是由于电池单体和电池组的退化过程之间存在着巨大的差异，同时不同测试模式也会导致明显的退化差异。

3.2 所开发的基于累积损耗特征的预测方法

现有的充电电池寿命预测方法大都是基于理想条件下的充电电池寿命测试。在试验测试中，充电过程和放电过程是在专业设备上交替执行的，故而可以保证充电过程和放电过程的完整性。也因此，传统的充电电池寿命预测方法大都采用充放电循环次数作为寿命。

在实际应用中，充电电池的使用方式和频次取决于用户的随机使用习惯。而在这种随机充放电场景中，充电过程和放电过程大都是不连续且不完整的，因而所对应的退化数据具有很差的规律性，也非常难以进行分析。

根据用户的使用习惯，在充电电池的使用过程中，可能其电量尚未完全用完时就会进行充电，或者其电量尚未完全充满时就需要进行放电使用。与此同时，放电过程中也可能会存在暂停和续接现象，例如需要暂时更换充电场所或充电场所内暂时的停电。此外，当用户的充电线发生接触不良现象时，可能会在短时间内产生数次极短的充电过程。对于手机来说，除非在关机状态下进行充电或存在软件设定，否则其充电过程必然同时伴随着耗电运行。对于便携式笔记本来说，可能会存在长期插电运行的使用场景，此时的充放电过程是难以界定的。故而在充电电池的实际应用过程中，基本不存在理想条件下的交替完整充放电设定，显然，以充放电循环次数为寿命是不准确且不合理的。

充电电池的退化过程是非常复杂的，显然单独采用循环次数来描述退化过程是不准确且不合理的。在对前述复杂随机工况下的锂电池退化数据进行分析和研究后发现，采用累计损耗量作为寿命指标能够获取非常一致的退化趋势。由于并不是单单地对循环次数进行计数，这种方式在理论上显得更加的合理。

图3. 采用累积放电量作为寿命指标

3.3 惊人的一致性和迁移预测效果

如图3所示，在采用累积放电量作为累计损耗寿命指标后，不同电池个体之间的退化一致性得到了显著的提升。

图4. 采用累积放电量作为寿命指标后实现的高度一致退化趋势

图4展示了应用累计损耗特征提取方法前后的领域差异。其中，其中黑色数据代表源域，红色的数据代表目标域。在采用循环次数作为寿命指标时（如图4a、图4b所示），源域中各个电池单体和电池组的总循环次数都比较少，均低于1000次循环，目标域中各个电池单体和电池组的总循环次数则较高，部分电池甚至超过了13,000次，这充分说明了源域和目标域之间的显著差异。

在采用累计损耗特征提取方法进行处理之后（如图4a、图4b所示），黑色数据仍然代表源域，红色数据则代表目标域。从中可见，源域和目标域之间的领域差异明显减少了。这为本文所开发的寿命预测方法提供了坚实的实际基础。

表 II. 不同方法在迁移应用场景下的早期预测误差对比

表II展示了传统的预测方法在迁移预测场景下的早期预测效果，包括平均百分比误差和平均绝对误差。很明显，在采用本文所开发的预测方法后，A型电池目标域上的平均百分比误差从52.3%降至12.8%；B型电池目标域上的平均百分比误差从57.5%降至13.50%。此处需注意，传统的基于循环次数的寿命预测方法在源域（即实验室场景）中的预测误差也低至11.4%，但是在目标域（即实际场景）中高达52.3%，难以在实际场景中进行工程应用。

此外，本文所开发的预测方法还遵循了简单实用和高效计算的原则，采用了非常高效的GPR技术，因此非常适合在便携式笔记本上进行计算。此外，所有方法在模型训练阶段的耗时都不超过1秒，并且预测耗时始终保持在10毫秒以下。训练阶段使用了源域中所有的电池数据进行模型训练，测试阶段同时预测了目标域内全部电池单体和电池组的失效寿命。执行运算的笔记本仅配备了AMD Ryzen 7840H处理器、16 GB内存，没有配置独立的图形处理芯片GPU。

4 总结与展望

本项目开发的方法将实验室场景中学到的电池退化模型成功应用于复杂的半充半放实际车辆场景下的电池寿命预测，并且实现了多种复杂工况之间的相互迁移。

图5具体总结展示了本项目实验研究的全面性，并且客观展示了所提出解决方案的卓越性能。本项目的实验验证长达4年之久，并且其中设置的测试模式非常繁多，既包括贴合实验室场景的标准模式，也包括多因素耦合下的复杂模式，还包括贴合真实场景的随机模式，包括但不限于采用随机的充放电频次，随机的充放电时长，随机的充放电电流大小，随机的充放电深度等。与此同时，还考虑了昼夜变化所导致的高频低幅温度变化，以及四季变化所导致的低频高幅温度变化。本项目的实验研究共采用了两种型号的电池，各自均是同一批次，但是不同电池的仓储搁置时间是不同的，因此也考虑了复杂日历退化效益的影响。

图5. 应用累计耗损特征提取方法前后的邻域差异

5 课题组介绍

该实验研究中全部电池单体和电池组的充放电循环次数总计超过了 54.6 万次，测试时长总计超过 2600 万分钟，是目前世界上规模最大，最贴近实际运行场景，持续时间最长的电池退化实验。对应的实验数据已经被命名为“WZU随机电池退化数据”，并面向全球开源共享。

相关数据和代码的访问和使用权限遵循知识共享署名-禁止演绎 4.0 国际许可协议（CCBY-ND 4.0）。在使用或向他人分享这些数据或代码时，请务必采用统一的命名格式“WZU随机电池退化数据”（英文版本为 "Wenzhou Randomized BatteryData"），并引用以下来源文章：Dongzhen Lyu et al., BatteryCumulative Lifetime Prognostics to Bridge Laboratory and Real-Life Scenarios,Cell Reports Physical Science (2024), https://doi.org/10.1016/j.xcrp.2024.102164

在分享数据或代码时，必须保持数据集的原始完整性，并提供直接访问原始数据的链接；严禁进行任何修改、处理、重组或重新打包。请务必访问下述链接获取许可协议的全文。

X_MOL主页：https://www.x-mol.com/groups/DongzhenLyu
ResearchGate：https://www.researchgate.net/profile/Dongzhen-Lyu
GitHub：https://github.com/lvdongzhen/Wenzhou-Randomized-Battery-Data
Onedrive：https://1drv.ms/f/s!AnQLciP1URipksZQPfoVLhdf67Y8mg

如有任何疑问需要澄清，请联系吕东祯博士。电子邮箱:lvdongzhen@hrbeu.edu.cn

客官，球球再点个广告，再走吧~

点击左下角阅读原文，即可在线阅读论文。

来源：故障诊断与python学习

论文学习 | SCI一区-一种用于变工况下旋转机械实时故障诊断的跨域类增量宽度网络

本篇论文是针对在实际工程中采集数据流产生新类别故障数据后模型如何有效更新而开展的研究，因为在实际开放环境中数据是以流的形式不断涌入，当出现新故障类别数据时，以往构建的诊断模型无法识别，需要模型更好地处理新故障类别的诊断任务。这实际上是一种跨域故障类别增量问题。因此提出了一种跨领域类别增量宽度网络。适合于深度学习、迁移学习、故障诊断、增量学习研究领域学习者。论文链接：通过点击最左下角的阅读原文进行在线阅读及下载。1 论文基本信息论文题目：Cross-Domain Class Incremental Broad Network for Continuous Diagnosis of Rotating Machinery Faults Under Variable Operating Conditions论文期刊：IEEE Transactions on Industrial InformaticsDOI：10.1109/TII.2023.3345449论文时间：2024年作者：Mingkuan Shi (a), Chuancang Ding (a), Shuyuan Chang (b), Changqing Shen (a), Weiguo Huang (a), Zhongkui Zhu (a)机构:a: School of Rail Transportation, Soochow University, Suzhou 215131, PR China；b: Key Laboratory of Advanced Manufacturing Technology, Beijing University of Technology, Beijing 100124, PR China.2 摘要机器学习模型在智能故障诊断领域取得了广泛的成功。目前大多数现有的机器学习模型部署在静态环境中，依赖于预先收集的数据集进行离线训练，这使得一旦模型被建立后无法进一步更新。然而，在实际的开放动态环境中，数据总是以流的形式不断涌入，包括持续生成的新类别数据。此外，由于机械设备的运行工况是时变的，导致数据流呈现非独立同分布特点。在工业应用中，非独立同分布的连续数据流的诊断问题被称为跨领域类别增量诊断问题。为解决跨领域类别增量问题，提出了一种新颖的跨领域类别增量宽度网络（Cross-Domain Class Incremental Broad Network，CDCIBN）。具体而言，为了解决非独立同分布问题，首先设计了一种新的域适应损失函数，使传统的宽度网络能够很好地处理类别增量任务。然后，设计了一种跨域类别增量学习机制，在学习新类别的同时，能够很好地保留旧类别的知识，而无需重放旧类别数据。通过多个机械增量故障的案例评估了所提方法的有效性。实验分析表明，设计的CDCIBN框架在可变工况类别增量应用中具有显著优势。关键词：宽度学习系统；类增量学习；智能故障诊断；变工况3 目录1 论文基本信息2 摘要3 目录 4 引言5 相关工作 5.1 基于正则化的方法 5.2 基于回放的方法 5.3 基于参数隔离的方法 6 方法介绍 6.1 问题描述 6.2 域适应CDCIBN目标函数 6.3 跨域类增量机制7 实验验证与分析 7.1 实验设备 7.2 实验设置 7.3 模型验证8 结论注：本文只选中原论文部分进行分享，若想进一步拜读，请下载原论文进行细读。小编能力有限，如有翻译不恰之处，请多多指正~4 引言在现代工业中，智能故障诊断（Intelligent Fault Diagnosis，IFD）不仅可以确保机械设备的稳定可靠运行，还能提高生产效率并降低维护成本[1]，[2]，[3]。作为工业领域的一个重要研究课题，基于数据驱动的故障诊断技术由于其能够规避对部件故障机理先验知识或先验信息的需求，已经引发了广泛关注[1]。近年来，随着技术不断进步和人工智能领域快速发展，机器学习已成为当今最热门和最具前景的领域之一。在故障诊断和模式识别中，机器学习技术取得显著成果，并广泛应用于各个行业[4]，[5]，[6]。深度学习的成功又将机器学习的发展推向了一个新的高度。然而，在现实世界中，机器学习系统总是会遇到学习连续任务的问题，如何有效学习连续任务成为当前研究重点。尽管现有机器学习方法在特定任务上性能表现优异，但这些方法往往局限于封闭的静态环境，也称为孤立学习。这种学习只考虑任务内部的信息，而忽略了学习任务之外的信息。换句话说，模型在给定任务下的训练和推理过程仅在符合独立同分布假设的数据上进行。显然，这种学习方式效率低下，因为现实世界是一个开放动态环境。在开放动态环境中，训练样本通常以数据流的形式出现。面对不断涌现的新数据，直接使用这些数据进行模型更新可能会导致模型灾难性遗忘。也就是说，在学习新数据的同时，模型可能会忘记之前学习的旧数据的特征和规律，失去区分旧数据的能力，从而导致模型分类性能急剧下降。同时，收集旧数据和新数据来重新训练模型所需成本极高。这些问题严重限制了机器学习模型在工业应用中的发展潜力。一个理想的机器学习模型应该能够使用数据流中的新样本来更新模型，同时避免浪费重复的计算资源。近年来，引入增量学习可以有效解决现有机器学习方法无法从数据流中持续学习的问题。增量学习的目标是实现模型持续更新，在学习新类别或任务的同时，保持模型在已学习类别或任务的性能。目前，已有学者研究并提出几种增量学习方法来应对数据流的挑战。Peng等人[7]提出了一种基于监督对比知识蒸馏的工业过程下的增量智能故障诊断方法。Chen等人[8]设计了一种应用于齿轮箱故障类型增量诊断的终身学习智能故障诊断方法。此外，Bojian等人[9]开发了一种能够实现机器增量的持续学习的智能故障诊断方法。Liu等人[10]提出了一种基于生成特征回放的类别增量智能故障诊断方法，以解决灾难性遗忘问题。与深度学习相比，宽度学习系统（Broad Learning System, BLS）[11]由于其训练快速、准确性高和增量学习等优点，在各个领域获得了广泛应用[12]，[13]，[14]，[15]。Fu等人[16]提出了一种广义自编码智能故障诊断方法，即通过利用宽度学习系统的增量属性来实现类别增量学习（Class Incremental Learning， CIL）。总体而言，上述类别增量学习方法已取得令人满意的结果，但在实际工业应用中仍面临一些未解决的挑战。具体来说，现有的基于深度学习的增量学习方法在满足最小计算、存储和时间要求的同时，难以减轻灾难性遗忘。此外，基于深度学习的增量学习算法在处理任务序列时严重依赖反向传播算法，这不仅增加了训练负担，还在超参数设置上极其敏感。相比之下，基于宽度学习系统的增量学习方法由于其独特的网络结构，能够以较低的时间复杂度和空间复杂度自动提取高质量特征信息，因此是一种更具前景的方法，也是本文的核心。然而，在处理增量类别时，宽度学习系统缺乏测量旧类别与新类别之间相似性的能力，且模型的训练时间随着节点数量的增加而增加。上述基于类增量学习的故障诊断方法都基于数据同分布的假设。在实际工业过程中，设备运行条件需要灵活适应不同的任务要求，难以保持稳定的工作状态，导致连续流数据表现出非独立同分布的特征。在面对分布变化的数据流时，现有增量学习故障诊断方法将失去其有效性，这可能容易导致对故障类别的误判。总之，工业应用中持续出现的故障类别和数据分布的改变对现有智能故障诊断方法提出了重大挑战。因此，迫切需要探索有效的方法来利用具有不同分布的数据流进行动态增量故障诊断。为了应对这些挑战，提出了一种新的跨域类增量宽度网络，用于不同操作条件的旋转机械的数据流下的智能故障诊断，如图1所示。在CDCIBN中，首先基于最大均值差异（Maximum Mean Discrepancy， MMD）框架和图嵌入框架设计了一种新的域自适应学习损失函数，可以使两个不同域之间的距离更近，从而使传统的BLS能够更好地处理不同分布的数据流。然后，设计了一种跨域CIL机制，该机制保留了旧类别的知识，并在不重放旧类别数据的情况下很好地学习了新类别的知识。具体而言，本研究的具体贡献总结如下：1. 基于源域和目标域之间的相似性，设计了一种新的域自适应学习损失函数，使传统的宽度网络能够很好地处理不同分布的类增量任务。2. 设计了一种跨域CIL机制，该机制有效地保留了先前类的知识，而不需要在学习新类时重放它们的数据。3. CDCIBN拥有高效的闭合解，能够快速准确地更新模型，而不需要大量的时间和计算资源进行模型迭代训练和优化。4. 提出了一种基于CDCIBN的机械IFD方法，并成功应用于不同操作条件下的故障增量场景。5. 与现有的类增量故障诊断方法不同，CDCIBN通过有效地解决复杂的跨域类增量问题，为旋转机械故障诊断领域提供了一个新的视角。图1 变工况下跨域类增量学习用于智能故障诊断5 相关工作5.1 基于正则化的方法基于正则化的方法通过在模型的训练过程中添加正则化项来约束模型的参数，从而减轻灾难性遗忘。例如，弹性权重巩固（Elastic Weight Consolidation，EWC）[17]通过计算模型中的参数对旧知识的重要性，然后在新数据下限制这些重要权重的更新。无遗忘学习[18]使用旧模型对当前数据的输出来获得软标签，然后通过结合数据本身的分类损失和根据软标签计算得到的蒸馏损失来微调模型。5.2 基于回放的方法基于回放的方法有效地将新类别数据与原始类别数据集成在一起，模型在学习新类别的同时回顾旧数据，确保模型在学习新类别时不会忘记旧类别。例如，Rebuffi等人[19]首先提出了一种基于数据回放的类增量学习方法，称为增量分类器和表征学习（ incremental Classifier and Representation Learning，iCaRL）。Xiang等人[20]使用对抗训练策略来生成与旧数据分布相似的中间层卷积特征表示，以减轻对旧知识的遗忘。5.3 基于参数隔离的方法方法为每个新任务提供不同的模型参数，以防止灾难性遗忘。具体地，该方法可以通过动态调整网络结构来适应不断变化的环境。这种训练方法允许对网络进行选择性训练，并根据需要扩展网络以适应新任务的学习。例如，一种名为自适应聚合网络的新型动态聚合网络可以解决类别增量学习中的稳定性-可塑性困境问题。6 方法介绍6.1 问题描述给定一组由多个数据块组成的数据流，其中第一个数据块表示为，第二个数据块表示为，以此类推，第k个数据块可以表示为。数据流中的每个数据块可以代表一个增量任务，每个数据块中包含有大量的源域样本和少量目标域样本。初始阶段，首先使用训练出初始模型。此时测试集的类别数目为初始数据集的类别数目。在第k个增量阶段使用更新的模型参数得到。此时测试类别数目为全训练阶段的类别数目。6.2 具有域适应学习能力的CDCIBN目标函数为构建高性能的跨域类增量模型，本文在决策层考虑源域数据和目标域数据之间的差异。这是因为决策层对模型的学习性能有直接影响。具体而言，设计了一种新的域自适应学习损失函数，使传统的宽度网络能够很好地处理不同分布的类增量任务。首先，根据MMD测量原理，通过匹配源域和目标域的投影均值来缓解源域和目标域之间的数据分布差异。随后，利用图嵌入理论使类内样本更紧凑，进一步减小源域和目标域数据之间的分布差异。6.2.1 故障特征提取给定数据集 , 是对应的标签矩阵，d 代表样本特征维度，m 代表类别总数。CDCIBN首先随机化权重和偏置，通过一个线性变换将输入数据映射为特征节点。由于权重和偏置是随机生成，具有一定的不可预测性。通过引入稀疏自编码器来约束参数。其中需要被稀疏自编码器学习。通过稀疏自编码器学习的特征，相较于传统映射特征更为稀疏和有效。新特征节点表示为：然后，CDCIBN进一步将特征节点映射至增强节点：紧接着，将特征节点表示和增强节点表示组合，获取特征矩阵： 6.2.2 故障分类损失学习的输出层权重表示为，训练集对应标签为。预测损失使用欧式距离来度量。真实标签和预测标签之间的误差被表示为：所有样本的分类误差表示为： 6.2.3 MMD度量损失MMD通过比较两个概率分布之间的距离来评估它们之间的相似性或差异性。因此，本文采用MMD度量来缓解源域和目标域之间的分布差异，从而实现域自适应。MMD的具体计算如下：和分别表示源域样本和目标域样本。公式（8）可以被表示为： 6.2.4 域适应图嵌入损失为了提高所提增量模型在目标域上的泛化性能，使用图嵌入理论构建了同域样本之间和不同域样本之间的结构关系，进一步减少源域和目标域数据之间的分布差异。具体来说，首先利用样本之间的距离关系和域之间的相关性来构建邻接图，其中是特征矩阵，是权重矩阵。具体被描述为：其中，是数据点的 k 个相邻点的集合。，为训练集样本数，为和的欧式距离。域自适应图嵌入损失由下面计算得出： 6.2.5 总损失函数CDCIBN的损失函数通过结合标签预测误差损失、MMD度量损失以及域适应图嵌入损失获得。即结合公式（7）,（9）,（12）得出。其中λ，β 和 γ 为正则化参数。令上式导数等于0求解。通过岭回归理论可以有效确定： 6.3 跨域类增量机制6.3.1 初始学习给定初始的训练集，其中源域样本数量为，目标域样本数量为。。初始训练集的输入矩阵可以表示为，对应标签矩阵为。根据公式（17）可以计算初始数据块的输出权重： 6.3.2 类增量学习假定一个新训练数据块，其中源域样本数量为，目标域样本数量为。。输入矩阵可以表示为，对应标签矩阵为。根据初始数据集和新数据集可以计算权重矩阵：进一步推导，可以得到：令则此时可进一步表示为上述增量学习的过程可进一步扩展到对第k+1个数据块学习的场景。此时权重矩阵可计算得到：其中， 7 实验验证与分析7.1 实验设备轮对测试系统如图2所示。在轮对测试系统中，电机转速分别设置为400、600和800 r/min。施加的载荷分别为1.6kN和2.4 kN。分别为试验轴承滚子和内圈设置五种不同的故障尺寸（0.2、0.3、0.4、0.5和0.6 mm）共十种故障模式。采样频率设置为32768Hz。表1 给出故障的详细信息和对应标签。图2 轴承试验平台表1 故障类别信息实验设置了各种跨域类增量诊断任务，包括不同速度、不同负载以及不同的速度和负载场景。详细的诊断任务设置见表2。表中任务“1.6-400”代表负载为1.6kN，速度为400r/min。表2 诊断任务信息7.2 实验设置实验引入宽度自编码器（Broad Auto-Encoder, BAE）、基于宽度学习的类增量方法（BLS-based CIL，BLS-CIL）、CDCIBN-A1、CDCIBN-A2与所提CDCIBN方法进行比较，评估CDCIBN的有效性。CDCIBN-A1未考虑MMD损失项，CDCIBN-A2没有考虑域适应图嵌入损失项和MMD损失项。为确保实验公正，BLS-CIL、CDCIBN-A2、CDCIBN-A1、CDCIBN和BAE配置了200-100个节点。每项试验进行10次，这10次试验的平均精度作为评估指标。训练集源域中的样本数设置为20，目标域样本数设置为5，因此每个类别总共有25个训练样本。总共使用每种故障模式的100个样本进行测试。7.3 模型验证首先进行单故障类增量分析。在这种情况下，初始学习时，类别数量设置为1，每次递增学习1个类别。考虑总共有十种故障类型，需要九次增量学习来完成模型训练。图3展示了所提方法的在类别增量下预测精度。CDCIBN在初始化阶段和第一个类别增量学习阶段都表现出100%的准确性。随着类别数量的增加，整体增量精度往往会降低。然而，CDCIBN在类别增量学习任务中显示出明显的性能优势，并且在长时间的连续增量学习中仍然保持良好的性能。结果表明CDCIBN可以很好地处理跨域类增量诊断任务。图3 单故障类别增量下方法的增量预测精度为了更直观比较不同方法的性能，图4展示了每种方法的平均增量精度（average incremental accuracy ，AIA），即计算每个增量学习阶段的平均精度。实验结果表明，CDCIBN能够有效地保留旧类别的知识，并在跨域类别增量学习中成功学习新类别。图4 基于单故障类别增量下不同类别增量方法的平均增量预测精度为了研究CDCIBN在基于多故障的跨域类增量诊断任务中的性能，初始化类别数量设置为2，每次增量的类别数量设为2。图5展示了每种方法的平均增量预测精度。可以发现，CDCIBN的性能远优于对比方法。结果充分证明了所提CDCIBN方法在跨域类增量诊断方面具有出色的能力，有效地解决了工业应用中不同工作条件下的流数据诊断问题。图5 基于多故障类别增量下不同类别增量方法的平均增量预测精度8 结论本文提出了一种新的CDCIBN模型，用于不同工作条件下的故障增量诊断任务。CDCIBN利用MMD度量理论和图嵌入理论构建损失函数，实现域适应学习，从而使CDCIBN能够在不同的数据分布条件下有效地处理类增量任务。此外，在CDCIBN中设计了一种跨域类增量机制，使CDCIBN能够在不同的分布式数据流中不断学习新的故障类别。同时，CDCIBN网络结构简单，不需要知识回放和迭代优化，具有较低的时间复杂度和空间复杂度。本研究为故障诊断的跨域类增量学习提供了一种新的解决方案。在动态变化的工业场景中，有效利用大量源域数据和少量目标域数据进行跨域类增量学习是有价值和意义的。未来，这种方法将扩展到没有目标域数据的类增量学习，从而可以仅使用源域数据在可变操作条件下很好地评估工业数据流。编辑：任超校核：李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、陈少华该文资料搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除。点击左下角阅读原文，即可在线阅读论文。来源：故障诊断与python学习