这是北航 PHM 实验室在健康管理大模型领域的成功尝试,研究团队提出了基于大语言模型的轴承故障诊断框架,提升预训练大模型对振动数据的解析与泛化能力。
以轴承为例,他们探索并打通了基于预训练大语言模型解决泛化故障诊断难题的技术路线,初步展现了对跨工况、小样本、跨对象等泛化诊断任务的综合解决能力。
北航 PHM 实验室为业界学者应对故障诊断领域泛化痛点问题提供了新思路,也是深入开展大模型与健康管理交叉研究并建立健康管理大模型的重要基础与参考。
论文题目:LLM-based framework for bearing fault diagnosis
论文期刊:Mechanical Systems and Signal Processing
论文日期:2024年
论文链接:
https://doi.org/10.1016/j.ymssp.2024.112127
作者:
Laifa Tao (a,b,c,d), Haifei Liu (b,c,d), Guoao Ning (b,c,d), Wenyan Cao (b,c,d), Bohao Huang (b,c,d), Chen Lu (a,b,c,d,*)
机构:
a: Hangzhou International Innovation Institute, Beihang University, Hangzhou, China
b: Institute of Reliability Engineering, Beihang University, Beijing, China
c: Science & Technology on Reliability & Environmental Engineering Laboratory, Beijing, China
d: School of Reliability and Systems Engineering, Beihang University, Beijing, China
作者简介:来自杭州北航国新院、北航,主要作者:陶来发、刘海菲、宁国澳、曹文燕、黄博昊、吕琛(通讯作者)。吕琛教授:国家级领军人才、英国皇家航空学会会士;陶来发教授:国家级青年人才。
准确诊断轴承故障对于保持旋转机械的高效运行至关重要。然而,由于应用环境的多样性,包括跨工况适应能力、小样本学习困难和跨数据集泛化能力,传统的诊断方法面临挑战。这些挑战阻碍了现有方法的有效性,并限制了它们的应用。大型语言模型(LLMs)为提高诊断模型的泛化能力提供了新的可能性。然而,将LLMs与传统诊断技术相结合以实现最佳泛化仍然是一个未被充分探索的领域。本文提出了一种基于LLMs的轴承故障诊断框架,以解决这些挑战。
首先,提出了一种信号特征量化方法,用于解决从振动数据中提取语义信息的问题,该方法结合了基于统计分析框架的时域和频域特征提取。该方法将时间序列数据文本化,旨在通过简洁的特征选择高效地学习跨工况和小样本的共同特征。基于LoRA和QLoRA的微调方法被用来增强LLMs在分析振动数据特征方面的泛化能力。此外,这两项创新(文本化振动特征和微调预训练模型)通过全量和少量数据的单数据集跨工况和跨数据集迁移实验进行了验证。
结果表明,所提出的框架能够同时执行三种类型的泛化任务。训练后的跨数据集模型在准确性上大约提高了10%,证明了LLMs对输入模式的适应性。最终这些结果有效地增强了泛化能力,并填补了使用LLMs进行轴承故障诊断的研究空白。
关键词:大语言模型,轴承故障诊断,微调,特征提取,泛化
3.1 轴承故障诊断
工业应用中的轴承故障诊断面临跨工况、小样本和跨数据集适应等挑战。提高故障诊断模型的泛化能力至关重要。通常,故障诊断依赖于在具有多个工况的复杂环境中分析振动信号。模型改进的需求主要集中在三个主要领域:
(1) 保留振动信号的长期知识:长期智能记忆的能力使模型能够更敏感地应对跨工况和小样本的挑战。因此,它们可以捕捉到细微的振动、温度变化和其他关键指标异常,并有效地预测潜在的故障。这一特性尤为重要,因为在跨工况场景中,故障性能可能随环境和工况而变化,而小样本问题意味着可用于训练的数据非常有限。即使从少数故障案例中不断学习,也能提高模型对新或罕见故障类型的敏感性,支持持续的健康监控和智能维护策略[24]。因此,系统维护策略的自动化和智能化得到了提高,以应对跨工况和小样本的挑战。这种深度知识积累和灵活应用是确保有效和准确故障预测的关键。在这方面,An等人提出了一种基于LSTM的滚动轴承故障诊断方法,该方法可以利用循环神经网络(RNN)的结构来学习和记忆历史数据中的故障模式,从而有效地处理和记忆时间序列数据中的长期依赖性。
(2) 从振动信号中提取元知识:元知识是从多个数据源或任务中抽象出来的,使模型能够适应新或罕见的环境。机械设备在跨工况场景下运行,往往缺乏故障数据。使用元知识减少了再训练的需求,更好地利用了有限的数据,降低了成本和时间。例如,L.M.Wang讨论了敏感IMF的包络解调分析,以获得故障诊断特征频率策略,该策略可以应用于从多个数据源中提取更稳健的故障度量元知识,以增强跨工况泛化能力[25]。J. Li 开发了一种经验小波变换(EWT),通过在正交基上将信号分解为单个分量来提取内在调制信息[26]。因此,可以使用从小波分解中获得的元知识自动识别和适应各种动态变化的环境,从而提高模型的泛化能力。H.Li提出了一种方法来减少数据分布的方差,设计算法来识别和抽象跨数据集和跨工况的共同特征,并提高模型在新环境中的适应性和预测能力[27]。
(3) 振动信号诊断模型的快速参数调整:减少参数调整的时间和资源,提高实时故障响应效率。Qian和Qin提出了一种改进的条件分布对齐机制,用于有效的跨工况故障诊断[28]。增强跨领域的自适应能力该机制允许进行有效的迁移学习,使模型能够快速适应新环境和故障类型。因此,减少了重新训练和手动调整。
尽管有这些进步,传统的故障诊断模型往往难以保持长期依赖性和复杂模式,因为特征学习更简单,参数更少。许多模型优先考虑稳定性而不是灵活性。因此,它们对新工况的适应缓慢,需要重新训练或人工干预。为了解决这些问题,本文提出了一种基于LLMs的轴承故障诊断框架,将LLMs的长期记忆能力与微调技术相结合。该框架利用了LLMs在处理复杂数据模式方面的优势,增强了在各种故障模式下的学习和记忆能力。通过微调几个参数,该框架可以快速适应新的条件和故障类型。因此,克服了传统模型在灵活性和适应速度方面的局限性。
这些改进可以显著提高轴承故障诊断系统的效率和准确性,稳定旋转机械的整体运行。
3.2 基于LLM的序列分析
LLMs拥有使用数十亿参数存储大量非结构化知识的能力,有效地形成长期记忆[29]。利用注意力机制和神经网络,LLMs可以从序列中提取关键信息。它在语音、视频和异常检测等时间序列分析应用中取得了初步成功。例如,圣何塞州立大学的Shruthi Hassan Sathish结合CNN-RNN和Transformer模型对图像(视频)和声音(音频)序列中的多模态情感进行分类[30]。南方电网的Mi Zhou和同事们将元学习与LLMs结合起来,对电力时间序列数据进行分类[31]。在贝尔格莱德天文台,叶夫根尼·A·斯米尔诺夫使用GPT-4视觉预训练模型来分类小行星振动状态[32]。
轴承故障诊断涉及识别振动时间序列数据中的异常,这是一个典型的时间序列分类问题。鉴于轴承的复杂运行工况,诊断方法必须在跨工况和小样本情况下表现良好。因此,将LLMs应用于轴承故障诊断是可行和有前景的。
为了方便预训练模型在特定领域快速应用,通常采用监督微调。这种方法简化了训练过程,并允许快速更新[34]。Hu等人[35]介绍了LoRA方法,该方法通过保持部分层的固定权重并添加可训练的低级分解矩阵来提高训练效率。T.Dettmers 等人[36]提出了QLoRA监督微调方法,该方法减少了内存使用,并在小型、高质量的数据集上取得了更好的结果。Muhammad Najam Dar等人[37]演示了使用预训练模型和微调进行跨数据集学习,验证了在实际应用中的鲁棒性。有监督的微调可以提高预训练模型的适应性和准确性,同时降低训练成本,并能够实现快速参数更新和将预训练模型的一般知识应用于下游任务。因此,它在跨工况、跨数据集和小样本任务中取得了良好的性能。在轴承故障诊断中,数据收集成本高昂且故障很少发生[38],这导致故障样本稀缺和模型训练样本量小[39]。这要求模型具有高度泛化能力使得监督微调成为将预训练模型应用于轴承故障诊断的合适方法[11]。通过用少量数据微调目标网络的较低层,以适应新任务,减轻了在轴承故障诊断中对大量原始数据的需求。Chuanjiang Li 等人[40]设计了一种缩放和翻译微调策略,以快速适应故障诊断任务不断变化的要求。
图1 所提出方法的总体过程
使用LLMs进行轴承故障诊断的所提框架概述如下。在基于振动数据的故障诊断特征构建中,提取振动信号的时域和频域特征可以为LLMs创建微调数据集。使用LoRA和QLoRA方法,对LLMs进行故障诊断的微调。微调框架涉及将振动信号分割成片段,使用值和Token嵌入层将这些片段转换为LLMs输入维度。最后,对 LLM 进行了微调,以实现故障诊断。
4.1.1 特征提取
该方法利用了传感器采集的轴承振动信号的时域离散数据点,有别于传统的LLM框架。为了利用LLM 处理语义信息的能力,从原始振动信号中提取可解释的成分。提出了一种基于特征的LLM故障诊断方法,从原始振动数据中提取时域和频域特征。此外,作为一个框架,特征还可以从其他方法获得,例如基于排列熵的二维特征提取[41]。
常用的时域特征包括均值、标准差、均方根值、绝对均值、峰值、偏度、峭度、方差、峭度指数、峰值指数、波形指数和脉冲指数。一般来说,频率分析是指对一个信号进行傅里叶变换后的分析。常用的频域分析方法包括频谱、功率谱和倒频谱。常用的振动信号频域特征有:频率均值、频率方差、频率偏度、频率峭度、频率重心、标准差、频率均方根、平均频率、正则度、变异参数、八阶矩、十六阶矩。
我们选择了12个时域特征和12个频域特征,共计24个特征,如表1所示。这些是简单的参数,没有使用像EMD分解或小波包分析这样的复杂时频分析方法来提取振动信号的复杂或局部特征。原因有两个:首先,提取复杂特征很繁琐,可能需要为振动数据的特征进行设计;其次,我们希望充分利用LLM的学习、提取和分类能力,基于易于获取的时域和频域特征进行故障诊断。
表1 时域和频域特性
4.1.2 微调
图3 基于特征的LLM故障诊断框架
基于LLM的故障诊断模型如下图4所示。在对振动数据进行实例归一化后,我们将信号分割成块,并使用值和位置嵌入将每个块转换为LLM输入维度向量,然后将这些向量输入到LLM中。我们通过微调LLM的Add&Layer Norm层来提取特征,并通过Layer normalization和Linear层对数据进行分类。
4.2.1 补丁(Patching)
振动数据的高采样频率造成了信息冗余。为了解决这个问题,我们使用 PatchTST 中的修补方法来聚合相邻的数据点。该算法提取局部语义信息,使LLM能够关注聚集斑块的特征和模式,减少冗余,提高局部信息处理能力。补丁还减少了LLM中的Token计数,增加了更多信息的输入数据长度,并减少了计算负载和内存使用。
4.2.2 嵌入(Embedding)
位置嵌入:对于位置嵌入,我们使用了Transformer的标准正弦位置嵌入,直接将位置信息嵌入到序列的表示中。正弦位置嵌入的公式如下所示。
因此,在对轴承振动数据进行Token嵌入和位置嵌入后,嵌入值被加总为最终输入嵌入值,以传递给LLM。
4.2.3 冻结注意力层
1) 充分利用模型学到的知识,帮助实现轴承振动数据的故障诊断;
2) 减少可训练参数的数量,加速训练过程,因为它包含了模型的绝大多数参数。
4.2.4 归一化
仿射变换公式如下图所示:
基于上述提出的基于LLM的轴承故障诊断框架,分别进行了基于特征的LLM故障诊断和基于数据的LLM的验证实验。通过单数据集实验、单数据集跨工况实验、全量数据和少量数据跨数据集迁移实验(如表2所示),证明了所提出的框架可以跨工况、小样本和跨数据集诊断故障。
在案例研究中,使用CWRU、MFPT、JNU和 PU四个公共轴承故障诊断数据集进行了基于特征的 LLM 故障诊断和基于数据的 LLM 故障诊断实验。
在CWRU数据集中,我们使用的故障数据从驱动端轴承的采样率为12kHz。故障缺陷深度分别为0.007英寸、0.014英寸和0.021英寸,涵盖了四种不同负荷和速度的工况。故障模式有四种:正常、内圈故障、外圈故障和滚动体故障。
在MFPT数据集上,使用了3个正常轴承、3+7个外圈故障轴承和7个内圈故障轴承的数据。该数据集包括3个外圈故障轴承,输入轴转速为25 Hz,负载为270磅,采样频率为97656Hz。七个外圈故障轴承的输入轴转速为25 Hz、采样频率为48828 Hz,负载为25、50、100、150、200、250和300磅。七个内圈故障轴承的输入轴转速也为25 Hz,采样频率为48828Hz,负载为0、50、100、150、200、250和300磅(见图6)。
江南大学(JNU)数据集的采样频率为50kHz,包括三种转速:600rpm、800rpm和1000rpm。它涵盖了四种故障模式:正常、内圈故障、外圈故障和滚动体故障。
在PU数据集,我们使用了来自12个人为损坏的轴承(7个有外圈故障,5个有内圈故障)和6个正常轴承的数据。振动信号的采样频率为64kHz,具有3种故障模式。
案例研究中使用的数据的STFT时频图像显示,四个数据集的振动数据之间存在显著差异,如下图5所示。
图6 基于特征的单数据集实验结果
轴承振动数据通过滑动窗口方法划分为2048点的样本,步长小于窗口长度以保留窗口边缘的潜在故障信息并最小化信息损失。
对于基于特征的LLM故障诊断实验,使用第二部分提到的公式从这些样本中提取时域和频域特征,以构建微调数据集。训练集和测试集按8:2分开。对于基于数据的LLM故障诊断实验,训练、验证和测试集被分成8:1:1。为了利用LLM从大型数据集中学习的能力,我们确保每个数据集中的每个故障模式都有相同数量的样本,旨在最大限度地减少类失衡的影响并最大限度地利用从数据中学到的知识。
对于后续在不同数据集上使用组合和交叉训练进行模型泛化的实验,我们根据故障模式(正常、内圈故障、外圈故障和滚动体故障)对每个轴承数据集进行分类,而没有进一步根据工况或故障严重程度进行标签区分,因为这些跨数据集因素可能存在很大差异(参见图7)。
表3 基于特征的单数据集实验结果
5.4.3.1 全量数据迁移实验。跨数据集的实验使用CWRU,MFPT,JNU,和PU的数据集。该模型在其中三个数据集中进行了训练,并在第四个数据集中进行了测试。这些实验的设计和结果如表6所示。与单个数据集训练相比,多数据集训练提高了 LLM 对新数据集的知识迁移。在epoch=1的迁移训练中,这四个数据集的诊断效果与单数据集训练相比有很大提高。对于PU和 CWRU数据集,在对其他三个数据集进行10次训练后,诊断准确度分别提高了0.077和0.0235。相比之下,MFPT和JNU的数据集的提升较小。
表7 少量数据跨数据集实验结果
在JNU轴承数据集上进行了交叉实验。江南大学的数据集包含三个工况,如下表12所示。
图8 基于t-SNE的江南大学跨工况特征可视化实验
PU数据集的具体工况,以及PU数据跨工况故障诊断结果如表14和表15所示。
5.5.4.1 全量数据迁移实验。为了充分利用 LLM 的能力,并验证多数据集训练对基于 LLM 诊断的影响,我们设计了一个多数据集训练诊断实验。实验设计和结果如表16所示。与单数据集全量数据实验的比较如图10所示。对于PU数据集,多数据集训练显著提高了约1%的诊断准确率。对于CWRU,MFPT和JNU数据集,多数据集训练的影响是最小的。
5.5.4.2 少量数据迁移实验。针对基于数据的LLM故障诊断方法进行了少量数据迁移实验。在多个数据集上进行训练后,模型通过使用10%的新数据集进行微调。将结果与模型仅在新数据集的10%上进行训练的情况进行了比较。测试数据集是全量的测试集,而不是小量数据的子集。同时进行了多次试验,并取平均诊断准确性以减少实验误差。实验设计和结果如表17所示。通过与图11的实验结果进行比较,发现多数据集训练提高了精度,降低了小数据集的标准差,这表明LLMs可以将学习到的知识迁移到新的数据集上,并提高了模型在新数据集上的泛化能力和稳定性。观察PU,MFPT,和JNU数据集可以看出显著的提升,准确性分别增加了0.0396、0.0376和0.0327,而CWRU数据集增加了最少为0.0028。
图11 少量数据跨数据集实验结果
本文的创新贡献包括:提出了使用LLMs在故障诊断特定领域执行各种任务的基本框架。它展示了所提出的框架在泛化任务中的优越性能,并填补了将LLMs应用于轴承故障诊断的研究空白。进行了初步的探索并取得了某些结果,但仍有很大的改进空间,例如进行的实验代表了部分泛化场景,并且没有讨论特征量化的替代方法。未来的研究可以在这个基本框架上进行,例如设计针对不同泛化任务的模型结构,以及使用实际诊断任务来探索框架的有效性、准确性和泛化能力。