FaultsMind（轴承）故障诊断大模型：一站式工业智能运维解决方案

4小时前浏览2

北航国家级PHM创新团队继 “MSSP论文学习 | 基于大语言模型的轴承故障诊断框架”论文成功发表后，研发了首款（轴承）故障诊断大模型（FaultsMind软件），首次实现了大模型驱动的跨场景泛化诊断能力自主生成及自适应部署，构建了集诊断需求建模、方案生成、代码生成、集成验证、应用部署于一体的全流程闭环体系，具备了工况条件泛化、数据条件泛化、诊断对象泛化与任务类型泛化等核心能力，为解决智能运维、健康管理领域核心任务面临的“强专家依赖、强定制化要求、长研发周期、跨场景泛化能力不足”等痛点、难点问题，并实现智能运维提供了通用化、工程化的一站式解决方案，其主要特性能力概述如下：

诊断需求融合分析能力：可结合运行环境、设备参数、数据条件与诊断目标，实现多维诊断需求的自动融合，为生成针对性诊断方案提供全面支撑；
方案生成能力：根据具体使用场景下诊断需求，自动生成故障诊断方案，降低人工制定难度与试错成本；
方案自主验证能力：内置验证模块，自动检测并评估所生成方案的合理性与有效性；
代码生成能力：在方案验证通过后，自动生成高质量、可直接部署的工程化诊断代码；
代码自主验证能力：集成调试、测试与反馈机制，实现诊断代码的自检与修正，提升部署可靠性；
快速泛化部署能力：支持模块化设计，适应不同场景下的快速迁移与部署，降低开发与集成成本；
差异化场景的代码动态自适应能力：可根据运行环境、设备参数和数据条件的实时变化，动态调整生成代码，实现个性化适配；
跨对象、跨任务适用能力：软件全栈技术具备良好的通用性，可扩展至齿轮、电机、集成电路等多类对象，以及异常检测、状态评估、故障预测、寿命预测、维修决策等多类装备智能运维任务。

PHM大模型软件：开启智能诊断与预测性维护的新时代

在工业4.0和智能制造的浪潮中，设备的可靠性、维护效率和全生命周期管理已成为企业竞争力的核心要素。传统的故障诊断与维护方式往往依赖于人工经验、复杂的手动建模和繁琐的调试过程，难以适应现代工业场景中多变的需求和海量数据的挑战。如今，随着人工智能和大模型技术的飞速发展，我们自豪地推出一款革命性的PHM（Prognostics and Health Management）大模型软件，为工业设备的健康管理和故障诊断带来全新的智能化解决方案。

诊断需求融合分析：精准洞察复杂场景

工业设备的运行环境复杂多变，涉及不同的设备参数、数据条件和诊断目标。我们的PHM大模型软件具备强大的诊断需求融合分析能力，能够根据用户的具体使用场景（如运行环境、设备参数、数据条件等）和诊断目标，自动完成多维度需求的有效融合。无论是高温高压的工业环境，还是数据稀缺的边缘场景，系统都能全面分析用户需求，为后续方案的生成提供精准的信息支持。这种能力不仅减少了人工分析的复杂度，还确保了诊断方案的针对性和适应性。

智能方案生成：从复杂到简单，一键生成诊断方案

在传统模式下，制定一套有效的故障诊断方案需要耗费大量时间和人力，尤其在面对复杂的设备和多变的运行环境时，往往需要反复试验和调整。我们的PHM大模型软件通过内置的智能算法，能够根据用户提供的场景信息，自动生成针对性的故障诊断方案。无论是轴承、齿轮还是电机等机电设备，系统都能快速生成适配的诊断策略，大幅降低人工制定方案的复杂度，同时提升方案的科学性和可行性。

方案自主验证：确保方案的可靠性和有效性

生成诊断方案只是第一步，验证其合理性和有效性是关键。我们的软件内置了强大的验证模块，能够在方案生成后自动检测其逻辑性和适用性。通过模拟运行环境和数据条件，系统能够快速识别潜在问题并优化方案，确保最终输出的诊断策略在实际应用中稳定可靠。这种自主验证能力不仅提升了方案的质量，还为用户节省了大量调试和验证的时间。

代码生成与验证：从方案到代码，一键落地

有了诊断方案，如何将其转化为可运行的代码是另一个关键环节。我们的PHM大模型软件具备强大的代码生成能力，能够基于验证后的诊断方案，自动生成高质量、工程可落地的代码。无论是Python、C++还是MATLAB，系统都能根据用户的需求生成适配的代码，并集成调试、测试与反馈机制，确保代码的正确性和稳定性。用户只需一键操作，即可将复杂的诊断方案转化为可直接部署的工程代码，大幅提升开发效率。

快速泛化部署：跨场景迁移，轻松适配

工业场景的多样性对诊断方案的泛化能力提出了极高要求。我们的PHM大模型软件采用模块化部署设计，能够快速适配不同的用户场景，降低跨场景迁移和部署的成本。无论是从实验室环境到工业生产，还是从单一设备到复杂系统，系统都能快速泛化，确保诊断方案的稳定性和适用性。这种能力为企业在不同场景下的设备维护提供了极大的灵活性。

差异化场景的动态适配：个性化定制，灵活应对

在实际应用中，设备的运行环境和数据条件可能随时发生变化。我们的PHM大模型软件具备差异化用户场景的代码自适应动态生成能力，能够根据用户场景的变化（如设备参数调整、数据条件更新等），动态调整生成的代码，实现个性化适配。无论是突发的设备故障，还是长期的性能优化，系统都能快速响应，确保诊断方案始终与实际需求保持一致。

引领工业智能化的未来

在智能化、数字化的工业新时代，设备的健康管理不再是单一的故障修复，而是贯穿全生命周期的预测性维护和优化。我们的PHM大模型软件通过诊断需求融合分析、智能方案生成、代码自动生成与验证、快速泛化部署等核心能力，为企业提供了一站式的智能化解决方案。无论是提升设备可靠性，还是降低维护成本，我们的产品都能成为您迈向工业4.0的可靠伙伴。

未来，我们将继续深耕大模型PHM技术，不断优化产品功能，为更多行业和企业提供智能化的设备健康管理服务。如果您希望了解更多信息或体验我们的产品，请随时联系我们。让我们携手开启智能诊断与预测性维护的新篇章！

团队介绍：

团队深耕装备健康管理、智能运维领域18年，荣获一系列国家级、省部级科技奖项，于2023年初开始从事大模型与健康管理的融合研究，在装备健康管理领域授权国家发明专利4项、在MSSP期刊发表/录用健康管理综述论文、大模型故障诊断（在MSSP的 Most Downloaded榜单中总排名第3，在研究型论文中排名第1）论文2篇，在审故障预测、维修决策期刊论文2篇，（轴承）故障诊断大模型（软件）、健康管理大模型知识工程（预计5月上旬发布）。

团队在大模型方向的相关研究成果参见：

(1) 健康管理大模型综述：https://doi.org/10.1016/j.ymssp.2025.112683

(2) 基于大模型的故障诊断：https://doi.org/10.1016/j.ymssp.2024.112127

(3) 大模型故障预测：https://arxiv.org/abs/2501.07191

(4) 大模型维护维修决策：https://arxiv.org/abs/2411.04476

来源：故障诊断与python学习

首个专注于工业机器声音的开放数据集：MIMII 数据集介绍

本期给大家介绍MIMII声音数据集，MIMII声音数据集提供首个专注于工业机器声音的开放数据集，支持无监督异常检测算法的开发与评估，推动自动化设备维护研究。论文基本信息论文题目：MIMII DATASET: SOUND DATASET FOR MALFUNCTIONING INDUSTRIAL MACHINE INVESTIGATION AND INSPECTION论文日期：2019论文链接：https://arxiv.org/abs/1909.09347数据链接：https://zenodo.org/record/3384388作者：Harsh Purohit, Ryo Tanabe, Kenji Ichige, Takashi Endo, Yuki Nikaido, Kaori Suefusa, and Yohei KawaguchiResearch and Development Group, Hitachi, Ltd. 1-280, Higashi-koigakubo, Kokubunji, Tokyo 185-8601, Japan目录1 摘要2 背景介绍3 录制环境与相关设置4 数据集内容5 实验6 数据读取1 摘要工厂机器容易出现故障或故障，给公司带来巨大损失。因此，利用包括麦克风在内的不同传感器进行机器监控正受到越来越多的关注。在科学界，公开数据集的出现推动了声音场景和事件的检测与分类研究，但在真实的工厂环境中，针对工业机器在正常和异常运行状态下的声音数据集却不存在。在本文中，我们提供了一个新的工业机器声音数据集，称为“用于工业机器故障调查和检查的声音数据集”（MIMII数据集）。该数据集为不同类型工业机器（即阀门、泵、风机和滑轨）记录了正常声音，并为了模拟真实场景，还记录了各种异常声音（如污染、泄漏、旋转不平衡和轨道损坏等）。发布MIMII数据集的目的是帮助机器学习和信号处理社区开发自动设施维护技术。2 背景介绍对机器自动检查的需求日益增长，这源于对工厂设备维护质量提升的迫切需求。目前，发现机器故障的部件主要依赖于现场工程师的经验，但由于检查需求的增加导致现场专家短缺。因此，迫切需要一种高效且经济的解决方案来解决这个困境。在过去的十年里，工业物联网（Industrial IoT）和数据驱动技术已经彻底改变了制造业，并且尝试了多种方法来监测机器的状态，例如基于振动传感器的方法[1-4]、基于温度传感器的方法[5]和基于压力传感器的方法[6]。另一种方法是利用声音场景分类和事件检测技术从声音中检测异常[7-13]。目前在声音场景分类和事件检测方面已经取得了显著进展，并且有许多前沿研究[14-16]。显然，众多开放基准数据集[17-20]的出现对于推动研究领域的发展至关重要。然而，据我们所知，目前还没有包含真实工厂环境中不同类型机器声音的公开数据集。在本文中，我们介绍了一个新的数据集，该数据集包含真实工厂环境中机器在正常和异常运行条件下的声音。我们收集了四种不同类型机器的声音——（i）阀门、（ii）泵、（iii）风机和（iv）滑轨——并且对于每种类型的机器，我们考虑了七种不同的产品型号。我们假设主要任务是在无监督学习的情况下，在10秒的声音片段中发现机器的异常状况。换言之，在训练阶段只能使用正常机器声音，而在测试阶段要正确区分正常机器声音和异常机器声音。3 录制环境与相关设置数据集采用System In Frontier[21]公司生产的TAMAGO-03麦克风收集，它是一个包含八个麦克风的环形阵列，可评估单通道和多通道方法，其细节如图1所示。麦克风阵列距离机器50厘米（在阀门案例中为10厘米），录制10秒的声音片段。数据集包含每个片段的八个通道。图2描述了每种机器的方向和距离的记录设置。在运行状态下，机器声音以16位音频信号形式在混响环境中以16kHz采样率录制。此外，还连续录制了多个真实工厂中的背景噪音，并将其与目标机器声音混合以模拟真实环境，背景噪音使用与目标机器相同的麦克风阵列录制。图1 圆形麦克风阵列图2 记录数据集的实验装置示意4 数据集内容MIMII数据集包含四种不同类型机器的声音：阀门、泵、风机和滑轨。阀门是反复开关的电磁阀；泵是排水并连续向水池注水的水泵；风机是用于在工厂中提供连续气体或空气流动的工业风机；滑轨则是由移动平台和底座组成的线性滑动系统。各种机器产生的声音具有平稳和非平稳特性，特征各异且难度不同。图3展示了所有四种类型机器声音的功率谱图，清楚地表明每种机器具有独特的声音特征。图3 6dB信噪比下正常条件的功率谱图表1列出了每种机器类型的声音文件列表。每种机器类型包括七台独立的机器，它们可能是不同的产品型号。为了有效训练模型，需要包含现实复杂性的大型数据集，因此我们为所有单个机器录制了总计26,092个正常声音片段。此外，还考虑了每种机器的不同现实异常情况：污染、泄漏、旋转不平衡、轨道损坏等。各种运行状况列于表2中。每种不同类型机器的每个异常声音片段数量较少，因为我们把数据集的主要目标视为无监督学习场景，并将异常片段视为测试数据的一部分。如第2节所述，在多个真实工厂中录制了背景噪音，并将其与目标机器声音混合，以模拟真实环境。在将原始声音与噪音混合时，八个通道是分别处理的。对于某个信噪比（SNR）γ dB，通过以下步骤创建每种机器模型的噪音混合数据：1. 计算机器模型所有片段的平均功率 a； 2. 对于机器模型的每个片段 i： (a) 随机选择一个背景噪音片段j，并调整其功率bj，使得 (b) 通过将目标机器片段i 和功率调谐后的背景噪音片段 j 相加，计算得到噪音混合数据。表1 MIMII数据集内容细节表2 运行和异常状况列表 5 实验本节介绍了一个基准测试的示例。主要目标是在无监督学习场景中检测异常声音。一些研究已经成功地将自编码器用于无监督异常检测[12,22–24]，因此在这里评估一种基于自编码器的无监督异常检测器。仅使用麦克风的第一个通道（图1中的"1号"）。将log-Mel（对数梅尔）谱图视为输入特征。为了计算Mel频谱图，在该实验中考虑了1024的帧大小、512的跳跃大小和64个Mel滤波器。五个帧被组合起来，用以初始化输入特征向量x（320维）。编码器和解码器神经网络的参数（即θ=(θe,θd)）被训练用以最小化给定的损失函数：我们的基本假设是，这个训练好的模型对异常机器声音将具有较高的重构误差。实验中使用的自编码器网络结构总结如下：编码器网络(E(·))包括FC(Input, 64, ReLU)；FC(64, 64, ReLU)；以及FC(64, 8, ReLU)，而解码器网络(D(·))包含FC(8, 64, ReLU)；FC(64, 64, ReLU)；以及FC(64, Output, none)，其中FC(a, b, f)表示一个全连接层，有a个输入神经元，b个输出神经元，以及激活函数f。ReLUs是指修正线性单元[25]。该网络通过Adam[26]优化技术训练50个周期。对于每种机器类型和模型ID，所有片段被分为训练数据集和测试数据集。所有异常片段被视为测试数据集，随机选择相同数量的正常片段作为测试数据集的一部分，其余所有正常片段则被视为训练数据集。通过仅由正常样本组成的训练数据集，针对每种机器类型和模型ID训练了不同的自编码器。通过对每个片段在10秒内平均重构误差设定阈值来执行异常检测，并为每种机器类型和模型ID的测试数据集计算了曲线下面积(AUC)值。此外，我们还考虑了不同信噪比水平(与工厂噪声相关)：例如，6dB、0dB和−6dB。表3列出了三次独立初始化训练的平均AUC。很明显，阀门的AUC低于其他机器。阀门的声音信号是非平稳的——特别是，它们在时间上是脉冲式的和稀疏的——并且随时间推移平均的重建误差往往很小，这使得检测阀门的异常变得困难。相比之下，风机的异常更容易检测，因为风扇的声音信号是平稳的。此外，对于某些机器型号，AUC随着噪声水平的增加而迅速下降。这些结果表明，我们需要解决非平稳性和噪声引起的性能下降问题以实现无监督的异常声音检测。表3 运行和异常状况列表 6 数据读取6.1 导入包import osimport librosaimport seaborn as snsimport numpy as npimport matplotlibmatplotlib.use('TkAgg')import matplotlib.pyplot as pltfrom matplotlib import rcParamsconfig = { "font.family": 'serif', # 衬线字体 "font.size": 15, # 相当于小四大小 "font.serif": ['SimHei'], # 宋体 "mathtext.fontset": 'stix', # matplotlib渲染数学字体时使用的字体，和Times New Roman差别不大 'axes.unicode_minus': False # 处理负号，即-号}rcParams.update(config) 7.2 数据分析数据储存格式为WAV文件，WAV（Waveform Audio File Format）是一种音频文件格式，广泛用于存储音频数据。它基于 RIFF（Resource Interchange File Format）文件结构，通常用于存储高质量的音频数据，支持多种音频编码格式（如 PCM、ADPCM 等）。WAV 文件的主要特点是无损压缩，因此文件体积较大，但音质较高。数据集分为：阀门、泵、风机和滑轨四种设备类型，每类数据下有四个模型（id_00、id_02、id_04、id_06)，每个模型下包含正常与异常数据。图4 数据集结构读取对应wav文件与采样率：def load_sound_file(wav_name, mono=False, channel=0): """ 加载音频文件并提取指定声道的数据。参数: wav_name (str): 音频文件的路径。 mono (bool): 是否将音频转换为单声道。默认为 False。 channel (int): 如果音频是多声道且 mono=False，指定要提取的声道索引。默认为 0。返回: signal (numpy.ndarray): 提取的音频信号数据。 sampling_rate (int): 音频的采样率。 """ channel_data, sampling_rate = librosa.load(wav_name, sr=None, mono=mono) signal = np.array(channel_data)[channel, :] return signal, sampling_rate绘制正常信号与异常信号对比（以水泵信号为例）：图5 正常声音与异常声音对比（水泵）def plot_waveforms(normal_signal, anomaly_signal, sr, title="Signal Waveforms"): """ 绘制正常信号和异常信号的波形图。参数: normal_signal (array-like): 正常信号的波形数据。 anomaly_signal (array-like): 异常信号的波形数据。 sr (int): 采样率。 title (str): 图表的标题，默认为 "Signal Waveforms"。 """ sns.set_theme(style="white", font_scale=1.2) plt.figure(figsize=(8, 5), dpi=100) librosa.display.waveshow(normal_signal, sr=sr, label="Normal Signal", alpha=0.8, color='blue', linewidth=1.5) librosa.display.waveshow(anomaly_signal, sr=sr, label="Anomaly Signal", alpha=0.8, color='red', linewidth=1.5) plt.title(title, fontsize=16, fontweight='bold') plt.xlabel("Time (sec)", fontsize=14) plt.ylabel("Amplitude", fontsize=14) plt.legend(fontsize=12, loc="upper right", framealpha=0.8) plt.grid(True, linestyle='--', alpha=0.5) plt.show()编辑：肖鑫鑫校核：李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈宇航、陈莹洁、王金、赵诚该文案例资料搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除来源：故障诊断与python学习