首页/文章/ 详情

论文学习｜第八篇-学位论文-面向零少样本场景的弱监督学习方法、应用与实现（附开源代码链接）

故障诊断与python学习

1年前浏览594

论文学习

非常尊重并感谢科研人员做出的辛勤贡献！若有侵权，烦请联系处理！

若有不当之处，恳请批评指正！

正文共： 12842字12图

预计阅读时间： 33分钟

论文信息

论文题目：面向零/少样本场景的弱监督学习方法、应用与实现

年份：2022年6月

作者：冯良骏

机构：浙江大学控制科学与工程学院

1. 课题研究背景与意义

2. 提出的多工况识别方法弱监督学习相关研究介绍

2.1 弱监督学习发展脉络

2.2 弱监督学习研究现状

2.2.1 增量学习研究现状

2.2.2 半监督学习研究现状

2.2.3 零样本学习研究现状

2.2.4 迁移学习研究现状

2.3 弱监督学习典型应用

2.3.1 手写数字识别与少样本问题

2.3.2 虚拟传感测量与少标签问题

2.3.3 工业故障诊断与零样本问题

2.3.4 户外场景检测与任意样本问题

附录：开源代码

摘要

本章节介绍了弱监督学习的研究背景和研究意义，讨论了弱监督学习的概念与典型的应用，同时系统地介绍了用于弱监督学习相关技术的研究现状，指出了一些现存的问题，最后对本文的主要研究工作和创新点进行了简要介绍。

关键词: 弱监督学习；增量学习；半监督学习；零样本学习；迁移学习；任意样本学习

Ⅰ 课题研究背景与意义

有监督学习（ Supervised Learning, SL），作为人工智能最基本的任务之一，长久以来受到了计算机视觉、工业控制、自动驾驶等各个前沿领域的广泛关注。具体地，有监督学习是指从标签化数据集中训练出映射函数的机器学习范式，自2012年Hinton与他的学生Alex Krizhevsky于 ImageNet竞赛上设计出AlexNet起，GoogLeNet和 ResNet等经典的卷积神经网络（Convolutional Neural Networks，CNNs）相继提出，推动有监督学习的发展迈向了一个新的高度。

以计算机视觉领域中的图像识别为例，如图1.1所示，在对ImageNet数据集1,000 种物体的目标识别任务中，top-5物体识别精度从2010年的71.8%快速上升至2021年的 98.7%。与此同时，基于TIMM库在ImageNet上对于552个标准有监督模型的复现结果，我们可以统计出图1.2，即展示不同目标识别精度范围内模型数量的分桶图。

不难发现，在使用top-1 度量时，TIMM 库中准确率超过86%的模型有25个，在使用top-5度量时，TIMM库中准确率超过98%的模型有16个。这揭示了在精心设计的实验室环境下，有监督学习模型取得了十分优异的性能，对于特定的学习任务，可以达到甚至在某些情况下超过人类的识别或认识能力。相似的，在众多研究的基准实验中，有监督模型在标准数据集以及丰富计算资源的支持下，对工业控制领域中的故障诊断任务、虚拟测量任务，以及自动驾驶领域的户外场景检测任务等等，均展现出了出色的适用性以及有效性。

图 1.1 大规模有监督学习任务性能发展趋势图（ImageNet上 1,000个类别的top-5分类精度）

图 1.2 基于TIMM库552个复现结果的ImageNet 目标识别精度分桶图

然而，当跳出实验室环境，面临实际商业活动或工业生产时，有监督学习模型所依赖的三大要素，即高性能算法、大规模标注数据集、高性能计算设备，往往无法同时满足。尤其是真实可靠的大规模标注数据集，在生产实践中显得尤为昂贵和难以获取，其困难之处列举如下：

1）数据的收集周期长：大规模数据集的采集和标注，需要特定领域的专家考虑各类场景，动员大量人力物力，定义统一的准入和标注规则进行数据清洗和准备。整个数据集的完善往往以月和季度为单位，有时甚至需要若干年的时间，其数据的供给往往是分批次的，不能一蹴而就 [23,24]。

2）数据的标注成本高：有监督学习需要样本与标签的配合进行模型训练，而标签的获取往往是通过人力进行的，这导致准备有监督学习模型的数据集费时费力。此外，很多数据标注都是外包给标注公司来完成的，低质量的数据标注会直接影响模型训练的泛化效果。

3）数据的稀有性：很多任务本身就是小样本问题，其目标具有稀有性，很难获取，比如户外探索中稀有的动物或植物，往往很难收集到，又比如药物发现中，已知化合物的分子结构是唯一的，换句话说，每个类别的训练样本有且只有一个，无法准备大量训练数据。

4）数据的隐私性：很多优质的数据资源集中在工业制造、教育培训、医疗诊断、交通管理、网络通信等公共事业部门中，这类数据涉及到个人隐私、商业秘密及国家安全，虽然优质且数量庞大，但隐秘性极高，对公众的开放程度低，无法进行大规模获取和使用。

更直观地，自然界里各种动植物的数量分布、都市生活中各类场景的数量分布、工业生产过程中各种故障发生的数量分布往往会呈现出一种长尾效应，即有着丰富个体的类别在集体中只占据少许分额，而在集体中占据很多份额的类别却只有少许个体。

如图1.3(a)所示，生活中常见的高斯分布便是典型的长尾分布，当收集到的类别数量足够多时，数据集的类别分布便会呈现出高斯分布的趋势。图1.3(b) 展示了ImageNet21k数据集的类别分布，该数据是目前人类公开的最大的图像数据集，包含了21,814个不同的物体类别，共超过一千四百万张图片。我们可以看出，即使是这样的大规模数据集，也只有一部分的常见类别具有大量的有标签图片，其余物体类别的图片则相对较少，其中296个物体类甚至仅有一张照片。

有时，对于更具体的对象来说，比如细分的狗类、鱼类、昆虫、花卉等，采集众多的标注训练样本愈发难以实现。据统计，人类的学习能力可以认识3万到4万种物体，ImageNet21k 中有2万多种物体，有很多类别没有包含在该数据集当中，这些现象都说明了欠数据、少数据的问题在大数据时代也是真实存在的。在另一方面，科研中常用的ImageNet1K则是 ImageNet21k的有丰富样本类别的一个子集，该子集的类别分布如图 1.3(c) 所示。该分布有很明显的人工整理特点。

图 1.3 有监督学习数据集的类别分布说明图

各类别的数量相对均衡充分，这说明了当前高性能的有监督模型是建立在人工设计的有充分数据的实验场景下。同时，也有大量结果证明，传统的有监督模型在面临欠数据、少数据问题时，会出现严重的过拟合和性能下降现象。而本文所关注的弱监督学习（Weakly Supervised Learning, WSL），则正是要在欠数据场景下，从少量的样本和标签中挖掘出有用信息，并据此建立有效的智能模型。这正日益成为人工智能、机器智能领域新的研究热点，具有重要的理论与现实意义。

本文以零/少样本场景下的弱监督学习为核心任务、典型的应用为依托，结合先进的机器学习、深度学习技术，建立起对应的具有实际应用价值的智能模型。目的是提高传统的数据驱动方法在弱监督欠数据场景的适用性，从而为后续更复杂的下游任务，如目标分割、根因追溯、自愈控制等打下坚实基础，真正促进人工智能技术在生产上的落地与应用。

Ⅱ 弱监督学习相关研究介绍

2.1 弱监督学习发展脉络

弱监督学习是机器学习领域的一个重要分支，与传统的有监督学习相比，它通过使用有限的、含有噪声的或未完全标注的数据来进行输入到输出模型映射参数的训练。弱监督学习是一个相对笼统的专有名词，它包含了各种尝试基于不充分的或有损坏的标注集合来建立智能模型的方法。

依据标注数据集信息的提供情况，弱监督学习的研究对象可以划分为少样本场景、少标签场景、零样本场景与任意样本场景。不管是传统的机器学习算法，如支持向量机（Support Vector Machine, SVM）、逻辑回归（Logistic Regression, LR），还是近年来流行的深度学习算法，如卷积神经网络、长短期记忆网络（Long Shot-Term Memory，LSTM），在面临少样本、少标签、零样本等挑战时，都会有严重的过拟合以及难以正常建模的问题。

针对这些具体的弱监督建模问题，学者们提出了不同的学习范式以克服相应的问题，典型的学习范式有应用于少样本场景的增量学习（Incremental Learning，IL）、应用于少标签场景的半监督学习（Semisupervised Learning，SSL）、应用于零样本场景的零样本学习（Zero-Shot Learning，ZSL）以及应用于任意样本场景的迁移学习（Transfer Learning，TL）。

弱监督学习的发展脉络如图 1.4 所示，在下一小节中，我们分别对本文中用到的增量学习、半监督学习、零样本学习、迁移学习这四种典型范式进行回顾，介绍重要的工作，并指出现存的一些问题。

图 1.4 弱监督学习发展脉络

2.2 弱监督学习研究现状

2.2.1 增量学习研究现状

增量学习最早于1962年由Coppock和Freund在Science杂志上发表提出，它是指一个学习模型能不断的从新样本中学习新的知识，同时可以避免对已学过知识灾难性的遗忘，其范式的核心动机有两点：（1）是在实践收集数据集时，样本量往往是逐渐增加的，因此，在面临新的样本时，学习策略应能对训练好的模型进行某些改动，以学习新数据流中的信息与知识；（2）更新一个建立完善模型的花费通常远低于重新训练一个模型所需的花费。

增量学习可以划分为基于机器学习模型的增量学习算法与基于深度学习模型的增量学习算法。为直观理解，增量学习发展脉络如图 1.5 所示。

图 1.5 增量学习发展脉络

综上所述，增量学习以独特模拟人脑学习的训练方式，特别适合可用原始训练数据较少、多批次学习以实现对数据知识全面掌握的少样本场景。然而，当前的增量模型往往并不具备全量的增量学习能力，对于特征增量、样本增量、类别增量这三种常见需求，往往只能满足其中的一至两种，同时，基于深度学习的增量模型也会受到训练效率的困扰，不能完全发挥增量学习的优势，这要求我们对应用模型有更多精巧设计。

2.2.2 半监督学习研究现状

半监督学习最早提出于上世纪 60 年代，是有监督学习和无监督学习相结合的一种建模技术，它使用大量的无标签数据，以及同时使用有标签数据，来进行模型训练。半监督学习的优点在于能够节省人工标注成本，能够充分利用所有的有标签和无标签数据，在使用相同数量的有标签样本情况下，额外的无标签样本往往能够给半监督学习带来相比于有监督学习更高的准确率。

半监督学习通常可以由自训练（Self-training，ST）、协同训练（Co-training，CT）、基于图的半监督学习和半监督支持向量机（Transductive Support Vector Machine, TSVM）等范式实现。

自训练出现于 20 世纪 60-70 年代的一些文件中，如 1965 年 Scudder 等人关于自适应模型误差概率分析的文献，以及 1967 年 Fralick和 1970 年 Agrawala 等人关于信息论的文献，其基本思想是首先利用有监督学习模型对无标签数据进行标记，再将带有标记值的样本加入到训练集作为新训练样本更新模型，如此迭代，提升有监督学习模型的性能。

相比之下，协同训练是一类基于散度和分歧的半监督学习算法，它利用两个相对独立又充分的视角，即训练集，训练两个分类器，并将其中一个分类器在无标签样本上作出的高置信率预测作为伪标签加入到另一个分类器的训练集当中，用以另一个分类器的更新训练，如此迭代，直至收敛。由于这两个分类器是被独立初始化的，它们可以通过这种相互标记扩充数据集的过程学习未知信息，提升分类性能。对于回归问题，Zhou 等人提出了一种协同回归 (Co-regression, Coreg) 算法，首次以协同训练的范式执行了回归任务。为了给无标签样本挑选置信度高的预测值作为伪标签，协同回归设计了一种基于 K 近邻度量的预测可靠性评估策略，大量在基准数据集上的实验验证了该策略的有效性和快速性。

类似地，Zhou 等人还提出了名为三重训练（Tri-training，TT）的基于分歧的半监督学习方法，通过使用三个分类器来寻找更可靠的伪标签以及进行最终的分类判定。基于图的半监督学习方法往往基于流行假设，即认为数据集中的个体以及它们之间的关系可以以无向图的结构进行表达，其中图的每个节点为一个个体，而图的边则代表了两个个体之间的相似性。基于图的半监督学习算法的优化目标就是要保证在图中样本点间的相似度关系满足标签的先验条件。Huang 等人将图正则项加入极限学习机当中，构造出了半监督极限学习机（Semisupervised Extreme Learning Machine，SSELM），用于多类别分类任务。同时，该模型还利用类别权重加入了损失敏感的特性，可以有效地处理类别不均衡数据集。Szummer 等人提出了基于马尔科夫随机游走策略的给图中未标记点进行标记的算法，通过计算节点之间类别标记的差异性来定义优化目标的损失函数，从而迫使对图中相似节点的预测区分性降低，达到类内紧缩的目的。

半监督支持向量机由贝尔实验室的 Vapnik 等人提出，是一种基于低密度分割思想的半监督学习算法，即在训练中，在避过数据较为密集区域的前提下，优化支持向量机的分隔超平面，在使得分类间隔最大。半监督支持向量机的错误率上界也被给出，这使得它在应用上有很好的理论支撑。为直观理解，半监督学习发展脉络如图 1.6 所示。

综上所述，半监督学习是在数据建模过程中充分利用有标签和无标签样本提升性能的有效范式，尤其适用于少标签场景。然而，随着建模样本的增多，尤其是无标签样本的增多，难免的会引入额外的噪声，在利用无标签样本进行学习的同时，如何克服噪声对预测的影响，是半监督学习模型需要考虑的重要问题。

图 1.6 半监督学习发展脉络

2.2.3 零样本学习研究现状

零样本学习最早于 2009 年在计算机视觉领域提出，是一种识别从未见过目标类别的建模技术，即训练的分类器不但能够分辨出在训练阶段已见过的目标，还可以分辨出训练阶段未见过的目标。零样本学习的核心思路是利用相关知识，如属性等，将数据集中的标签表示到语义空间中，再利用训练集中的样本学习这种从数据到语义的潜在关系，此后，模型便可以基于任意类别的语义知识同时分辨出已见过或未见过的类别。

零样本学习代表性的策略有基于概率的方法、基于匹配度的方法和基于生成模型的方法。

基于概率的方法中典型的是Lampert 等人提出的间接属性分类（Indirect Attribute Prediction，IAP）与直接属性分类（Direct Attribute Prediction，DAP）方法，这两个模型训练了很多从样本到属性映射的概率分类器，并组合这些概率分类器在测试样本上输出的分数进行类别预测。Feng等人在属性预测的基础上提出了迁移增量策略，使用增量学习器来平衡对已见类别和未见类别的预测性能。

基于匹配度的方法通常在语义嵌入空间和视觉嵌入空间学习一系列匹配函数，并根据匹配函数的得分进行分类。Romera-Paredes等人利用平方损失与嵌入空间内的间接正则项来排序类别概率。Ji等人基于哈希模型在语义嵌入空间迁移类别知识并实现零样本的跨模态学习。Rahman 等人在语义和视觉嵌入空间中为每一个已见类别制造了一个主成分方向，然后加权组合他们来构成未见类别的主成分方向，从而以统一的范式实现零样本和少样本学习。

相比之下，生成模型生成虚拟样本来克服数据不足的问题，是当前零样本学习领域中最流行的策略。最著名的生成模型有变分自编码器（Variational Autoencoders， VAEs）和生成对抗网络（Generative Adversarial Networks, GANs）。变分自编码器使用一个编码器将输入编码为具有高斯分布的潜变量，又利用一个解码器从潜变量中重构输入。Shao 等人提出了一种多通道的高斯混合变分自编码器，该模型将高斯混合模型引入了带有多通道的多模态变分自编码器，实现虚拟样本的精准生成。生成对抗网络由一个生成虚拟样本的生成器和区分真假样本的判别器组成。由于标准生成对抗网络难以训练，Arjovsky 等人使用推土机距离（Wasserstein Distance，WD）构造出了基于 Wasserstein 距离的生成对抗网络（Wasserstein Generative Adversarial Networks，WGANs）以优化训练稳定性。Xian 等人提出了一种特征生成对抗网络，通过使用一个额外的分类器来增强生成特征的可分性。Han 等人在特征生成的基础上更进一步，通过从生成的虚拟特征中提取出无冗余特征，达到特征类内紧缩和类间分离的目的。Verma等人基于元学习也提出了一种新颖的周期训练策略，通过让生成器在训练阶段练习生成未见类别，达到在测试阶段更好的生成效果。一个生成对抗网络更有趣的应用是 Li 等人提出的 LisGAN模型，它引入了灵魂样本的概念作为类别样本生成的不变元素，以正则化模型的特征生成过程，实现更真实的虚拟样本生成。为直观理解，零样本学习发展脉络如图 1.7 所示。

综上所述，零样本学习通过引入类别的语义辅助知识，实现了从已知类别到未知类别的跨模态分类，克服了数据缺失的问题，适用于零样本场景。然而，在很多具体的工业应用如故障诊断中，语义辅助知识并不都是像计算机视觉领域中的“图片属性”那样直观易得，如何设计和获取零样本学习中的语义辅助知识，是该范式应用于实践的关键所在。

图 1.7 零样本学习发展脉络

2.2.4 迁移学习研究现状

迁移学习起源于上世纪90年代对机器学习理论的研究，它是运用已存有的知识对不同但相关领域问题进行求解的一种新的学习范式。为了基于掌握的知识来解决目标任务中标签数据匮乏或者样本数据匮乏的建模问题，迁移学习松弛了两个数据建模中的基本条件，即充足样本条件与独立同分布条件。文献表明，大量的数据集和实验场景是很难直接满足独立同分布条件与充足样本条件的，也因此，对于迁移学习的研究尤为重要。迁移学习大体上可以划分为基于特征选择的方法、基于特征映射的方法、基于实例的方法和基于生成模型的方法。

基于特征选择的迁移学习方法为了进行信息的跨域学习，需要找出目标域和源域中共有的属性。Jiang 等人为基于特征选择的方法提出了一种两步的建模框架，第一步会基于目标域和源域共同的属性得到一个常见的学习器，第二步则使用目标域中无标签样本的特有属性对该学习器进行微调和精细化，从而得到适用于目标域的学习器。Fang 等人则通过构造源网络和目标网络的标签传播矩阵来发现两个网络间共同的隐性特征，从而实现跨网络的协作分类任务。这一模型会在训练过程中赋予那些与类别关系紧密的特征更大权重。

基于特征映射的方法也被称为域自适应（Domain Adaptation，DA）方法，它是把各个领域的数据从原始的数据域中映射到一个共同的特征域当中，在该特征域中源域特征与目标域特征具有相同的分布，从而使用源域数据克服目标域中的数据不足问题。一种结构匹配建模方法被 Blitzer 等人提出，该方法使用轴特征作为各个域所独有的特征的共享，然后基于轴特征建模，该模型目前在词性标注和内容理解等领域取得了较好结果。Pan等人使用最大均值差异度量（Maximum Mean Discrepancy，MMD）最小化源域数据与目标域数据在隐变量空间中的分布差异，从而求解到这个被源域和目标域共享的隐变量空间。Yeh 等人提出一种新的域自适应方法以解决跨域学习问题。典型相关性分析（CanonicalCorrelation Analysis，CCA）算法在该方法中被用于得到相关子空间，并作为所有域样本的联合表达。他们还提出了基于核的典型相关性分析方法用来应对非线性特征的情况。特别地，一种新的带有匹配度正则项的支持向量机模型被提出，该支持向量机可以在建模过程中引入域自适应能力，并进行迁移性的分类。

通过测算无标签的测试样本与有标签的训练样本之间的匹配性来施加源域中的样本采样权重的方法称为基于实例的迁移学习方法。该方法会增大对训练目标模型有利样本的采样权重，减小不相关样本的采样权重。Dai等人提出了TrAdaBoost 模型，该模型将 Boosting 提升模型引入迁移学习中，在训练的迭代过程中改变源域样本被采样的权重，从集成学习的角度论证了策略的有效性。Jiang 等人则从分布的角度分析了迁移学习的动机，并由此提出了基于实例的最小化分布差异的损失函数，用以解决迁移问题。

相比之下，基于生成模型的迁移学习方法则是更直接以生成虚拟样本的形式解决目标域中数据缺失的问题。在上一小节中提到的特征生成对抗网络以及 LisGAN 等都是基于生成模型的迁移学习方法。为直观理解，迁移学习发展脉络如图 1.8 所示。

综上所述，迁移学习通过使用源域学习的知识、参数和特征来缓解目标域中的数据匮乏或者标签匮乏问题，适用于任意样本场景。但对于基于生成模型的方法而言，很少有工作分析了生成模型从源域到目标域迁移的可行性问题，该问题决定了生成模型迁移过程中的偏差来源，是迁移学习领域的固有问题，相应的分析和研究有助于消除迁移偏差，增强基于生成模型范式的可解释性。

图 1.8 迁移学习发展脉络

2.3 弱监督学习典型应用

在这一小节，我们介绍弱监督学习领域中四个最具代表性的零/少样本任务，包括手写数字识别、虚拟传感测量、工业故障诊断、户外场景检测，并分别讨论它们面临的真实弱监督问题。

2.3.1 手写数字识别与少样本问题

手写数字识别（Handwritten Digit Recognition，HDR），也叫数字图像分类，是有监督学习最基本的任务之一，它是指基于收集的有标注数字图片数据集训练判别函数，继而对相同类型图像进行对象识别，以区分各种不同数字的技术。图像内容的分析和理解是计算机视觉中的核心问题，准确地进行数字识别与数字分类是理解和分析图像内容的关键所在，对机器人、自动驾驶系统等智能设备具有重要价值。大家所熟知的数据集 Modified National Institute of Standards and Technology（MNIST）便是典型的手写数字数据集。如图 1.9 所示，该数据集的每一个样本都是一张 28*28 像素的灰度手写数字图片，抽取自 2,000 名人口普查调查员的手写字符，内容在0到9之间，一共有10个类别。MNIST手写字体数据集用于建模的集合包含 60,000 张图片，用于测试的集合包含10,000张图片。

MNIST是一个经典的、使用已久的基准数据集，标准的有监督模型在该数据集上的top-1准确率早已超过 98%，也正是由于大家对它的熟知，我们可以很方便的利用该数据集来模拟利用一个收集中的数据集进行增量建模的过程。正如研究背景中所讨论的，大规模数据集的收集过程是漫长的，而数据和标签的提供往往是分批次的，刚开始的时候往往只有少量标注样本，不可能一蹴而就。如何在这种少样本的场景下高效利用每个批次的数据更新模型，提升模型对新数据的泛化能力，是实践中建模需要考虑的重要问题。

图 1.9 MNIST 手写数字数据集样本展示

2.3.2 虚拟传感测量与少标签问题

虚拟传感测量（Virtual Measurement，VM），也称为软测量（Soft Sensor, SS），是指利用数据驱动建模技术，基于一些可以使用传感硬件直接测量的过程参数，对无法测量或暂时不能测量的重要生产参数及质量指标，构造出某种数学关系来推断或者估计，以软件来代替硬件的功能。使用虚拟传感测量技术实现工业重要参数和质量指标的在线检测不但经济可靠，而且动态响应迅速，可连续给出测量结果，易于达到对产品质量的控制。

然而，对于数据驱动的虚拟传感测量，足够的训练数据对于模型训练至关重要，包括样本和标签。如图 1.10 所示，在虚拟传感测量建模过程中，输入样本是传感器信号，比如过程压力、温度、流体流速等，通常从分布式控制系统中采集，由于传感器的高采样率和自动分析，我们往往可以获得大量的输入样本。相比之下，虚拟传感测量建模所拥有的标签很少，因为建模标签是过程的质量指标，通常通过实验室分析或人工标注获得，无法通过硬件传感器进行高频率化验和检测。

因此，在实际的虚拟传感测量建模场景下，我们所拥有的是少量有标签样本和大量没有标注的无标签样本，这是非常典型的少标签场景。在这样的情形下，如何在虚拟传感测量建模时有效地将无标签样本与有标签样本结合起来，使用无标签样本辅助和提升有标签样本训练的模型，会在很大程度上影响着虚拟测量的质量。

图 1.10 虚拟传感测量数据说明图

2.3.3 工业故障诊断与零样本问题

工业故障诊断技术（Industrial Fault Diagnosis，IFD）是指在工业装备，如磨煤机，正常运行时或不破坏装备的情况下，测试设备的运行状况，对装备的过程数据等进行计算分析，识别装备是否处于不健康状态或故障状态，其目的是提高设备的运行可靠性及奠定故障发生后根因追溯的分析基础。

流行的数据驱动故障诊断建模包括三个阶段：数据采集、特征提取和故障分类。在第一个数据采集步骤中，工厂会安装许多传感器来收集日常运行中的故障信号。特征提取则通常采用矩阵分解方法、时频分析和卷积神经网络等来实现降维和去噪。在最后一个分类步骤中，将提取的特征作为输入，得到用于故障诊断的机器学习模型。然而，这种做法往往依赖于丰富的历史故障数据，在实践中，更常见的工业场景是没有或者很少有故障数据可用。

考虑到许多故障可能具有破坏性并会造成巨大损失，很少有工厂会被允许运行到故障状态并采集样本来训练故障诊断模型。同时，机器的损坏通常会经历一个从健康到故障逐渐退化的过程，这也意味着为数据驱动方法获取足够的故障样本是费时费力的。如图1.11所示，我们可视化了田纳西-伊士曼过程（Tennessee Eastman Process，TEP）数据集中的一次故障，如何在没有历史故障样本的零样本场景下完成故障诊断模型的建立，是有监督模型应用于该任务值得思考的重要问题。

图 1.11 工业故障传感信号展示图 (基于TEP数据集)

2.3.4 户外场景检测与任意样本问题

户外场景检测（Outdoor Scene Detection, OSD）是指在户外野生场景下将一种类型的目标从其他目标中区分出来的过程，其基本思想是利用图片的形状、色调、亮度等视觉信息，通过多维空间上的映射变换来预测图片中对象的形态、种类、特点和标识等，最后根据海量数据所确定的映射函数进行分辨检测。

相比于之前介绍的手写字体识别任务、虚拟传感测量任务与工业故障诊断任务，户外场景检测任务是一种更开放的任意样本场景。图1.12展示了Caltech UCSD Birds（CUB）野生鸟类数据集和SUN attributes（SUN）户外场景数据集的部分图片，相比于之前的手写字体识别，我们可以很明显的看出户外场景物体的检测是更为丰富与细粒度的。同时，由于户外各种类别数据的不确定性，即某些稀有动植物的数据难以收集或只能收集到很少的样本，任意样本场景需要同时考虑零样本、少样本的情况，这使得真实的户外场景检测建模任务尤为复杂。为了涵盖任意样本场景中的各类欠数据问题，需要设计新的建模范式，从而以统一的模型实现对各类物体的检测识别任务。

图 1.12 CUB 野生鸟类数据集和 SUN 场景数据集部分图片展示

注明

1、本篇摘抄自论文的绪论部分，如想更加详细了解请阅读原论文。

2、若需引用本文的公式、专业术语等内容建议再细读原论文核实；若本文对您的论文idea有帮助，建议引用原论文～

参考文献

[1] 冯良骏. 面向零/少样本场景的弱监督学习方法、应用与实现[D].浙江大学,2022.DOI:10.27461/d.cnki.gzjdx.2022.001726.

附录：开源代码

本文共提出了四个用于弱监督问题的模型，包括宽网梯度提升系统、对抗平滑三重回归模型、基于故障描述的属性迁移模型以及语义精炼生成对抗网络。其开源代码及数据提供如下：

1） 宽网梯度提升系统 Paper: BNGBS: an efficient network boosting system with tripleincremental learning capabilities for more nodes, samples, and classes,Neurocomputing, 2020，412:486-501.

Code & Data:https://github.com/LiangjunFeng/BNGBS

2） 对抗平滑三重回归模型 Paper: Adversarial smoothing tri-regression for robustsemisupervised industrial soft sen[1]sor,Journal of Process Control, 2021, 108:86-97.

Code & Data:https://github.com/LiangjunFeng/ASTR

3） 基于故障描述的属性迁移模型 Paper: Fault description based attribute transfer for zero-sampleindustrial fault diagnosis, IEEE Transactions on Industrial Informatics, 2021,17(3):1852-1862.

Code & Data:https://github.com/LiangjunFeng/Industrial_ZSL

4） 语义精炼生成对抗网络 Paper: Bias-eliminated semantic refinement for any-shot learning,IEEE Transactions on Image Processing, 2022, 31:2229-2244.

Code & Data:https://github.com/LiangjunFeng/SRWGAN

编辑：李正平

校核：张勇、张泽明、王畅

如需转载，请后台联系小编

说明：图片来源原论文，若有侵权，烦请后台联系处理

来源：故障诊断与python学习

非线性通信理论自动驾驶机器人控制工厂人工智能

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2023-06-22