摘要
针对数字孪生车间建模、仿真和验证的困难,提出了一种数字孪生车间建模和在线训练方法。本文描述了一种包括状态属性、静态性能属性和波动性能属性的多层次数字孪生集 合建模方法,并设计了一个数字孪生组织系统,即数字孪生图。针对数字孪生体的数据需求,构建了时空数据模型。提出了一种基于截断正态分布的数字孪生模型训练方法。此外,还提出了一种基于实虚误差的数字孪生模型验证方法。通过实例验证了实时状态监测、在线模型训练和生产仿真的有效性。
关键词:数字孪生模型;数字孪生聚合体;在线训练;模型验证;时空数据模型;数字孪生车间
正文选读
1. 引言
随着新一代智能制造技术的兴起,制造业与信息技术深度融合、交叉发展。数字孪生(DT)是以物理车间实时数据为驱动,综合多个物理量、尺度和概率,实现物理车间到虚拟空间的映射和实时交互的高保真仿真过程(Tao et al. 2017,2019)。
世界各国学者对DT技术进行了广泛的研究,提出了许多DT框架和应用,并取得了许多研究成果。Jiang等人(2021)提出了一种基于离散事件系统建模理论的虚拟建模方法,并设计了虚拟物理连接方案和数据交互机制。Zhang等人(2019)提出了基于机器人的智能制造系统的DT虚拟实体的五维融合模型,以支持自动重构。Guo等人.(2018)提出了模块化方法,以帮助构建灵活的数字孪生模型并进行相应的改变。Luo等人(2019)建立了DT的多域统一建模方法,物理空间与数字空间的映射策略,提出了DT的自治策略。Leng等人(2021)提出了一种新型的数字孪生驱动联合优化方法,用于大型自动化高层仓库产品-服务系统中的仓储。Aivaliotis、Georgoulias和Chryssolouris(2019)提出了利用基于物理的模拟模型和DT概念计算机械设备剩余使用寿命的方法。Autiosalo等人(2020)从早期文献中识别出DT的共同特征,并提出了一种分析方法,根据这些特征比较DT实例。Schluse等人(2018)引入了EDT的概念,作为基于仿真的系统工程过程及其在VTB中的跨学科和跨领域仿真的新结构元素。Zhang等人(2017)提出了一种基于数字孪生模型的方法,用于快速个性化设计中空玻璃生产线,以提供工程分析能力,并支持系统设计和解决方案评估的决策。Tao et al.(2018)提出了一种使用DT驱动的预测和健康管理的新方法,有效利用了DT的交互机制和融合数据。Zhang,Zuo和Tao(2018)提出了DTS中的EECM框架,并讨论了潜在的应用。Zhuang,Liu,and Xiong(2018)提出了一种基于数字孪生模型的复杂产品装配车间智能生产管控方法框架。Jones等人(2020年)通过对过去十年92篇数字孪生文献的系统文献综述和主题分析,提供了数字孪生的特征、知识差距的识别和未来研究所需的领域。
这些结果表明,车间数据挖掘的研究主要集中在建模、调度和评审的技术和框架方面。除此之外,还有一些关于设备DT的用例,如预测、分析、优化和健康监控等。另一类包括那些特定的用例,如生产预测、优化、管理和生产线设计。
在数据挖掘的仿真与验证研究中,传统的方法主要是通过离线仿真来分析和预测车间的生产状态。Qian et al.(2021)从隐性和显性两方面提出了验证DTW孪生模型的数学方法。Wang et al.(2019)提出了DTw的动态数据驱动建模和仿真方法。Savolainen和Urbani(2021)提出了一种基于DT仿真的多机组系统维修优化方法。近年来,一些学者开始对在线时延的仿真和预测进行研究。刘娟等(2021)提出了一种基于实时数据的DT车间运行状态在线预测方法。Zhang et al.(2022)在当前研究中提出了一种改进的基于模拟的多保真优化方法,该方法基于具有序数变换和最优采样的多保真优化。Zhang等人(2021)提出了装配界面接触特性DT模型的构建方法,研究装配界面的精确建模和DT模型的更新,以保持物理信息和数字信息的一致性。Weyer等人(2016)提出了一个适当的框架,用于基于CPS的工厂建模和仿真。Um,Weyer,and Quint(2017)提出了工程师如何使用基于AutomationML的数字孪生概念所启发的通用数据模型来自动设置数字环境。
上述研究提出了一些数据驱动的建模与仿真方法,但主要集中在理论框架上。然而,DT车间的具体建设和应用技术尚不明确,缺乏动态反映生产过程、实体状态的在线仿真模型。在此背景下,本文针对DT车间的建模、仿真和验证,提出了面向对象的建模方法。提出了基于面向对象模型的DT车间在线训练与验证方法。
2.面向对象的DT建模和组织
2.1.基于数字孪生集 合的建模与训练框架
为了深入实施DT,提出了一种新的DT车间建模和在线训练方法,构建了DT车间的体系结构。如图1所示,该体系结构由五个部分组成:物理车间、数据感知、DT建模、DT训练和验证以及DT应用。
物理车间是DT车间架构的基础,是各种客观物理实体的集 合(Ding et al. 2019)。物理车间包括各种设备、操作人员和材料,以及大量的传感器和用于数据采集的网络传输线。物理车间合理的数据采集方式是DT车间建设、运行和控制的基础和保障(Guo et al. 2020)。
感知数据的来源包括DT车间各类操作人员、机械、设备、物料、环境的资源属性、任务状态、交互过程(Cai et al. 2017;Leng等人,2019年)。本文将感知数据分为状态数据、静态性能数据和波动性能数据,为DT的建模和仿真提供了数据基础。
DT的对象模型是基于数学逻辑模型的具体表达( Rasheed , San and Kvamsdal 2020) 。根据物理车间制造要素的耦合关系,以数字化、符号化和图形化的形式描述了物理车间各要素的属性和作用。最后,构建了一个包括对象组织和车间操作的全方位DT模型(Liu et al. 2019)。
DT模型一方面要真实的监测物理车间的物理行为和状态,从真实中反映虚拟车间;另一方面要将DT车间的生产结果和异常数据动态反馈给物理车间,从虚拟中控制真实车间(Zhou et al. 2020)。通过实时数据驱动的在线模型训练、实时监控、仿真和模型验证,实现对实际车间生产状态的连续预测。
DT应用包括生产数据分析和车间运行控制,可实现物理车间运行状态的实时模拟、诊断、预测和控制(Redelinghuys ,Basson and Kruger 2020)。
2.2. 多层次数字孪生聚合体建模
为了建立一个能够真实反映真实的世界的DT模型,采用面向对象的建模方法对物理车间的所有元素进行分类和建模(Zhang,Yan,and Wen 2020)。其中,物理车间的总生产要素可分为车间实体和车间规程。
定义1(数字孪生聚合体(DTA)):根据生产单位规模大小,DTA分为四级:元件级、生产线级、车间级和工厂级。元素数字孪生聚合体(ELDTA)包括设备数字孪生聚合体(EDTA)、操作员数字孪生聚合体(ODTA)和材料数字孪生聚合体(MDTA)。生产线数字孪生聚聚合体(PDTA)和存储数字孪生聚合体(SDTA)分别由各种ELDTA组成。以同样的方式,车间数字孪生聚合体(WDTA)形成。每个DTA都是一个复合体,包含三层逻辑关系:类、子类和数字孪生实例(DTI)。
定义2(元素数字孪生聚合体):ELDTA是基本DTA单元的总称,包括EDTA、ODTA和MDTA。EDTA是DT车间各种设备的代表。由DTI组成的EDTA可表示为EDTAj = e1, e2, ... ei, ... en (1<i<n)。DTI在MDTA中的映射表示为MDTAj = m1,m2, ... mi, ... mn (1<i<n )。ODTA可表示为ODTAj = o1, o2 ,...oi,... on (1<i<n)。
定义3(DTI的属性):DTI的属性分为状态属性as、静态性能属性asp和波动性能属性afp,以满足虚实融合仿真的需求,如图2所示。每个DTI包含机构特征、性能数据、行为规则、功能属性和形状参数等多个元素,即DTIi(A),如式(1)所示。
定义4(交互耦合行为(ICB)):ICB是车间规则的表达,是不同DTA之间的纽带。ICB包括人与设备或物料之间的人机交互和设备与物料之间的物与物交互,是DT车间物流行为和加工行为的集 合。生产单元(MU)包括串联单元(SU)、并联单元(PU)、扩散单元(DU)和装配单元(Au),MU = SU、PU、DU、AU,如图3所示,车间内各生产要素之间通过ICB形成生产单元。
定义5(生产线数字孪生聚合体):PDTA由EDTA、ODTA、MDTA等车间实体组成,基于一定的ICB。PDTA可以表示为PDTAj =p1,p2,...pi,... pn (1<i<n) 或 PDTA= EDTA × SDTA × ODTA或PDTA = SU × PU × DU × Au,如式(2)所示。SDTA由立体货架、堆垛机、自动输送机、叉车和物联网设备、仓库工作人员和管理人员等的DTA组成。因此,SDTA可以表示为SDTA = EDTA × MDTA × ODTA,并且SDTA的一个实例可以表示为SDTAj = s1,s2,...si,... sn (1<i<n)或SDTA =(EDTA × SDTA × ODTA)。
定义6(车间数字孪生聚合体):WDTA是PDTA和SDTA通过ICB形成的复合物,可表示为WDTA = PDTA×SDTA。WDT的一个例子可以表示为WDTAj = p1×s1,p2 ×s2, ...,pi×si, ...,pn×sn(1 ≤ i ≤ n)。
2.3.数字孪生图
定义7(数字孪生图(DTG)):类、子类和实例以图的形式组织,分为五层,这是一个包含n(n>0)个节点的有限集 合。其中,图中1 ~ 4层为DTA的类,下层为上层的子类,第5层为DTAs的实例,如图4所示。因此,DTG由一组类和子类组成,由ei、oi和mi实例按一定规则排列而成,如式(3)所示。在任何DTG中,第一层上的DTA是根节点。其它结点可分为k(k>0)个相交有限集,每个相交有限集是上结点的子图。
首先,DTG的构建从第五层的DTI开始。然后,建立第4层上的EDTA、ODTA和MDTA。进一步,自下而上建立PDTA和SDTA、WDT和FDT。下层DTAs是上层DTAs的子类或实例,下层DTAs继承上层DTAs的属性但不限于上层DTAs,一个下层DTA可以属于多个上层DTAs,不同的DTAs之间存在ICB。
在定义DTA和DTG的基础上,DTG的DTAs遵循以下构造规则。
根据上述流程和规则,构建了DTG的组织模型,如图4所示,其中实线为子类或实例关系,虚线为DTA之间的ICB。
3.DT模型的在线训练方法
与实际车间高度同步的模拟和模型验证是实现DT的关键(Wang 和 Luo 2021)。然而,真实的车间的afp会随着客观生产条件的变化而发生概念漂移,造成真实车间与DT车间的不一致。为此,提出了一种动态时间表模型的在线训练方法(OTMDT)。OTMDT能够处理动态数据集,处理概念漂移,并根据输入数据更新模型。
本文通过DTAs及其ICB构建了DT模型。建立了基于虚实数据的时空数据模型(SDM),设计了多时间线的仿真和验证方法。DT模型的实时物理车间监控功能由当前时间轴的时空数据驱动。在验证时间轴上对DT模型的虚实误差进行了判断。通过对DT模型进行在线训练,以适应物理车间不断更新的状态和性能,从而提高虚拟现实融合的深度,实现模型的不断进化。通过DT模型的虚实融合仿真,可以得到车间在未来任意时刻的运行状态。从而实现车间的连续性预测和状态监控。
3.1.时空数据建模
3.1.1时空数据采集
为了避免物理车间重要数据的丢失,保证状态属性的更新能力(Coelho,Relvas,and Barbosa-Póvoa 2021),根据不同数据类型的特点设计了物理车间的数据采样模式。每个属性的采集频率不同步。数据采集模式设计为事件采集、周期采集和事件触发周期内采集的混合模式。在ICB发生时收集数据的方法称为事件收集。在ICB结束前的t周期内连续采集数据的方式称为事件触发周期内采集。在t周期内采集数据的方式称为周期采集。此外,DT与实际车间采用相同的数据采集方式构建维度一致的SDM。表1显示了一些数据收集模式。
三种采集模式相互独立。在“周期性收集”期间,如果“事件收集”的ICB未被触发,afp将保留最后的数据。当“事件收集”发生时,将调用“周期性收集”以获取相应的asp数据。同样,要在"事件触发周期内获取“中获取作为asp的,将调用”周期性收集“。在此期间,如果事件收集的ICB未被触发,afp将保留最后的数据。时空数据采集模式如图5第一部分所示。
3.1.2.时空数据模型
物理车间收集的大量传感器数据的值密度稀疏,为了保证DT模型的实时数据驱动能力,需要对原始数据进行边缘预处理。首先,对不同数据源的原始数据进行清理,消除异常,纠正错误,填补缺失数据,规范数据格式。然后,将净化后的数据分类为as、asp和afp。然后,构造出如图5所示的SDM,同时,将ICB加入到DTAs中,形成相应时间维的DTG。将as、asp和afp从SDM传输到仿真模型并存储在DTG中,以供建模重用。
定义8(时空数据模型(SDM)):SDM是具有三维的张量模型:元素、属性和时间。元素和属性构成了SDM的空间维度。在空间上,元素的维度由不同的DTIs构成,属性的维度包含多个属性DTIi(A)。时间维度是由不同时间的空间维度累加而成的。
由ti处的多维DTI(A)组成的SDM可以表示为等式(4):
SDM由一个从Ti到Tn维的增量空间矩阵组成,实际车间和DT车间的SDM分别可以表示为SDMr和SDMd。SDM如公式(5)所示SDMr是m×n维矩阵,SDMd是p× n维矩阵。由于SDM的数据维数较大,用于ERV计算的SDM按比例γ选取δ个数据,如式(6)所示,其中γ = n/δ
3.2.基于SDM的DT模型训练与验证
3.2.1.DT模型的训练方法
提出了一种基于历史时间轴、新历史时间线、当前时间节点和未来时间线的DT模型训练与验证方法。该模型以afp为训练目标,采用多个时间轴对DT模型进行训练和验证。该方法避免了仿真模型的反复调试和评估,实现了DT模型的在线训练。
根据车间布局和ICB,利用DTI建立DT模型。训练和验证过程如下。首先定义了DTAs的属性,然后根据仿真目标和车间布局,利用DTI或MU构造仿真对象。其次,确定了ICB,编写了仿真算法,在事件调度和对象交互的方法下建立了DT系统。第三,当前时间轴在数据采集周期内从T0向前移动。在当前时间轴上,由实时数据驱动仿真,更新as、asp、afp,最后更新数据后运行DT模型,在验证时间线上用DT和真实SDM验证模型的准确性,重复第三步,直到满足训练完成条件。
由于空间的限制,本文只给出了符合正态分布的afp训练方法,其他分布的训练思想是相同的。以站集结时间为例,符合截断正态分布的特征,具有有限的数学期望和方差E(Xi)= μ,D(Xi)= σ2 (i = 1,2...)。任意Xi的分布函数如式(7)所示。
当数据量较大时,afp近似服从大于0的截断正态分布。服从正态分布的afp的训练目标是下限为a,上限为b的函数f(x),分布的随机数种子为stream,记为N(stream,μ,σ2,a,b)。流是由数据产生的分布规律。训练f(x)的目标函数如等式(8)所示。在模型训练的初始阶段采用历史数据的方差,截断正态分布初始阶段的μ、σ2、a、b的训练公式如式(9)所示,其他分布相同。
在初始阶段之后,模型的训练工作正常。DT模型的训练依赖于当前订单的SDMr数据,以避免历史数据的影响。稳定阶段截断正态分布σ2的更新方式如式(10)所示,其他分布相同。
3.2.2 DT模型的验证方法
DT模型的准确性可以通过在某个历史时间轴上运行来验证。当前时间节点和最后一个时间节点之间的时间间隔称为新历史时间轴,新历史时间线和历史时间线被分类为验证时间线,用于DT模型的实时仿真验证。整个订单的时间轴是DT模型最终模拟验证的验证时间线。DT模型的验证过程如图6所示。
定义9(实虚误差):实虚误差是精度判断的依据,也是DT模型的优化目标,记为ERV。根据验证的时间轴,ERV分为实时误差Er和最终误差Ef。Er的验证时间线是从开始到订单出现。Ef的版本化时间线是从订单开始到结束。SDMd可通过在验证时间线上进行模拟获得。响应于真实和DT生产工艺之间的误差,ERV可以通过计算SDMr和SDMd之间的差值比来获得,如等式(11)所示。Er和Ef的计算与ERV相同。在逐列计算ERV之前,SDM中的数据如等式(12)中所示被归一化。
根据Er的变化规律,将训练过程分为数据真空期、缓冲期和稳定期。缓冲时段的训练阈值λ被设置为与生产计划相关的递增函数,如等式(13)所示。p为实时产品数量。
当生产达到一定的时间表,Er和Ef将改变同步和DT模型将达到一个稳定的阶段。假设之间的边界数据真空和缓冲周期是pi,和之间的边界缓冲区和稳定周期点。然后模型训练的训练条件方程(14)所示,记录为TC。
DT模型的训练过程如图7所示,as和asp在物理车间每次数据采集后真实的更新。as经常更新,反映了实体车间的实时生产运行状态。asp反映了设备的性能,并随着设备的配置和修改、车间布局等因素动态更新。
当ERV满足触发要求时,可获得合格的DT模型。同时,通过不断地训练模型,可以得到最优的ERV。利用DT模型可以预测车间未来的运行过程,为真实的车间的管理和决策提供依据。
4.案例研究
4.1.数字孪生车间建模与历史时空数据分析
本文以某脉冲装配车间为例,对该系统进行了应用。脉冲装配是介于固定工位装配和连续运动装配之间的一种装配生产形式。每个工位组装一个特定的流程。当所有组装工位的工序完成后,产品将移动一次。通过产品的脉动运动,使车间以快速稳定的工作节奏进行生产。脉冲组件的移动方式如图8(a)中箭头所示。
根据脉冲总装车间的实际生产任务,对不同装配订单的一个产品进行批量装配。本案例以装配时间为例对DT模型进行训练和验证。总装车间的工序很多,每一道工序的装配时间都很长。本文收集了100个产品订单的历史数据,按照公式(4)整理的部分历史数据见表2。并将表2中的时间间隔扩大,以改善数据的呈现。
表3显示同一过程的装配时间在一定范围内有规律地波动。利用式(7)对数据进行分布拟合,工序90、140、160、190的分布拟合曲线如图9所示,从图9可以看出,虽然样本数据量不够大,但拟合曲线符合正态分布的特征。当订单进行下去,组装工人的熟练程度会逐渐提高,所以上述分配会经历概念漂移。为了保证DT模型的准确性,需要对afp进行增量训练。
4.2.装配车间DT模型的训练与验证
超参数和训练结果如表4所示。“订单”是生产的订单形式。第二列是stream的取值范围。“init_step”和“con_step”分别表示在数据真空期和缓冲期每采集20或30个样本训练一次DT模型,式(6)中的参数δ表示从SDM中选取400个数据进行ERV计算。α和β是式(13)中λ的参数。对模型的训练方法如下:在数据真空周期使用式(9),在其他周期使用式(10)。不同模型下Ef的收敛趋势如图10所示。图10中两条红色垂直虚线为数据真空期、缓冲期和稳定期的分界线。水平红色虚线为训练阈值λ,Er的值是判断是否训练的依据。
从图10可以看出,三个模型与真实的车间的初始误差约为14.5%,可见历史分布与实时分布存在概念漂移。总体来看,随着训练次数的增加,DTOTM的Ef呈现下降趋势,随着订单的扩大,固定分布的误差减小,但波动性增大,一般在定值线附近波动。
在数据真空期,由于缺乏实时数据,Er是不稳定的。随着订单的扩大,DTOTM收敛速度较慢,说明随着实时数据比例的增加,少量实时数据模型对Ef的影响越来越小。在缓冲期,DTOTM呈明显下降趋势,Er与Ef的同步性越来越明显。所有订单在缓冲期结束时基本上都能实现较低的Ef。进入稳定期后,Er和Ef的值趋于基本相同,因此只有在获得较小的Er时才能训练模型。从图10(c、d)可以看出,Efs在稳定期仍有一定的下降空间。
本文仅给出了装配30个产品时工艺10的参数变化。表5显示了模型训练期间装配工位1及其平行工位的流、μ、σ2、a、b和Ef。从表5中可以看出,截断正态分布参数在每次训练后都发生变化。如图11所示。
装配时间的训练曲线是一个有上下限的截断正态分布,图10显示了工序10在不同顺序下装配过程中截断正态分布的变化趋势。
最后,完成了固定分布、固定值和DTOTM对完工时间预测的对比实验,如图12所示,从上图可以看出,DTOTM与真值的预测误差最小,而固定值、DTOTM与真值的误差约为18%。
综上所述,从上述案例可以看出,随着DT模型的训练,Ef不断减小,截尾正态分布曲线也逐渐接近最优值,证明了本文提出的方法是有效可行的。
5. 结论
本文介绍了DT车间中的建模和在线训练框架。在面向对象建模方法的基础上,提出了面向DTA的建模与组织方法。构建了DT车间资源、产品、过程等生产全过程的多层次DTI。为了便于数据共享和重用,动态地满足dt模型的数据需求,建立了DTA的组织和管理结构。SDM建立在多传感器异步数据采集模式的基础上。提出了DT车间在线训练与验证模式,实现了数据驱动的实时仿真。通过实例验证了建模和在线训练方法的有效性,为DT车间的运行模式提供了新的思路。
未来,将在不同车间采用多种数学模型构建波动性能属性,并利用机器学习技术实现DT模型下的实时控制和决策,以扩展该方法的适用性。