来源:仿真秀App
作者:永恒熵增
导 读
什么是基于仿真的数字孪生?目前,市场上对数字孪生的定义是相对较为混乱的。很多公司或机构都结合自身技术特点和经营范围,对数字孪生有自己的定义。百度百科里的定义是:数字孪生是充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。数字孪生是一种超越现实的概念,可以被视为一个或多个重要的、彼此依赖的装备系统的数字映射系统。依据不同的业务范围,数字孪生的实体装备可以是某个客观实体,也可以是某种抽象客观事物(如一个企业)。目前,市场上的数字孪生以客观实体为主。如图 1所示,为一般的数字孪生系统示意图。
目前在市场上,数字孪生有两个相关的概念:(1)数字孪生模型。(2)数字孪生系统。其中,数字孪生模型的概念,对应于图 1中的虚拟设备(计算模型)。数字孪生系统对应于图 1的整个或部分(无控制信号)系统。显然,数字孪生模型是整个数字孪生系统中的关键部分之一。
基于仿真的数字孪生就是针对数字孪生模型而言的。如图 2所示,是对市场上主要的数字孪生按照不同方法进行的分类。分类方式分别为:1、按实际设备的尺度分。2、按设备的生命周期分。3、按数字孪生模型的生成方法分。
按实际设备的尺度分,数字孪生模型最大可到城市级,最小可到某个设备。
按设备生命周期分,产品主要阶段包括设计、制造和运维。
按数字孪生模型的生成方法分,可分为基于几何、基于大数据+机器学习、基于经验公式和基于CAE仿真的。其中基于经验公式和基于CAE的方法。其中,基于经验公式和基于CAE的方法,都是基于仿真的数字孪生。基于经验公式的仿真为系统仿真,即通常所说的1D仿真。基于CAE的仿真即通常所说的3D仿真。基于仿真的数字孪生并不适用于所有数字孪生,图 2中,红框所示的数字孪生,是基于仿真的数字孪生较为擅长的领域。另外,某些企业还推出了混合型的数字孪生,即把大数据+机器学习的和仿真相结合做成孪生模型,从而实现了优势互补。
基于仿真的数字孪生的用途有很多,主要有四种:
1、虚拟传感器。
2、基于物理机理的预测。
3、运行方案筛选。
4、故障根源分析。其中虚拟传感器是基础。
虚拟传感器是指,在实际设备中,某些位置的某些物理量,是使用者迫切想或缺,但无法获取的。比如加温炉内某个空间点上的温度值、电机转子的温度分布等。在传统情况下,使用者只能依靠标准操作规章来防止出现操作风险,无法在操作中实时监测这些物理量。而使用基于仿真的数字孪生系统,可通过设备外围可布置传感器的数值驱动仿真计算,获取这些物理量,从而实现更精准、更安全的操作。
基于物理机理的预测是指,当数字孪生模型为由瞬态仿真处理而来的模型时,则可在本时刻,根据真实设备的传感器数值,预测出该设备未来时刻的工作状态,从而实现精确控制、危险预警等功能。一般来说,这一用途与基于大数据+机器学习的数字孪生模型的用途重叠。但是两者间并不完全相同。基于大数据+机器学习的数字孪生模型是以神经网络为基础的,因此是黑盒子,使用者并不能通过查看模型内部数据获知其机理,但是模型的生成相对简单,只需大量的历史运行数据即可。基于仿真的数字孪生模型是以仿真模型为基础的,因此是白盒子,使用者可通过查看模型清楚的了解内部机理,并加以修正改进,因此具有更高的置信度,但是模型生成相对复杂,需要真实设备的设计资料进行仿真模型的建立。
运行方案筛选是针对多种操作方案的场景。例如,在一个管路系统里,若干阀门开度的不同组合可实现同样的流量与压力。但是哪种组合更节能、使设备寿命更长等等,是需要筛选的。这是,可以先试用数字孪生进行离线试验,等找到最好的阀门开度组合后,再在实际管路上进行操作。
故障根源分析是对虚拟传感器的衍生用途。一般设备发生故障时,表现为超温、振动超标、噪声等表象。使用者一般很难根据这些表象,分析出具体是设备内那个零部件失效。但是,当该设备配备了较全面的数字孪生后,通过对设备内部虚拟传感器的检查,可以较方便的定位失效零部件,从而为快速排故提供便利条件。
本文所述为某公司的基于仿真的数字孪生系统路径,而非所有基于仿真的数字孪生系统技术路径。
基于仿真的数字孪生系统的总体技术路径,如图 4所示,可分为三步走:(1)建立仿真模型。(2)建立孪生模型。(3)部署到数字孪生系统中。
其中,建立仿真模型是整个路径的起始。这一步与传统的仿真过程一致,需要根据设备的设计资料(如果是给正在研制的设备制作数字孪生将非常方便),制作仿真模型。由于数字孪生系统的运行场景是与实际设备平行运行的虚拟设备,因此一般来说必须进行实时仿真。为此,最满足这一要求的仿真是系统仿真。然而,这并不意味着三维仿真无法参与到数字孪生的建设中来。三维仿真是通过降阶模型的方式,成为系统仿真的某一元件,从而为数字孪生带来仿真精度的提升或直接输出三维物理场的能力。但是,从总体来说,由于数字孪生系统的使用场景的要求,用于生成数字孪生模型的仿真模型,必须是系统仿真。
在含有降阶模型的系统仿真模型中,一般来说,绝大多数元件是系统仿真模型库里的元件,由各类方程、公式以代码的形式实现,而最核心的元件为降阶模型。由于初值问题的复杂性,降阶模型元件的数量不宜太多,一般不超过3个。如所示,为典型的含降阶模型的系统仿真模型。目前,由于语言的广泛性与便捷性,系统仿真的求解器与模型库一般使用Modelica语言的求解器与模型库。
Modelica语言是目前世界上最广泛使用的系统仿真语言。由于其简单性和开放性,在世界范围内,具有较多的用户和较多的模型库。在使用Modelica语言建立模型时,使用者绝大部分精力可放在数学物理问题本身上,而不需要涉及具体的方程求解方法和计算机执行层面的问题。因此,使用Modelica语言的工程师,只需要对本专业的技术知识做到精通即可,不需要对软件、编程、计算机等专业知识的精通,从而大大降低了使用门槛。
建立仿真模型里的另一个较为核心的内容是降阶模型。降阶模型(Reduced Order Model,缩写为ROM)这一词语,最早由ANSYS公司大量使用。其含义是把包含极大数量维变量的问题(三维仿真或复杂的系统仿真),通过某些数学方法处理成仅含有限维变量的模型。其实质是非侵入式的机器学习。虽然三维仿真/复杂系统仿真所含变量维度极高,但由于物理问题本身的复杂程度有限,控制其主要特性的物理规律数量远小于其所含维度,因此可通过对仿真的输入量与输出量组成一定数量的采样点进行机器学习,获得相应的降阶模型。机器学习所使用的数学工具,根据物理问题的类型差异而多种多样,包括但不限于神经网络、贝叶斯推论、移动最小二乘法、克里金插值、奇异值分解等各类方法。
孪生模型与仿真模型的区别,在于鲁棒性和运行环境。
仿真模型,由于其一般应用于产品设计过程中,因此强调的是仿真精度,而对仿真的速度、收敛性的要求更次要一些。对于设计阶段运行的仿真模型,如果出现仿真发散等问题,可以通过修改参数,再运行一遍解决。但由于数字孪生是在工业环境内运行的模型,其在运行过程中的突然失效,可能会导致严重后果,因此必须具备极高的鲁棒性。为此,仿真模型需重新编译,方程求解形式放生改变。而且,由于这种形式上的改变,仿真精度有所下降,需在重新编译后进行精度验证。
另一方面的区别是运行环境。仿真模型的运行,必须依托于某种软件环境,例如,由Modelica语言形成的系统仿真模型,在操作系统上存储的文件后缀名为”.mo”。这不是一个可执行文件,而必须通过打开Dymola、Mworks等基于Modelica语言的仿真软件,然后载入该”.mo”文件,才能运行。然而,孪生模型并不是这样,它是一个可在Windows、Linux等操作系统内直接执行的程序。之所以要这样,是由于数字孪生的成本原因。由于仿真软件的获取,需要购买许可证,而这类仿真软件往往价格不菲。因此,如果从数字孪生系统的建设成本上来说,为了建设一个数字孪生系统而采购一个仿真软件,在大多数数字孪生的应用场景里并不划算。因此,需要把数字孪生制作成可直接在操作系统内运行的程序。在本技术路径里,孪生模型的制作是以由Modelica模型转换出的fmu文件作为核心,附加上与之对应的调用、通讯等辅助软件包,形成的小型软件程序包。操作系统通过启动软件包内相应可执行文件,即可启动整个数字孪生模型软件包。并且该软件包提供了可供编辑的输入输出API。
部署是整个路径的最后一个环节。工作内容是:一方面,实现实物传感器数据与数字孪生的输入接口的对接,另一方面,实现数字孪生输出接口与后续使用该数据的环节进行对接。
一般来说,整个系统的大体框架如图 6所示。实际设备上的传感器,连接数据采集系统。数据采集系统的硬件连接到某服务器上。这个服务器可以是设备现场的边缘设备,也可以是云上的服务器。服务器上有某种数据处理平台,一般情况下可使用某种IOT平台。数字孪生模型就根据IOT平台的具体部署要求,部署在平台内。使用这通过IOT平台实现对数字孪生模型的操作。数字孪生模型是事先在其他计算机上制作完成后部署到服务器的,在数字孪生系统运行过程中,制作用的计算机并不参与运行。
基于仿真的数字孪生系统,是众多数字孪生系统中的一种。它的优缺点都很明显。
基于仿真的数字孪生的优点,本质上有两点:第一、机理明确的白盒模型。第二、不过分依赖历史数据。
目前,数字孪生领域的模型生成方式,仍然以大数据+机器学习为主。但是越来越多的用户,尤其是航空航天等高技术领域用户,不满足于基于神经网络的孪生模型。他们更希望了解模型内部发生的事情,这有助于评估该模型的可靠性。然而,神经网络无法以人类思维能力理解的方式体现出其内在机理。在这方面,基于仿真的数字孪生模型天然为白盒模型,其机理清楚明白,让使用者更加放心。
在基于大数据+机器学习的数字孪生制作中,获取历史运行数据是至关重要的一环。然而,现实存在的历史数据往往不能覆盖设备的关键工况数据。例如,对于设备失效预警的数字孪生,真实设备失效前一段时间的历史运行数据是最重要的。然而,设备失效往往意味着报废。因此,对于一个仍在正常运行的设备,不可能从历史运行数据中找到它即将失效的运行数据。从而造成神经网络的行为与真实设备存在偏差。而基于仿真的数字孪生不存在这一问题。因为仿真实在计算机中进行的虚拟试验,工程师可以随意指定其工况,包括失效工况,因此天然可覆盖各种工况。
基于仿真的数字孪生的缺点,本质上也有两点:第一、制作困难。第二、模型成长困难。
由于基于仿真的数字孪生的第一步是进行仿真建模,因此需获取真实设备的设计资料信息。数字孪生系统的受益方是设备的运维厂商,而设计资料信息一般存在于设备的生产厂商。因此数字孪生的建设者,需要频繁联系设备生产厂商,而无法为其提供真正的利益价值,从而产生商业上的矛盾。因此,数字孪生模型的制作比较困难。
基于仿真的数字孪生模型,一般在仿真模型确定后,就不能更改。因此较难实现其在部署一段时间后的继续学习进化。相比起来,基于大数据+机器学习的数字孪生在这方面具备天然优势。
本文首先对基于数字孪生的定义和范围进行了阐述。然后对基于仿真的数字孪生的整体技术路径进行了较详细的介绍。最后,对基于仿真的数字孪生的优缺点进行了详细分析。
最后的结论是,基于仿真的降阶模型,相比于其他类型的降阶模型,具有一定的特点。它有擅长的地方,也有不足的地方。因此,并不是说哪种方法一定优于其他方法,而是需要根据业务需求进行合理选择和布置。