概念模糊会带来许多认识上的问题。
前些年,有位砖家到处去说“智能制造=人工智能+制造”。如果按照这种荒唐的说法,不懂人工智能就没有办法搞智能制造了。这样,绝大多数智能制造项目都被他的概念排除在外了。其实,工业人所谓的智能制造在英文中主要是指“Smart Manufacturing ”,而不是“Intelligent Manufacturing”。这位砖家则根据汉语的叫法望文生义,就闹出了笑话。
谈智能制造时,经常有人强调CPS和数字孪生,强调模型的作用,强调算力和算法的作用。但人们普遍感觉,现实中的应用往往不理想、这种说法似乎也不靠谱。为什么会是这样的?原因之一是“模型”的概念模糊,导致了认识的混乱:人们在谈论模型时,在同一篇文章、同一个段落甚至同一句话中,其实不自觉地用了不同的概念。这样,从语言逻辑上看起来没有问题,其实却行不通。
模型的定义是:为了特定应用目标,对实体进行的简化描述。所谓简化,就意味着模型不等于实体、不能完整地描述实体,但对某些应用目标来说是足够的。所以,BOX说:模型都是错的,但有些是有用的。。
我们仔细分析一下,模型有两种相关而不完全一样的概念。
第一种是“先有模型后有物理实体”。比如,为制造产品建立模型。这时,制造过程要根据模型的要求进行制造。在这种场景下,所谓的“精度”是对制造过程的要求,而不是评价模型的指标。换句话说,人们关心制造精度,却并不太关心“模型精度”。我们知道:计算机能力弱或者存储量不大时,模型的应用就会受到限制。所以,计算和存储能力的提升,以及在此基础上的算法进步,都会显著促进(这种)模型的发展。
另一种是“先有物理实体,后有模型”或者“物理实体出现后,需要对模型进行修正”。比如,为了便于优化生产和控制,对生产设备建立模型。比如各种数据建模。这时,建模的目标之一是往模型的计算结果逼近物理对象。如果模型的精度不高,就可能无法用于“特定目标”。特别地,物理实体在运行过程中,许多因素会导致物理对象的属性发生改变。这也可能引发模型精度的变化,并导致模型无法有效使用。在工业领域,所谓的“机器学习”,其实往往就是用来应对实体的这种变化,而不是所谓的建模。
在这种场景下,模型精度足够高、足够稳定是应用的基础;模型精度不高时,算力提升的作用有限。而且,在许多场景下,算力提升对提高精度的作用不大。这时,解决模型精度的关键,是提高数据的质量。当然,大数据基础有助于数据质量的提升。
两种模型还有一些重要的区别:前面一种模型描述的,往往是物理实体的属性;后一种模型描述的,往往是物理对象的输入输出关系。第一种模型关注的是“预料之中”的事情,而人们经常希望用第二种模型处理“预料之外”的事情。两种模型的关注重点也是不一样的。
我发现一个问题:许多人谈模型的时候,其实是把两种“模型”的概念混淆了。比如,有人认为:建立了模型之后,就可以把模型用于生产优化。其实,前面谈的“建立模型”指的是第一种模型,而应用模型指的是第二种模型。但他们很自然地以为,只要前面建模好了,到了应用的时候自然就有了模型。岂不知,有了第一种模型,不一定会有第二种模型。再如,他们知道:算力和算法对解决第一种模型的意义重大,他就认为算力和算法能够解决所有模型相关的问题。于是,一个看起来无懈可击的逻辑,其实是走不通的。
许多人对CPS或数字孪生的误解,也来自于这种模糊的认识。
有人认为,只要有了第一种模型,就容易建立CPS或者数字孪生,进而把CPS或数字孪生用于生产的管控。但他们没有意识到:前面是一种模型,后面需要的往往是第二种模型。于是,许多地方建立了好看而无用的数字孪生,而这些技术往往只能用来展示。
CPS或者数字孪生中需要模型。模型也要按照前面的定义去做:为了特定应用目标,对实体进行的简化描述。所以,建立模型之前,要搞清楚“特定应用目标”到底是什么?否则,目标就成了给别人演示、好看不中用。
最近我想,建立数字孪生的常见的用途(目标)有两种。一种比较简单,主要便于开发和维护人员;第二种则是用于智能控制。
第一种数字孪生的本质是数据的组织方式,是便于人类来用数据。这时,数字孪生的概念与程序设计中的“对象”差不多,便于开发人员使用数据进行开发和维护。
第二种场景是进行复杂的自动化生产,是便于机器用数据。这时,计算机必须知道加工对象的位置和状态,这些参数来自数字孪生。
比如,用在产品种类和加工方法频繁切换的自动化产线(其实就是智能化产线)。在这种产线上,机器需要进行不同的加工并随时切换加工参数。显然,机器要知道现在被加工的零件是什么、甚至要精确知道摆放的角度等参数。这时就可以用数字孪生来描述零件和产品的若干属性。
我们注意到:如果工厂的物流运输不是全自动化的,计算机甚至都不能准确知道零件当前的位置,自然也就不能自动加工。所以,采用数字孪生的一个重要基础,往往是厂内物流的高度自动化。我参观过许多企业,对多数企业来说,往往是做不到的。另外,如果加工过程不是足够复杂,这种技术其实也是没有必要的。
这大概就是这种技术应用不太广泛的原因。