工业大数据时代的建模技术与艺术

1年前浏览227

讨论技术问题时，常常会问：“A增加1时，B会增大多少？”。这个问题背后，其实反映了人们习惯的一种“线性思维”。微积分中的“导数”就体现了这种思维。严格来讲，这种思维是有局限性的，存在“不可导”的现象。然而，大多数的现实问题在多数情况下是“可导”的。这种普遍性的存在，是“微积分”能成为重要的数学分支的原因。

运筹学中有个著名的方法叫做“线性规划”。这个方法是美国人丹齐克(DantzingDantzing)提出的。当他介绍这个方法时，受到有位著名数学家的质疑：世界是非线性的，线性规划有什么用？对于这个问题，年轻的丹齐克被问懵掉了，站在台上说不出话。这时，听众中有位长者举手，代他回答这个问题：“如果你遇到的问题是线性的，你就用这个办法；如果不是，你再想别的办法。”而这位长者就是著名数学家冯.诺依曼。

线性与非线性的矛盾一直困扰着人们。但是，两者却也能有机地结合。我们知道：微积分适合大量的非线性函数。两者的关系是：“可导”是局部的特点，“非线性”是大尺度或全局性的特点。事实上，数学和工程科学上遇到非线性问题，往往会被人们转化成某种意义下的线性问题——线性特点实在是太好了，离开这个特点的研究几乎寸步难行。

这个困惑同样也摆在工程师面前。

工业上绝大多数问题都是非线性的：比如钢材的成分、工艺参数与性能之间的关系就是非线性的。如果工程对象是线性的，数据建模就是非常方便的——只要线性回归就可以了。然而，现实中的模型往往既不是线性的、还不知道该如何描述非线性。

这就是数据建模的困惑和魅力所在。

我常说：理论是解决方向性的问题。其实，只有当我们遇到非线性问题时，“方向性”才是个问题。然而，解决“方向性问题”的方法，往往不能解决“落地的问题”。因为落地的问题往往是细活——所谓细节决定成败。具体到模型，往往是精度决定好坏。

某种意义上说，工业对象的建模是一门艺术：是“方向性问题”和“落地问题”的融合。

昨天在攀枝花，我把建模问题比作“打高尔夫球”。打球可能会分成几个阶段：首先用力打、把球打到一个差不多的地方。接着要瞄准方向、用好力气，甚至可能要经过几次调整，直到把球打进洞里。

对于工业过程的建模，一般也要先找到一个差不多的初始工作点：这个工作点一般是通过经验和宏观的理论得到的——有经验的专家脑子中中往往有一个说不清楚的非线性模型。有了这个“工作点”以后，大尺度的全局问题就变成了小尺度的局部问题，就可以近似“线性”了。人们再在这个工作点附近进行实验、调整，就容易多了。而工程师的水平在于可通过比较少的实验来解决问题。

控制论之父维纳有个著名的思想：“反馈修正”。他认为模型总是有误差的，关键是要进行修正。在修正的过程中，方向往往是理论给出的，而修订的大小却往往要用数据进行修正。我的经验是：数据建模切忌“急于求成”，希望有个好的模型一下子解决问题。一个好的模型一定是通过反复修正得到的，关键的问题是如何反复修正、如何尽量少的修正。换句话说，数据建模来不得“大跃进式”的急功近利。善于反复修正，才体现工匠的水平和精神。

现实中，如果不依靠人的经验，往往很难用理论和数据来摸索到这个比较好的“初始工作点”。进一步利用理论和数据建立模型，往往能做得比人更好。这就是数据建模的价值所在。

而大数据的作用，往往能把以往人的成功经验用数据记录下来，自动地找到一个比较好的“初始工作点”。我们不必关心经验怎么来的，这就是大数据“不纠结于因果”。由于大数据具有“样本=全体”的特点，无论各种情况，好的初始工作点几乎总能找到。而数据涉及到各种方面的信息、容易帮助人们找对，这就是大数据“混杂性”带来的优势。这就是大数据（数据的二次应用）对建模的作用。

来源：蝈蝈创新随笔

非线性理论控制

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2023-07-22

工业大数据时代的建模技术与艺术

《智能驾驶—产品设计与评价》：教你如何从用户角度，系统深入地评价智能驾驶

基于OpenFoam和AI机器学习14讲：使用人工智能建立流体力学中的数据驱动模型

杨继深：接地对电磁兼容性的影响到底有多大(报告回放)

2022第四届中国仿真技术应用大会-复合材料专题论坛（回放）

2022轨道交通技术学习月：先进的轨道交通设计标准、试验和仿真

ABAQUS高级接触分析精讲

ABAQUS求解器从入门到精通

昆明理工大学吴顺川教授：新形态《岩石力学》教材编写经验与交流（直播回放）