今天探望了我的师傅王洪水先生,王先生和我聊起上世纪宝钢建设信息系统的一些事情。我把这些工作用一个词来描述:打通。
王洪水先生
我曾用一句话概括数字化转型的本质:让机器多干活。按照现在的说法,机器干活用IT技术,活干的是OT的活。所以,数字化技术首先就是要把IT和OT融合起来。要做到这一点,需要用数据把OT描述清楚。
王先生说,当年最重要的工作之一就是建立数据词典。这是用IT表述OT的基础。这件事是需要花时间的,需要懂得工业的人来做。有了这个基础之后,宝钢曾经举行过一个仪式,公开烧毁纸质的台账,推动无纸化。当我们可以用数据描述企业运行了,后面的工作就好办了。
我们知道:IT用得好的企业,管理上一般都会比较规范。这种现象可以这样理解:如果管理不不规范,IT就无法准确地描述OT,信息世界和物理世界就无法对应起来。我们还发现:厂内物流自动化程度高的企业,容易推进数字化。同样是因为:自动化能够使得物流运行和数据采集比较规范。总之,企业的这些基础决定了能否“打通”。
当年何老先生推动“数据不落地”,把不同工序的数据串起来,是典型的信息流打通。“数据不落地”就是数据不经过人的干涉,从而可以保证数据的准确性。这样的目的,同样也是便于用IT描述OT。
数据不落地保证了信息的及时传递,也就是现在所说的信息集成。在工业互联网时代,工序之间的打通已经比较常见了。比如,纵向集成实现了生产过程和管理过程的打通,提升了企业的管理能力;推进“横向集成”实现跨企业的信息打通。
王先生还提到:当年他力主买一台高性能计算机,解决了复杂计算问题。在我看来,这属于另外一种“信息打通”。在我看来:如果信息不能及时处理,系统其实就无法发挥作用。只有当计算机的性能足够好时,才能实现这种“打通”。这种“打通”在离散制造业意义更大:当计算机的存储和数据传输能力足够强大时,可以把各个设计环节打通、把设计过程和制造过程打通、把研发设计和研发管理打通,甚至把用户需求、设计、制造和服务打通:这就是所谓“端到端集成”。从某种意义上说,“端到端集成”不仅是互联网技术发展导致的,还得益于计算和存储能力的增强。
“数字化就是让机器多干活”。机器多干活的关键是机器参与的决策。我认为,科学决策的基础可以用孙子的两句话概括:“知己知彼、百战不殆”;“多算胜少算不胜”。数字化网络化的作用,是让机器做到“知己知彼”;计算和存储性能的提升,让计算机做到“多算胜”。所以,数据的传递、存储和运算能力的提升,催生了数字化时代。数字化时代的外部条件具备了,基础技术都可以购买。企业自己该如何做才能不辜负这个时代?
现在看来,关键是解决以业务需求为导向的数据质量问题。强调“以需求为导向的数据质量”,指的是“质量需求”决定于、服务于应用场景,是有具体要求的、不是抽象的。否则,计算机和网络的能力再强也无法发挥作用。所以,“打通”工作的实质,就是让计算机能获得及时、准确、完整,且能被计算机理解的信息,以便于计算机及时做出决策。
如果数据质量不理想,“知己知彼”潜力变成了假的、不及时的、不完整的数据。这个时候“多算”的结果也不会正确。王先生和何老当年的工作,其实都是为了提高数据的质量。从某种意义上说,就是为“打通”做准备。
最后,我还和王先生谈起当年研究力学性能的事情。从数字化角度看,这件事能够做成主要有两个原因:
1、王先生建立的数据仓库,保存了数以百万计的检测数据。检测这些数据的成本就数以亿计。这些数据的质量很好,给后面的分析奠定了基础。什么叫质量好呢?就是影响质量的各种因素都记录下来了。也就是信息完整。
2、数据分析和建模工作。这项工作的实质困难是什么?仍然是数据质量问题。在建模过程中,影响产品质量的因素特别多。对建模来说,都会对建模过程带来系统干扰。幸运的是:这些干扰因素都记录下来了,就便于我们排除和研究系统干扰。另外,数据存在显著的随机干扰。而数据量大的好处,是帮助我们排除随机干扰。
从某种意义上说,数据分析的过程就是提高数据质量的过程。而收集数据时得到的数据质量,是数据分析的基础。数据分析的过程,是用数据描述物理规律的过程。如果分析师的脑子里,不能把数据空间和物理世界的逻辑打通,分析的效率和质量也就不会高。
与之相反,现在许多人的逻辑,不是在数据质量上下功夫、把基础工作做好,而是把算法搞复杂、越来越高级:线性回归不行,就采用人工神经元方法;普通的人工神经元方法做不好,就采用深度学习;深度学习方法不行,现在又来了大模型。
这种浮躁的做法,对工业是有害的。