我过去讲工业大数据,都是我非常熟悉的领域:从数据中发现知识。但我隐约感到:这并不是工业大数据的全部,我甚至搞不清它在工业大数据中的地位。为了搞清这个问题,我翻阅了一些资料,希望得到权威性或者总结性的说法。
但总体的感觉是:大家的认识都比较凌乱。所以,只好自己理一下思路。
有人把工业大数据的地位抬得很高,认为是智能制造的基础。但我觉得,把“大数据”换成“数字化”或许更加妥当:数字化是智能制造的基础。如果数据是在业务系统中产生、在业务系统中使用,的确是支撑智能制造的。在业务系统中,数据价值的体现是自然的,总感觉没有必要强调“大”字。
有一种观点:大数据是业务系统所产生数据的二次利用。可以形象地说,大数据就是原来当做废料的数据,现在要用起来了——如果这样看待的话,大数据的核心问题就是发现知识、关联和信息:也就是开头说的问题。
但是,这个观点似乎有点狭隘。我感觉,大数据时代,数据采集和存储成本下降,会导致一些新的业务系统出现。这些业务系统的作用在过去是不显著的,但在互联网背景下的作用会上升。
我感觉,这类系统的功能定位应该是的监控和回溯。
有人会说:过程监控和回溯,不是什么新的东西(1990~1994 年我本人就开发过4个监控系统)。的确。其实,任何有价值的系统都会有“原型”存在,但随着历史的发展,其内涵会不断丰富、作用会不断加大。比如,监督能力显著提升:通过透明化、提高协同能力,可以减少猫腻、提高管理水平,有利于推进少人化、无人化,为智能制造的推动保驾护航。
搞信息系统有个原则:系统开发以业务清晰为基础,否则不知道怎么入手。数据仓库系统其实就有这样的问题。现在很多人困惑的是:大数据系统是干什么的。如果给出了这种定位,工业大数据系统的业务就相对清晰化了,做起来目标也就清晰了。
这样以来,工业大数据系统的技术工作大概有两个方面,它们都是围绕着“知识”来的:离线分析数据得到知识是一个方面,将知识嵌入在线大数据系统是另外一个方面。在此基础上,可以讨论工业大数据和一般商务大数据的不同。
这样想的话,对工业大数据的整体轮廓似乎清晰了一些。