有人认为:收集大量的高频数据,就构成工业大数据了。岂不知:高频数据可以让数据量很大,却未必是有用的。要让工业大数据蕴含价值,关键在于数据的完整性。
完整就是要求对相关过程的可追溯。当发生一个与质量、安全、故障、能耗相关的事件时,能够用数据复现当时的原因。信息充分时,事件的发生可以看做确定性事件而不是随机事件。工业技术的分析和优化,应该建立在可追溯的基础上。
高频数据有没有用处,关键是对追溯的必要性。我们知道:高频数据往往来自于控制系统、目的是反应迅速及时;而分析某些重要事件的发生时,未必需要高频数据。
可追溯性最大的问题往往是数据不完整。数据不完整的原因很多:人工操作非数字化、人工记录不准确不及时(或故意不记、错记)、物料备件相关的不确定性、产品或中间品存储过程的信息缺失、数据对应误差大、数据获取过程本身的偏差等等。
要做到可追溯性往往很难的。前面说的这些过程,往往没有数据或者难以数字化,并不像高频数据那样存起来就行了。要想做到可追溯,需要在管理、流程方面下大工夫,还可能需要大量的投资、甚至需要机器代人。这大概才是用好工业大数据的现实阻力。