人们常说世界是三维的。其实,大家指的是物理空间是三维的。如果增加物质属性,就远不止三维了。例如,如果在设备上安装N个实时传感器,则设备的信息就是N维的。
眼球视网膜得到的信息是三维的(两维加颜色),耳朵听到的声音是一维。依靠传感器,人们可以得到更多维的信息。所以,人类获得的信息是多维的。但人类的语言(包括计算机语言)是一维的,语言用到的概念(或变量)则是零维的。这件事会引发麻烦。比如,某些知识难以用语言或者程序表达。
能用语言、文字、程序表达的知识和信息,往往都要基于零维的“概念”。科学知识、法律法规等讲述的都是概念之间的联系或者规则。概念清楚了,才能与规则联系起来。
例如,法官宣判:“根据刑法某条,判处杀人犯张三死刑”。在这里,法官把“张三”纳入“杀人犯”的概念,就可以与法律条文对应了。
人或者动物,往往要把多维的信息转化成零维的概念,才能进行决策并采取行动。仅仅有多维的信息而没有与概念关联,未必能用于决策。
牛犊见到老虎时,看到了老虎的图像信息。但牛犊并不害怕老虎。因为牛犊并没有形成“老虎”的概念、不知道它能吃掉自己。医生看病时要测量和检查病人的多维信息,他要把这些信息归结到具体的“病”的概念,才能开出药方。
从多维的信息转化成零维概念的过程,其实就是“认知过程”。图像识别就是典型的认知过程。例如,通过一张照片,认出图像中关注的对象:某个人、某种动植物或某种质量缺陷。
“符号学派”是人工智能最经典的学派。这个学派把智能理解为符号的推理,其实就是计算概念之间的关系。但这个学派并不涉及人类的认知能力,从而有明显的短板。所以,才有了后来的连接学派(人工神经元),来解决这个问题。
如前所述:人类在思考问题时,往往要把多维信息转化成零维的概念(认知),才能与科学知识与规则结合在一起。但是不是一定要这么做呢?也不一定。
直觉就是一种例外。基于直觉的决策,是根据一种说不清、道不明的原因做出的。决策的人或许并没有形成什么概念,而是直接根据“多维信息”采取行动。当然,“直觉”也可以看成形成了某种模糊的、尚未明确命名的“概念”。
这种决策机制,就比较难以用传统的办法编程序。如果想模拟这种直觉机制,或许需要首先进行自动的模式分类,再基于分类结果进行决策。但直觉有一个毛病,就是“不靠谱”。工业人不喜欢不靠谱的东西,但“不靠谱”东西会有一定的用处:用来触发靠谱的办法来检查、分析,做出决策。
我觉得,工业智能化的主要方向还是应该发展“认知”能力。但是,不要把工业中的“认知算法”想得过于复杂。比如,一台设备的震动频率过大、超出常规的范围,就可以被“认知”为“不正常”。这时,就可以提醒工人去检查一下。
我认为:针对工业对象的认知,主要就是区分“正常、不正常”。只要数据能够做到及时、完整、准确,这种认知往往就不困难。这个过程中,主要的技术是对数据的滤波和对场景的分类。其中,场景分类往往特别重要:因为“正常”与否与场景和其他参数有关的。比如,1.4的个头对10岁的孩子正常,对5岁的孩子就不正常。如何对场景进行分类,可以参照技术人员的经验。
---------------------------------------------------------------------------------------------
版权声明:
原创文章,作者郭朝晖,来源蝈蝈创新随笔,本文已经授权,欢迎分享,如需转载请联系作者。