人工智能有很多流派、各种说法和定义。早在几十年前,人们就把人工智能分成三个学派,分别称为符号主义、连接主义和行为主义。除此之外,还有各种不同的定义。学派和定义多了会把人搞糊涂,就要对概念本身做点思考。
我们要问:为什么这样划分学派、为什么没有其他学派?对此,钟信义先生从一个角度有点意思:他认为这三个学派其实都是模拟:模拟神经结构、大脑功能和动物行为。这个分类的视角很有启发性——三个学派其实是三个层次。
从工程师的角度讲,我们研究智能是有目的的:是为了应用、而不是玄乎的概念。古人讲究“知行合一”,就是“脑体的有效协同”、就是在行动总体现智能。所以,单纯从理念上说,“行为主义”是站在了智能概念的制高点上。但是,理念落地的时候会遇到一些困难,其中有些困难需要用模拟人的大脑功能来解决——这就是“符号主义”。但符号主义仍然有些问题难以解决。于是,学者们想到模拟大脑的结构,这就是“连接主义”。这大体就是三个学派的关系。由此可见,另外两个学派解决的主要是概念落地时面临的部分问题——所以,识别这两个学派时,不仅考虑目的还附带手段。换句话说:很多标准算法即便可以解决同样的问题,也往往不算作人工智能的范畴。
学派名称 | 别名 | 模仿对象 | 特征 | 代表成就 |
符号主义 | 计算机学派、 逻辑主义 | (大脑)功能 | 模拟人的逻辑推理能力。 | 深蓝 |
连接主义 | 生理学派、 ANN学派、 | (神经)结构 | 模拟人或动物神经系统的学习能力 | 阿尔法狗 |
行为主义 | 进化主义、 控制论学派 | (动物)行为 | 模拟动物感知、决策和动作的协同。 | 各种控制器 |
下面再详细地分析一下各个学派的关系。模拟智能行为的一个重要问题是如何决策。这是任何智能系统都不可避免的问题,行为主义也不例外。长期以来,行为主义(也就是控制论学派)是应用最广泛、影响力最大的一个学派,其影响力甚至远远超出了“人工智能”学科本身。究其原因是:该学派能够针对一类相当广泛的实际问题,找到一般性的解决方法。这就是反馈控制理论(经典控制论)和现代控制理论的内容。
但是,这两项控制论是有很大局限性的。现实中最主要的局限性是对象模型一般要用常微分方程组来描述——这种对象适合于动态系统的变化范围不大的情况,其控制器可以用电感、电阻和电容等电子线路来搭建。在控制论刚刚出现时(甚至在我读大学时),这都是一个极大的优势:可以落地。
但无论如何,这种模型是有局限性的,难以用于复杂非线性、离散或者混杂系统。对于复杂的系统,其实也有一般性的解决方法:数学模型——因为几乎任何对象都可以建立数学模型。数学模型有这么大的好处,但也有不足:其广泛应用要等到计算机性能足够好以后才逐步步入历史舞台,否则就会受到极大的约束——20年前我刚到宝钢时,就能体会到这种约束、稍微复杂一点就不能实时计算。现在,这个约束没有了,CPS就呼之欲出了。CPS之所以受到重视,就是因为这种技术具备高度的一般性、能解决各种问题。现在成为热点的原因是计算、存储、传输数据的能力不再是瓶颈,其价值就会被释放出来——此外,我常常强调问题的另外一面:广泛应用的另外一个条件是实际问题需要足够的复杂才行,否则就是“高射炮打蚊子”,没有多大必要性。而智能制造和工业互联网的应用,恰恰就让这种必要性体现出来了。这就是我常说的:要想雪中送炭,也得先有下雪的地方。
说数学模型是一种一般性办法,是指它有能力为所有对象建模。但在实际应用过程中,数学模型却不是那么容易建的——不像常微分方程组那样有成熟的、一般性的办法。实际操作的时候可谓“八仙过海各显神通”。而逻辑规则就是一种简单而常用的模型,很多决策可以用逻辑规则来解决。在写程序的时候,往往就是用IF语句这类土办法来解决的。如果这种逻辑关系简单,理论上也就没什么好研究的了。学者们总要找一些难题来解决——如何解决复杂推理问题。为此,若干年前出现了Prolog和LISP语言,相关理论也就被称作人工智能或专家系统,也就是所谓的“符号学派”或“计算机学派”。从本质上说,这些系统就是逻辑推理复杂了一点,和多用几条IF语句没有多大区别。所以,若干年前就有人用把有三条IF语句的算法成为“智能控制”——道理是对的,大家笑话他的原因是有点夸张。
我曾经很奇怪:符号学派为什么没有发展起来。后来意识到,一个重要的原因是:对于具体问题,人们完全可以用普通的计算机语言来编程序、具体问题具体分析,没有必要绕个大弯子。也就是说,合适的应用场景少了:你是想“雪中送炭”,怎耐没有下雪的地方。
讲到这里大家应该明白:符号学派是当初是解决相对复杂的、传统控制论方法难以解决的决策推理才提出来的——如果太简单了也就没有必要了。同样,连接学派是因为符号学派解决不了的问题才提出来的。我们知道:人的很多知识是感性认识,很难表达出来、自然也就很难编码。比如,“张三很漂亮”、“衡水老白干好喝”、“这是一棵樟树”、“这步棋很重要”。这些感觉性的东西都是很难用编码的办法表达的。于是,才有了“连接学派”的用武之地——其特点就是机器自己学习。机器学习会遇到新的问题:有没有条件学好、如何学好?其实,大数据解决了有没有条件学好的问题、深度学习解决了如何学好的问题。
从我们工程师的角度看,我们做事是为了解决问题的。什么办法最好用就用什么办法。比如,我们造飞机是为了起飞、需要模仿飞鸟。但是,飞机却没有模仿鸟类扑扇翅膀。所以,模仿是为了追求目标的搭成,而未必是手段的一模一样。这样看来,三个学派的关系就清晰了:模拟神经元的结构是为了模仿大脑的功能,但实现大脑的推理过程未必需要神经元这种结构。同样,实现人或动物的行为,未必需要模仿大脑的复杂功能。所以,行为学派是最本质的——虽然从算法的角度看,似乎不太怎么像“智能”。提到Artificial Intelligent时,人们常常并不包括控制论学派、而是主要针对另外两个学派——这是从学问角度看问题,而不是从解决问题的角度看问题。但智能制造、CPS的很多理念,就是从控制论学派发展而来的。
我一直认为,智能与工业界的结合,多数情况下并不是现在流行的人工智能(即与深度学习相关的智能),而是用计算机代码写出来,形象地说就是“用N条IF语句”或者是我常说的“吴淑珍式的智能”。人们过去并非不知道这么做,而是问题不够复杂。是智能制造的复杂性逼迫人们把自己的做法告诉计算机,让机器快速决策,也就是必要性增加了。这个道理我说过很多次了:人在制造环节中最重要的要求是规范化、而不是自由发挥,关键就是要说明白在什么条件下怎么做。
当然,现在流行的人工智能当然也有用,主要用于产品质量的检测(主要是图像)、设备诊断和服务等场合,而不是生产制造的控制环节。
很多人认为,“通过模仿结构实现模仿功能、再模仿功能”是一条不错的路子。所以,科学院的很多人花了很大力气去研究人的大脑。这种事科学家可以做,企业不能做:投入产出不合算。对企业来说,就是要用最有效的办法解决问题。比如,如果人的知识能够通过代码写下来,就不一定要让机器去自己学习。
我们再把眼光放大一点:智能就一定要模拟人脑吗?也不一定。因为计算机处理信息的方式和人不一样,为了达到智能的目的,不一定要模拟人的思维方式。计算机的存储和运算能力是人类不能比的,对人来说的很多“笨办法”可以被计算机运用得出神入化——在我看来,大数据就是一种不同于人类常规思维方式的智能。我把大数据的思维方式提炼为:把成功或者失败的案例记下来,跟着学(避免)就是了。显然,当数据量非常大的时候,人类的大脑是不可能记住这么多案例的。换句话说,智能不一定模仿人的思维方式。
走向智能从书的编委们曾经一起写过一本《三体智能革命》的书。在这本书中,我们用20字箴言来描述智能:状态感知、实时分析、自主决策、精准执行、学习提升。这20个字是从功能模拟为出发点,解析出对功能的需求,并不受限与具体的结构和功能模拟方法:因为我们的目的是应用,何必被手段来束缚呢?
按照学术界的观点,智能是用来处理复杂问题的、处理普通算法无法解决的问题。否则就不要叫人工智能了。从这个角度看问题,有人提出了对智能的一种观点:智能是在巨大的搜索空间中迅速找到较优解的能力。显然,人工智能的两个主要学派常常是具有这个能力的。我们注意到:不论是图像、语音识别还是阿尔法狗下棋,都需要“在巨大的搜索空间中迅速找到较优解的能力”。事实上,谷歌公司在成立之初,就把自己定位为人工智能公司——或许就是借鉴了这种定义。从某种意义上说,这是从大脑的“行为”来定义智能的。大数据的很多算法,就符合这种定义。
最后讨论一个问题:智能为什么重要?我有个观点,可以与ICT技术起来说:
互联网为什么重要?因为互联网可以让我们离开物理空间——通过控制Cyber空间,来控制物理空间。
智能为什么重要?因为智能可以让我们离开Cyber空间,让计算机做得更好、让人去做更重要的事情。
大数据为什么重要?因为能够保证以上两点的落地。
对于我们工程师来说,不论办法土不土,达到目的就好;特别地,不要把问题想得太玄了。想得太玄、把自己下着了,就做不成事了。