首页/文章/ 详情

智能与随机性杂谈

1年前浏览792

假如我们能够深入、细致地观察一个没有生命的星球,就会发现:星球上发生的事情,几乎都可以用物理定律来解释、甚至预测。比如,一块石头从山上滚落,往往可以这样解释:温度变化导致石头产生热疲劳并导致强度降低;当强度不足以抵抗重力的时候,石头就掉下来了。

但回到地球上,情况就不一样了。比如:我在书房坐久了,突然想动一动。于是开车到了附近超市,顺便买了袋大米回来。这件事情的起源是我脑子中的想法,就很难用基本的物理学原理来预测了。对外在的研究者来说,随机不确定性大大增加了。这就是有智能和无智能的区别。

没有人能够违反物理定律。但在遵从物理规律的前提下,人类似乎拥有决策和行动的自由度。年轻时我就曾经困惑:“我想到”这件事本身,是人真正能决定的,还是一种由物理规律决定的必然结果?换句话说,“我想”的过程其实像计算机运算那样,只是按照既定的代码进行运算。只是人脑比计算机高级一点:“代码”会在学习和实践中变化,但这种变化也是按照自然界的代码运行的。如果是这样,看似可以自我控制的“我想”,其实就是一种错觉。

这些问题最终归结为:有没有独立于物理学定律之外的、真正的随机性?如果随机性不受(必然性的)物理规律约束,是否可以等价于受“上帝”指派?这种“上帝”是否在人类的大脑中?量子力学发现,客观世界中有真正的随机性。这使得人类的哲学思考,有了科学的依据。这对人类认知的冲击,可见一斑。

工程技术中的“随机问题”,一般上升不到这个高度。现实中的“随机性”往往是“伪随机”。有的是非线性导致的“伪随机”,有的则是信息不足导致的“伪随机”。而“信息不足”往往是影响因素多导致的。这些随机性,其实也是非常值得研究的。

世界上有很多人们不容易想清楚的事情。从数学的角度看,所有的困难和困惑,几乎都可以归结到三类问题:多变量、非线性、随机不确定性。世界的神奇和多样化,也可以归结到这三类问题。人工智能与大数据有许多有趣的应用,也不例外。

先来看看非线性问题。

我曾经发现:数学系四年学的东西,几乎都与“线性”相关:高等代数的主要是线性代数、微分方程基本上是线性微分方程、泛函分析主要是线性泛函分析。线性方法之所以被人喜欢,不仅是因为它简单,还因为它可以用来解决一些非线性问题。比如,微积分就是对非线性问题的局部系线性化。

老子说:“物极必反”。这句话可以理解为:世界是非线性的。线性本质上只是一种局部的近似。非线性带来很多奇妙的现象(如混沌现象),难以用常规的方法研究。混沌现象和随机现象是非常类似的。我曾经对非线性问题很感兴趣,.博士论文就研究“非线性控制”。但后来发现:这个领域实在是太难了,我的智商根本应对不了。

再来看看多变量问题。

从中学到大学,我们学习了很多科学原理。这些科学原理有个共同的特点:变量个数很少。比如,牛顿第二定律只是表述了三个变量之间的关系。是不是世界上所有的科学原理,都可以表述成少数变量之间的关系呢?似乎是这样的。有人说,最令物理学家难以理解的问题之一就是:物理规律都是简单的、是可以理解的。

物理学原理是简单的,因为针对的是简单抽象的对象。

但简单抽象对象可以构成复杂的现实世界。这就好比,用0和1可以写出计算机中所有的代码和数据。所以,现实中的因果关系就非常复杂:一件事件的产生往往由多个原因导致、又会进一步影响其他事件的发生。导致一件事发生的原因中,又有很多层次:包括直接原因、间接原因、间接原因的原因....于是,问题就变得复杂了。

面对复杂问题时,人们需要知道:什么样的手段会导致什么结果。比如,吃什么药能把病治好、如何加合金能让材料具备理想的性能、怎样的政策能提振经济。面对这类问题时,任何一种做法都可能涉及到复杂、多样的作用机制。最终的结果却决定于多种机制综合性、定量的结果。所以,即便人们能看到每一种作用机制、也能把每种作用机制定性地说清楚,也不一定能根据这些机制预测最终的结果。

举个例子:对某种钢来说,增加碳含量会降低强度。很多钢铁专家认为不可理解。事实上,碳通过两种机制影响强度,而且都是使得强度增加。但是,其中一种碳含量的作用是非线性的,有“物极必反”、“过犹不及”的现象。于是,在某种特殊的情况下,碳含量的增加会降低强度。所以,所谓的“不理解”是:明白了定性却没有搞清楚定量。

医学家、社会学家、经济学家都需要研究这类复杂问题。他们研究问题的方法往往分成几步:发现一种现象(经验知识)、提出因果关系假设、验证这种因果关系。其中,验证过程往往要用数据说话,才具有科学性。比如,70年代后期开始,中国经济开始步入高速发展阶段。对于这种现象,不同人有不同的解释。比如,有人认为:农业丰收是WG期间发展化肥厂的结果。周其仁先生则采用了详实的数据,用数据证明这是改革开放的结果。可以说,如果没有数据,就没有科学的结论、就无法揭示真相。

世界上复杂的问题很多。对应这些问题,人们往往会有些经验。同学曾经说过一件事:老警察到公共汽车上一看,基本上就能看出谁是小偷。我小时候有个特殊的本事:看到地下的裂缝,就能判断下面有没有蘑菇。这些知识都是确实存在的,但却很难把“因果链”说清楚。

最后,再看看随机不确定性。

在大多数工程技术问题上,我们遇到的随机不确定性并非是真正的随机,而是一种“伪随机”。非线性和多变量会让问题变得复杂、人们难以获得必要的知识和信息,常规的科学研究方法变得失效、结果变得难以预测。给我们的感觉就是随机不确定性。

我们知道:信息技术往往用来应对随机不确定性。应对的办法有两种。一种与信息有关:

通过获得必要的信息,把不确定性问题变成确定性问题,或者把确定性低的变成确定性高的。一种与知识有关:通过提升获取知识的能力,把原本(因缺乏知识导致的)不确定性问题转化成确定性问题。现实中,前者往往比后者更具有普适性,但学术界往往更关心后者。

人工智能、大数据分析就是获取知识的技术。但这些方法获取的知识,往往不同于常规的科学知识,而是更加接近人的经验和认识。这些知识中,有些是复杂的知识,有些与人相关。比如,张小姐喜欢穿白裙子,李先生喜欢吃萝卜。正如前面所说的,这些“知识”实在难以用常规的科学知识来解释。但是,换个角度看:人工智能、大数据分析开始进入了过去传统科学研究难以进入的领域。不妨称之为“读心术”。这种“读心术”在销售、娱乐领域很有用,但在生产领域的价值相对较小。原因很简单:工厂里面的知识,几乎都是可以用物理原理解释的。工厂里所谓的智能,主要就是我说的“吴淑珍式的智能”、“小秘书式的智能”,也就是专家知识软件化。

我们前面曾经谈到:在医学、经济学、材料学等领域,人们其实早就从事“从经验到知识”的研究了。但这些研究往往要付出巨大的时间和成本。在现实中,有些知识并不值得这么做。这就如同我前面说到的例子:我小时候看到地上的裂纹,就知道下面有没有蘑菇。现在用人工智能、大数据的方法研究的问题,往往也是过去“不值得人类研究”的问题。如果从经济角度看,AI、大数据的作用在于提高了人类获取知识的效率、降低了获取知识的成本,从而提高了知识生产的经济性。

显然,这样的基本可以归结为算力的进步、数据的增多。因为计算机用的往往是些笨办法。过去的人即便想得到方向,也没有办法实现。30年前,混沌和分形理论热的时候,也是因为计算机的计算能够超出人的想象和计算能。于是,算力和数据的提升把我们带入了一片处女地。现在研究算法的人,本质上是提高算法的效率、降低对数据本身的依赖性。

经验知识的一个重要缺陷是可靠度低、应用范围模糊。所以,科学家往往不满足于经验知识,而是要对经验进行科学研究。研究的过程,本质上是用基本的科学机理,把复杂的因果关系解析、论证清楚。这个过程需要许多领域之外的知识、信息或者数据。难度要大很多。维纳说:“人有人的用处”。在这些领域,人类比机器强多了。

最近,国内有位大学者说,AI的发展方向是可解释性。在我看来,这种观点与“医学的目标是长生不老”有的一比。理想的东西想想可以。在没有手段、条件和思路的前提下,如果把理想当成现实去做,基本上是浪费生命。总之,国内许多专家喜欢提出夺人眼球的观点。如果要用他们的办法干活吃饭,差不多就会饿死。

来源:蝈蝈创新随笔
疲劳非线性汽车农业裂纹理论材料控制工厂人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2023-07-23
最近编辑:1年前
蝈蝈创新随笔
只是把思考的日志搬运,不当之处...
获赞 93粉丝 15文章 1159课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈