2017年5月27日,乌镇围棋峰会的最后一天,万众瞩目的柯洁与阿尔法狗的最后一场对决,人类围棋第一人柯洁九段使出全身解数仍无济于事投子认负,本次人机大战最终以柯洁三连败告终。这不禁让人想起了远在二十年前的1997年,国际象棋大师等级分排在世界第一的棋手加里.卡斯帕罗夫输给IBM的深蓝计算机。虽然,国际象棋人类输给了计算机,但人们认为围棋计算机想战胜人类是不可能的。虽然围棋的规则很简单,就九句话,但它的变化比撒哈拉沙漠的沙子还要多,围棋的变化是10的808次方,每一步棋的复杂组合,远远超过人类的想象。在人工智能领域,想战胜围棋是十分困难的。最后,阿尔法狗还是胜了,而且还是以压倒性的优势胜的,柯洁用了不同的战术还是败了。
其实,深蓝和阿尔法狗是两回事,深蓝的胜利只是使用了定制硬件,基本上装入了国际象棋的所有变化,所以只能说用了蛮力,离开了国际象棋领域就没什么用了。阿尔法狗的技术优势就是深度学习能力,深蓝国际象棋大师靠的是强大的计算能力。阿尔法狗开始的时候根本就不知道围棋是什么,它是通过不断与人对弈而不断的学习,从而最终打败了围棋最顶级的高手。深蓝和阿尔法狗代表着人工智能的两个阵营,一个是规则式的,一个是模仿人脑构建类似生物神经元的结构。可能说道这里,大家还是不太明白两者的区别,下面就通过一个简单的例子加以说明。榴莲是我的最爱,那怎么能让计算机辨别出一张图片里有没有榴莲呢?第一种规则式的方法,会列出很多条件告诉计算机,比如一个圆形的物体上有很多刺,有这些条件的图片里就有榴莲。第二种方法要给计算机录入成百上千张图片,并告诉计算机那些里面有榴莲,那些里面没有,让计算机根据这些数据做求同的筛选。并不断的让计算机对新的图片进行判断有没有榴莲, 这个过程就是深度学习的过程。图片数据越多,计算机判断的准确率就越高。
21世纪之前的计算机的计算能力是无法满足深度学习的计算和存储体量的。所以,人工智能的研究一度停滞,但随着计算机性能的不断提升,并找到了在人工神经网络中新增神经元的方法,这使得人工智能得到了更快的发展。
所谓深度学习,就是算法使用了大量来自特定领域的数据,为想要的结果做出决策,让计算机利用这些数据,训练自己识别数据的能力。刚才榴莲的例子,让计算机自己去总结那些数据特征里有榴莲那些没有,从而通过强大的数据库,产生大量的关联性知识库。大量的数据、强大的算法和足够细化的领域明确的目标,成为深度学习的三个条件。
大数据和人工智能其实早已在我们的生活中得到了广泛的应用。几年前在传统的快递物流仓库,物流人员开着小车穿梭在一排排的货架之间,取货装箱全靠人工完成。但现在无论是国外的亚马逊还是国内的京东,全是甲虫机器人驮着货物来回的奔跑。这些机器人高速穿梭于不规则的路线,行驶过程中还要躲避障碍物和其他的机器人,这些全靠传感器和和算法实现。在我们的生活中,应用场景的复杂程度远超工厂,扫地机器人就是人工智能技术的初级产品。
汽车自动驾驶也非常符合人工智能的技术特征,其背后也要有大量的数据进行支撑。谷歌花了八年时间收集了800万英里的现实道路驾驶数据。而特斯拉已经上路了,所以它的数据更多,两年就收集了1亿英里的数据。这也是为什么这两家公司能跑在无人驾驶技术的前列,而不是传统的汽车公司,就是因为它们掌握了大量的数据。
今日头条、抖音和一些电商,也是根据用户的使用习惯,通过算法推送给你,实现千人千面。所以,我们享受娱乐购物等便利的同时。个人资料生活习惯等隐私也同时被大量的收集,有时计算机可能比你自己更了解你自己。以后的世界是一个透明的社会,人与人之间没有隐私可言,个人信用就会变得十分重要。在未来的几十年大数据时代将会到来,谁拥有数据谁就是王者。大数据理论的科学基础就是信息论,利用信息消除各种不确定性。大数据理论不仅仅是一种技术手段,而且是一种方法论,我们必须摒弃那种依靠规则强调因果关系的机械的做事方式,变成利用数据信息解决问题的方式。
西方虽然点燃了人工智能革命的火炬,但很可能最大的受益者是中国。因为,谁有更多的数据,谁有更多的应用场景,谁就能获得更强大的人工智能。中国虽然在技术上落后美国,但中国人在具体干活,而美国人提供知识和技术,这也就意味着实干越多的中国获得的数据也就越精确。深度学习的关键在于数据,在计算能力越来越强大的今天,输入的数据越多,变现就会越好。这将迅速抹平中美之间的技术差距,机器可以学习了,我们的劣势瞬间就会变成优势。
利用大数据实现人工智能,将会给我们带来很多便利。但这也是一把双刃剑。人工智能势必会减少结业机会,而且冲击可能马上就会到来,甚至比我们想象的还要快。大多数人类是否会像赫拉利的《未来简史》描述那样变成无用之人呢?这一话题留着我们以后再讨论吧。
关于大数据和人工智能大家有什么想法,可以踊跃留言,让我们一起学习一起提高。