首页/文章/ 详情

自动驾驶规模化落地的“三座大山”

2年前浏览551

1.jpeg

图片来源视觉中国

深度学习技术很玄幻。它不可解释,又蕴含人生哲学。

比如它需要喂大量的感知数据,且数据的质量直接影响算法精度。对比我们为人,多与优秀、厚德之人交友,更能提升修养——也解释了环境为何能影响人。

数据是机器认知世界的“粮食”,算法就像大脑和思维方式,算力如身体。如果你有强大的脑力,但缺乏强壮的体魄,再好的算法亦如过眼云烟。中国的传统思想很强调提升个人思想与修养,但体魄是我们实现这些的基础。

算法又与人类解决实际问题很相通,比如计算机的车牌检测是一种算法,垃圾检测是一种算法,识别犯罪团伙也是一种算法,医学影像又是一种算法……计算机处理大事小事均有不同类型的算法。相比较人类,处理工作当中的人际关系是一种算法,财务管理是一种算法,写代码是一种算法……方式方法分门别类。反之推理,人类要更好解决问题,可参考计算机的认知世界的模式:不断寻找和优化最好的方式方法,就像算法迭代和升级那样。

为何要讲深度学习与人类处理实际问题的关联?因为本文涉及自动驾驶技术发展的面临的关键问题:伦理道德。在讨论这个问题之前,须先探讨行业面临的关键技术难题,自动驾驶规模化商业落地,技术才是源头和根本。

视觉技术:自动驾驶破局的核心

如果站在未来回顾科技发展,2021年一定很特别,这一年,世界与中国都发生了深刻变革。全球气候危机逼近,新冠疫情关键转折,中国生育率首次低于日本,互联网巨头垄断时代落幕,汽车产业也到了巨变的前夜。

2021年,也是移动互联网时代的结束,一个全新的硬科技创新的周期敲响钟声了。在这个新的技术周期里,自动驾驶如灿烂星空的一道耀眼的光。

今年,大量车厂发布了L3和L2自动驾驶解决方案,接下来将有大量带着这些解决方案的车在路上跑。2021年也被称为自动驾驶元年。

特斯拉CEO埃隆·马斯克在2021年新能源世界大会上说,“特斯拉相信自动辅助驾驶可以完全通过视觉神经网络来实现,因为人就是生物意义上的视觉神经网络驾驶的,所以计算机也一定可以。”

与人类一样,机器感知世界最重要的方式就是视觉,占比近60%,远超听觉、嗅觉、味觉。马斯克也表示,视觉可以应对95%-99%的辅助驾驶场景。

但马斯克说的纯视觉技术路径也存在一个很大的BUG,由于深度学习的通用能力局限,机器很难把看到过的场景泛化到一个全新陌生的环境,车在路上遇到未看过的场景就会“不知所措”。

要应对这个行业痛点,AI商业评论认为,主要有三种方法:

其一,通用人工智能(AGI)技术取得飞跃。谷歌、微软以及商汤科技等前沿AI企业均在大力研发通用AI。

今年10月30日,谷歌人工智能主管Jeff Dean发文,称他们正在研究下一代AI框架Pathways,目标直指AGI。

仅不到一个月,11月17日,上海人工智能实验室联合商汤科技SenseTime、香港中文大学、上海交通大学共同发布了新一代通用视觉技术体系“书生”(INTERN),该体系旨在系统化解决当下人工智能视觉领域中存在的任务通用、场景泛化和数据效率等一系列瓶颈问题。

微软也于2019年向OpenAI投资10亿美元,以支持构建具有广泛经济效益的通用人工智能技术(AGI)。

因为通用人工智能拥有强大的泛化能力,能做到“触类旁通”,以少量的数据就可完成数据训练。

其二,为深度学习算法喂大量数据,让其准确率达到自动驾驶上路要求。特斯拉今年8月份开始陆续抛弃毫米波雷达,彻底选择了纯视觉技术路线,离不开其长期大量的数据积累和数据训练。特斯拉首席财务官Zachary Kirkhorn说,到目前为止,特斯拉已经收集了超过1亿英里的驾驶数据。算法与算力相辅相成,特斯拉的AI超算也排名世界前三。

其三,多传感器融合方案,即视觉 激光雷达 毫米波雷达。视觉相当于人的眼睛,但还有听觉,多种感知结合能让机器成为一个更健全的“人”。

马斯克说的“视觉可以解决95%-99%的辅助驾驶场景”限定得很清楚,仅“辅助驾驶”场景。因为视觉无法应对阳光直射、超低能见度情况,无法应对,而通过多传感器融合方案能有效提高自动驾驶鲁棒性和应对复杂场景的能力。

2.jpeg

当然,多传感器融合方案也面临一个很现实的问题:成本高。这也是马斯克选择纯视觉方案的主要原因,定位于“做人人都买得起的电动车”。

数据很“香”,既近又远

数据是AI时代的生产资料,据市场预估,智能汽车生成数据的价值,到2030年,可能高达4500-7000亿美元。但如何挖掘这些数据价值?

首当其冲的难题是,数据标准化和共享。因为不同公司的传感器数据,包括位置、高度、角度这些初始参数都不同。比如宝马的数据拿给一汽,完全没法用。

而且,考虑隐私、网络安全和保持竞争优势方面,企业通常不愿意与其他利益相关者共享这些数据,包括测试、运营和客户行为等各类数据。

车本身的E架构(Electrical/Electronic Architecture,汽车电子电气架构)也是一个问题。它是整合汽车内各类传感器、处理器、线束连接、电子电气分配系统和软硬件生成的总布置方案。过去绝大部分汽车的E架构按照功能信号来设计的,做成了集成的通用平台。今天智能车的E架构融合了数据架构和计算架构,但包括特斯拉在内的企业,都还未认真考虑过数据架构和计算架构,这将导致数据获取成为一个隐藏的大问题。

据了解,一台车每天能产生大概4000GB的数据,如果是十万台甚至百万台,这些数据的传输到云端的成本就会骤升。所以最好的办法,就是能够在边缘侧处理数据,将垃圾数据处理掉,把有效的特征点提取出来。

3.jpg

据希捷科技发布、国际数据公司(IDC)调研完成的《数据新视界:从边缘到云,激活更多业务数据》报告称,企业目前定期将大约36%的数据从边缘传输到核心,两年后,这一比例将增至57%。从边缘立即传输到核心的数据量将翻倍,从8%增长到16%。

自动驾驶还需解决数据分布“长尾问题”的任务,时而出现的corner case(极端情况)是对数据驱动的算法模型进行升级的来源之一。

打造数据闭环是绕不过去的坎。以谷歌waymo报告提到的数据闭环平台为例,它包括数据挖掘、主动学习、自动标注、自动化模型调试优化、测试校验和部署发布。打通这些全链路,才能让数据高效、高质回流。

4.jpg

云计算是打通数据闭环的基础,它在资源管理调度、数据批处理/流处理、工作流管理、分布式计算、系统状态监控和数据库存储等方面提供了数据闭环的基础设施支持,比如亚马逊AWS、微软Azure和谷歌云等。

腾讯自动驾驶总经理苏奎峰说:“自动驾驶的核心竞争力在于数据要素和计算资源的低成本获取和高效利用。对数据要素进行高效收集和利用,提高数据循环链路的速度,是整个自动驾驶技术迭代的关键点。”

伦理治理:短期阻力,长期助力

100多年前,当机动车替代马车的时候,就有过安全相关的争论:机动车会不会惊吓到马?

对此英国出台了一个“红旗法”,一个车有三个人开,一个人烧锅炉,一个人驾驶,还有一个人在这个车前面50多米的地方拿着红旗挥动,告诉别人有个危险物过来了,这个法案一直沿用了30多年才被取消。可见,公众对于一个新事物的恐惧与认知有一个长期接受的过程。

想象一下完全自主的自动驾驶汽车的未来。你的自动驾驶汽车接近红绿灯,但突然刹车失灵,计算机不得不在瞬间做出决定。它可以突然转向附近的杆子并杀死乘客,或者继续前进并杀死前方的行人。

而控制汽车的计算机只能通过访问汽车传感器收集的有限信息,并且必须基于此做出决定。尽管这看起来很戏剧化,但距离我们可能面临这样的困境只有几年的时间了。

这也是我们看到特斯拉大力推动辅助驾驶汽车,但尚未生产全自动驾驶汽车的核心原因之一。

另一个是数据安全问题。

近年来,我国大力加强数据监管,发布了一系列具有里程碑意义的法规,网络安全法(CSL)、数据安全法(DSL)和个人信息保护 法(PIPL)形成了监管基础。

为了提高技术安全性并保护用户数据和国家安全,智能汽车企业正受到越来越多的审查和更严格的监管。

2021年5月,国家互联网信息办公室(CAC)开始就《车辆数据安全管理若干规定》(以下简称“规定”)的一套试行规定征求意见,该规定概述了智能网联汽车制造商和运营商保护汽车安全的新要求。

《规定》将“个人信息”定义为来自任何利益相关者的信息,包括车主、司机、乘客和行人,以及任何可以从中推断出利益相关者的个人身份或描述其个人行为的信息。

诚然,企业已经面临遵守新法规的压力。包括特斯拉、福特和宝马在内的几家外国汽车制造商都在中国建立了数据中心,用于存储从中国用户那里收集的数据,以符合数据法规。

但是,由于政府也急于发展自动驾驶产业,仍然不太可能监管到严重阻碍发展的程度。从长期来看,更强大的数据安全管理和治理也可能有助于提升行业形象,引导行业朝着更高安全性和可靠性的方向发展。

来源:钛媒体 AI商业周刊


著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2021-12-01
最近编辑:2年前
行业观察
硕士 观世界,看未来!
获赞 293粉丝 31文章 289课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈