雷刚 发自 副驾寺 量子位 | 公众号 QbitAI
不争了。
辅助驾驶是通向自动驾驶的必由之路,渐进式路线更快赢得终局。
在创办的第1020天,在第六个HAOMO AI DAY现场,这种态度被亮得明确,结论讲得掷地有声。此时此地此身,在实践成果和趋势再清晰不过的情况下,多年的自动驾驶路线之争,已再无争论的必要。
特斯拉开创的路线,国外以FSD公测开始上路,国内则被速度更快的面壁者推向了检验时刻,而且是一个更大的数据闭环模型启动时刻。
这个在中国直道超车的面壁者就是毫末智行,现在还旗帜鲜明把行业公理真谛打上公屏:遵循数据智能,依靠数据智能,实践数据智能,这是驱动自动驾驶驶入终局的第一性原理。
并且随着自动驾驶相关的软硬件进入量产期,行业的探索来到了规模化进城时刻——新的分水岭,同样再清晰不过。
整个自动驾驶,将进入以数据智能驱动的3.0时代。
大道至简,方法论清晰,自动驾驶已无壁可面。
实践成果是展现真理的唯一标准
毫末智行的面壁成果是通过实践成绩展现的。
自创办以来,毫末智行刚度过了第1000天,却已经快速坐稳了中国量产自动驾驶第一名。
量产自动驾驶,对应的是无人驾驶,指的是把自动驾驶能力应用于量产车落地的实践。
在乘用车领域,毫末智行在短短2年多的时间内,从无到有推出了三代乘用车辅助驾驶产品HPilot,两年6次OTA升级,实现搭载超过十款乘用车型量产落地,同时并行30个项目异步开发。
包括魏牌摩卡、魏牌拿铁、魏牌玛奇朵、坦克300、坦克500、哈弗神兽、拿铁DHT-PHEV等在内的上市车型,均已完成上车搭载。此外摩卡DHT-PHEV激光雷达版、欧拉闪电猫、欧拉芭蕾猫、全新一代长城炮等则正在陆续交付。
于是截至2022年9月,毫末用户辅助驾驶行驶里程突破1700万公里,在中国量产自动驾驶阵营坐稳第一名。
并且这只是规模化落地的开始,毫末智行方面称,到2022年底,HPilot预计搭载车型近30款,未来搭载车型达到百万量级。
同时自动驾驶历史进城号角,也已经被吹响。
就在成都车展上,魏牌宣布搭载毫末智行城市NOH的全新摩卡DHT-PHEV激光雷达版,9月计划量产,年内发售,上市即交付。
城市NOH(Navigation On HPilot),正是毫末HPilot3.0的核心主打功能,计划让乘用车实现城市开放路况下的端到端智能驾驶。
而一旦交付,也意味着将毫末城市NOH将成为中国第一个大规模量产的城市导航辅助驾驶,将再次刷新量产自动驾驶乃至整个中国自动驾驶赛道的纪录。
在现场,产学研大牛对毫末速度、模式和成绩,不仅表达了一致的认可,还认为毫末所代表的是自动驾驶产业化落地的前进方向。
中国工程院院士、清华大学教授、清华大学智能产业研究院(AIR)院长张亚勤说,毫末成立1000天取得的成就令人瞩目,而且坚持举办的HAOMO AI DAY也是国内非常难得的聚焦AI自动驾驶的技术盛宴,搭建起了一个行业技术交流平台。
阿里巴巴集团副总裁、知名AI框架大牛贾扬清,则认为毫末正在自动驾驶领域推动新的AI技术工程范式,特别是数据智能体系和自动驾驶超算打造,或许会成为全行业内都有影响力的体系。
知名AI芯片公司寒武纪创始人陈天石,分享了云端和车端正在展现的计算需求和趋势,认为毫末的速度,站在了趋势一方。
△毫末智行“天团”:
董事长张凯(左二)、CEO顾维灏(右二)
COO侯军(左一)、CIO甄龙豹(右一)
所以毫末速度的秘诀是什么?董事长张凯这次开门见山给出了结论性答案——
坚定地走渐进式发展路线。在自动驾驶的3.0时代,辅助驾驶是通向自动驾驶的必由之路。
张凯表示,目前中国已成为全球智能汽车主战场,预计到2025年,高阶辅助驾驶搭载率可达70%,智能驾驶的时代风口,避无可避。
之所以确认辅助驾驶是通向自动驾驶的必由之路,是因为数据驱动在其中的核心作用。
张凯强调,渐进式路线是数据积累的最佳路径越来越被行业所公认,成为自动驾驶公司的普遍发展方向。
毫末模式、毫末速度,就是对于渐进式路线的坚定实践的结果,也是自动驾驶行业最快1000天的速度之源。
接下来的问题是如何加速、且可持续?
Attention大模型加速自动驾驶终局?
靠MANA(雪湖),毫末自研建立的国内首个自动驾驶数据智能体系。
其中包含了数据获取、传输、感知、计算、验证等多个子模块,可以实现数据从输入到输出的迭代闭环,这也是毫末可以快速迭代、持续加速的保障。
在HAOMO AI DAY上,毫末披露了MANA的最新数据,截至2022年9月,MANA学习时长超过31万小时,虚拟驾龄相当于人类司机4万年。
毫末智行CEO顾维灏,还揭秘了MANA如何持续进化的秘诀。
- 一是来自产品和落地挑战的作用力。
- 二则是不断吸收最前沿创新技术。
比如在城市场景的落地中,就存在着4类场景难题、6大技术挑战。
其中场景难题主要包括“城市道路养护频繁”、“大型车辆密集”、“变道空间狭窄”、“城市环境多样”等。
与之相对应会产生6大技术挑战:
- 如何在自动驾驶领域应用大模型?
- 如何让数据发挥更大的价值?
- 如何使用重感知技术解决现实空间理解问题?
- 如何使用人类世界的交互接口?
- 如何让仿真更真?
- 如何让自动驾驶系统运动起来更像人?
在4大场景6大挑战之下,毫末智行对MANA的感知智能和认知智能都进行了针对性升级调整。
首先,数据标注。通过使用大规模量产车无标注数据的自监督学习方法,可以实现模型效果的有效提升,相比只用少量标注样本训练,训练效果提升3倍以上,可以更高效完成训练,更好适应感知需求。
其次,增量式数据学习方法。针对新增数据,抽取部分训练数据构成混合数据集,而不是新旧数据区别对外的方法,更追求新数据的拟合和新模型对齐旧模型的输出,这样能让整体算力节省80%,响应速度提升6倍,也能避免量产车规模化产生数据后,无法兼顾规模和效率。
第三,重感知轻地图,告别高精度地图依赖。通过用时序的Transformer模型在BEV空间上做了虚拟实时建图,使得感知车道线的输出更加准确和稳定,让城市导航辅助驾驶不必依赖高精度地图——这实际也是更快更低门槛落地城市导航辅助驾驶的必备能力。
第四,车辆信号灯识别。通过车端感知系统升级,对车辆刹车灯、转向灯状态进行专门识别,让驾驶员在处理前车急刹、紧急切入等场景中更安全和舒适。
第五,仿真系统进化。针对城市最复杂场景——路口,在仿真系统中引入高价值的真实交通流场景,与阿里云、德清政府合作,将路口这一城市最复杂场景引入仿真引擎,构建自动驾驶场景库,通过自动驾驶的真实仿真验证,时效性更高、微观交通流更真实,效破解了城市路口通过“老大难”问题。
值得注意的事,这是中国首个基于车路协同云服务的大规模自动驾驶场景库,也是中国第一个使用交通数据生成的自动驾驶场景库,对外发布和应用,也标志着中国自动驾驶来到了新阶段。
最后,拟人化认知。面对城市路况,如何让驾驶决策更像人类是公认的体验难题。毫末的方法则是通过对覆盖全国的海量人类驾驶进行深度理解,学习常识和动作拟人化,让系统能够结合实际情况选择最优路线保证安全,体感上也更像老司机。
以上,就是毫末在系统量产上车之后,获得的数据和场景的反馈作用力。
而在另一端,毫末延续本色,把AI最前沿创新技术的吸收作为进步的另一重保证。
现如今,大模型和Transformer落地应用自动驾驶已是业内所有玩家的共识,但熟悉行业前情的人或许多少还有印象,最早把Transformer作为新手段用于感知的,正是毫末。
最新前沿判断方面,顾维灏此次特别强调了Attention机制下的大模型带来的惊喜。
Attention大模型背后的机制,主要是用统一模型的思路解决问题,告别不同AI任务使用专门模型的范式。这种机制其实早在2014年便已经提出,但主要在NLP领域被应用,直到2020年起在计算机视觉领域也取得明显突破,从谷歌的VIT到微软的SwinTransformer,轻松刷爆各大排行榜。
基于Attention机制的Transformer结构,更是在各种通用任务中表现惊人,展现出有效的通用AI模型范式的潜力。
而且Attention机制结构简洁,可以无限堆叠基本单元得到巨大参数量模型,随着参数提升效果也在提升。
顾维灏认为,基于Attention大模型,辅助驾驶获得的大规模人机共驾数据就有了更高效地转换,随着量产车交付和上路,数据量不仅大而且足够多样,就能更快抵达自动驾驶终局。
这也是毫末认为“辅助驾驶是通往自动驾驶的必由之路”的技术底层自信,现阶段没有比辅助驾驶能更高效地积累到足够规模和多样性的数据。
但欲享Attention大模型之利,就得解决其落地之不易。
最核心的就是超大参数对于算力的需求:高需求、高成本,高落地难度,让摩尔定律不再有效。
顾维灏透露,毫末的方法是通过低碳超算来降低训练成本,通过改进车端模型和芯片设计来实现车端落地。云端和终端两头并举,两头优化。
于是毫末超算中心也正式亮相,成为首个构建超算的自动驾驶公司。
毫末方面还透露,毫末超算中心的目标是满足千亿参数大模型,训练数据规模100万clips,整体训练成本降低200倍。
自动驾驶的3.0时代?
量产、规模化、数据智能……
这是毫末智行谈到最多的词、强调最多的词,也是对于自动驾驶发展阶段的最新认知的总结。
在自动驾驶的落地探索征程中,有过路线的划分,比如Waymo为代表的终极派和特斯拉为代表的渐进派;有过传感器的阵营,如激光雷达阵营和纯视觉阵营;甚至以商用模式为基准,还有To C、To B和To G的划分。
但如果从第一性原理出发,有没有大一统的标准和审视?
毫末智行认为:有,而且只有一个标准:数据。
按照数据的规模,也能把自动驾驶探索大道至简划归为三个时代:
1.0时代,硬件驱动为主,规模历程在100万公里左右,主要感知方式是激光雷达,认知则依赖人工规则。
2.0时代,软件驱动开始发挥作用,规模可以累积到1亿公里,感知开始融合,但依然是不同传感器单独输出的结果,认知方面依然人工规则占主导,开始用小规模小数据实现更好的预测和规划。
3.0时代,数据驱动为核心,硬件和软件在这里实现了大一统,感知也实现了多模态传感器联合输出的大一统,认知上可以实现依靠大模型大数据拥有可解释的场景化驾驶常识,能够驱动1亿公里以上的数据迭代。
实际上,按照毫末提出的三个时代划分,不仅很多过去的自动驾驶现象能得到解释,比如1.0时代堆砌了激光雷达的Robotaxi为何还会有低级事故,又比如2.0时代量产车上的高速环路导航辅助驾驶产品的体验差异……以及特斯拉AutoPilot和FSD的体验确实在日拱一卒、不断得到优化。
所以更重要的是,毫末提出的这种数据维度的划分,真正能让自动驾驶流派和演进万佛朝宗,业内和业外,都可以有更加客观的坐标和参考。
以前,衡量自动驾驶的技术发展水平,有过VC认可的维度,有过自报MPI的维度,有过体感体验的维度,也有过路测牌照的维度……
但无一例外都是偏向主观的维度。
只有量产基础下的数据维度,才接近AI跃迁的原理,才是更加客观的维度。
而且这也是自动驾驶第一阶段竞速的结果,也是量产落地被作为自动驾驶中场哨的原因。
有意思的是,随着数据智能的自动驾驶3.0提出,自动驾驶领域已然无壁可面。无论哪一路线,无论哪个阵营,最核心的竞争力都已经被放在了明面上——
有多大规模的数据?有多高效率的数据获取、训练和利用的能力?
这关乎迭代速度,也关于能耗、成本和赢得终局的加速度。
数据智能的能力,就是衡量自动驾驶公司核心壁垒的指标。
数据智能的能力,就是自动驾驶新阶段的分水岭。
其实这种分水岭效应,之前已经在更受关注的路线之争中展现。
特斯拉的价值,在产能问题被上海解决后得到了完全认可,股价和市值一飞冲天,马斯克个人登顶地球首富,AutoPilot和FSD技术能力越来越强……而且随着量产车上路越多,获取数据的规模越大场景越丰富,这种能力迭代和进化就还会持续。
作为对应,这波自动驾驶浪潮的开创者Waymo,估值却被一而再下调,落地和推进速度一而再delay,获取数据的规模和多元性——没能展现出更大的增长趋势。
不过,上述已经展现的这种分水岭效应,之前更多被作为特斯拉和Waymo的“私人恩怨”看待,遮盖了背后反应出的本质问题。
现在,摸着特斯拉过河的毫末智行,在敢于天下后的实践成果基础上,把渐进式、辅助驾驶更快赢得自动驾驶终局的道理喊得响亮,并且用自动驾驶3.0的判别式,验证自动驾驶公理下的新定律。
这代表着自动驾驶的终局之战已经拉开了帷幕,也意味着整个自动驾驶江湖,又到了重新洗牌、重估位次的时候。
至少,是时候提出这个问题了。
— 完 —
点这里