未来三年覆盖100万辆车,毫末智行360T的算力之下还有一个「雪湖」

2021-12-27 15:44:51 浏览数 (1)

机器之心报道

机器之心编辑部

十亿元融资的同时,毫末的数据智能完成了体系化打造,已形成数据闭环与产品闭环。

「毫末的同学们用疯狂的工作热情,在 24 个月内打造了 12 款产品,」毫末智行 CEO 顾维灏说道。「我们乘用车的首款产品魏牌摩卡在不到七个月的时间里,辅助驾驶里程已经突破 400 万公里,用户非常喜爱我们提供的新功能。」

说到国内发展速度最快的自动驾驶公司,可能非毫末智行莫属。12 月 23 日,在毫末智行 AI Day 活动中,这家国内自动驾驶独角兽公布了一组亮眼的落地数据,同时宣布推出国内首个自动驾驶数据智能体系 MANA。

在新体系加持下,明年中量产搭载「小魔盒 3.0」的汽车上,自动驾驶系统将实现巨大进步,毫末智行表示,通过将数据、算法、应用系统高度整合起来,城市场景自动驾驶的挑战已被解决。MANA 作为毫末 AI 的底层系统,将成为数据智能进化的核心动力。

数据是人工智能最大的驱动力,也是最大的成本。自动驾驶产品的进化是一个长期过程,所以毫末数据智能的核心,就是降低成本、提高迭代速度。顾维灏将其比喻为毫末数据智能的「思想钢印」。

数据智能体系 MANA

MANA 是一个完整的智能驾驶数据智能体系,一举把毫末智行在自动驾驶领域中从数据挖掘、知识再到车端应用的能力全部打通,之前相对独立的点被串联了起来。

MANA 包含四个子系统,其中:

  • LUCAS 是对算法在应用场景上的实践,包括高性能计算、诊断、验证、转化等核心能力。
  • TARS 主要是车端能力,包含关于计算的核心算法原型,用于感知、认知、车端建图、验证及实践。
  • VENUS 是数据可视化系统,展示软件和算法执行情况,对场景进行还原,同时也有数据洞察等能力。
  • 在这些功能之下是基础层 BASE,负责数据的获取、传输、存储、计算,以及新数据分析和服务。

MANA 的第一个进步是数据利用效率的升级,实现了 AI 算法「后融合」到「前融合」的演进。

后融合方法是当前业界大多数公司通行的思路,自动驾驶系统通过多任务学习来自传感器数据不同的特征层,再通过不同任务实现分割,检测等任务。

这样做最大的问题就是无法高效利用多传感器的配合。利用近年来跨模态算法和时间序列算法的进步,毫末的工程师们实现了前融合方法。

在新范式下,自动驾驶算法首先把从摄像头和 LiDAR 的感知中间结果,经过基于 Transformer 框架的多模态模型融合映射到张量空间中。然后加入时序的特征,使用循环神经网络 RNN 和光流 SLAM 进行时空融合,获得了时空一体的模型,在此基础上再进行多 head 计算,进行决策推理。

这种算法配合汽车上越来越多的传感器,将实用化的自动驾驶从高速路拓展到了城市场景。

通过前融合方法,从相机、点云上提取的特征在张量层次被拼接到俯视图视角的一张图上,在 3D 维度上检测车道线,道路和车辆、行人等物体,该方法有效提高了障碍物,车道线检测的能力,让机器可以更准确地刻画现实世界。

从感知跃升到认知,MANA 带来了哪些启示?

在 AI 能力大规模应用的今天,让机器获得视觉、听觉、触觉等能力的感知智能承担了与真实世界进行交互的大部分工作。但对于人工智能来说,认知和推理能力才是未来方向。

认知智能即「能理解会思考」,需要拥有处理复杂的事实和情形的能力。毫末智行希望通过 MANA 的加持,让自动驾驶超越感知智能的范畴。

此前,绝大多数公司使用的算法源自传统机器人理论,通过规则求解的方式进行决策规划。相比高速公路,城市中的路况会复杂很多倍,只有像人类一样实行决策的系统才能够胜任。

认知和感知存在显著差别:感知有完全白盒的标准,没有歧义,算法需要利用巨量数据去保证覆盖掉所有特殊情况。认知则没有这样可解释、可量化的,且存在共识的评价标准。

根据模仿学习算法直接生成驾驶决策。毫末智行在这个方向进行了很多实践,也有了一些收获。

毫末智行提出了认知三要素:安全、舒适与高效,在此之上实现的「基于协同场景安全的认知系统」CSS 包括专家系统和深度学习系统,其决策除了基础规则以外,还参考了从数据中学习到的,其他交通参与者行为的理解和历史经验。

我们也可以看出,MANA 体系实践了很多深度强化学习。首先定义好得分的目标函数,它是一个概率函数,表征了在某个场景下人类动作和交通规则约束下该做的动作的概率。实践 6 种强化深度学习的算法,发现 RSAC 更适用于不同场景的研究,能够更快收敛,能够得分最高,能够走的更远。

由于舒适与高效很多时候并不能同时顾及,自动驾驶系统会学习驾驶者的风格,从数据中学习不同量化标准。

简单说来就是,你开得更激进还是更稳当,AI 算法在学习了你的风格后会做同样的事,身后还有保证基本安全的规则算法。这才是能够满足大多数人的自动驾驶系统。

很多人工智能的算法,比如感知的进步需要很多标注的数据。面对大规模量产,尤其要关注这个问题。

毫末要做的是一个高效且闭环的标注系统,把无监督自动标注算法用上。比如车道线识别,目前大部分是通过自动标注完成的。

我们知道感知对场景非常敏感,光影、强度都会对识别有影响。在自然界中采集,相对就会低效。所以,毫末在仿真系统中生成这些目标图片,然后进行感知和认知的效果验证,效率被大大提高。

「我们在研究一种端到端的模拟学习,让算法能根据之前的事例作为指导改进本车具体动作,」顾维灏说道。「我认为这是自动驾驶的最佳认知学习方式,因为所有场景都可以被数字化感知,所有的标注都已经在开车的过程中自动完成了。我们需要做的就是挑选更符合要求司机的驾驶行为,在不同场景下持续进行训练。」

模拟学习需要更大的数据样本,特别是标注好的数据。对此,毫末智行提出了基于无监督算法的图像自动标注系统,将图像标注速度提升了几个数量级。

未来在智能汽车的推动下,人类记录的数据正在从文本向图像转变,图像的存储和计算规模将占据主导,由此对存储和计算将带来新的革命。据顾维灏在演讲时介绍,用于自动驾驶的数据处理、训练、推理和验证等需求的 MANA 超算中心正在筹备中。

城市级 NOH 辅助驾驶系统,计划 2022 年上线

顾维灏表示,到明年中,毫末辅助驾驶系统将推出「城市 NOH」功能,通过业界最大算力辅助驾驶域控制器小魔盒 3.0,并针对城市多样、复杂的路况进行专项优化,具备更快、更及时的感知能力和响应能力。

在 34 分钟的行驶中,辅助驾驶通过共计 11 公里,24 个路口,27 个人行横道,5 个无保护人行横道,22 个红绿灯,2 个四岔环岛,完全无接管。

从毫末智行提供的演示中看,现在城市道路中的车辆左转、右转、红绿灯路口,环岛路口,避让路口加塞车辆、避让调头车辆、自动通过待转区、导航变道、避让横穿行人、驶入驶出环岛、路口无保护左转等场景都能被 AI 算法顺利搞定。

毫末公布了自己的乘用车智能驾驶路线图:2022 年下半年,其计划交付全场景 NOH,2023 年推出拥有 HSD(HAOMO Self-Driving)的车队。

目标:世界级自动驾驶公司

毫末智行的目标是成为世界级自动驾驶公司。这家公司的前身是长城汽车技术中心智能驾驶前瞻分部,2019 年 11 月,毫末智行正式独立出来,长城汽车既是毫末智行的大股东,也成为了毫末的主要客户。

除了长城,毫末智行也与美团、阿里、物美多点等企业在无人物流车上进行了合作。这家公司现在的团队规模已超过 500 人,拥有保定、北京、上海三个研发中心。

在 AI Day 进行的前一天,毫末智行宣布获得近 10 亿元人民币的 A 轮融资,投后估值超过 10 亿美元,该公司已成为国内为数不多实现智能驾驶规模量产的自动驾驶独角兽企业。据介绍,本轮的投资方为美团、高瓴创投、首程控股等。这是毫末智行年内获得的第三轮融资。

毫末仅用 24 个月,就把自己的技术覆盖到了 12 款产品上,搭载该公司产品的乘用车车型达到 5 款,无人物流车车型 5 款,还有两款无人跟随设备,这家公司今年的营收已经达到了数亿元。

从人们关注最多的乘用车领域上看,毫末智行自动驾驶系统批量装配在长城旗下的摩卡、坦克等车型上,辅助驾驶用户行驶里程累计已突破 400 万公里。本月,毫末智行还将迎来第 1000 辆末端无人物流车的量产下线。

预计未来三年,毫末的自动驾驶系统将搭载到 100 万辆长城汽车上,这意味着每年数百亿级别的里程。如此大规模的应用,对于自动驾驶算法带来的突破可能会是颠覆性的。

毫末智行董事长张凯

「2022 年将是自动驾驶行业发展最为关键的一年,乘用车辅助驾驶领域竞争将会正式进入下半场,其他场景的自动驾驶也将正式进入商业化元年」毫末智行董事长张凯说道。

辅助驾驶未来会成为每辆车的标配,毫末已为这次革新做好了准备。

0 人点赞