这个最新无人车模拟环境,让仿真路测效率提升数千倍!华人团队提出,登上Nature子刊

2021-02-26 14:37:55 浏览数 (1)

贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI

150亿英里,这是独步全球的自动驾驶公司Waymo的模拟测试里程。

但是这还不够。

有业内人士估计,要完全证明一个算法的安全可靠,模拟测试里程甚至要超过千亿公英里。

那么,有没有在保证可靠性的前提下,大幅降低模拟路测时间和成本的方法呢?

美国密歇根大学的刘向宏教授团队,开发出了一种新的自动驾驶测试环境,直接将现有的同类测试所需里程,减少4个数量级。

这项研究,也发表在了Nature Communications。

模拟效率提高上千倍

2015年,马斯克推测,2018年能实现完全自动驾驶。

2014年,日产曾承诺,到2020年,市场上将有多款、商业上可行的无人驾驶汽车。

但是现在,路上的汽车绝大部分还是L2级辅助驾驶。

为什么汽车制造商总无法兑现当年的Flag?

刘向宏教授领导的密歇根大学Traffic Lab在这篇研究论文中认为,阻碍自动驾驶发展的障碍之一,是测试和评估效率严重低下。

成百上千亿的英里的模拟,成本巨大。

所以,团队开发了一个名为NADE的自动驾驶系统的测试评价环境。

NADE,是naturalistic and adversarial driving environment的缩写,直译为自然-对抗驾驶环境。

顾名思义,NADE通过学习实际道路中背景车辆的行为,能够生成模拟某些对抗性动作,同时保持驾驶环境的真实性。

按照团队给出的测试结果,与类似于Waymo的CarCraft9、百度的AADS10等传统的模拟测试环境(NDE)相比,每跑一英里,至少相当于在以前的几百、几千英里。

在上面的测试结果中,蓝线代表在NDE中的测试结果,底部x轴表示测试次数。红线代表在NDE中的测试结果,顶部x轴为测试次数。阴影代表90%的置信度。

团队总共测试了两个自动驾驶系统,分别称为AV-I和AV-II。

如上图a、c所示,在NADE中模拟的通过对两种系统的测试次数大大减少,获得了与NDE相同的事故率估计结果。

具体计算一下,对于AV-I模型,NADE只需要8.74×104次测试,而NDE需要4.39×107次测试。NADE加快进程约500倍,减少约1000万英里的里程。

同样,对于AV-II车型,NADE需要2.32×104次测试,而NDE需要1.41×108次测试。

新的方法可以让测试进程加快6000倍,减少3500万英里模拟里程。

大大提高模拟测试效率的NADE环境,具体是如何搭建的呢?

如何构建NADE

对于以前常用的NDE来说,构建算法的实质,是对代表NDE复杂性的变量的联合分布进行采样处理。

为了简化高维度的时空分布,一般利用变量之间的时空独立性关系,用马尔科夫决策过程(MDP)和概率图模型(PGM)对NDE进行建模。

环境中的变量,包括天气、道路类型、车辆加速度等等,将它们表示为:

其中xi,j表示第i个BV(背景车辆)在第j个时间点的变量(如位置和速度),N表示BV数量,T表示总的时间点数量。

NDE的生成是根据变量的自然联合分布进行取样,表示为x ∼P(x)。

由于P(x)的维度极高,所以选择利用变量之间的时空独立性关系来简化问题。假设过程具有马尔科夫属性,联合分布可以用因子化的方式简化为:

其中,u(k)、s(k)分别是在时间步骤?=0,⋯,?时,环境内目标的状(位置)和动作(加速度)。

而NADE要做的,就是求得新的行为分布q(u|s),替换NDE中的P(u|s)

为了克服变量维度太高的挑战,团队选择在重要的时刻选取车辆POV(主目标)的方法。

为了识别POV,研究人员将识别边界点定义为暴露频率P(ui|s)和机动挑战P(Ai|s,ui)的乘积:

其中Ai表示第i个BV与被测AV之间的事故。右侧的第一部分是暴露频率。第二部分是机动挑战,该机动挑战表示在给定状态的事故概率。

所以,最后,新的NADE行为分布概率可以表示为:

其中,C c(s)是所有背景车辆的动作总和。

得到基本的NADE架构之后,如何来评判一个自动驾驶算法的表现呢?

具体来说,如果将感兴趣的事件(比如自动驾驶事故)表示为A,则可以通过以下性能估计方程,来评判自动驾驶算法优劣:

本文提出的方法,以及增强现实测试环境,将于2021年在美国移动中心(ACM)部署。

部署NADE意义在于,可以让企业或有关部门大大降低在安全、可控、可重复的测试环境中验证算法的总体成本和周期。

华人团队主导

本研究的第一作者封硕,目前在美国密歇根大学安娜堡分校做博士后。

封硕本科和博士学位都在清华大学自动化系获得,研究方向是优化控制、互联和自动驾驶评估以及交通数据分析。

封硕所在的Traffic Lab实验室,由刘向宏教授领导。刘教授也是本文的共同通讯作者。

刘向宏博士现任美国密歇根大学土木与环境工程系终身职正教授、密歇根大学交通研究所(UMTRI)研究教授,北京航空航天大学客座教授、兼职博士生导师。

刘向宏1993年本科毕业于清华大学汽车工程系,2000年在威斯康星大学麦迪逊分校取得博士学位。

刘教授是交通工程领域论文引用率最高的学者之一,他发明的用于精确测量交叉路口的排队长度和旅行时间的SMART-Signal系统于2012年取得美国国家专利,并已在美国明尼苏达州和加州得到广泛应用。

论文地址: https://www.nature.com/articles/s41467-021-21007-8#Sec8

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

0 人点赞