贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI
150亿英里,这是独步全球的自动驾驶公司Waymo的模拟测试里程。
但是这还不够。
有业内人士估计,要完全证明一个算法的安全可靠,模拟测试里程甚至要超过千亿公英里。
那么,有没有在保证可靠性的前提下,大幅降低模拟路测时间和成本的方法呢?
美国密歇根大学的刘向宏教授团队,开发出了一种新的自动驾驶测试环境,直接将现有的同类测试所需里程,减少4个数量级。
这项研究,也发表在了Nature Communications。
模拟效率提高上千倍
2015年,马斯克推测,2018年能实现完全自动驾驶。
2014年,日产曾承诺,到2020年,市场上将有多款、商业上可行的无人驾驶汽车。
但是现在,路上的汽车绝大部分还是L2级辅助驾驶。
为什么汽车制造商总无法兑现当年的Flag?
刘向宏教授领导的密歇根大学Traffic Lab在这篇研究论文中认为,阻碍自动驾驶发展的障碍之一,是测试和评估效率严重低下。
成百上千亿的英里的模拟,成本巨大。
所以,团队开发了一个名为NADE的自动驾驶系统的测试评价环境。
NADE,是naturalistic and adversarial driving environment的缩写,直译为自然-对抗驾驶环境。
顾名思义,NADE通过学习实际道路中背景车辆的行为,能够生成模拟某些对抗性动作,同时保持驾驶环境的真实性。
按照团队给出的测试结果,与类似于Waymo的CarCraft9、百度的AADS10等传统的模拟测试环境(NDE)相比,每跑一英里,至少相当于在以前的几百、几千英里。
在上面的测试结果中,蓝线代表在NDE中的测试结果,底部x轴表示测试次数。红线代表在NDE中的测试结果,顶部x轴为测试次数。阴影代表90%的置信度。
团队总共测试了两个自动驾驶系统,分别称为AV-I和AV-II。
如上图a、c所示,在NADE中模拟的通过对两种系统的测试次数大大减少,获得了与NDE相同的事故率估计结果。
具体计算一下,对于AV-I模型,NADE只需要8.74×104次测试,而NDE需要4.39×107次测试。NADE加快进程约500倍,减少约1000万英里的里程。
同样,对于AV-II车型,NADE需要2.32×104次测试,而NDE需要1.41×108次测试。
新的方法可以让测试进程加快6000倍,减少3500万英里模拟里程。
大大提高模拟测试效率的NADE环境,具体是如何搭建的呢?
如何构建NADE
对于以前常用的NDE来说,构建算法的实质,是对代表NDE复杂性的变量的联合分布进行采样处理。
为了简化高维度的时空分布,一般利用变量之间的时空独立性关系,用马尔科夫决策过程(MDP)和概率图模型(PGM)对NDE进行建模。
环境中的变量,包括天气、道路类型、车辆加速度等等,将它们表示为:
其中xi,j表示第i个BV(背景车辆)在第j个时间点的变量(如位置和速度),N表示BV数量,T表示总的时间点数量。
NDE的生成是根据变量的自然联合分布进行取样,表示为x ∼P(x)。
由于P(x)的维度极高,所以选择利用变量之间的时空独立性关系来简化问题。假设过程具有马尔科夫属性,联合分布可以用因子化的方式简化为:
其中,u(k)、s(k)分别是在时间步骤?=0,⋯,?时,环境内目标的状(位置)和动作(加速度)。
而NADE要做的,就是求得新的行为分布q(u|s),替换NDE中的P(u|s)。
为了克服变量维度太高的挑战,团队选择在重要的时刻选取车辆POV(主目标)的方法。
为了识别POV,研究人员将识别边界点定义为暴露频率P(ui|s)和机动挑战P(Ai|s,ui)的乘积:
其中Ai表示第i个BV与被测AV之间的事故。右侧的第一部分是暴露频率。第二部分是机动挑战,该机动挑战表示在给定状态的事故概率。
所以,最后,新的NADE行为分布概率可以表示为:
其中,C c(s)是所有背景车辆的动作总和。
得到基本的NADE架构之后,如何来评判一个自动驾驶算法的表现呢?
具体来说,如果将感兴趣的事件(比如自动驾驶事故)表示为A,则可以通过以下性能估计方程,来评判自动驾驶算法优劣:
本文提出的方法,以及增强现实测试环境,将于2021年在美国移动中心(ACM)部署。
部署NADE意义在于,可以让企业或有关部门大大降低在安全、可控、可重复的测试环境中验证算法的总体成本和周期。
华人团队主导
本研究的第一作者封硕,目前在美国密歇根大学安娜堡分校做博士后。
封硕本科和博士学位都在清华大学自动化系获得,研究方向是优化控制、互联和自动驾驶评估以及交通数据分析。
封硕所在的Traffic Lab实验室,由刘向宏教授领导。刘教授也是本文的共同通讯作者。
刘向宏博士现任美国密歇根大学土木与环境工程系终身职正教授、密歇根大学交通研究所(UMTRI)研究教授,北京航空航天大学客座教授、兼职博士生导师。
刘向宏1993年本科毕业于清华大学汽车工程系,2000年在威斯康星大学麦迪逊分校取得博士学位。
刘教授是交通工程领域论文引用率最高的学者之一,他发明的用于精确测量交叉路口的排队长度和旅行时间的SMART-Signal系统于2012年取得美国国家专利,并已在美国明尼苏达州和加州得到广泛应用。
论文地址: https://www.nature.com/articles/s41467-021-21007-8#Sec8
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。