作者:Peter Ondruska
编译:VK
来源:Medium
我们相信开发自动驾驶技术是我们这个时代最大的工程挑战之一,行业和研究团体之间的合作将扮演重要角色。由于这个原因,我们一直在通过参加学术会议,以及最近推出的自动驾驶数据集和基于语义地图的3D对象检测的Kaggle竞赛,来帮助研究社区解决自动驾驶这个挑战。
自动驾驶数据集Level5链接:
https://level5.lyft.com/dataset/
Kaggle竞赛链接:
https://www.kaggle.com/c/3d-object-detection-for-autonomous-vehicles/
自动驾驶研究正以惊人的速度向前进步。为了进一步研究,我们今天共享了一种资源,这种资源对参与竞争的人以及自动驾驶更广泛的研究是有用的。每次会议结束后,我们都会发送一份读者文摘,在内部分享信息,并提出与自动驾驶相关的话题。现在,我们把这些提供给你!我们将在这个文章上分享这些内容,以便从流行会议中轻松找到与自动驾驶相关的主题。
CVPR 2019
在我们的第一期《公众读者文摘》中,我们从CVPR会议上为你介绍我们最喜欢的自动驾驶主题。CVPR是世界上最受欢迎的计算机视觉会议之一,最近在加利福尼亚长滩举行。1290篇论文被提交,其中有9000多参会者,包括来自Lyft团队的28人。我们已经过滤出有关自动驾驶的论文和相关的研讨会,包括视频和代码。
链接:https://sites.google.com/view/wad2019
请继续关注我们的博客,我们将从2019年跟踪过去的会议,并为你提供我们在即将到来的会议上的发现。
Lyft 5级数据集
Lyft 5级数据集,有数千个带有人工标签的3D注释帧,一个可驾驶的表面地图(可驱动曲面图),以及能为资料提供情境的高画质度空间语意图(空间语义图)
我们在此数据集上的Kaggle竞赛现已开始!
感知与跟踪
Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving
基于视觉深度估计的伪激光雷达:填补自动驾驶三维目标检测的空白
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Wang_Pseudo-LiDAR_From_Visual_Depth_Estimation_Bridging_the_Gap_in_3D_CVPR_2019_paper.pdf
代码:
https://github.com/mileyan/pseudo_lidar
视频:
https://www.youtube.com/watch?v=mNtXTTo6wzI
Cornell公司的论文,作者使用立体摄像机生成3d点云,不是由CNN处理点云,而是插入到激光雷达管道中处理。这个简单的技巧能带来意想不到的性能提升,在立体感知方面达到了新的SOTA性能。
PointPillars: Fast Encoders for Object Detection from Point Clouds
PointPillars:用于从点云中检测对象的快速编码器
论文:http://openaccess.thecvf.com/content_CVPR_2019/papers/Lang_PointPillars_Fast_Encoders_for_Object_Detection_From_Point_Clouds_CVPR_2019_paper.pdf
代码:
https://github.com/nutonomy/second.pytorch
nuTonomy的论文,这篇论文探索了一种新的方法来预处理三维激光雷达输入格式转换到一个可以被二维CNN处理的二维图像,而不是由传统的三维CNN处理。这为激光雷达检测提供了新的SOTA性能。
ROI-10D: Monocular Lifting of 2D Detection to 6D Pose and Metric Shape
ROI-10D:单眼将2D检测提升为6D姿态以及公制形状
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Manhardt_ROI-10D_Monocular_Lifting_of_2D_Detection_to_6D_Pose_and_CVPR_2019_paper.pdf
视频:
https://www.youtube.com/watch?v=wCGCJW81LQc
丰田研究院的论文—作者联合了目标检测和单目深度预测为单目车辆检测实现新的SOTA性能。结果该网络不仅可以预测车辆的三维姿态,而且可以重建车辆的(部分)三维网格模型。
CVPR其他18篇感知与追踪论文: https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit#gid=2092320208
预测与计划
End-To-End Interpretable Neural Motion Planner
端到端的可解释的神经运动规划器
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Zeng_End-To-End_Interpretable_Neural_Motion_Planner_CVPR_2019_paper.pdf
Uber ATG的论文——这篇论文探索了端到端可训练架构。论文通过将检测、感知、预测和计划整合到单个神经网络中,该神经网络生成单个模块的输出以及用于计划的成本函数。这些输出可以被检查,从而提高最终驾驶决策的可解释性。
Rules of the Road: Predicting Driving Behavior with a Convolutional Model of Semantic Interactions
道路规则:使用语义交互卷积模型预测驾驶行为
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Hong_Rules_of_the_Road_Predicting_Driving_Behavior_With_a_Convolutional_CVPR_2019_paper.pdf
Zoox的论文—作者描述了一个端到端的神经网络来预测未来的汽车运动。该网络能够预测复杂的动作,同时也提供了不确定性的预测。
Multi-Step Prediction of Occupancy Grid Maps with Recurrent Neural Networks
递归神经网络的占用网格图的多步预测
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Mohajerin_Multi-Step_Prediction_of_Occupancy_Grid_Maps_With_Recurrent_Neural_Networks_CVPR_2019_paper.pdf
视频:
https://www.youtube.com/watch?v=Bskd0Z7eLFE
华为的论文—该网络仅使用原始传感器数据,不需要任何人工标注,可以预测未来其他车辆的运动和车辆周围的占用网格。
阅读CVPR的另外两篇预测与计划论文:
https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit?usp=sharing
地图构建和定位
L3-Net: Towards Learning-Based LiDAR Localization for Autonomous Driving
L3-Net:面向自动驾驶的基于学习的激光雷达定位
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Lu_L3-Net_Towards_Learning_Based_LiDAR_Localization_for_Autonomous_Driving_CVPR_2019_paper.pdf
视频:
https://www.youtube.com/watch?v=dptbd4D78Mk
百度论文—作者使用神经网络以厘米级的精度定位在预先构建的LIDAR地图中。他们表明,所产生的性能可与最先进的手工方法相媲美。
Understanding the Limitations of CNN-Based Absolute Camera Pose Regression
理解基于CNN的绝对摄影机姿态回归的局限性
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Lu_L3-Net_Towards_Learning_Based_LiDAR_Localization_for_Autonomous_Driving_CVPR_2019_paper.pdf
代码:
https://github.com/tsattler/understanding_apr
视频:
https://www.youtube.com/watch?v=7Efueln55P4
慕尼黑工业大学的论文—姿态回归神经网络是基于相机定位的最新进展。然而,它们的性能仍然与基于特征的方法不对应。
BAD SLAM: Bundle Adjusted Direct RGB-D SLAM
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Schops_BAD_SLAM_Bundle_Adjusted_Direct_RGB-D_SLAM_CVPR_2019_paper.pdf
代码:
https://github.com/ETH3D/badslam
视频:
https://www.youtube.com/watch?v=7Efueln55P4
苏黎世联邦理工学院的论文—论文探索了一种将视觉和深度快速融合到与激光雷达相机系统相关的多模态SLAM系统中的新方法。
阅读CVPR上的其他11张地图构建和定位: https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit?usp=sharing
模拟,安全性和稀有事件的长尾
Why ReLU Networks Yield High-Confidence Predictions Far Away From the Training Data, and How to Mitigate the Problem
为什么ReLU 网络远离训练数据就能获得高可信度的预测,以及如何减轻问题的影响
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Hein_Why_ReLU_Networks_Yield_High-Confidence_Predictions_Far_Away_From_the_CVPR_2019_paper.pdf
代码:
https://github.com/joe-siyuan-qiao/NeuralRejuvenation-CVPR19
图宾根大学(University ofTübingen)的论文—自动驾驶的一个主要问题是,在“从未见过的”场景中,神经网络的性能很差,并且会产生高置信度的错误预测。本文展示了如何使用对抗性优化过程来解决这些问题。
Latent Space Autoregression for Novelty Detection
新颖性检测的潜在空间自回归
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Abati_Latent_Space_Autoregression_for_Novelty_Detection_CVPR_2019_paper.pdf
代码:
https://github.com/joe-siyuan-qiao/NeuralRejuvenation-CVPR19
来自摩德纳大学的论文—为了检测网络是否首次看到新事物,本文探讨了将自编码器与潜在编码上的密度估计器结合使用的方法。
Parametric Noise Injection: Trainable Randomness to Improve Deep Neural Network Robustness against Adversarial Attack
参数噪声注入:可训练的随机性,以提高针对对抗攻击的深度神经网络的鲁棒性
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/He_Parametric_Noise_Injection_Trainable_Randomness_to_Improve_Deep_Neural_Network_CVPR_2019_paper.pdf
来自佛罗里达大学的论文—神经网络的问题之一是它们可能会受到对抗攻击的欺骗,这是网络产生高置信度但是是错误预测的一种特殊情况。本文展示了如何通过在训练过程中注入噪声来减轻这种情况。
另请参阅CVPR的六篇模拟,安全性和稀有事件的长尾论文: https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit?usp=sharing
机器学习效率,准确性和优化
Bag of Tricks for Image Classification with Convolutional Neural Networks
带有卷积神经网络的图像分类技巧包
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/He_Bag_of_Tricks_for_Image_Classification_with_Convolutional_Neural_Networks_CVPR_2019_paper.pdf
代码:
https://github.com/weiaicunzai/Bag_of_Tricks_for_Image_Classification_with_Convolutional_Neural_Networks
来自亚马逊的论文—机器学习(ML)实践者用来调整ML系统性能的日常技术的全面收集。
Neural Rejuvenation: Improving Deep Network Training by Enhancing Computational Resource Utilization
神经复兴:通过提高计算资源的利用率来改善深层网络训练
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Qiao_Neural_Rejuvenation_Improving_Deep_Network_Training_by_Enhancing_Computational_Resource_CVPR_2019_paper.pdf
代码:
https://github.com/joe-siyuan-qiao/NeuralRejuvenation-CVPR19
来自Adobe的论文—该研究探索了一种训练神经网络的新优化方法,该方法可以在训练过程中重新分配“死神经元”以改善性能或缩小模型。如本文中所示,这大大提高了各种SOTA网络的性能。
Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation
Auto-DeepLab:搜索语义图像分割的分层神经架构
论文:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Liu_Auto-DeepLab_Hierarchical_Neural_Architecture_Search_for_Semantic_Image_Segmentation_CVPR_2019_paper.pdf
视频:
https://www.youtube.com/watch?v=ltlhQXHGzgE
Google论文—有一种自动搜索最佳NN体系结构的方法,而不是经典的手动超参数调整方法。本文中用于语义分割的解决方案优于手动找到的解决方案,并且在许多基准测试中均达到了SOTA性能。
另请参阅CVPR的七篇机器学习效率,准确性和优化论文: https://docs.google.com/spreadsheets/d/1pOjqWwY_MGohPwxUT5LVg1WVsTLZ0n77P4lUZ4UbgQk/edit