【场景布局估计】开源 | MonoLayout:基于单幅图像的实时的模态场景布局估计的深度神经网络

2021-02-24 14:37:24 浏览数 (1)

论文地址: http://arxiv.org/pdf/2002.08394v1.pdf

代码: 公众号回复:09010716039

来源: 印度国际信息学院,印度理工学院

论文名称:MonoLayout Amodal scene layout from a single image

原文作者:Kaustubh Mani

内容提要

在本文中,我们解决了一个新颖的,具有高度挑战性的问题,估计布局复杂的城市驾驶场景。从驾驶平台上给定捕获的单一彩色图像,我们的目标是预测道路和其他交通参与者的鸟瞰布局。估计的布局应该超越图像中可见的内容,并补偿由于投影而造成的3D信息损失。我们把这个问题称为模态场景布局估计,它涉及到被图像遮挡的部分的幻觉场景布局。为此,我们提出了一种基于单幅图像的实时模态场景布局估计的深度神经网络——MonoLayout。我们将场景布局表示为一个多通道语义占用网格,并利用对抗特征学习来幻想“遮挡图像部分的似是而非的完成”。我们扩展了几个最先进的方法,通过鸟瞰估计严格模态设置,估计道路布局和车辆占用情况。通过利用时间传感器融合来生成训练标签,我们的方法在许多数据集上性能优越。

主要框架及实验结果

声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请联系删除。

0 人点赞