论文地址: http://arxiv.org/pdf/2008.08418v2.pdf
代码: https://github.com/hensoldtoptronicscv/multispectralpedestriandetection
来源: 卡尔斯鲁厄理工学院,
论文名称:Anchor-free Small-scale Multispectral Pedestrian Detection
原文作者:Alexander Wolpert
内容提要
由排列的视觉光学(VIS)和热红外(IR)图像对组成的多光谱图像非常适合于实际应用,如自动驾驶或视觉监视。这些数据可以用来提高行人检测的性能,特别是在弱光照,小尺度,或部分遮挡的实例。目前SOTA的是基于Faster R-CNN的变异模型,需要经过两个阶段:一个带有手工制作锚盒的proposal generator network用于目标定位,以及一个用于验证目标类别的分类网络。在本文中,我们提出了一种在单级无锚基础结构中有效地实现两种模式多光谱融合的方法。我们的目标是学习基于对象中心和尺度的行人表示,而不是直接边界盒预测。这样,我们既可以简化网络架构,又可以获得更高的检测性能,特别是对于遮挡下或低目标分辨率下的行人。此外,我们还研究了适合的多光谱数据增强技术,以改进常用的增强技术。实验结果表明,该方法对小尺度行人的检测是有效的。在具有挑战性的KAIST多光谱行人检测基准上,与目前最先进的7.49% (提高25%)相比,我们的方法实现了5.68%的log-average miss rate。
主要框架及实验结果