论文地址:http://arxiv.org/pdf/2005.03572v2.pdf 代码:https://github.com/zzh-tju/ciou 来源:天津大学 论文名称:Enhancing Geometric Factors in Model Learning and Inference forObject Detection and Instance Segmentation 原文作者:Zhaohui Zheng
基于深度学习的目标检测和实例分割取得了前所未有的进展。在本文中,我们提出了CIoU (Complete-IoU)损失和Cluster-NMS来增强边界盒回归和非最大抑制(NMS)中的几何因子,在不牺牲推理效率的情况下,平均精度(AP)和平均召回率(AR)都有显著提高。在本文中,特别关注目标检测和实例分割中测量边界盒回归的三个关键点——重叠区域,归一化中心点距离和高宽比。为了更好地区分难回归的情况,将这三个几何因子被纳入到CIoU损失中。利用CIoU损失对深度模型进行训练,相比于广泛采用的n范数损失和IoU-based损失,结果得到一致的AP和AR改进。此外,我们提出了Cluster-NMS,其中NMS在推理期间是通过隐式聚类检测框来完成的,一般需要更少的迭代。由于它纯粹的GPU实现,可以合并几何因子提高AP和AR,所以Cluster-NMS是非常有效的。将CIoU损失和Cluster-NMS应用于实例分割(例如YOLACT)和目标检测(例如YOLOv3, SSD 和 Faster R-CNN)模型实验中,性能表现SOTA。以MS COCO上的YOLACT为例,使用NVIDIA GTX 1080Ti GPU可以达到27.1 FPS,同时本文的方法在目标检测上提升了1.7 AP和6.2 AR100,在实例分割上提升了0.9 AP和3.5 AR100。
下面是论文具体框架结构以及实验结果:
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请联系删除。