本文改进:Inner-IoU引入尺度因子 ratio 控制辅助边框的尺度大小用于计算损失,并与现有的基于 IoU ( GIoU, DIoU, CIoU,SIoU )损失进行有效结合
推荐指数:5颗星 新颖指数:5颗星
1. Inner-IoU介绍
论文:https://arxiv.org/pdf/2311.02877.pdf
摘要:随着检测器的迅速发展, 边框回归取得了巨大的进步。然而,现有的基于 IoU 的边框回归仍聚焦在通过加入新的损失项来加速收敛,忽视 IoU 损失项其自身的限制。尽管理论上 IoU 损失能够有效描述边框回归状态,在实际应用中,它无法根据不同检测器与检测任务进行自我调整,不具有很强的泛化性。基于以上,我们首先分析了 BBR 模式,得出结论在回归过程区分不同回归样本并且使用不同尺度的辅助边框计算损失能够有效加速边框回归过程。对于高 IoU 样本,使用较小的辅助边框计算损失能够加速收敛,而较大辅助边框适用于低 IoU 样本。接着,我们提出了 Inner-IoU Loss, 其通过辅助边框计算 IoU 损失。针对不同的数据集与检测器,我们引入尺度因子 ratio 控制辅助边框的尺度大小用于计算损失。最后,将 Inner-IoU 集成至现有的基于 IoU 损失函数中进行仿真实验与对比实验。实验结果表明在使用本文所提出方法后检测效果得到进一步提升,验证了本文方法的有效性以及泛化能力。
IoU损失函数在计算机视觉任务中有广泛的应用。在边界框回归过程中,不仅可以评估回归状态,还可以通过计算回归损失来加速收敛。在这里,作者讨论IoU变化与边界框大小之间的关系,分析边界框回归问题的本质特征,并解释本文提出方法的可行性。
图8.a, 8.b和8.c 为CIoU and Inner-CIoU的训练过程曲线图,三张图分别对应ratio 为0.7, 0.75, and 0.8。图8.d, 图8.e和 图8.f 为ratio 分别为0.7, 0.75, and 0.8时,SIoU and Inner-SIoU的训练过程曲线图。在以上图中,橙色曲线代表本文方法,现有方法用绿色曲线表示。不难看出在训练过程中50至150 epochs 本文方法优于现有的方法。
原理可参考作者博客:
作者导读:Inner-IoU:基于辅助边框的IoU损失-CSDN博客
3.Inner-IoU加入RT-DETR
3.1 修改ultralytics/models/utils/metrics.py
核心代码:
https://cv2023.blog.csdn.net/article/details/134407373
我正在参与2023腾讯技术创作特训营第三期有奖征文,组队打卡瓜分大奖!