目标检测 | AP-Loss：提高单阶段目标检测性能的分类损失，超越Focal loss

论文地址：https://arxiv.org/pdf/1904.06373v3.pdf

代码地址：https://github.com/cccorn/AP-loss

动机

单阶段目标检测器是通过同时优化分类损失和定位损失来训练的。由于anchor的数量很多，存在前景目标和背景目标不平衡的问题。

为了解决单阶段目标检测的这种问题，很多不同的方法引入了新的分类损失，如 balanced loss、Focal loss 和 tailored training 方法（Online Hard Example Mining (OHEM)）等。这些 losses 对每个 anchor box 都分别独立建模，在分类损失中，其尝试对前景样本和背景样本重新赋权值，来适应样本不平衡的情况，这些方法没有考虑不同 samples 之间的联系。设计的平衡权重是手工选取的超参数，并不能很好的适应于不同类型的数据集。

本文认为，分类任务和检测任务之间的鸿沟阻碍了单阶段目标检测器的性能提升，本文并未从分类损失函数的修正上着手，而是直接使用排序方法（ranking）来代替分类损失。其中，关联的 ranking loss 显式地对关系建模，并且对正样本和负样本的比例不敏感。

同时，提出了一种新的框架来缓和上述不平衡问题，即使用排序方法来代替分类任务，并且使用 Average-Precision loss（AP-loss）来完成排序问题。

因为 AP-loss 是不可微且非凸的，AP-loss 不能直接被优化，故本文使用一种新的优化方法，可以将感知学习过程的误差驱动的更新机制和深度网络中的反向传播机制进行巧妙的结合。

概况简介

1、用于目标检测的 AP loss：

AP 被当做评价指标，但由于其不可微和非凸性，难以用作优化函数，本文的方法有四个特点：

1）本文方法可以被用于任何可微线性或可微非线性模型，如神经网络，其他的那些方法仅仅可以在线性 SVM 模型中起作用。

2）本文方法直接优化 AP- loss，会导致 loss 出现 gap

3）本文方法不是近似的梯度，且不受目标函数非凸性的影响

4）本文方法可以端到端的训练检测器

2、感知学习方法：

本文优化准则的核心是“误差驱动更新”，是感知学习方法的泛化版本，有助于克服不可微目标函数的困难。当训练数据是线性可分的时，该方法能够保证在有限次数内收敛。

具体方法

Average Precision Loss（AP Loss）对每个预测框进行排序，用排序后的序号来设计loss，核心思想在于鼓励正样本预测框的得分在负样本得分序列中尽可能靠前。启发自AUC Loss，后者用AUC的排序序号来设计loss，直接对AUC进行优化，而目标检测通常以mAP为指标，因此作者指出直接对AP进行优化能有更好的效果。

Bounding Box的设置方式跟传统的设置方式有些不同。比如有K个分类，