基于世界权威的人脸检测公开评测集 WIDER FACE『http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html』的两张性能测试图,以 RetinaFace 为标杆,寻找所谓的比它性能更好的人脸检测算法。
首先先介绍 RetinaFace,出自论文『RetinaFace: Single-stage Dense Face Localisation in the Wild』,作者提出一个鲁棒的人脸检测器:RetinaFace,通过利用额外监督和自监督多任务联合学习的优势,对不同尺度的人脸进行 pixel-wise 人脸定位。
在 WIDER FACE Hard 测试集上,RetinaFace 当时比最先进的平均精度(AP)高出1.1%(实现AP等于91.4%)。
在 IJB-C 测试集上,RetinaFace 可以使最先进的方法(ArcFace)在人脸验证中提高它原来的结果(FAR=1e-6时,TAR=89.59%)。
作者 | Jiankang Deng, Jia Guo, Yuxiang Zhou, Jinke Yu, Irene Kotsia, Stefanos Zafeiriou
单位 | 帝国理工学院;InsightFace;英国密德萨斯大学;FaceSoft
论文 | https://arxiv.org/abs/1905.00641
代码 | https://github.com/deepinsight/
insightface/tree/master/RetinaFace
arxiv提交日期 | 2019 年 5 月
再来看看当前 WIDER FACE 的性能测试排名。
验证集性能结果:
测试集性能结果:
从以上两张性能图中,得出 ASFD、MaskFace、RefineFace、AInnoFace 的结果略优于 RetinaFace。但其中 MaskFace 不管是在验证集还是测试集中的 Hard 都低于 RetinaFace,AInnoFace 在测试集中的 Hard 也低于 RetinaFace。
下面我们就来详细认识认识这四款人脸检测算法。
01
ASFD
ASFD,出自论文『ASFD: Automatic and Scalable Face Detector』,ASFD 是一种新型的自动和可扩展的人脸检测器,基于神经架构搜索技术以及新的损失函数设计的结合。
目前在 WIDER FACE 的 Easy、Medium 和 Hard 三个评测子集的六项评估结果中五项排名第一(验证集的 Easy 中排名第二)。轻量级 ASFD-D0 在使用 MobileNet 处理 VGA 分辨率图像时的运行速度超过 120 FPS。
作者 | Bin Zhang, Jian Li, Yabiao Wang, Ying Tai, Chengjie Wang, Jilin Li, Feiyue Huang, Yili Xia, Wenjiang Pei, Rongrong Ji
单位 | 腾讯优图;东南大学;厦门大学
论文 | https://arxiv.org/abs/2003.11228
arxiv提交日期 | 2020 年 3 月
02
RefineFace
RefineFace,出自论文『RefineFace: Refinement Neural Network for High Performance Face Detection』。RefineFace 由 5 个模块组成:
- Selective Two-step Regression (STR)
- Selective Two-step Classification (STC)
- Scale-aware Margin Loss (SML)
- Feature Supervision Module (FSM)
- Receptive Field Enhancement (RFE)
STR 提高定位精度;STC 提高分类能力,实现高召回效率;SML 来区分不同比例的人脸和背景,并引入FSM 来让骨干学习更多的判别特征进行分类;RFE 提供更多样化的感受野,更好地捕捉一些极端姿势下的人脸。
在 WIDER FACE、AFW、PASCAL Face、FDDB、MAFA 上验证结果都达到 SOTA,并在 ResNet-18 上以 37.3 FPS 的速度运行 VGA 分辨率的图像。
作者 | Shifeng Zhang, Cheng Chi, Zhen Lei, Stan Z. Li
单位 | 中科院自动化所;国科大
论文 | https://arxiv.org/abs/1909.04376
arxiv提交日期 | 2019 年 9 月
03
AInnoFace
AInnoFace 出自论文『Accurate Face Detection for High Performance』,在其刚问世时,在 WIDER FACE 的 Easy、Medium 和 Hard 三个评测子集的六项评估结果中排名第一。
作者 | Faen Zhang, Xinyu Fan, Guo Ai, Jianfei Song,
Yongqiang Qin, Jiahong Wu
单位 | 创新奇智
论文 | https://arxiv.org/abs/1905.01585
arxiv提交日期 | 2019 年 5 月
04
MaskFace
MaskFace 出自论文『MaskFace: multi-task face and landmark detector』,是一个高精度的人脸和关键点检测模型,通过增加一个关键点预测头,扩展了以往的人脸检测方法。
新的关键点头采用了 Mask R-CNN 的思想,通过 RoIAlign 层提取面部特征。在图像中人脸较少的情况下,关键点头增加了较小的计算开销,同时大幅提高了精度。
作者 | Dmitry Yashunin, Tamir Baydasov, Roman Vlasov
单位 | Harman 公司
论文 | https://arxiv.org/abs/2005.09412
arxiv提交日期 | 2020 年 5 月