Robust Real-Time Face Detection

2022-09-04 21:20:25 浏览数 (1)

我们构建了一个正面人脸检测系统,实现了与已发表的最佳结果相当的检测和假正性率。该人脸检测系统与以前的方法最明显的区别在于它能够非常快速地检测人脸。在传统的700mhz Intel Pentium III上,人脸以每秒15帧的速度在384×288像素的图像上运行。在其他人脸检测系统中,辅助信息,如视频序列中的图像差异,或彩色图像中的像素颜色,都被用来实现高帧率。我们的系统实现了高帧率的工作,只有在一个单一的灰度图像中的信息。这些替代的信息来源也可以与我们的系统集成,以实现更高的帧速率。

这项工作的第一个贡献是一个新的图像表示称为积分图像,允许非常快速的特征评估。部分由Papageorgiou等人的工作激励,我们的检测系统并不直接与图像强度工作。像这些作者一样,我们使用了一组让人想起Haar基函数的特性。为了在许多尺度上快速计算这些特征,我们引入了图像的积分图像表示。积分图像可以从一个图像计算使用几个操作每像素。一旦计算出来,这些类harr的特征中的任何一个都可以在恒定的时间内以任意比例或位置计算出来。这项工作的第二个贡献是通过使用AdaBoost选择少量重要特征来构造分类器的方法。在任何图像子窗口中,类Harr特性的总数都非常大,远远大于像素的数量。为了确保快速分类,学习过程必须排除大部分可用的特性,并专注于一小组关键特性。在Tieu和Viola工作的激励下,通过对AdaBoost过程的简单修改,实现了特征选择:对弱学习者进行约束,使得返回的每个弱分类器只能依赖于一个单一的特征。因此,每个阶段的增强过程,即选择一个新的弱分类器,可以看作是一个特征选择过程。

这项工作的第三个主要贡献是,在一个级联结构中,将依次更复杂的分类器组合起来,通过将注意力集中在图像的有希望的区域,显著提高了检测器的速度。更复杂的处理只保留给这些有希望的区域。未被初始分类器拒绝的子窗口由一系列分类器处理,每个分类器都比最后一个分类器稍微复杂一些。如果任何分类器拒绝子窗口,则不执行进一步的处理。级联检测过程的结构本质上是退化决策树的结构,与Amit和Geman的工作有关。完整的人脸检测级联有32个分类器。然而,级联结构导致极快的平均检测时间。人脸检测器在384×288像素的图像上以每秒15帧的速度运行,比之前的任何系统都快15倍。在包含507张人脸和7500万个子窗口的MIT CMU数据集上,我们的检测率为90%,有78次错误检测(约96.1万个查询中有1次假正性)。

0 人点赞