OpenCV 人脸检测级联分类器解读

2022-05-07 09:05:09 浏览数 (1)

1.基本概念 opencv中的人脸检测使用基于Harr的级联分类和基于LBP的级联分类。 Harr是在2001年,由Viola和Jones等人提出的,它的脸部检测的基本思想是:对于面部正面的大部分区域而言,会有眼睛所在的区域比前额和脸颊更暗,嘴巴应该比脸颊更暗等情况。和这样类似的比较大约有20个,通过这样的比较决定该区域是否为人脸。 LBP是在2006年由Ahonen等人提出的,相比于Harr,LBP有更快的速度。通过比较想读亮度直方图来确定是否为人脸。但是对于稳定性,LBP要弱于前者。 Opencv自带训练好的人脸检测模型,存储在sources/data/haarcascades文件夹和sources/data/lbpcascades文件夹下。其中几个.xml文件如下: 人脸检测器(默认):haarcascade_frontalface_default.xml 人脸检测器(快速Harr):haarcascade_frontalface_alt2.xml 人脸检测器(侧视):haarcascade_profileface.xml 眼部检测器(左眼):haarcascade_lefteye_2splits.xml 眼部检测器(右眼):haarcascade_righteye_2splits.xml 嘴部检测器:haarcascade_mcs_mouth.xml 鼻子检测器:haarcascade_mcs_nose.xml 身体检测器:haarcascade_fullbody.xml 人脸检测器(快速LBP):lbpcascade_frontalface.xml

2.如何使用

2.1 加载一个检测器:应用CascadeClassifier并实例化,写入文件路径并加载。

代码语言:javascript复制
CascadeClassifier face_cascade;
String face_cascade_name = "C:\Program Files\OpenCV2.4.11\opencv\sources\data\lbpcascades\lbpcascade_frontalface.xml";  
face_cascade.load( face_cascade_name );

2.2 图像预处理:灰度变换,收缩尺寸和直方图均衡化

代码语言:javascript复制
cvtColor( frame, frame_gray, CV_BGR2GRAY );
const int DETECTION_WIDTH = 320;
Mat smallImg;
float scale = frame_gray.cols/(float)DETECTION_WIDTH;
if (frame_gray.cols>DETECTION_WIDTH)
{
	int scaledHeight = cvRound(frame_gray.rows/scale);
	resize(frame_gray,smallImg.size(DETECTION_WIDTH,scaledHeight));
}
else
{
	smallImg = frame_gray;
}
Mat equalizedImg;
equalizeHist( smallImg , equalizedImg);

2.3人脸检测

代码语言:javascript复制
std::vector<Rect> faces;
face_cascade.detectMultiScale( equalizedImg, faces, 1.1, 2, 0, Size(80, 80) );

此时检测结果保存在faces这个vector容器中。

3.几个使用技巧 3.1 在加载检测器时通常由于路径问题容易产生错误,最好有一个提醒或异常捕获机制。

代码语言:javascript复制
	face_cascade.load( face_cascade_name );
	if( !face_cascade.load( face_cascade_name ) )
	{ printf("--(!)Error loadingn"); return -1; };

或者

代码语言:javascript复制
	try {   
		face_cascade.load( face_cascade_name );
	} catch (cv::Exception &e) {}
	if ( face_cascade_name.empty() ) {
		printf("--(!)Error loadingn"); return -1; 
		exit(1);
	}

3.2根据情况设置参数 detectMultiScale函数原型如下:

代码语言:javascript复制
 CV_WRAP virtual void detectMultiScale( const Mat& image,
                      CV_OUT vector<Rect>& objects,
                      double scaleFactor=1.1,
                      int minNeighbors=3, int flags=0,
                      Size minSize=Size(),
                      Size maxSize=Size() );

其中: minSize=Size()和maxSize=Size(): 决定了检测到的最小和最大的人脸大小,如果图片中人脸距离相机较远,把minSize参数设置为=Size(20,20) scaleFactor:参数决定由多少不同大小的人脸要搜索,通常为1.1 minNeighbors: 决定着人脸检测器如何确定人脸已经被找到,默认值是3,如果改为4的话,将会使检测的正确率增加,但是漏检率也可能增加,可以理解为参数越大,判断的条件越苛刻。 flags:是否要检测所有人脸。

0 人点赞