俗话说:
不基于需求的敲代码都是耍流氓
一、人脸检测:
1.准备材料
首先需要准备人脸的训练数据,这个在官方的Github可以下载到,这里用:lbpcascade_frontalface.xml 然后有请
世界上,最傻最天真,最美丽,最善良的Girl登场
:
2.Java/Kotlin层面
代码语言:javascript复制本想全用Kotlin写的,不过发现Kotlin竟然无法自动生成JNI函数... 但我又懒得找id,就混着用吧,使用TolyCV提供native方法。
---->[src/main/java/com/toly1994/toly_cv/TolyCV.java]----
public class TolyCV {
public static native int faceDetector(Bitmap bitmap, Bitmap.Config argb8888, String path);
}
代码语言:javascript复制在Kotlin的Activity中,点击图片时使用faceDetector,让C 对图片进行操作 由于人脸识别需要xml的模型文件,这里通过copyCascadeFile将文件考到包里
---->[src/main/java/com/toly1994/toly_cv/MainActivity.kt]----
class MainActivity : AppCompatActivity() {
private lateinit var mCascadeFile: File
private lateinit var mFaceBitmap: Bitmap
override fun onCreate(savedInstanceState: Bundle?) {
super.onCreate(savedInstanceState)
setContentView(R.layout.activity_main)
copyCascadeFile(R.raw.lbpcascade_frontalface,"lbpcascade_frontalface.xml")
iv_photo.setOnClickListener {
mFaceBitmap = BitmapFactory.decodeResource(resources, R.mipmap.kqq2)
val count= TolyCV.faceDetector(mFaceBitmap,Bitmap.Config.ARGB_8888, mCascadeFile.absolutePath)
title="检测到$count 个人脸"
iv_photo.setImageBitmap(mFaceBitmap)
}
}
companion object {
init {
System.loadLibrary("toly_cv")
}
}
private fun copyCascadeFile( id:Int,name:String) {
try {
val inputStream = resources.openRawResource(id)
val cascadeDir = getDir("cascade", Context.MODE_PRIVATE)
mCascadeFile = File(cascadeDir, name)
if (mCascadeFile.exists()) return
val os = FileOutputStream(mCascadeFile)
val buffer = ByteArray(4096)
var bytesRead: Int = inputStream.read(buffer)
while (bytesRead != -1) {
os.write(buffer, 0, bytesRead)
bytesRead = inputStream.read(buffer)
}
inputStream.close()
os.close()
} catch (e: IOException) {
e.printStackTrace()
}
}
}
复制代码
3.C 层面使用OpenCV进行人脸识别
代码语言:javascript复制很多教程都把代码塞到JNI的cpp里,感觉看着太混乱,太难受了 根据单一职责原则,这里定义一个
FaceDetector类
专门用于识别传入的图片数组 并通过detectorFace
方法进行识别后返回识别到的结果集,这样思路就清晰多了。
---->[src/main/cpp/FaceDetector.h]----
#include <android/bitmap.h>
#include <opencv2/opencv.hpp>
using namespace cv;
#include <vector>
using std::vector;//有分号
class FaceDetector{
public:
//加载文件
static void loadCascade(const char *filename);
//识别矩阵,返回脸的矩形列表
static vector<Rect> detectorFace(Mat &src);
};
代码语言:javascript复制cpp文件进行方法的实现,核心是
CascadeClassifier#detectMultiScale
方法
---->[src/main/cpp/FaceDetector.cpp]----
#include "FaceDetector.h"
CascadeClassifier cascadeClassifier;
//人脸检测
vector<Rect> FaceDetector::detectorFace(Mat &src) {
vector<Rect> faces;//脸的数组
Mat temp_mat;//用于存放识别到的图像临时矩阵
cvtColor(src, temp_mat, COLOR_BGRA2GRAY);//灰度图,加快解析速度
equalizeHist(temp_mat, temp_mat);//直方图均衡化
//多尺度人脸检测
cascadeClassifier.detectMultiScale(temp_mat, faces, 1.1,3,0, Size(300,300));
return faces;
}
void FaceDetector::loadCascade(const char *filename) {
cascadeClassifier.load(filename);
}
代码语言:javascript复制核心方法
detectMultiScale
介绍:
CV_WRAP void detectMultiScale( InputArray image, 图像
CV_OUT std::vector<Rect>& objects, 人脸目标矩形集
double scaleFactor = 1.1, 每次图像尺寸减小的比例
int minNeighbors = 3, 构成检测目标的相邻矩形的最小个数(默认为3个)
int flags = 0, 标识
Size minSize = Size(), 目标的最小尺寸
Size maxSize = Size() ); 目标的最大尺寸
4.C 层进行方形的绘制,标识人脸
代码语言:javascript复制其实上面已经识别出人脸,并到存到一个vector中。现在把它在图像上画出来
#include "FaceDetector.h"
extern "C"
JNIEXPORT jint JNICALL
Java_com_toly1994_toly_1cv_TolyCV_faceDetector(JNIEnv *env, jclass clazz, jobject bitmap,
jobject argb8888, jstring path_) {
const char *path = env->GetStringUTFChars(path_, 0);//文件路径
FaceDetector::loadCascade(path);//加载文件
Mat srcMat;//图片源矩阵
bitmap2Mat(env, bitmap, &srcMat);//图片源矩阵初始化
auto faces = FaceDetector::detectorFace(srcMat);//识别图片源矩阵,返回矩形集
for (Rect faceRect : faces) {// 在人脸部分画矩形
rectangle(srcMat, faceRect, Scalar(0, 253, 255), 5);//在srcMat上画矩形
mat2Bitmap(env, srcMat, bitmap);// 把mat放回bitmap中
}
env->ReleaseStringUTFChars(path_, path);//释放指针
return faces.size();//返回尺寸
}
根据不同的模型数据,可以检测到不同的部位,比如眼睛:
haarcascade_eye.xml
检测也会出现误差,此时可以通过一些判断来筛选结果,比如先检测人脸,之外的部分可以过滤 或者根据两眼间距,计算出不可能的矩形,将其剔除,这也是图片识别比较好玩的地方
二、自动尺寸裁剪
现在需求是:
根据一张照片(尺寸任意),截取人脸及周围,并裁成规定的尺寸,如两寸:413*626
就像这样:
1.Java/Kotlin层
代码语言:javascript复制新定义一个native方法faceDetectorResize方法进行执行该功能,返回一个处理过的图片
---->[src/main/java/com/toly1994/toly_cv/TolyCV.java]----
public class TolyCV {
public static native int faceDetector(Bitmap bitmap, Bitmap.Config argb8888, String path);
public static native Bitmap faceDetectorResize(Bitmap bitmap, Bitmap.Config argb8888 , String path,int width,int height);
}
---->[src/main/java/com/toly1994/toly_cv/MainActivity.kt]----
iv_photo.setOnClickListener {
mFaceBitmap = BitmapFactory.decodeResource(resources, R.mipmap.kqq)
val bitmap= TolyCV.faceDetectorResize(mFaceBitmap,Bitmap.Config.ARGB_8888,
mCascadeFile.absolutePath,413,626)
iv_photo.setImageBitmap(bitmap)
}
2.C 层
代码语言:javascript复制这里只针对一个人脸,多个人脸可以采取问题分化的思想。 首先要解决的是区域的问题:这个Rect是何许人也?如果你对一个对象有疑惑,debug是不二人选
extern "C"
JNIEXPORT jint JNICALL
Java_com_toly1994_toly_1cv_TolyCV_faceDetectorResize(
JNIEnv *env, jclass clazz, jobject bitmap,
jobject argb8888, jstring path_, jint width, jint height) {
const char *path = env->GetStringUTFChars(path_, 0);//文件路径
FaceDetector::loadCascade(path);//加载文件
Mat srcMat;//图片源矩阵
bitmap2Mat(env, bitmap, &srcMat);//图片源矩阵初始化
auto faces = FaceDetector::detectorFace(srcMat);//识别图片源矩阵,返回矩形集
Rect faceRect= faces[0];
rectangle(srcMat, faceRect, Scalar(0, 253, 255), 5);//在srcMat上画矩形
env->ReleaseStringUTFChars(path_, path);//释放指针
return createBitmap(env,srcMat,argb8888);//返回图片
}
代码语言:javascript复制知道这些信息,就很容易构建目标区域(红色区域),剩下的就是裁切红色区域了
extern "C"
JNIEXPORT jint JNICALL
Java_com_toly1994_toly_1cv_TolyCV_faceDetectorResize(JNIEnv *env, jclass clazz, jobject bitmap,
jobject argb8888, jstring path_, jint width,
jint height) {
const char *path = env->GetStringUTFChars(path_, 0);//文件路径
FaceDetector::loadCascade(path);//加载文件
Mat srcMat;//图片源矩阵
bitmap2Mat(env, bitmap, &srcMat);//图片源矩阵初始化
auto faces = FaceDetector::detectorFace(srcMat);//识别图片源矩阵,返回矩形集
Rect faceRect= faces[0];
rectangle(srcMat, faceRect, Scalar(0, 253, 255), 5);//在srcMat上画矩形
//识别目标区域区域---------------------------
Rect zone;
int a= faceRect.width;//宽
int b= faceRect.height;//高
int offSetLeft=a/4;//x偏移
int offSetTop=b*0.5;
zone.x=faceRect.x-offSetLeft;
zone.y=faceRect.y-offSetTop;
zone.width= a/4 *2 a;
zone.height=zone.width*(height*1.0/width);
rectangle(srcMat, zone, Scalar(253, 95, 47), 5);//在srcMat上画矩形
env->ReleaseStringUTFChars(path_, path);//释放指针
return createBitmap(env,srcMat,argb8888);//返回图片
}
代码语言:javascript复制裁剪是非常简单的
createBitmap(env,srcMat(zone),argb8888);//返回图片
代码语言:javascript复制Mat类重载
()运算符
可以传入一个矩形,实现是通过构造生成一个新Mat 这样就完成了既定比例的裁切,并保证人脸始终在中上部。
---->[mat.hpp#Mat::operator()]----
/** @overload
@param roi Extracted submatrix specified as a rectangle.
*/
Mat operator()( const Rect& roi ) const;
---->[mat.inl.cpp#Mat::operator()]----
inline
Mat Mat::operator()( const Rect& roi ) const
{
return Mat(*this, roi);
}
另外有一点需要注意:
当矩形范围超出Mat,会报错
,应该可以通过添白来处理,Mark一下
代码语言:javascript复制最后只剩重设尺寸了,
注意把你画的矩形线给去掉,不然会输出到结果中
extern "C"
JNIEXPORT jobject JNICALL
Java_com_toly1994_toly_1cv_TolyCV_faceDetectorResize(JNIEnv *env, jclass clazz, jobject bitmap,
jobject argb8888, jstring path_, jint width,
jint height) {
//英雄所见...
env->ReleaseStringUTFChars(path_, path);//释放指针
resize(srcMat(zone),srcMat,Size(width,height));//<----重定义尺寸
return createBitmap(env,srcMat,argb8888);//返回图片
}
OK,打完收工,再也不怕妹子让我帮她设置图片尺寸了。 对于大批量,形形色色的人物照片,想要裁剪规整,一个for循环搞定,程序是绝佳劳动力。
这样你对OpenCV应该多了那么一丢丢感觉了吧,其实只是在调一调已有的方法