前言
本项目参考了ArcFace的损失函数结合MobileNet,意在开发一个模型较小,但识别准确率较高且推理速度快的一种人脸识别项目,该项目训练数据使用emore数据集,一共有85742个人,共5822653张图片,使用lfw-align-128数据集作为测试数据。
源码地址:https://github.com/yeyupiaoling/Pytorch-MobileFaceNet
数据集准备
本项目提供了标注文件,存放在dataset
目录下,解压即可。另外需要下载下面这两个数据集,下载完解压到dataset
目录下。
- emore数据集百度网盘
- lfw-align-128下载地址:百度网盘 提取码:b2ec
然后执行下面命令,将提取人脸图片到dataset/images
,并把整个数据集打包为二进制文件,这样可以大幅度的提高训练时数据的读取速度。
python create_dataset.py
训练
执行train.py
即可,更多训练参数请查看代码。
python train.py
训练输出如下:
代码语言:javascript复制[2021-11-03 15:18:28.813591] Train epoch 9, batch: 6100/90979, loss: 1.215695, accuracy: 0.859375, lr: 0.000107, eta: 5 days, 5:28:26
[2021-11-03 15:18:37.044353] Train epoch 9, batch: 6200/90979, loss: 0.908210, accuracy: 0.859375, lr: 0.000107, eta: 5 days, 6:35:02
[2021-11-03 15:18:45.229030] Train epoch 9, batch: 6300/90979, loss: 0.964092, accuracy: 0.875000, lr: 0.000107, eta: 5 days, 9:17:21
[2021-11-03 15:18:53.449567] Train epoch 9, batch: 6400/90979, loss: 1.208947, accuracy: 0.828125, lr: 0.000107, eta: 5 days, 12:41:06
[2021-11-03 15:19:01.682437] Train epoch 9, batch: 6500/90979, loss: 1.081449, accuracy: 0.875000, lr: 0.000107, eta: 5 days, 10:29:44
[2021-11-03 15:19:09.895995] Train epoch 9, batch: 6600/90979, loss: 1.277803, accuracy: 0.828125, lr: 0.000107, eta: 5 days, 12:29:05
[2021-11-03 15:19:18.086872] Train epoch 9, batch: 6700/90979, loss: 1.308692, accuracy: 0.828125, lr: 0.000107, eta: 5 days, 7:23:03
[2021-11-03 15:19:26.306897] Train epoch 9, batch: 6800/90979, loss: 1.474561, accuracy: 0.781250, lr: 0.000107, eta: 5 days, 8:20:23
[2021-11-03 15:19:34.528685] Train epoch 9, batch: 6900/90979, loss: 1.295028, accuracy: 0.812500, lr: 0.000107, eta: 5 days, 5:54:56
[2021-11-03 15:19:42.736712] Train epoch 9, batch: 7000/90979, loss: 1.474828, accuracy: 0.812500, lr: 0.000107, eta: 5 days, 8:32:33
评估
执行eval.py
即可,更多训练参数请查看代码。
python eval.py
预测
本项目已经不教提供了模预测,模型文件可以直接用于预测。在执行预测之前,先要在face_db目录下存放人脸图片,每张图片只包含一个人脸,并以该人脸的名称命名,这建立一个人脸库。之后的识别都会跟这些图片对比,找出匹配成功的人脸。。这里使用的人脸检测是MTCNN模型,这个模型具有速度快,模型小的特点,源码地址:Pytorch-MTCNN
如果是通过图片路径预测的,请执行下面命令。
代码语言:javascript复制python infer.py --image_path=temp/test.jpg
日志输出如下:
代码语言:javascript复制人脸检测时间:38ms
人脸识别时间:11ms
人脸对比结果: [('迪丽热巴', 0.7030987), ('杨幂', 0.36442137)]
人脸对比结果: [('杨幂', 0.63616204), ('迪丽热巴', 0.3101096)]
预测的人脸位置: [[272, 67, 328, 118, 1], [156, 80, 215, 134, 1]]
识别的人脸名称: ['迪丽热巴', '杨幂']
总识别时间:82ms
如果是通过相机预测的,请执行下面命令。
代码语言:javascript复制python infer_camera.py --camera_id=0