编辑 | 代码医生团队
从手机安全和监控摄像头到增强现实和摄影,计算机视觉的面部识别分支具有多种有用的应用。根据您的具体项目,可能需要在不同光照条件下的面部图像或表达不同情绪的面部。从使用面部关键点注释的视频帧到真实和伪造的脸部图像对,此列表上的数据集的大小和范围各不相同。
在哪里可以找到面部识别模型的免费图像数据集?
编制了一份公共面部识别图像数据集列表。从GIF和从Youtube视频拍摄的静止图像到热成像和3D图像,每个数据集都是不同的,适合不同的项目和算法。
1. 对齐面部数据集
https://www.kaggle.com/frules11/pins-face-recognition
通过从Pinterest拍摄的图像,该数据集包括100多个不同名人的10,000多张图像。每个名人平均包含100张图片。
2. CelebA数据集
http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
仅用于非商业研究目的,来自MMLAB的此数据集包含超过200,000个名人图像。
3. 带边界框的图像中的人脸检测
https://dataturks.com/projects/devika.mishra/face_detection
一个简单但有用的数据集,图像中的人脸检测包含超过500个图像,其中大约1,100个面已标记有边界框。
5百万面孔 - 面部识别的前15个免费图像数据集 - 边界框
4. 带有标记地标点的人脸图像
https://www.kaggle.com/drgilermo/face-images-with-marked-landmark-points
该数据集包括超过7,000个面部图像,每个图像上都标注了关键点。每个图像上的关键点数量不尽相同,单个图像上关键点的最大数量为15。关键点数据包含在单独的CSV文件中。
5. Flickr Faces
https://github.com/NVlabs/ffhq-dataset
对于从Flickr拍摄的图像,该数据集具有210,000张图像。总图像数量由来自Flickr的70,000张原始图像,以1024 x 1024像素裁剪的70,000张图像和以128 x 128像素裁剪的70,000张图像组成。
6. 谷歌面部表情比较
https://ai.google/tools/datasets/google-facial-expression/
来自Google AI的Google Facial Expression Comparison数据集包含156,000张面部图像。图像以三元组形式出现,每个三元组中的两个图像在面部表情方面注释为三元组中的“最相似”。在真正的Google时尚中,这些图像经过精心注释,每个三元组至少由六个独立的人类注释器处理。
7. 野性的标记面孔
https://www.kaggle.com/jessicali9530/lfw-dataset
该数据集由马萨诸塞大学的研究人员创建,最初用于研究无约束的人脸识别。它总共超过13,000张超过5,700人的图像。数据集还包括CSV格式的有用元数据。
8. 真实和假人脸检测
https://www.kaggle.com/ciplab/real-and-fake-face-detection
该数据集用于训练面部识别模型以区分真实面部图像和生成的面部图像。该数据集包括超过1,000个真实人脸图像和900多个假脸部图像,这些图像因简单,中等和难以识别的难度而异。
9. 辛普森一家的面孔
https://www.kaggle.com/kostastokis/simpsons-faces
图片来自美国流行卡通系列的第25至28季,该数据集包含超过9,800个辛普森一家的裁剪面。
10. 塔夫茨脸部数据库
https://www.kaggle.com/kpvisionlab/tufts-face-database
Tufts Face数据库拥有超过100,000张图像,包括大量的面部图像,分为九类。这些类别包括计算机化的草图,热量,热裁剪,三维,Lytro,2D RGB周围,2D RGB情感,夜视和视频。
11. UMDFaces
https://www.umdfaces.io/
到目前为止,该列表中最大的数据集,UMDFaces数据集在静止图像中的超过8,200个不同主题中有超过367,000个面部注释。除了这些图像之外,该数据集还包括超过370万个视频帧,所有视频帧都注释了超过3,100个主题的面部关键点。应该注意,该数据集仅用于非商业研究目的。
500万面孔 - 面部识别的前15个免费图像数据集 - UMDFaces
12. UTKFace
https://susanqq.github.io/UTKFace/
UTKFace数据集包括来自广泛年龄段的面部。这些图像中的人们从不到一岁到100岁不等。该数据集包括超过20,000个具有年龄,性别和种族注释的面部图像。
13. 更宽面
https://www.kaggle.com/mksaad/wider-face-a-face-detection-benchmark
此数据集包含10,000多个图像,其中包含多个人或仅包含一个人。图像分为多种设置,如会议,交通,游行等。
14. 耶鲁人脸数据库
https://www.kaggle.com/olgabelitskaya/yale-face-database
耶鲁人脸数据库是一个数据集,包含各种照明条件下15个不同主题的165个GIF图像。图像中的主体显示不同的情感和表情。
15. Youtube面对面部关键点
https://www.kaggle.com/selfishgene/youtube-faces-with-facial-keypoints
该数据集由名人的公共Youtube视频组成,总共155,560个静止帧。视频已经在名人的脸上被裁剪,并且每个视频的每个帧都有面部关键点注释。
推荐阅读
Python和Plotly实用统计与可视化