全球首发、业界第一:武汉大学开源口罩人脸识别数据集

2020-04-08 15:15:59 浏览数 (1)

By 超神经

内容提要:武汉大学免费开放了全球首个口罩遮挡人脸数据集,包括近 10 万张真实戴口罩与正常人脸图像,以及 50 万张模拟戴口罩人脸图像。

关键词:武汉大学,口罩人脸数据集, TLS 数据集

在对抗新冠肺炎这段特殊时期,武汉大学的老师和同学们依然没有放慢科研节奏。

3 月初,武汉大学国家多媒体软件技术研究中心,开放了一个特殊的人脸识别数据集——口罩遮挡人脸数据集:Real-World Masked Face Dataset,简称 RMFD。

发布一:全球首发真实口罩人脸数据集

新冠肺炎疫情期间,几乎人人都戴着口罩,而这让此前的人脸识别技术基本失效。口罩遮挡之下的人脸识别技术,成为疫情期间迫切的需求。

3 月 8 日,武汉大学国家多媒体软件工程技术研究中心王中元教授,带领团队及时启动了口罩人脸识别的应急攻关研究。

据悉,王中元教授带领团队黄宝金、洪琪、吴浩等十余名研究生,初步收集人脸数据达 36 万张,并开发了数据清洗、标注等半自动化辅助制作工具。

团队的黄金宝同学正在调试程序

数据集①:5000 张真实口罩人脸数据集

除了模拟口罩人脸数据集,该团队还构建了全球首个公开的真实口罩人脸识别样本集 RMFD,含 525 人的 5 千张口罩人脸、9 万正常人脸。

真实口罩人脸样本示例

数据集②、③:50 万张模拟口罩人脸数据集

(含 WebFace 模拟、 LFW 模拟两类)

同时,为了扩充数据多样性,该团队开发了一个精准戴口罩软件程序,通过给公开数据集中的人脸戴上口罩,构建了 1 万人、50 万张人脸的模拟口罩人脸数据集。

口罩人脸识别样本集须包含同一人的多张戴口罩与未戴口罩的人脸图像,构造起来很困难。

因此,团队针对口罩人脸样本集制作周期长的情况,制定了四步走的迭代研发技术路线,制定 4 套研发方案,以便根据样本集情况和模型的性能表现适时调整、择优选取。

模拟口罩人脸样本示例

目前,真实口罩人脸识别数据集、模拟口罩人脸识别数据集数据集均已向社会免费开放,其中模拟口罩人脸识别数据集包括 WebFace,和 LFW 模拟口罩人脸数据集。

该团队基于他们所建立的数据集,开发的面部-眉眼多粒度口罩遮挡人脸识别模型,在数据集上可达到 95% 的准确性。

数据集:欢迎你的贡献

此外,为了进一步扩充数据集,团队表示欢迎大家将个人收集到的戴口罩图片,通过邮件的方式发送到 x_zhangyang@whu.edu.cn,并会对收到的图片统一处理。

有了数据集,如何下载和使用

如何下载?

口罩人脸识别数据集_开源下载地址:

https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset

如何使用?

疫情期间,无法取得学校、公司的算力,如何继续机器学习任务?

本次要介绍的合作伙伴 OpenBayes ,一个针对机器学习提供云端算力的云服务。他们拥有大规模的超算集群,GPU 集群架构专针对矩阵计算设计,面向 AI 应用提供算力容器,而且上手非常简单,开箱即用。

目前 OpenBayes 的算力容器产品已经支持 TensorFlow、PyTorch、MXNet 等 CPU 和 GPU 环境下,不同版本、类型的标准机器学习框架和各种常用依赖。

目前 OpenBayes 算力容器支持的标准库

并提供 CPU、NVIDIA T4、NVIDIA Tesla V100 等多种算力资源,无论是海量数据的集中训练,还是低功耗的模型常驻运行,都能轻松满足用户需求。

从 CPU 到 T4 再到 V100,丰富的算力容器配置

OpenBayes 支持脚本上传和 JupyterLab 编辑器在线编程,然后进行模型训练。

清晰简洁的执行过程

完整教程:https://openbayes.com/docs/quickstart/

注册新用户,即可享受 GPU 算力!

访问 openbayes.com,在官网首页点击立即注册,而且内测期间周周有赠哦,再也不用跟同学、同事抢算力了~

数据集可在公共资源直接使用/下载

活动说明

访问 openbayes.com

凭邀请码 【HyperAI】 注册新用户

即可享受

每周 600min 的 CPU 300min NVIDIA T4

的免费算力~

明日数据集预告:

武汉大学的测绘遥感信息工程国家重点实验室课题组,紧跟着也发布了一个数据集,是全球最大规模:多类型场景、地面站扫描点云配准基准数据集(WHU-TLS)。

我们将在明天更新下载方式~

0 人点赞