七夕情人节
Love
首先祝大家七夕情人节愉快,能和喜欢的人度过浪漫的一天,也祝在科研的同学抽出时间陪伴你的伴侣,一起度过一年一次的中国情人节,若还处于单身的同学,希望你们不仅科研成功、还能遇到自己喜欢的他(她)!
接下来,先看一小段我做的比较简单的人脸检测识别Demo!开始进入今天我们正式的主题!
♥
通过视频可以看出,人脸检测识别在我们的生活中已经无处不在,未来十年内,人脸领域的技术依然火热,今天就让谷歌公司带领大家一起来学习认知下该领域的技术,及未来发展趋势!
近年来由于深度学习爆炸式的发展,已经带动了整个行业的发展。身为人工智能的一份子,为该技术骄傲自豪。在丰富的应用场景,人脸识别市场潜力巨大。应用场景逐渐增多,布局人脸识别的生态从而也更丰富。从消费电子领域,到汽车电子、安防、互联网支付、金融等领 域逐步引入指纹识别,随着消费者用户习惯的养成,未来市场渗透快速攀升。
几年前的三大巨头,引领了人工智能的热潮,之后很多互联网公司奋力直追,现在已经有许许多多的互联网公司后起之秀,而且做的都特别好!
为了回答市场空间有多大,应该关注三个现象:
- 整体市场成长迅速;
- 手机市场正在启动;
- 汽车、安防市场潜在增量。
人脸识别方案整体空间大,年复合增长率达27.68%。根据相关数据,2016年人脸识别市场规模为38亿美元,占生物识别的26%。人脸识别技术从2016年至2020年复合增长率将达到27.68%,届时含硬件、软件、服务的人脸识别整体 市场达到101亿美元。手机市场已经爆发,未来空间超100亿。根据目前消息,苹果45%的新机型、三星主力机型有望搭载人脸识别,虽然其他厂商也有开始研究并准备相关方案,但根据整个方案成型并且最终搭载,需要等到明年。如此测算,2017年人脸识别对应的窄带滤光片渗透率约6-7%,窄带滤光片ASP以3元计算,对应市场空间约3个亿。中长期来看,在领导厂商示范效应下,未来正面人脸识别放量,渗透率到80%,那么空间约50亿;并且考虑正面人脸识别 背面3D建模的话,生物识别 增强现实双双实现,对应的市场空间再翻一倍,共达到100亿,是目前IRCF空间的2.5倍。
即使考虑降价因素,市场空间仍很大。人脸识别,汽车及安防提供潜在的增量空间。汽车电子是下一个金矿,电动汽车 与无人驾驶技术带动下,汽车电子化率提速明显。2000年时平均每辆汽车使用芯 片数量仅有十几个,2016年平均每辆车需要600个芯片,未来汽车电子化率进一 步提升。博世、大陆、英伟达、克莱斯勒在2017年CES均展示了车内人脸识别应用,人脸识别未来有望大规模进入汽车电子领域。全球每年汽车销售8000万辆,考虑到汽车所需要的滤光片的数量、尺寸;组立件结构等因素,且在整车成本占比更小,价格敏感性低,ASP应比手机高,以50%渗透率算,未来空间容量约5亿。安防领域贡献人脸识别另一个增量市场。保守估计,安防用摄像头销量未来能够达到4000万台,以50%渗透率计算,未来市场空间约1亿。
通过上面的分析可以清晰的知道,未来人脸领域是一个发展空间巨大的技术,其中基本的技术路线如下图所示:
所以今天来和大家聊聊人脸检测与识别中的一些技术,简单为大家介绍和展示,希望可以给有兴趣的您带来一丝丝帮助,给未知的您带来浓厚的兴趣!今天主要内容有:人脸检测,人脸配准,人脸属性识别等技术。
人脸检测
“人脸检测(Face Detection)”是检测出图像中人脸所在位置的一项技术。其中,人脸检测算法的输入是一张图片,输出是人脸边界框坐标。一般情况下,输出的人脸坐标框为一个正朝上的正方形,但也有一些人脸检测技术输出的是正朝上的矩形,或者是带旋转方向的矩形。
常见的人脸检测算法基本是一个“扫描”加“判别”的过程,即算法在图像范围内扫描,再逐个判定候选区域是否是人脸的过程。因此人脸检测算法的计算速度会跟图像尺寸、图像内容相关。
人脸检测的结果
人脸专集1 | 级联卷积神经网络用于人脸检测(文末福利)
人脸配准
“人脸配准(Face Alignment)”是定位出人脸上五官关键点坐标的一项技术。人脸配准算法的输入是“一张人脸图片”+“人脸边界框坐标”,输出五官关键点的坐标。五官关键点的数量是预先设定好的一个固定数值,可以根据不同的语义来定义(常见的有5点、68点、90点等等)。其实,我一般的做法是在精确检测人了后,进行裁剪将最后的结果作为人脸配准的输入。
当前效果的较好的一些人脸配准技术,基本通过深度学习框架实现,这些方法都是基于人脸检测的边界框,按某种事先设定规则将人脸区域扣取出来,缩放的固定尺寸,然后进行关键点位置的计算。因此,若不计入图像缩放过程的耗时,人脸配准算法是可以计算量固定的过程。另外,相对于人脸检测,或者是后面将提到的人脸提特征过程,人脸配准算法的计算耗时都要少很多。比较流行的模型如:CFAN,MTCNN,Cascade CNN等。
各种流行框架模型
人脸专集2 | 人脸关键点检测汇总(文末有相关文章链接)
人脸专集3 | 人脸关键点检测(下)—文末源码
人脸专集4 | 遮挡、光照等因素的人脸关键点检测
关键点配准结果
人脸属性识别
“人脸属性识别(Face Attribute)”是识别出人脸的性别、年龄、姿态、表情等属性值的一项技术。一般的人脸属性识别算法的输入是“一张人脸图” “人脸五官关键点坐标”,输出是人脸相应的属性值。人脸属性识别算法一般会根据人脸五官关键点坐标将人脸对齐(旋转、缩放、扣取等操作后,将人脸调整到预定的大小和形态),然后进行属性分析。
常规的人脸属性识别算法识别每一个人脸属性时都是一个独立的过程,即人脸属性识别只是对一类算法的统称,性别识别、年龄估计、姿态估计、表情识别都是相互独立的算法。但最新的一些基于深度学习的人脸属性识别也具有一个算法同时输入性别、年龄、姿态等属性值的能力。
人脸比对
“人脸比对(Face Compare)”是衡量两个人脸之间相似度的算法。其中,人脸比对算法的输入是两个人脸特征,输出是两个特征之间的相似度。人脸验证、人脸识别、人脸检索都是在人脸比对的基础上加一些策略来实现。
基于人脸比对可衍生出人脸验证(Face Verification)、人脸识别(Face Recognition)、人脸检索(Face Retrieval)、人脸聚类(Face Cluster)等算法。
人脸识别
“人脸识别(Face Recognition)”是识别出输入人脸图对应身份的算法。它的输入一个人脸特征,通过和注册在库中N个身份对应的特征进行逐个比对,找出“一个”与输入特征相似度最高的特征。将这个最高相似度值和预设的阈值相比较,如果大于阈值,则返回该特征对应的身份,否则返回“不在库中”。
人脸活体
“人脸活体(FaceLiveness)”是判断人脸图像是来自真人还是来自攻击假体(照片、视频等)的方法。和前面所提到的人脸技术相比,人脸活体不是一个单纯算法,而是一个问题的解法。这个解法将用户交互和算法紧密结合,不同的交互方式对应于完全不同的算法。鉴于方法的种类过于繁多,这里只介绍“人脸活体”的概念,不再展开。