智能识别方面主要进展 | 语音识别、OCR识别、图像识别、生物识别…… | 智能改变生活

2020-08-04 11:19:47 浏览数 (2)

智能核心是对认知能力的升级革命,从感知、认知到决策执行,目前基础理论层、技术层的发展已经达到认知层面的建模与分析,应用层则体现为利用智能技术解决各种多模态目标识别的速度和精度,本文整理了目前市场上智能识别领域的典型应用进展及部分厂商。

20世纪50年代以来,计算机技术的发展使通过机器学习实现识别与分类成为可能,并且取得了很好的目标识别效果。众所周知,机器学习是人工智能的一个重要研究和应用领域。因此,通过引入智能信息处理的方法构造能够处理大规模数据的目标识别与分类的新方法已成为人们急切关注的热点之一。目标识别与分类问题的任务是对目标的类别、属性作出某种判决。识别与分类技术可应用于图像识别、医疗诊断、生物识别、信号识别和预测、雷达信号识别、经济分析,以及在智能交通管理、机动车检测、停车场管理等场合的车牌识别等很广泛的领域。

互联网发展之初受到网络带宽、数据存储等相关技术的限制,信息的传播以单模态形式为主,如文字报道、图像相册等。进入大数据时代,信息的传播变得丰富多彩,人们从互联网中同时接受图像、视频、文本等不同模态的信息。例如,当我们在互联网上浏览一篇精彩的新闻报道时,不仅可以看到详细的文字描述,还能看到记者在现场拍摄的照片,甚至还有相关的视频报道。这体现了互联网数据从单模态到多模态的转变。随着互联网多模态数据的大量出现和传播,“管不住”和“用不好”两大问题也日益突出。“管不住”是指多模态大数据中隐藏着大量涉恐、涉暴等有害信息,极大地危害着国家安全和社会稳定,目前还缺乏自动的分析与识别技术。“用不好”是指现有技术一般是单模态分析与识别,仅针对信息有限的单模态数据,难以对多模态数据进行有效利用。如何让计算机看懂世界,实现对互联网多模态大数据的有效监管与利用,是目前急需解决的重大问题。

语音识别:语音识别行业现在似乎维持着最大的平衡,因为国内外各家的引擎识别率都基本在同一个水平线上,差不多达到了当前语音识别技术的极限,彼此之间差距不是那么明显。未来的语音识别市场,预计将会有越来越多的公司参与,以后语音识别的性能可能更多的体现在前端技术和语义理解上。国内著名的语音识别产品主要有百度语音、科大讯飞的灵犀、云知声的语音助手等。

人脸识别:全球科技业者不仅陆续推出指纹辨识解锁手机的技术,包括苹果(Apple)、微软(Microsoft)等亦加速脸部辨识技术发展,未来消费者可望不用再记忆一长串的密码,只要透过脸部扫描便可更安全地登入相关装置。目前人脸辨识技术逐渐应用于全球摄影机产品,而数百万消费者的脸部照片也储存在持续扩大的资料库中,以供交叉比对,尤其是大陆相关业者在脸部辨识技术发展迅速,应用范围包山包海,包括安控和支付等用途。

当前,国内国外的人脸识别技术大多数在开源OPENCV等开源库上进行新规则添加,公司之间的识别正确率差异仅仅在小数点上,提升意义不大,最关键的强化方向是商业适用性,使用表现的准确率和高可用性。人脸识别在身份确认、公司考勤、公安部排查犯罪嫌疑人、安保公司的人脸警报等方面应用比较广泛。国内人脸识别领域比较出名的公司有商汤科技、格灵深瞳等。

车牌识别:车牌识别技术相信大家都不会觉得陌生,智能交通,小区停车场等,都有很好的应用.为满足市场和用户需求。目前国内外的研究机构或公司企业采取的办法是采用主动红外照明摄像或使用特殊的传感器来提高图像的质量,继而提高识别率,这样做的同时也造成了系统的投资成本过大,应用领域变小,不适合普遍的推广。在国外己提出不少关于车牌自动识别的理论,有的己经很成熟,投入实际应用。早在70年代国外就有自动车牌检测系统用于检查被盗车辆的情况,时至今日,己达到很高的应用水平。国内著名的车牌识别产品主要有中科院自动化研究所汉王公司的汉王眼、北京文通科技有限公司的文通车牌识别系统等。

虹膜识别:现代信息社会对精准识别的需求,呼唤更加不可替代的生物体特征,虹膜识别应运而生。虹膜识别是目前生物识别技术中安全系数最高的识别方式。它具有如下优势:唯一性,即便使用克隆技术也无法复制某个虹膜。且极其稳定,一经形成,终身不变。一般性疾病不会对虹膜组织造成损伤,不会因职业等因素造成磨损。高度防伪,具有极强的生物活性。无需用户接触设备,对人身没有侵犯,因而容易被公众接受。根据某报告显示,虹膜识别在手机、平板电脑等消费级终端市场规模将增长的更快。从终端市场来看,有数据显示,2016年全球企业级虹膜识别终端出货量1070万台,预计到2025年出货量将达到6160万台,复合年均增速为19.1%,对应市场规模将从2016年的6.77亿美元增长至2025年的41亿美元,复合年均增速19.7%。其中,2020年市场规模约为13.5亿美元。

国内方面,尽管起步落后于海外公司,但是在国家科研计划和研究所科研人员的共同努力之下,目前已经有多家较为知名的公司出现,产业链正在不断完善。除了在手机等消费终端上的应用,目前虹膜识别技术覆盖范围也正在进一步拓展,被广泛应用在门禁考勤、银行金融、医疗社保、信息安全、司法安检等多个领域。相信未来虹膜识别技术在中国市场的空间已经被打开,未来有望在更多智能终端和日常领域得到应用。

OCR(Optical Character Recognition,光学字符识别)智能识别技术:通过对图片中的文字进行提取识别,转换成可检索的数据。OCR基于汉字的识别最早见于20世纪60年代,采用基于模版匹配的方法,由IBM公司的Casey和Nagy于1966年提出。我们国家开始于70年代,后在90年代,中文OCR技术慢慢走商业市场,开始在实际中应用。目前主要应用有证件识别、银行卡识别、名片识别、文档识别、车牌识别等。

唇语识别:相较于前文提到的语音识别、车牌识别、人脸识别等难度更大,其很大程度上取决于语言的语境和对其的了解,而这些都只通过视觉来呈现的。成熟的唇语识别系统需要建立在大量人脸特征样本的基础之上,通过带记忆的深度神经网络才能保证结果的最大准确性。目前,唇语识别主要存在于学术领域的研究,比较著名的有牛津大学研发的Lipnet、Google团队研发的Deepmind,但离投入实战还有很长的路要走。国内,对唇语识别研究的比较知名的公司仅海云数据一家。与目前市面上存在的“单词”识别不同,海云主要研发具有更高应用价值的“语句”层面的唇语识别,目前,海云数据的唇语识别中文准确率已经达到了71%,英文识别率高达80%。

指纹识别:即指通过比较不同指纹的细节特征点来进行鉴别。指纹识别技术涉及图像处理、模式识别、计算机视觉、数学形态学、小波分析等众多学科。由于每个人的指纹不同,就是同一人的十指之间,指纹也有明显区别,因此指纹可用于身份鉴定。由于每次捺印的方位不完全一样,着力点不同会带来不同程度的变形,又存在大量模糊指纹,如何正确提取特征和实现正确匹配,是指纹识别技术的关键。统计数据显示,2015年,全球智能终端指纹识别芯片的出货量达到4.78亿颗,市场销售额达到21.1亿美元。预计到2018年,全球智能终端指纹识别芯片市场规模将达到11.99亿颗,销售额将达到30.7亿美元,销量的年复合增长率约 36%,销售额的年复合增长率约 13%。在此背景下,指纹芯片厂商、指纹识别模组厂商、指纹识别方案提供商均将从中获益。

面对这样一个巨大的市场,苹果在iPhone 5s上率先标配了指纹识别,推动了指纹识别技术在智能手机市场的应用,之后众多的国产芯片厂商也纷纷杀入指纹识别市场,而且数量众多。目前国外的指纹识别厂商主要有AuthenTec(2012年被苹果收购)、FPC、Synaptics等几个国际大厂,以及神盾、义隆、敦泰、茂丞等台湾厂商之外,国产指纹识别芯片厂商主要有汇顶、迈瑞微、费恩格尔、信炜、芯启航、贝特莱、思立微、集创北方、比亚迪等十多家企业。

0 人点赞