Sensory Inc.作为向全球移动设备提供先进的复杂生物识别算法的供应商,于近期展示了其采用面部和声音识别算法的AI虚拟银行助理技术。
以下为demo视频 -
Sensory于近期更新了其TrulySecure平台至4.0版本,支持3D面部识别和增强AI系统,比传统的2D面部识别的准确率提升了50%。
Sensory CEO Todd Mozer接受了FindBiometrics&Mobile ID World 执行总编Peter Counter的专访。访问从双方探讨Sensory TrulySecure最新升级4.0版本开始,并谈到了Apple Face ID,语音识别技术,虚拟助理(Virtual assistant),设备端人工智能技术(On-device AI)和其他话题。
PC(Peter Counter)- 感谢接受我们的专访。Sensory最近更新其TrulySecure生物认证(Biometric authentication)至4.0版本,新版本带来哪些更新呢?
TM(Todd Mozer) - 去年我们开发和很多新的技术,而4.0版本是技术的高峰(the culmination)。你可以考到我们的TrulySecure包含以下几大部分 -
- TrulySecure Speaker Verification,是其语音生物识别部分(voice biometrics side)
- TrulySecure Face是面部认证部分
- Wake word唤醒词
接下来,请让我逐一介绍整个去年我们所增加的部分。
语音部分,我们将唤醒词集成到了TrulySecure,我们可以用"Alexa"或"Hey Google"唤醒词唤醒TrulySecure。我们也增加了与文本无关的用户语音验证(Text Independent Speaker Verification),用户无需重复说出特定的词汇(Specific word)设备就可以辨别和验证。
同时我们做了很多的工作提升用户语音验证的准确度,在较低的信噪比环境下(Low signal/noise radios)也可以展现极佳的性能,更好的混响环境性能(better in reverb),更好的的远距离性能。改进后的特征提取(Improved feature extraction)和更多的数据,有助于达成更好的性能。
在面部生物识别部分,我们增加了对3D Camera的支持。随着3D Camera的越来越普及,可以提供更好的暗光环境下性能,支持更大角度的面部识别,并且最重要的更强悍的防欺骗性能(Anti-spoofing)。
TrulySecure Face我们重写了代码以更高效的调用GPG。事实上,Sensory是一间设备端AI技术公司(On-device company),所有Sensory的技术方案都是边缘侧设备端的。但是我们最新的TrulySecure4.0也支持云端集成的选项(Ability to have options for cloud-based integration)。事实上我们的一些客户要求我们在云端支持2D防欺骗面部识别技术。
面部识别和语音识别的准确率获得了极大地提升,原因之一在于我们获取了更多的数据。Google Play Store上由Sensory开发的AppLock by Sensory是等级最高的(4.3 rating)的生物识别APP,下载量高达百万级,也有利于我们获得每几周高达Terabytes的数据,我们获取了不同的面部,不同环境,不同角度的数据。
此外,TrulySecure 4.0不仅仅应用于面部身份识别,在此基础上,Sensory开发出面部特征检测,如眼睛是否张开或者是闭合。这样当你打盹的时候,别人就不再可能解锁你的手机了。
Sensory也在同步开发比如人的情绪的检测(喜怒哀乐)和个人人口统计特征(Demographic ID)检测等。
PC(Peter Counter)- 我非常感兴趣的是(Fascinated)如此众多的满足主流需求和趋势的产品,Sensory在短时间内开发出如此强大和丰富的功能,相当的不可思议。刚才提到的3D Camera,在Face ID时代是否有强烈的用户需求?
TM(Todd Mozer) - 当然!在Apple推出Face ID之后,突然之间所有的移动设备开发商都在计划支持人脸生物识别,也极大地牵引了(Got traction)对Sensory面部识别技术的需求,我们与众多的手机制造商签署了技术转移合同。Sensory的独特优势在于我们可以第一时间获得用户的反馈,客户需要3D人脸识别,这鞭策(Spur)了我们技术方向的决心,完全是技术和客户驱动的创新成果。(Market and customer driver innovation)
PC(Peter Counter)- 是的,时间节点也恰到好处,恰好VCSEL技术在Android手机上逐渐获得了广泛的采用。Sensory同样支持语音识别解决方案,Sensory的TrulyHandsFree和TrulyNatural技术最新状态如何?
TM(Todd Mozer) - TrulyHandsFree是一项小尺寸内存占用(Small-footprint)唤醒词和小词汇量(Small vocabulary)语音和控制技术。我们在此领域需求极大,牵引了我们技术的持续更新。我们所做的很多工作是提升其准确率(on accuracy improvement)。过去十年间发生的最重要的事件之一是Amazon推出了Echo产品家族和Alexa,突然之间远场(Far field)成为了显示(Became a real thing)。我们最近五年所做的最重要的工作之一就是关于如何提升远场下的识别率。
不仅仅是在一臂范围内达到精准识别,市场更需要的是在室内回声和各种噪音条件下的室内远距离精准识别(Bring into effect room echo and signal noise kind of things)。同时Sensory技术栈(Technology stack)也引入了多种不同的技术,比如回声消除(AEC, Acoustic Echo Cancellation)。这样对于手机来说,可以在响铃的同时识别到语音命令,比如“接听电话”。实际上我们也有噪音消除领域的(Noise cancellation)紧密合作伙伴。
Sensory TrulyNatural是我们的大词汇量(Large vocabulary)自然语言识别(Natural Language Recognizer),主要工作在于需要不断的提升识别精度的同时缩小尺寸。最小仅达20M-30MB,考虑到自然语言识别的负责性(Sophistication)这已经相当的令人印象深刻(Impressive)。
PC(Peter Counter)- 绝对同意。作为一个新技术的早期采用者(Early adopter)。对于虚拟助手和智能家居来说,如果不能正常工作的话,会令人相当的恼火。非常高兴的看到在此领域有如此之多的技术创新。
TM(Todd Mozer) - 是的,你也将会看到技术革新仍会持续发生。目前仅仅是可用(Useable)但我们仍需要持续的改进。我们在持续的向前努力,你也会看到智能手机将会更加的智能,而虚拟助理也将真正的可以帮到我们(Our assistant really can assist)。
PC(Peter Counter)- 让我们继续说说语音,曾经人们对语音命令和语音方式的身份验证存在很大的疑问(Skepticism),人们对使用语音来代替密码存在的很大的疑惑。你们是否看到对于语音验证方式的持续的增长的需求,特别的是,这些需求有多大方面来自于虚拟语音助理?
TM(Todd Mozer) - 这是一个好问题。我的意思是说使用生物识别的方式,语音身份识别的需求更多的是来自于手机厂商(Mobile Phone OEMs),而面部识别的需求更多的是来自银行手机APP。我们有若干个银行客户使用我们的面部生物识别,或者是与语音相结合的方式。我们的手机客户则相当的不同,我们没有看到客户要求使用面部和语音相结合的方式,这相当的令人惊讶和有趣(Whish is surprising and interesting)。
PC(Peter Counter)- 确实相当有趣,特别是在银行这种高风险的交易应用中(High-risk transaction),更多的是采用多因素的方式(Multi-factor approach)。
未来(Going forward)人工智能将在Sensory技术中扮演非常非常重要的角色,可以是Sensory是使用神经网络技术来强化生物识别的开拓者(Pioneer of using neural networks to enhance biometrics)。人工智能正在如何的改变身份验证技术,人工智能正在成为主流么?
TM(Todd Mozer) - AI是一个相当宽泛的概念(Very broad concept),对于不同的人来说其含义也不同。Sensory当然的已经在机器学习和神经网络算法领域耕耘超过25年,是的非常感谢称呼Sensory为行业开创者 - 我们确实,特别是在消费电子领域是应用机器学习和神经网络算法技术的先锋。
不同之处在于算法越来越多的需要数据。我们发现在深度学习中,提供的数据越多模型越优秀,数据越多也将获得越为复杂的网络(Complex net)进而更好的利用数据。所以,某种程度上市是一种通用的技术(General technologies)从计算机机器学习(Computer machine learning)到深度学习,在过程中流程越来越深入和宽广(Gotten deeper and wider in the process)。
我们看到越来越多的从传统的程序方式(Traditional Programmed Approches)到人工智能到深度学习方式,事实证明深度学习确实更佳。
我不认为任何持怀疑态度的人,特别是对于计算视觉(Computer Vision)来说,深度学习会超过任何形式的专家程序(Expert programming)。
深度学习的挑战在于,你的模型越来越大,流程的复杂性也越来越高,从而需要更复杂的处理过程。在这方面,Sensory拥有独特的专有技术(Proprietary techniques),可以使大模型变小并更有效率。