戴口罩的人脸数据被公开贩卖:两毛一张,能用于训练算法精准度也能申请信用贷款!

2020-04-07 15:02:39 浏览数 (1)

新冠疫情之下,京东数科、汉王、百度、腾讯、云从科技、中科视拓等众多科技企业纷纷推出或开放了自己“戴口罩状态下的人脸识别”技术。殊不知,方便了居民、秀了肌肉的同时,也带来了新的一波数据安全隐患。

大数据产业创新服务媒体

——聚焦数据 · 改变商业


目前,已有卖家在网上以两毛钱一张的价格开始售卖人们面戴口罩的人脸照片,数量高达几十万张。据悉,这些面部照片有的是通过“网络爬虫”技术从网上搜集,有的则是通过上下班打卡、进出小区门禁时拍摄的面部照片获取。而购买方,则主要是用于训练算法精准度,或用于申请信用贷款,甚至注册公司。

在如今的新冠疫情之下,众多公司纷纷研发出针对戴口罩场景下的人脸识别技术。在给人们带来便利的同时,也减少了摘口罩所带来的病毒感染风险。但对于那些本就担心人脸识别技术会造成数据泄露的人来说,忧虑依旧:人们即便戴上口罩也阻挡不了人脸数据的泄露,而这样的风险存在于人脸识别技术从研发到应用的几乎每个环节。

人脸识别技术主要是基于对人面部特征点的提取来做出判断,而对于戴口罩的人来说,只能能提取到眼睛、眉毛等区域的特征点,无法进行全脸扫描。所以,戴口罩的人脸识别技术,主要实现方法是通过模型训练加强对眼睛、眉毛等重点区域的识别,或者是通过图像重构网络的方式将戴口罩的人脸图像重构为未戴口罩的人脸图像,进而通过比对实现人脸识别。

图片来源:某企业公布开发的口罩遮挡下的人脸/身份识别 SDK测试范例

无论是哪种实现方法,都需要有人脸数据的积累,且数据越海量往往越能提高精准度。

那么,这些海量数据从哪里来的?据悉,大量人脸数据被非法售卖用于训练算法的精准度。虽然并不能将买家与研发新技术的公司对号入座,但是推出新技术的公司应该公布训练所需人脸数据的来源。

虽然技术是中立的,但如果用于研发的基础数据来源不明,就很难说清技术究竟是天使,还是魔鬼。此外,也不能排除一些不法分子也在研发利用人脸识别技术,他们购买数据,训练算法的精准度,就是为了更方便地破解人脸密码,进而拿到数据用于非法利益所的。

这些基础数据可能泄露于保存、传输、应用等各个环节。这既有技术本身存在漏洞的原因,也有人为窃取的原因,甚至有些数据是监守自盗,负责管理数据的人售卖数据的新闻并不少见。尽管具体到单个数据泄露案例,可能会找到原因,但是大量泄露数据综合在一起,背后原因错综复杂,很难说清楚到底是怎么泄露的。

人脸的不可更改性,让很多人对人脸识别技术持保守态度。去年底发布的《人脸识别落地场景观察报告(2019年)》显示,在个人信息泄露频发的态势下,超过七成民众对网络运营者的安全保障能力存有疑问,担心人脸数据被泄露。去年一位大学教授被杭州野生动物园强制使用人脸识别入园,更是一怒之下将后者告上法庭。

人脸识别技术所需基础数据的采集如何规范?技术应用的边界在哪,如何把握合法性和正当性?目前还没有相关的明确说法。有关部门要监管也存在一定困难,更多的要靠行业自律,这让数据泄露存在很大的不确定性。

尽管众多科技公司宣称人脸识别技术已经准备好了,戴口罩人脸识别技术也已经应用于一些公司,但如何防范人脸数据泄露,却很少提及。事关个人隐私安全的大事,在社会规制没有准备好之前,应该严格限制应用的范围,并征得用户同意。高筑安全防线,再推广应用不迟。毕竟,脸可能是人们最后一道隐私防线,这个密码被破解,后果将不堪设想。

—— / END / ——

0 人点赞