背景
“语音隐私泄露在未来会是重灾区”
对于窃取用户语音隐私这件事,企业和用户基本上都是各执一词。有的企业表示,从技术上,目前声音信息的处理,远达不到通过麦克风去获取个人隐私的水平。
然而事实是 手机、智能音箱,包括一些车载的智能语音终端,完全可以做到每一分每一秒监听我们的谈话、聊天,这也使得隐私安全问题更加突出
现在手机系统越升越高,从按键输入密码到指纹解锁再到现在的刷脸。如果猜想与朋友不经意的对话都能被商家进行贩卖,那刷脸后凭证将传向何方,更是令人不寒而栗。
语音作为场景交互的入口,其存在的隐私安全隐患在很多时候更加令人难以防范,对涉及的一些隐私安全问题,平台开发者也缺少真诚的回应。我们固然要发展、要创新,但不代表在技术刚起步时就要忽视这些问题的存在。
哥大研究院的算法是什么
哥伦比亚工程公司的研究人员开发了一个人工智能新系统,它可以产生一种低音,人们可以在任何房间、任何情况下播放,从而阻止智能设备的窥视。而且它很容易在电脑和智能手机等硬件上下载,使人们有能力保护自己的声音隐私。
算法特点
该算法具有预测性。它会推断用户接下来要说什么,并实时产生干扰性的可听背景噪音(耳语)来掩盖声音。
算法效果
目前,该系统只适用于英语,成功率约为80%。噪音的音量相对较低,最大限度地减少对用户的干扰,并允许舒适的交谈。
该算法研究过程背后的故事
如今,几乎所有的电子设备都嵌入了麦克风,当用户收到私人谈话中提到的产品广告时,他们就会体验到高水平的自动窃听。
最初方案
许多研究人员以前曾试图通过使用白噪声来降低这种风险
白噪声可以在一定程度上欺骗自动语音识别系统。
然而,在实际情况下使用任何现有的实时声音隐藏方法都是不可能的,研究人员说:因为音频需要接近瞬时的计算,而这在当今的硬件上是不可行的
声音伪装
语音识别模型将考虑到每一个被训练来转录的口语单词,预测用户什么时候会说这些单词,并在适当的时候产生耳语。
他们的实验用各种语音识别系统测试了该算法,发现当耳语被使用时,总的诱导错误率为80%。
实验表明,像“the”、“our”和“they”这样较小的单词更难被屏蔽,而较长的单词通常更容易被算法攻击。
总结
语音识别所带来的隐私安全隐患更多的是和每个个体相关,与每个用户的切身利益相关,而不仅仅是存在于商业层面。所以,在目前阶段,一些法律、规则必须要即时跟上来,不能任其发展。“语音隐私泄露在未来会是一个重灾区,而且是一个要害区域。