“Hello world”几乎成为每一个学习编程的开发者与代码之间的第一句对话,这是人与人通过计算机平台进行的远程信息交流方式。当苹果将一个叫做Siri的女声装进手机,并主动向大家说“Hello”时,人类与机器对话的时代已经来临,而这也代表着人工智能正在走向我们的生活。
1996年春晚那天,蔡明阿姨从一个纸箱子里冒出来,用一种后现代电子音的风格与郭达大叔展开一番“人机大战”,最后的结局以郭大爷背着“机器人”蔡阿姨去找赵忠祥告终,机器人完胜。一年后,IBM研发的“深蓝”超级计算机在与国际象棋冠军的比赛中胜出,在科学领域中,这是计算机以一种主动的方式第一次战胜人类。
通过这次真正意义上的“人机大战”,人们才猛然醒悟,原来计算机自主学习的能力如此强大,已经可以在代表高智商的领域中战胜人类,甚至有专家提议尽快控制或遏制人工智能技术的发展,不然人类社会早晚会被计算机控制,成为计算机的奴隶。
相信在同一年重新回到苹果的史蒂夫·乔布斯,也在关注着这场世纪大战,并已经在自己脑海中勾画出了未来的人机交互场景。遗憾的是,在2011年Siri问世时,乔布斯已经病逝,没能看到他极力推动的第四代人机交互革命给人们生活带来的改变。
人工智能的初代体验
第四代人机交互被定义为多通道、多媒体的智能人机交互阶段,Siri的出现,可以说对第四代人机交互革命作出了重要贡献。它把人工智能技术集成在我们日常使用的手机上,赋予了手机更加智能化的功能,让我们在生活与工作中随时都能感受到人工智能技术带来的便利,同时拉近了人类与智能计算机之间的距离,降低了人类对智能计算机的恐惧感,甚至还能表现出一些人类智商依然高高在上的优越感。
比如,你对着Siri说:“我家热得快炸了!”,它并不知道你是想打开淘宝买个热得快,还是想让它通过智能家居模式打开家里的空调。
成立于2007年的Siri本来一直安静的躺在App Store里,供大家下载使用,不出意外,安卓版Siri也将在未来几个月后与大家见面,这一切的转变都发生在2010年的一个夜晚。乔布斯卧床养病期间,翻看App Store时,偶然发现了这款智能语音识别应用,当即决定与Siri开发团队取得联系,并最终以2亿美金完成收购,2011年就出现在了iPhone 4s上。
初代Siri搭着iPhone的顺风车,瞬间成为全球关注热点。Siri的注入,也让移动手机的使用方式发生了质的改变,从按键,到触屏,再到人机对话。我们可以试着创建一个应用场景,看一下Siri给我们的生活带来的变化。
背景
小乔想约小库明天到自己家的车库里,聊一下公司接下来的发展规划。
Siri之前的操作
小库需要打开天气app,查询明天的天气情况是否合适出行;打开地图app,规划好路线;在闹铃里设置一个事件提醒。
Siri出现之后的操作
小库直接唤醒Siri,然后说:明天上午十点到小乔家的车库,Siri就会将这个事件自动记录在事件提醒中;然后继续问:明天是否需要带伞?Siri会将明天的天气情况显示在对话屏幕上。最后告诉Siri明天要去的具体地址,对话屏幕上将自动弹出从小库所在地到目的地的具体路线图。
不用打开任何app,对着手机说出你的需求,就能快速得到解决方案,这个看似简单的应用场景,背后的技术含量可并不简单。
Siri是如何工作的
首先我们知道在使用Siri时,会用到网络流量,这是因为iPhone需要将你的语音指令通过网络传输到远端服务器,服务器再运用大数据分析技术在海量数据库中针对语音指令传达的内容做进一步分析,最终将结果传输回手机,这个过程,其实也可以看做云计算的基本运行原理。
而对语音指令的分析,就要用到智能语音识别技术,对自然语言进行语义分析,转换成计算机能够理解的编程语言。语音识别技术是一个非常复杂的系统,所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等。在Siri与大家见面之前,工程师将利用以上涉及到的技术,设计一套复杂的数据模型,让Siri通过这套模型学会听懂不同国家和地区的对话方式。
Siri的改进
为了让Siri的存在感显得更加自然,苹果改进了Siri的唤醒方式,当你直接对着手机喊:“Hey Siri”时,Siri就已经来到你身边了。苹果在自己的机器学习博客上发布了一篇文章,讲解了“Hey Siri”的功能是如何实现的。苹果在协处理器中集成了非常小的语音识别装置,并让它们持续运行,翘首以盼的等着用户对喊出“Hey Siri”,当识别到这两个单词后,Siri就会突然出现在你的面前,就像孙悟空召唤筋斗云一样神奇。
前一阵,抖音上流行过一段视频,朋友正在紧张吃鸡,眼看98k在八倍镜的加持下,马上就要拿下比赛了,旁边突然冒出来一句“Hey Siri”,手机屏幕立即变成了与Siri的对话模式,等再回到游戏画面,游戏结束。
苹果的工程师也许在吃鸡时也遇到了类似的悲痛,所以痛定思痛的工程师们决定为Siri增加一个更加智能的功能——机器学习技术,用于识别设备所有者的声音,使其能够利用机器学习特性来非常精确识别设备的主人。同时,引入机器学习,也能为Siri下一步的迭代更新打下一个更加智能化的基础,赋予Siri更多功能。
Siri未来还能给我们带来什么
除了移动手机端,Siri还被装在了苹果iWatch以及即将在国内发布的HomePod智能音箱上。据悉,大众汽车将通过一项系统更新,让人们可以通过Siri打开车门,启动汽车。
对于神秘的苹果,我们都不知道他下一步要怎样改变世界,但是从目前的产品布局看,Siri肯定将是苹果迈向人工智能领域的一个重要突破点,未来的产品也都将会围绕Siri开展,用Siri串起苹果各产品线之间的联接,同时开放第三方接口,接通各种智能家居,让智能的Siri与你形影不离。
我们不妨想象一下,当手机接到一通骚扰推销电话,这时Siri跑出来主动接听电话,并和对方聊了半小时,这是多么魔幻的一件事。其实这样的智能客服技术现在已经来到我们身边,感兴趣的朋友可以拨打一下海底捞的客服电话,聊两句。
我:Hey Siri,帮我写一篇文章。
Siri:需要我写什么?
我:关于你自己的事情。
Siri:好的。
完稿。
【科技云报道原创】
转载请注明“科技云报道”并附本文链接