最近非常火热的人工智能虚拟个人助手(VPA),2015 年相比于 2014 年还下降了一点,为什么经过一年的发展,人们的期待反而降低了?
而低调的虚拟客户助理(VCA),从 2014 年的曲线顶端走到了右边。这意味着技术可以产业化,在这块市场谁抓住了机会?
刚好在2015中国计算机大会上,遇到了从十多年前涉足VPA ,到如今作为VCA的典型代表被Gartner向全球推荐的小 i 机器人的朱频频总裁,给大家讲解了这方面的事情,同时他也对小 i 背后的产品和技术原理做了介绍。
新智元也借这个机会对朱频频进行专访,来看看人工智能虚拟助理背后的故事。
【专访】小 i 机器人
1、作为一家中国企业,小 i 在 Gartner 的报告中多次被提及,并不多见,是什么吸引了他们对小 i 的关注?
朱频频:吸引Gartner关注我们的原因应该是小i的技术以及我们成熟的产业应用吸引了他们。Gartner最早在做智能客服、机器人等的调研报告时,就发现了小i机器人,通过对小i的追踪了解,他们觉得小i确实在全球具有代表性。之所以取得这样的成绩,是因为这么多年来,小i一直专注于智能机器人的研发,而专注的结果就是某一天你一抬头,发现自己就成了某领域专家。不一定非要去copy别人,如今,从中国整个IT和互联网的发展来看,其实在很多方面,中国已经不再仅仅是个追随者,中国人有了非常多的创新,像阿里、腾讯,无论是在商业模式,甚至在一些技术上面,都有创新,在硅谷,很多美国人也在学习中国的创新。小i能在该领域取得一些成绩,特别是这种企业级的应用,是相当不容易的,因为,国外的企业级应用的已经发展了很长时间。
2、Gartner将小i定义为“通用智能机器人平台和架构能力输出方”,小i在产业链中所处的位置是怎样的?
回答这个问题,先要弄清一个问题,对于智能机器人来说,什么是应用开发商,什么是技术平台提供商。所谓应用开发商,就是帮助客户如何把机器人与业务对接起来,为客户服务。而技术平台提供商在底层将核心的技术封装起来,提供一些开发接口和模块,能够供应用开发商调用。Gartner将小i定义为VCA(虚拟客户助理),也就是我们说的智能客服,在这个领域,我们在国内做了很多的大客户,而且我们也发布了iBot cloud云服务平台,为中小企业提供支持,做一些自己的虚拟机器人,现在有超过10万的开发者,在我们的平台上进行开发。所以可以看出,我们既是应用开发商,也是技术平台提供商。
3、在 Gartner 技术成熟曲线报告上,我们看到小 i 所在的技术类别,VCA 从 2014 年的曲线顶端,来到了 2015 年的曲线顶端的右边部分。这意味着什么?
如果懂得Gartner技术成熟曲线图含义的话,这个问题很好解释。在曲线的左边,代表着一些新的技术,随着技术的发展,业界对该技术的期望愈来愈高,而到达顶点之后就开始回落,意味着该技术进入了实用化阶段,即产业化的前期,这个过程也不是一蹴而就,需要慢慢推进。2014年VCA在顶点右边一点,2015年,又往右前进了一点。意味着,产业化的过程又往前推动了一步,可以很骄傲的说,这中间是有小i的功劳的。
那么技术上的差别呢?因为可以看到,它的技术已经过了技术预期的最高点,所以这里面的技术已经不是最重要的了,重要的是技术的产业化。如果是分布在曲线图的左边,那么提升一点点就代表着技术有了很大的提升。
4、看 Gartner 的技术成熟曲线图,最近很火热的 VPA 技术,2015 还要比 2014 年相比反而位置下降。这也是小 i 涉及到的技术,请问下降的原因是什么?
其实是说明业界对VPA的技术充满了期待,但它的表现出的结果不尽如人意,或者说业界对VPA的期待高于技术的表现。
5、像小 i 这样的虚拟客户助理,我看到服务的客户有金融、运营商、电子政务等。在构建不同领域的服务系统时,相同点是什么,不同点是什么?
从目前来看,相同点就是在不同的领域我们所用的知识模型、包括语义的结构,基本是相同的,当然,知识模型本身也经过了不断的发展,从早期的概念开始,发展后把本体的一些概念,后来像知识图谱这些技术都融合了进来。
但不同行业的内容却是不同的,例如金融行业跟电信行业,所涵盖的知识肯定是不一样的,本体的结构也不大一样,之间的一些节点的关系,知识图谱的关系都不一样,还有很多的场景化的应用也很不一样。但结构是比较类似的,我们的知识工程师可以通过一些工具,包括一些分析工具、操作工具,帮助不同的领域去生产知识。
而且,我们做的行业越多的话,会越来越发现行业之间的一些通用性,所以,我们也在语义层,也就是自然语言理解层面,其实做了很多跨行业的一些融合,包括我们独创的抽象语义的技术,其实就是把各行业通用的语义用我们自己的方式把它沉淀下来。随着不断的研究发展,我们看到,其实这些知识也是有变化的。
以前,各行业的知识主要是以客服为主,现在很多的客户开始做一些内部的知识,包括内部员工的培训呀,分享、创意呀这样的知识,甚至我们现在还在一些很重要的行业,在做一些深入的生产性的知识,这与客服和内部的知识还不太一样,所谓生产性的知识,你举个例子,比如说汽车维修相关的技能,再比如说看病。到生产性知识,不同行业之间的差别就会非常之大,思考的模型也就完全不一样了。
6、据我所知,小 i 通过合作发布了一些硬件产品,包括智能机器人 Ina、扫地机器人等。在这些产品中,小 i 扮演着什么角色?
简单的说,机器人有三大要素,感觉、思考、运动,与硬件厂商合作,我们其实是把思考,还有感觉能力植入进去,让硬件能够像真人一样,具有智能交互这样的能力。在外观、还有运动的部分,我们会交给合作伙伴去做,毕竟术业有专攻,在外观设计,制造,运动控制方面,我们的伙伴相对比较专业一些。从全球来看,特别是西方国家,大家都强调分工合作,每个人做自己最核心的部分。
有一些能够在智能方面做深度合作的企业,当然我们也会在技术方面做一些研发的工作,目的不一定是要去做硬件,最主要还是去研究,如何让我们的软件更好的去为硬件服务。
7、那么这些产品的IP属于谁?
这个情况还不大一样,像智能电视,我们提供的是核心的智能交互的能力,可以以电视云搜索这样的形式出现,我们完全只是一个技术的提供者,可以说我们是一个provider。在Ina机器人,外观是合作方的,如果在上面更改一些颜色,这是在范围之内的,里面所有交互的内容,包括交互的界面,这个属于小i的。简单的说,在软件和内容上,是小i的IP,在外观上是合作伙伴的IP。再比如说扫地机器人,外观设计也是小i的,合作伙伴帮我们做出来,所以它的外观、软件还有内容都是小i机器人的。所以不同的合作,都是不大一样的。
附朱频频CNCC现场演讲全文
主持人田丰: 下面我们有请小 i 机器人朱频频总裁,他担任国家信息技术标准化委员会用户界面的委员,下面我们欢迎朱总。
朱频频: 大家好! 非常高兴来到合肥。我在合肥学习了五年。刚才提到我是中科院博士毕业,其实我的本科是在中国科大读的,当时在静态物理系跨电子专业。后来在2001年的时候,我在上海中科院读博士一年级。我跟合作伙伴一起出来创业,创立了小 i 机器人,后来拿了很多风险投资。
我们一直在发展人工智能,以及智能交互技术。十多年间我们已经积累了很多用户,我们一直在探索聊天机器人到底有什么样的商业模式。后来我们给有很多企业和政府做了类似智能客服,可以智能交互的机器人。
最近几年公司的发展非常快,我们不但有虚拟在线机器人,现在还有很多硬件机器人,出现在像银行、运营商等很多地方。所以我今天的题目是《智能交互开启未来》。刚才联想的王博士举了很多人机交互的方式,我这边说的比较集中,主要是一些后台的人工智能,能够理解你的语义。当然前面也可以加上像语音、图像等多种输入方式,背后是认知智能的方面。
前面几年云计算和大数据被热炒,到处都在建云计算机房,到处都在说大数据。当时我跟一些朋友开玩笑,我们很多企业连小数据都没有用过,现在一步登天开使用大数据了。最近一两年人工智能和机器人特别火,在很多地方听到大家热炒这些事情。我们虽然已经做了十几年,自己定位还是一家创业公司。我们刚刚拿了好几亿人民币,估值也达到了30亿人民币以上,很快要在国内的资本市场挂牌。
为什么现在人工智能又被重新热炒起来?这是一个非常重要的概念,它跟云计算和大数据的发展有密切关系。云计算还包括现代化的硬件设备,包括GPU和CPU计算能力的增强,以及云计算、分布式计算能力的提升,这为计算更多数据提供了坚实的基础。也是在这个基础上,像深度学习这样的算法,为人工智能进一步发展提供了很好动力。
所以我们看到最近人工智能和机器人被提的非常多,我们一提到机器人会想到变形金刚或大白,但他们是最不像人的机器人。他们没有人形,但是具有人的智能。所以我觉得这主要和大脑有关系,我们应该更关注大脑部分。
我们认为完整的机器人应该包括三个要素,分别是感觉、运动和思考,当然每一方面做起来都很难。我们一提到机器人,之前说的比多的是工业机器人,现在服务机器人被提起来更多。服务机器人对智能的要求更高一点。
在机器人里面,一个非常重要的技术是人机交互。我们要让人跟机器人之间有一个很好的在线交互,包括语音、图像、体感、情绪等多种通道, 这样才能让机器人更好为人类服务。
最近在类人智能也有很多讨论。我们提到人工智能,提到了感知、认知智能。感知智能包括了语音识别、图像和人脸识别等,而认知智能,最重要的是把对世界的认知,凝结成为知识。正在认知智能方面,动物和人类的区别非常大。
比如说一只猫,它可以认清楚很多东西。它可以认得主人,但是没有办法对整个世界形成自己的认知,没有办法把形成的知识传承下去。
在人工智能方面,国际上各大巨头都投入了很多精力。包括像Google、Apple、IBM等公司。10月份,IBM投资28亿美金成立了Waston Group,还发布了完整战略,其实他们就是做人工智能。他们做的人工智能提供了一系列的IPR,意图打造关于人工智能的开放平台,让更多的开发者可以参与其中。
国内去年也确定了十大科技发展方向,其中有一项就是智能机器人。
这是我10月初在美国参加Gartner峰会现场拍下来的,应该说这是全球最顶尖的面向企业和CIO的会议。这里面总结了2016年的十大技术趋势,有三条和人工智能相关。分别是:
1、万物信息:整个数字网格里面,所有的事物都可以产生、制造和传递各种信息,尤其是这些信息还包括了自身对语义和环境适应性的内容。
2、高级机器学习技术,包括了深度学习、深度神经网络等。
3、无人自动代理,包括网上的虚拟机器人,或者无人驾驶汽车等。
他们还有一个重要预测,到2020年时,有40%的移动流量来自人工智能。这些虚拟助手会产生40%流量,也就是说5年之后,我们很多跟环境、设备直接用人机交互的方式,无论是文本还是语音。
这幅图是人工智能发展的趋势图。这里面反映了很多人工智能技术,以及目前它所处的位置。从最左边看起,我们可以看到大家对它的期待在不断上升,这也代表了技术能力的发展。在到达顶点后,大家对它的技术预期开始回落,意味着这种技术已经比较成熟,开始往产业化发展。这里面有些技术和应用小 i 已经涉足,尤其是 Virtual Customer Assistants(虚拟客户助手),已经到了产业化的前夕。
我们在微信上加了招商银行助手后,你可以在里面对话,问余额有多少,信用卡丢失了怎么办。这种虚拟客户助手的出现,已经很大分流了电话压力,取消了很多人力工作。但它取代的不一定是人类体力劳动,它取代的是脑力劳动,尤其是重复性的脑力劳动。
而虚拟个人助手,现在技术发展相对来说还比较前卫,还有很大的技术发展空间。
刚才提到了虚拟代理方式,也包括聊天机器人、虚拟客户助手、虚拟个人助手和实体智能机器人。未来有40%的交互量来自于人们跟他们的交互。
具体来说,先说一下聊天机器人,最早出现在1966年的计算机里面,你用字符串跟它交互。它表面上听懂你的话,实际上根本不懂你,只是在做字符串的游戏工作。1995年ALICE推出了自己的框架,大家可以用语言描述聊天机器人。
2003年底,我们推出了自己的小 i 机器人,刚推出来的时候用户增长非常快,两三个月增长了几十万用户。后来我们这个机器迁移到QQ上面,获得了更多用户。在当时互联网的情况下,我们因此拿了很多风险投资,当时我们也不知道是忽悠投资人,还是投资人忽悠我们,要做WEB3.0,所谓的智能互联网入口。现在回想起来这个事情做的有点太早,但是当时也是初生牛犊不怕虎,就做这样一件事情,后来失败了。但是我们在这条路上积累了很多经验,无论是自然语言处理,还是知识模型表示等方面,都积累了很多能力。这也为我们后来往智能客服,领域化的智能助手发展奠定了一定的基础。
我们还做了其他聊天机器人,包括像股票、地图、订票等各种各样垂直机器人。后来我们把机器人融合到一起,形成了超级小i机器人。
小i推出以后,拿了很多风险投资。后面市场上出了很多机器人。
在虚拟客户助手方面,刚才提到了像招商银行信用卡中心虚拟客服助手。现在大概有1500万用户,每天大概有超过100万的用户跟机器交互,除了招商以外,小米、三星、联想都已经采用了我们的技术和产品。
虚拟个人助手,其实有人也把它叫做语音助手,因为语音作为一种主要的交流方式。这包括2011年10月份出现的Siri,以及后来的Google Now等等。
智能机器人非常多,我这里罗列了很多实体机器人。各种各样形态的,有大有小,玩具类型和实用类型,有些目的是做家用,也有在实验室做研究用。
小 i 现在是什么样状况?刚才说到的人工智能机器人,跟我们是什么关系呢?我们的定位是一家做智能机器人的厂商,我们提供技术和平台,现在每年大概有超过数百次的对话活动,服务用户超过5亿,也为客户提供了智能客户服务解决方案。
在这方面的行业定位,目前在智能客服方面,90%以上的市场都是我们做的,在技术评价当中也是遥遥领先,也跟很多学校展开了联合工作。在资本市场我们很受追捧,今年年底上国内资本市场。
Gartner对我们公司一直做追踪报道,2013年它把我们评为在CRM领域当中的第六,去年谈到虚拟客户助手的时候,他们举的例子就是我们为招商银行做的小招。
在今年的大会上,虚拟客户助手又被提到比较新的高度,把我们定义成不仅仅是虚拟客户的提供商,而且是与IBM并列成为智能机器人平台的提供商,小i机器人旁边的图片是IBM Watson。
这是我们的核心技术架构。我们的核心能力是语义理解和智能交互,里面包含自然语言处理、语义分析和理解,我们在这方面做的非常深入。
语义理解和智能交换,是靠知识支撑起来的,这在很大程度上需要不断的积累。我们在十多年的创业过程中,积累了相当多的语义和知识,它背后按照各种形式来表示。更重要的是,现在我们形成了智能大数据和学习体系,不断挖掘知识和语义。
通过各种人机交互方式,我们也包含了各种交互渠道,包含了听觉、视觉、体感和情绪。前段时间我们通过各种产品,把这些能力输送出去,基本上把互联网上所有渠道全覆盖,内置在他们的产品中。
语言分析、场景关联、语义匹配、逻辑推理和回答组织,构成了知识库。
我们所做的知识模型,也包括最基础的像概念、本体、知识图谱和各种场景,这是基本形式。在语义层面,也包括各行业的词类、语义表达、抽象语义,以及各语义的权重模型。
我们的学习体系不是完全自学习的体系,里面有三种角色,分别是运营人员、专家和机器。专家是负责定义知识结构和运营规则。
通过这样的方式,挖掘那些真正能够使用的知识。现在 小 i 所做的工作是非常工程化,这是刚才提到的智能大数据平台的机器学习系统。
我们说一下产品和云平台,我们已经应用到了各行各业。
我们覆盖了从大到小的客户群体,无论是大型客户还是中小型开发者,都可以利用不同的产品开发智能机器人。
也提供各种各样丰富的解决方案,目前客户覆盖的范围非常大,无论是运营商或者金融客户,以及政府客户和各种其他客户。
我们也与合作伙伴推出了特殊的产品,比如说智能企业助理。
包括酒店的生态系统,和政府做的智慧城市信息惠民服务。也包括我们推出的硬件智能云,可以通过SDK把智能交互能力集成到硬件中去。
而且你还可以把智能服务和智能营销的能力同时集成进去。基于支持图谱的后台,就能方便维护你的知识。当然还有很多行业资源,包括和淘宝、微信的对接。
我们最近即将发布的产品叫做ibot os,它可以跟各种各样的操作系统桥接,为智能硬件提供智能服务。包括像智能电视,左边是联想的智能电视,右边是LG的智能电视,里面已经接入了我们的智能交互能力。
这是我们今年五月份发布的扫地机器人,它不但可以扫地,还可以通过微信的方式智能交互,实现远程控制。
这款机器人很多人都认识,法国人制造的智能机器人。我们可以让它做更好的智能交互。这款机器人能用在交通银行大厅里面,做办事导航。
我们的核心优势是通过产业化的应用,产生大量真实的数据。这些数据能够通过学习,不断的变成各个行业的知识和语义,这样才能更好的为产业化应用添砖加瓦。 最后,也希望能把计算机智能进一步推进,谢谢大家。