AI 科技评论按:今年 315 晚会曝光了智能骚扰电话机器人产业链,让我们意识到那些令人不堪其扰的销售来电背后,好多都是没感情的 AI。对此深恶痛绝的阿里人工智能实验室研究员聂再清决定「以其人之道还治其人之身」,近日发布一款名为「二哈」的防骚扰电话 AI 技术,让我们在接到骚扰来电时,可以选择转给 AI 代为应答。
阿里巴巴人工智能实验室近日发布的一段录音显示,「二哈」已达到以假乱真的对话水平,录音中的人类销售对此毫无察觉,不知与之对话的竟是一名 AI。
在这段长达 1 分多钟的对话中,「二哈」对答如流,不但会主动向女销售咨询「北京能不能贷款?」、「最多能贷多少钱?」,甚至还在对话中「调戏」对方:「你之前给我打过电话吧,听起来挺耳熟的?」
阿里 AI labs 北京研发中心负责人聂再清介绍,「二哈」应用了他提出的「智能聊天」概念,需要理解用户请求,用强大的知识图谱生成知识点,在对话中将知识点「输出」给用户,同时用基于深度强化学习的对话策略引导对方的问题,从而将聊天进行下去。
「大家可能看视频觉得这是一个特别逗的产品,但这里面其实应用了非常多的前沿技术。我们现在已经申请了几十项人工智能领域的技术专利,今天大家就可以在支付宝小程序和天猫精灵的 App 上『调戏』我们的这个小机器人了。」
相关技术积累
在聂再清一篇 2018 年 AAAI 录用论文中,他提出一个聊天机器人人机协作框架 CoChat,该框架可以让人类工作者随时干预机器人的学习过程,机器人能够通过从标注过的对话日志、人类工作者的反馈以及用户的反馈中学习,由此使对话质量获得持续改进。换句话说,CoChat 结合了监督学习(标注日志)以及有延迟奖励 / 反馈的强化学习(人类工作者/用户反馈),可以持续不断地自我完善。
CoChat 框架示意图
此外,该论文还进一步提出对话管理器模型 MemHRNN,可以让机器人迅速对人类提出的新问题作出回应(原来数据库所没有的)。
在具体操作上,首先将对话历史、语言理解结果和 API 调用结果等外部信息组合起来作为输入,然后输出所有动作的概率分布以用于动作选择。当出现新动作时,该 HRNN 的架构可以相应地改变,而不会丢失在之前的学习过程中积累的知识。最重要的是,聂再清团队还在 MemHRNN 中进一步引入了外部记忆来处理由即时引入新动作所导致的单样本学习难题,即这些新动作出现的次数太少,让 HRNN 难以学习与它们有关的有效策略。
论文链接:
https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/view/16748
聂再清的「实用产品」梦
聂再清此前在微软亚洲研究院主要负责微软自然语言理解、实体挖掘的研发工作。在对象级别搜索与大数据挖掘方面申请国际专利十余项。
在 2017 年年底,他选择加盟阿里人工智能实验室,当时被媒体称为「阿里达摩院成立后打响的人才强夺战第一枪。」,在业界的分量不言而喻。对于选择加盟阿里的原因,他在接受采访时表示,阿里可以让他「把一些想法做成真正影响很多人生活的一个东西。」,而到了阿里巴巴人工智能实验室的他主要专攻知识图谱与自然语言理解两个研究方向,为阿里巴巴提供包括意图理解、实体抽取、对话管理以及知识图谱在内的技术支持。
去年接受媒体采访时,聂再清总结了当时 NLP 领域的阶段性问题,并提出相应的 4 大对策,可以看作是他过去 1 年试图攻克的事情:
- 其一,从公开大数据中积累更多的可替换词典和语义模板。以「请帮我打辆车」为例,「请帮我」有很多说法,如「麻烦帮我」、「给我」等,「打车」可以叫「约车」等,这些同类词(或同义词)叫做可替换词典,它可以增强自然语言的通用性,能够很好的解决语言的歧义性问题。而语义模板侧重这句话中语义的顺序,不同顺序问答的积累,也可以解决一部分自然语言歧义性、多样性的问题;
- 其二,他希望建立一个知识图谱的生态平台,让大量的开发人员在上面去建立知识图谱,使用积累的知识图谱,不断扩大知识图谱在常识性和专业性方面的积累,即共建知识图谱,产生 1 1>2 的效果;
- 其三,随着语音交互进入千家万户,通过强化学习、深度学习等不同的策略,让机器在与人沟通中判断用户的喜好,并进行不断的自主学习和迭代,当有大量用户大量数据的时候,自然语言理解就会更准确和个性化;
- 其四,把知识库、知识图谱运用起来,让这些结构化的数据促进自然语言的理解。
因此,「二哈」如今看来令人惊叹的对话水平,其实早有相应积累。这既是聂再清加盟阿里后的阶段性成果,也是他个人「实用产品」梦的实现,让人不禁期待,他在未来又将为我们带来哪些有意思的产品。