10月8日,北京智源人工智能研究院在清华大学FIT楼举行了“‘自然语言处理’重大研究方向暨‘北京智源-京东跨媒体对话智能联合实验室’”发布会 。
北京智源人工智能研究院院长黄铁军、京东集团副总裁兼人工智能事业部总裁、京东人工智能研究院院长周伯文,以及其他来自北京人工智能领域的高校、科研院所和企业的代表们出席了本次发布会。
自然语言处理是全球人工智能战略的关键
清华大学人工智能研究院的常务副院长孙茂松做了题为“大数据和富知识驱动的自然语言处理”的主题发言。
孙茂松指出,自然语言处理是全球人工智能战略的关键,举例说,“美国国家科技理事会2019年6月发布的国家人工智能八大战略中,有三项与自然语言处理有关”。但是当前,自然语言处理相关技术远未成熟,突破它瓶颈的关键是“大数据与富知识双轮驱动”。
同时,发布会上启动的“北京智源-京东跨媒体对话智能联合实验室”是智源研究院继今年4月成立的“北京智源-旷视智能模型设计与图像感知联合实验室”之后,第二家和企业共建的联合实验室。
根据北京智源-京东跨媒体对话智能联合实验室主任周伯文的介绍,联合实验室将聚焦跨模态智能对话与人机交互领域,针对零售、物流等应用场景,开展大规模跨模态信息感知、对话、用户画像及其应用的技术研究。
大数据与富知识双轮驱动促进自然语言处理的发展
随后进行了“圆桌讨论:自然语言处理的经世致用之道”,由清华大学副教授刘洋主持,参加讨论的学者们分别就“自然语言处理的技术突破和挑战”、“自然语言和人工智能的关系”、“自然语言行业应用状况和未来趋势”等方面的相关话题,提供了自己的研究视野和专业性意见。
过去十年自然语言处理技术取得非常大的进展,京东的何晓冬博士认为,深度学习是其中当之无愧的重大突破。2012年,他们团队首次将深度学习用于对话语言理解,结果性能提升了20%,他们随后建立了一系列模型,包括一些深度语义的模型。
深度学习在某种程度上帮助NLP走出了本身的“反”,也使跨模态学习变成可能,比如现在很新的语言视觉跨模态学习。
清华大学的李涓子教授认为,自然语言处理有两个很重要的方面,一个是对大数据的理解,尤其是文本数据,另一个是用自然语言做人机交互。
其中不只是深度学习,知识图谱也是十分重要的突破技术,现在已经到了知识与NLP融合的阶段。知识图谱给了NLP另一个路径,可能不需要经过分词和句法语义分析,直接就能从大规模的文档里面把一篇文章提炼出来。
自然语言处理的进步是被整个互联网发展的需求驱动,比如搜索引擎、文本挖掘,NPL正式走向应用还是由这些应用来推动的。
北京大学严睿教授认为,自然语言处理能改变生活,还是依赖于机器翻译的进步。由于神经网络、深度学习等技术推动,机器翻译已经进入日常生活,比如拿着翻译宝去世界各地旅行,不需要掌握当地语言就能与当地人交流。
未来在对话系统和语音技术方面或许能继续深入研究。比如,对话系统可能成为未来改变人类生活方式的技术,向机器提问,机器就能够回答,这样可以解放很多人力,把重复的事情交给机器完成。
北京语言大学的杨尔宏教授认为,说到“哪些NLP技术目前已经成功应用于人们的日常生活”,这需要和语言分开,智能辅助学习是让计算机帮助人学习语言,在这个非常窄的领域里,英文做得非常好,但是没有汉语。
在公共媒体上,每年学习汉语的人越来越多,每年参加汉语考试的人也越来越多,但是一款真正的能够帮助外国人学习汉语的智能学习机器还没有,这是一项巨大的挑战。
其中肯定有汉语本身的难度,但是也不得不考虑NLP的难点是什么,就像语言分为本体研究和应用,就像词法分析、句法分析等,这些语言学知识能够支撑自然语言处理或者说语言学习达到什么状态,或者说随着技术发展,这些知识对语言分析的结果在智能语言学习里起到什么作用,还不太知道。
之前做机器翻译要考虑句法分析和句子结构,有深度学习之后就不用了,但是在语言学习里面的具体情况,是不是要学结构、结构怎样融入到现在的学习里面,是没有解决的问题。
另外就是语言本身承载的内容,比如不知道中国的政法大学就是国外的法政大学,外语里可能也是法在前政在后的模式,如果没有中国大陆范围的知识,就改不成政法大学,这背后又是非常宽的知识,这个知识怎么和本身的语言的东西结合起来,也是很大的挑战。
京东的何晓冬博士介绍了NLP技术在京东上线的应用,最传统的还是智能客服,京东智能客服在双十一期间每天会接到数百万的消息,机器能完全解决的比例大概达到60%、70%,所有的消息首先都会用机器接待,如果太难再转向人工。
另一方面,京东也想通过机器来帮助人工客服做得更好,人工客服是一个压力很大的工作,一天8小时都要听别人的抱怨。考虑到这点,京东会用机器尽可能地把一些知识过滤,减轻人工客服的压力,这是NLP技术对于客服的贡献。
在这之外,京东还将NLP应用到其他方面,比如商品上架或者商品的标题、广告等,京东有一个频道叫“发现好货”,很多都是通过NLP技术来挖掘商品卖点。
北京大学的穗志方教授区别了图像识别等领域和NLP领域,NLP不仅是感知,更多涉及到推理知识的利用,语言的认知属于认知智能,不仅需要解决表层问题、理解语言,还需要挖掘语言背后所蕴含的深层含义。
自然语言处理的发展与深度学习分不开,但是也会逐渐遇到瓶颈,即数据量总是不够的,那么能否借助人类的先验知识,把这些融入到深度学习范式之上进行扩充,这是更大的问题。
杨尔宏教授补充道,2009年有一篇文章提到,把整个的神经元是做成了具有句法的信息,从深度学习的结果来看,能提高处理性能。2017年也有一篇这样的文章,提到说,本身结构或者说语言学本身的知识在语言处理里肯定能发挥作用,但怎么运用或者是对什么任务有用,这个还需要进一步探索。
何晓冬博士认为,语言和其他领域的融合是一个重要的趋势,比如在机器人方面,让机器人听懂语言级别的意思,然后去做一些事情,比如直接给智能体一个意思,到门口右转,看到楼梯下去,左边有一个售货机,帮我买一个可口可乐。
针对目前NLP技术面临的挑战,韩先培教授认为主要的技术挑战是用深度学习挖掘大数据中的隐藏模式,这道路可能逐渐进入了一条平缓期。未来利用大数据和富知识的双驱,把这两种模式结合在一起,才会取得更大突破。
严睿教授教授同意深度学习的瓶颈存在,同时提出,知识没有充分被利用是因为在语言背后蕴含了常识性的知识,但是如果不告诉机器,就很难把常识体现在结果中。
自然语言处理还面临一项挑战,就是用大量的数据重复训练,这样学习得到的经验是不够的,这也不是人类的方式。人类是通过长期以来的知识积累,通过较少样本就可以得到很好的学习状态,但是机器现在是做不到的。
李涓子教授认为,很多人在做机器怎么去理解文本,然后通过问答来去体现机器对文本的理解的过程。但是人在阅读文本的时候,不是以文本的形式进行记忆的,因此从认知以及对知识的利用角度去做机器理解或许能产生突破。
严睿教授补充道,语言和其他的信号有本质区别,语言有严格语法和句法,它还具有很强的多义性和相关性。能不能通过大数据把语义的模糊性解决掉,再通过某种程度的知识把逻辑性解决,上下相加才能够真正的把NLP驱动。如果这样做的话,也许会创造一个新的模式,从而把认知智能提高到更高的高度。
穗志方教授认为,下一步NLP的发展,一个是多模态的融合,一个是知识驱动。多模态融合利用深度学习、机器学习的模式,逐渐走向数据匮乏。自然语言处理不能越做越窄,要把它和图像处理等联系起来,还要了解人类的认知过程以及人脑对于语言的认知机制。
其次,一定需要知识驱动,但是现在知识的问题也有很多。在理想状态下,希望把全世界的知识交给计算机,知识是无边无际的,怎么对知识建模?是广度优先,还是宽度优先?针对什么领域建立知识库?知识构建的边界在哪里?有了边界以后,知识体系如何满足计算机分析的需要?如何建立深度的对接?
针对未来的自然语言处理的发展,杨尔宏教授希望能落地到汉语上,让学习汉语的人能够有一个比较好的APP辅助学习。
穗志方教授认为自然语言处理的每个中间阶段的成果都会及时的服务于人们生活的方方面面,同时一定要定位辅助的角度,比如智能教学、远程教学、辅助外国人汉语学习。未来五年到十年自然语言处理的辅助功能,在方面都会有应用的。
何晓冬博士把未来的发展目光放在了多轮、跨模态任何驱动的大规模的对话系统上。
李涓子教授希望的突破是每个人都有一个个性化、对我们在生活和学习中有帮助的自然语言对话的个人助理。
严睿教授赞同李娟子教授的畅想,希望未来有一个机器大白,或者像钢铁侠里面的管家一样。除了这个,可能会有大量的机器写手出现在生活里,在未来某一年自然语言处理的技术达到一定状态之后,获取的信息可能来自于机器创作,从而可能催生其他的应用,比如鉴别真伪和可信度,怎么更好的利用这些机器创作的结果,辅助我们做更好的任务。
编辑:于腾凯