允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI
语言与智能技术发展到了什么程度?未来的技术发展趋势是什么?如何与其他人工智能技术协同发展?都是值得思考与探讨的问题。
作为“最具挑战”的认知智能,自然语言处理(NLP)是人工智能发展过程中亟待突破并实现落地的重要问题。在过去几年里,基于深度学习的自然语言处理取得了巨大成功,但其局限性也逐渐显现。
为了共同探讨这个问题,中国计算机学会与中国中文信息学会联合创办了“语言与智能高峰论坛”,邀请工业界与学术界一起加入进来。
今年,语言与智能高峰论坛今年已经举办到第四届。本届论坛于8月24日在北京语言大学礼堂召开,邀请到了国内外相关领域的学术界和工业界资深专家学者。
论坛开始,由大会主席、中科院院士张钹院士致辞。
张钹院士指出:
过去的3年,可以说是深度学习和自然语言处理“深度”结合的3年,自然语言处理的研究方法、模型框架均发生巨大变化,研究和应用上都取得了一系列突破。 尽管深度学习在自然语言处理和人工智能领域取得了巨大的成功,它的局限性也逐渐显现。作为典型的数据驱动方法,深度学习所面临的可解释性不强,鲁棒性差等难题同样在自然语言处理中存在。 为了应对面临的挑战,我们提出发展第三代人工智能的理念,一是与数学与神经科学等结合发现新原理和构建新模型,二是把数据驱动与知识驱动方法相结合,这也是自然语言处理未来发展的必由道路。
上午,大会特邀多名NLP的资深学者和业界翘楚,就自然语言处理技术的热点、难点以及前沿方向进行了深度的剖析。
新加坡国立大学教授李海洲在题为《Adequacy-fluency Evaluation of Natural Language》的报告中指出要让机器像人一样对文本进行评估。
报告以机器翻译为例,提出要仿照人类评价的方式,“信达雅”,同时使用原文和参考译文,结合Adequacy与Fluency这两个角度评价机器译文。Adequacy代表了“信”与“达”,Fluency则是“雅”。这为机器翻译,对话系统等评价指标有争议的领域,提供了一种新的思路。
北京理工大学计算机学院院长黄河燕发表题为《语言智能处理及应用展望》的报告,从科技发展的一般规律引入,阐述了语言智能处理的研究概况及现状,并分析了目前研究的几个难点与不足。
随后,黄河燕对观众介绍了知识图谱,机器阅读理解,自动问答等自然语言处理主要领域的发展。最后,报告就语言智能处理的未来作了展望,认为多模态协同,垂直化以及多学科的交叉融合可能会成为未来热门的趋势。
华为诺亚方舟实验室语音语义首席科学家刘群博士演讲的题目为《基于深度学习的自然语言处理:边界在哪里?》的报告分为三个部分。
首先介绍了通过深度学习解决的自然语言处理中的问题,从语言形态和句法结构等角度阐述了神经机器翻译之于基于规则的机器翻译与统计机器翻译的优势。
接下来,报告以还没有解决的问题为主题,探讨了资源稀缺,可解释性等当下的难题。
更近一步地,刘群博士指出,人工智能之所以在围棋、电子竞技等项目上大获成功,一个主要原因是这些问题都是定义明确的。而大部分的自然语言模型,还只是流于对词语符号之间的关系建模,没有对所描述的问题语义进行建模。
人在理解自然语言时,大脑中有一个客观世界模型,而目前大部分自然语言处理系统没有这个客观世界的模型。知识图谱是建立通用性模型的一种长期努力,但仍然不能得到大规模成功的应用。
微软研究院医学自然语言处理主任潘海峰博士题为《Machine Reading for Precision Medicine》的报告,从精准医疗的角度,向大家阐述自然语言处理在MTB文献处理以及CaaS信息抽取上的应用。
潘海峰博士将整个任务的工作量类比为金字塔,顶端的部分需要大量的专业知识,人工智能很难完成。底部寻找候选的部分是大海捞针的一步,医疗专家们在此耗费的时间是最多的,而这恰恰是自然语言处理可以做的一步。专家和机器各取所长,可以大幅地提高效率,造福人类医疗事业。
京东人工智能研究院常务副院长何晓东博士题为《从语言理解到多模态智能》的报告,首先回顾了近年来深度学习,语音和自然语言处理的一些进展。
之后,报告指出,人类从多个知识源学习,包括文本,语音,视觉,知识,从而有一个更深刻的了解。因而我们在发展新一代人工智能技术的时候,必然也要综合多个模态进行联合学习与推理,才能达到通用人工智能。这些从不同模态提取的语义表征,将被映射到一个统一的语义空间,在这个空间进行智能的理解,推理,变换,决策。
何晓东博士还通过情感会话智能,绘画机器人,多模态问答等例子,向观众介绍了多模态的广泛应用。
另外,本届论坛还设立了“青年科学家与企业论坛”,邀请了北京大学万小军教授、清华大学长聘副教刘知远、微软亚洲研究院主管研究员段楠、狗尾草智能科技有限公司人工智能研究院院长邵浩先生以及北京妙笔智能科技有限公司CEO周登平先生进行主题报告。
为了推动语言理解与智能技术的发展,从2018年开始,高峰论坛联合百度公司举办了语言与智能技术的评测。2019设立了机器阅读理解、知识驱动的对话和信息抽取三个任务,吸引了来自国内外的2,376支队伍报名,超过80%的211高校参加了本次评测。
此外,本届高峰论坛的一个特色环节是学术界与工业界的圆桌对话,学术界和工业界的资深专家就语言与智能领域的技术创新和商业应用前景进行智慧碰撞。
本次对话,由北京大学赵东岩研究员主持,参与对话的有来自学术界的李海洲、周明、马少平、孙乐、刘知远,和来自工业界的百度技术委员会主席吴华、狗尾草智能科技有限公司的邵浩、北京妙笔智能科技有限公司的周登平。
嘉宾们首先讨论了人工智能发展的现状与重大成果。随后,对于“学术界与企业界如何合作”的问题,嘉宾们表达了“学界提供算法,公司提供算力”,“公司力取,学界智取,专注于小规模的数据”,“学校的好处,就是可以试错,把原本不靠谱的事情做得靠谱了,就可以交给公司了”等观点,引发了在场观众对于学术界和工业界的深深思考。
而对于“人工智能的定义”,嘉宾们则各抒己见。有的嘉宾支持“能替代人类工作的就是人工智能”,也有的嘉宾认为机器真正地模拟了人类高级能力与智慧才算“人工智能”。
— 完 —