作者 | 钱磊
编辑 | 陈彩娴
近日,原任滴滴实验室(洛杉矶)自然语言处理组首席科学家的 NLP 大神 Kevin Knight 在其领英页面宣布他将从滴滴实验室离职:
My last day today at DiDi labs; it’s been fantastic experience. A little nostalgic! Proud of our work, and thankful to collaborate with great scientists and engineers over the past four years.
这是我在滴滴实验室的最后一天,在滴滴的这些日子是一段超棒的经历。真有些惆怅!我对我们的工作感到十分自豪,也十分感谢过去四年里曾共事过的优秀科学家和工程师们。
随后,他也在领英主页上更新了自己在滴滴(DiDi)的履职时间:从2018年6月到2022年3月。
近年来科学家从大厂出走的消息不断,Kevin Knight 的离职,是个人的选择,却也进一步反映了学术大咖与大厂难以建立长久关系的局面。
1
Kevin Knight 简介
Kevin Knight 最为人知的身份是滴滴实验室NLP首席科学家、南加州大学(USC)计算机科学系院长教授以及 ACL 2011 的大会主席。
此外,他也是 ACL Fellow、AAAI Fellow(在2014年同年入选)。
Dr.Knight在1982年1986年就读于哈佛大学并获得计算机科学学士学位,毕业后到卡耐基梅隆大学语言技术研究所(LTI,全球NLP排名第一)攻读自然语言处理,于1991年获取PHD学位。
自1992年9月加盟南加州大学(USC)起,他在 USC 执教已接近30年,撰写了超过 150 篇关于自然语言处理的研究论文,并获得了数项最佳论文奖,包括 NAACL 2018 杰出论文奖、NAACL 2009 最佳论文奖、ACL 2001 最佳论文奖、AAAI 2000 杰出论文奖。
他的学术成果颇多,研究方向涵盖人工智能,自然语言处理,机器翻译,对话处理等,更参与编写了学界广泛采用的教科书《人工智能》(Artificial Intelligence):
谷歌学术还显示,Dr.Knight 目前的 H 指数为 81,其工作的被引用数高达 25445 次:
作为 NLP 领域的研究大神,Kevin Knight 的研究工作对同行具有极高的阅读与参考价值。他的被引数排名 TOP3 的论文分别如下:
- A syntax-based statistical translation model(基于语法的统计翻译模型)
论文简介:文中提出了一个基于语法的统计翻译模型。该模型通过在每个节点上应用随机操作将源语言解析树转换为目标语言字符串。这些操作能捕获语言差异,如词序和大小写标记。作者还采用EM算法在多项式时间内估计模型参数。该模型生成的单词对齐比 IBM model 5 生成的单词对齐更好。
- Abstract meaning representation for sembanking(sembanking的抽象意义表示)
论文简介:文中介绍了抽象意义表示(AMR),这是一种语义表示语言,可以用来记录数千个英语句子的意思。作者希望一个简单的、全句语义结构的 sembank 就能够促进统计自然语言理解和生成的未来发展
- Toward distributed use of large-scale ontologies(面向大规模本体的分布式使用)
论文简介:大规模的知识库系统的构建既困难又十分昂贵。如果能够做到跨系统共享知识,那么成本就会降低。然而由于知识库通常是从零开始构建的,每个知识库都有自己的特殊结构,因此共享会很困难。近来的研究集中于使用本体(ontology)来促进共享。本体是一个层次结构的术语集,用于描述一个可以用作知识库框架的领域。如果两个知识库建立在一个共同的本体上,知识就可以更容易地共享。本文概述了一组本体的需求,然后描述了如何使用大规模(5万多个概念)本体半自动地开发特定领域的本体。随后讨论了本体与系统开发过程的关系,本文认为要使本体成为有用的“活文档”,必须将本体的开发与系统的开发紧密地结合起来。文末则探讨了正在开发的基于web的本体工具。
2018年6月,Kevin Knight 宣布加盟滴滴出行位于洛杉矶的实验室。彼时,滴滴出行正处于快速发展的黄金时期。入职没多久,他便在 NAACL 上作了名为《The moment when the future fell asleep》的主题演讲,引来广泛关注。
图注:Kevin Knight 在 NAACL 2018 上作演讲
作为机器翻译界大牛,Dr.Knight过去几年一直在滴滴从事NLP研究,他出席各类公众活动时的介绍也少不了滴滴NLP团队首席科学家的头衔。
离职前夕,他在领英评论中对合作过的同事们一一表示感谢,看来那是一段无可替代的科研时光。
图注:如今,滴滴实验室的首页仍是 Kevin Knight 在工作中的图片
2 NLP在出行上扮演什么角色?
可滴滴作为出行领域的巨头,为何会组建自己的NLP团队呢?这种操作在大众看来难免有些跨行。
据滴滴实验室官网介绍,作为滴滴出行的一部分,其设立NLP团队的目的在于支持司机、乘客、客服和自动驾驶汽车之间自然高效的沟通。司机和乘客存在语言不通的可能性,我们偶尔能在社交媒体上看到外国留学生描述自己在中国打车全程采用肢体语言沟通的趣事,如果用上滴滴定制机器翻译技术,司机乘客之间就能无碍交流,做到畅通出行。滴滴不仅在热门语言互译上投入工作,也关注较为冷门的语言互译,比如中文-日语互译和中文-西班牙语互译。
据悉,滴滴 NLP 团队曾参与2020 年WMT机器翻译比赛 (Workshop on Machine Translation) 新闻机器翻译赛道,并在这场机器翻译领域认可度最高的国际比赛中与全球企业、科研机构和顶级高校竞争,最终获得第三名的好成绩。
不仅如此,滴滴还开发了支持客服的工具,可以帮助客服识别客户的问题并快速响应。他们的NLP工具不仅有自动完成功能,还能做到将对话系统完全自动化。滴滴的NLP工具还帮助了新司机加入拉丁美洲的滴滴交通网络。
除了开发有助于出行领域的NLP技术,滴滴洛杉矶分部还从事基础人工智能研究,关注的问题有神经网络序列模型和具有环保意识的人工智能。
参考链接:
1.https://www.infoq.cn/article/sqT1d2cT92S4JtvcQfRU
2.http://www.didi-labs.com/los-angeles/
3.https://scholar.google.com/citations?user=oQnyyGkAAAAJ&hl=en
4.https://kevincrawfordknight.github.io/