读博6年两次换导师,靠一点点“倔”,俞舟成为social chatbot的开拓者之一

2021-04-29 11:11:58 浏览数 (2)

导语:读博六年,两次换博士导师、差点交不上学费,还能顺利毕业、成为所在领域的青年佼佼者之一,俞舟不简单。

作者 | 陈彩娴

在俞舟的想象中,智能机器的存在不仅是为了执行人类下达的任务,而是拥有与人类相近的感知与情绪,可以与人类建立情感的纽带。

比如,在电影《她》(Her)中由斯嘉丽·约翰逊配音的OS对话系统,既可以帮助用户完成会议安排、信件阅读与文稿撰写等工作,也能够以朋友的身份陪伴他们,与他们谈天说地,理解人类的情绪并作出回应。

图注:电影《她》中的男主人公(左)与OS对话系统(右)

因此,在2014年刚接触对话系统时,俞舟便选择了当时较为冷门的研究方向——非任务导向的对话系统,即“chatbot”(聊天机器人)。

在构思博士论文时,她选择从社交对话系统的用户参与度入手,研究如何吸引人类与机器进行更长时间的交流。这需要提高机器的“情商”,在与人类的交互中进行文本、语音、视觉等不同模态的信息传递,包括但不限于类人的情感表达输出。

当时,研究对话系统的学者大多集中在任务导向的对话系统,直接给计算机下达简单指令,比如订机票、订餐馆、获取公交车信息等,然后由计算机去执行相应的任务。所以,一开始,俞舟的“社交型”对话系统思想也遭到了许多人的质疑与否定。

每次听到他人评价“你做的研究没有用”,俞舟就会与之争辩。不服气的背后,是因为她始终认为,社交语言在人的日常交往中占了极大的比例。既然是要打造一台能够与人进行无障碍交流的对话系统,那么社交语言的研究一定是不可避免的。

果不其然,随着苹果的Siri、微软的小冰、亚马逊的Alexa等智能语音助理越来越受欢迎,人们开始注意到社交语言对人机交流的重要作用。在她博士毕业的那一年(2017年),社交型对话系统已成为人工智能的主流研究趋势之一。

后来,2018年,俞舟又带领加州大学戴维斯分校(UC Davis)的14名学生参加亚马逊Alexa Prize对话机器人大赛,以人机交流长达10分钟的出色战绩夺冠,在对话系统研究领域一举成名。

她能在这次比赛中夺冠的一个关键因素,就是使用算法在对话中插入一些停顿或高级韵律提示音,比如“哇”、“哈哈”,让机器的对话系统更具情感色彩。

俞舟能成为最早开拓社交型对话系统的知名学者之一,靠的是当初那一点点“倔”。

1 俞舟的两次选择

2018年亚马逊Alexa Prize夺冠之后,俞舟获得了许多来自学术界与产业界的关注。

图注:俞舟(中间)与学生获得Alexa Prize冠军

“俞舟是谁?”关于这个问题,人们很快找到了一些信息:

UC Davis助理教授,主要研究多模态对话系统,入选2018年“福布斯30位30岁以下科学精英榜”(Forbes 30 Under 30 list in Science),卡内基梅隆大学(CMU)博士、浙江大学竺可桢学院本科,双修计算机科学与语言学双学位……

这一特殊的学科背景引起了许多人的注意。因为在中国,拥有语言学背景的CS学生可谓凤毛棱角。而对话系统一直是自然“语言”处理研究领域的重要课题,俞舟在该领域能有所建树,是否与早期的学习经历有关?

在AI科技评论与俞舟的对话中,她谈起当初的选择,与她后来研究多模态对话系统的动机是相似的:“其实无论是学习语言学,还是研究多模态对话系统,我都是觉得这些方向比较有意思、比较适合我,所以我才去学习。”

2007年,俞舟通过小语种自主招生通道,提前半年从苏州中学毕业,保送至浙江大学外国语学院。经过一个学期的学习,她重新参加考试考入竺可桢学院,并选择了竺院与外语学院联办的英语双学位班,同时修读计算机科学与英语专业的语言学方向。

她是当年竺院(也可能是全国)计算机专业下唯一一位修读语言学的学生,也是语言学专业里唯一一位修读计算机的学生。俞舟从小接触计算机编程,也很爱学习英语,所以看到可以同时学习这两个专业的机会时,她毫不犹豫就报名了。

这个不经意的选择对她产生的最直接影响是:在本科大四申请卡内基梅隆大学语言技术研究所(简称“LTI”,NLP专业全美排名第一)的博士生时,俞舟凭借计算机 语言学的跨学科背景,在一众申请者中脱颖而出,成为浙江大学第一位成功拿到 LTI 博士offer的本科生。

俞舟读博的想法缘于大一时参加梅尔顿基金会(Melton Foundation)。

这个基金会由POS机的领导者Verifone公司创始人在90年代初创立,共有5个成员大学,分别是德国Friedrich Schiller大学、印度B.M.S理工大学、智利La Frontera大学、美国Dillard大学以及中国浙江大学,每年都会从成员大学的一年级新生中选拔新成员(Melton Fellow),免费提供一台电脑与全年的上网,让大家进行跨文化交流,其中,中国最有名的Melton Fellow就是拼多多的创始人黄峥。

在基金会的年会活动上,俞舟遇到了几位同样学习计算机专业的浙大师兄师姐。她与他们讨论本科毕业后的道路,前辈总结,可以选择的路无外乎几种:出国升学,国内读研,或直接工作。俞舟对自己的未来尚未明确,学长就建议她:可以先试试做科研,看看自己合不合适,如果觉得有兴趣,就去读博士。

“我当时就很简单。他们说什么,我就做什么。”

图注:浙大时期的俞舟

所以,到了大三,俞舟选择加入何晓飞与蔡登的实验室,跟着他们做科研,学习机器学习与计算机视觉的知识。当时,何晓飞与蔡登刚从美国回来,俞舟是他们的第一批学生,因此,在带俞舟那帮学生时,他们在指导上付出了很多时间与心血。

但即使是这样,当蔡登与何晓飞听说俞舟拿到卡内基梅隆大学的博士offer时,他们也很惊讶:“为什么俞舟会申请到这么好的学校?”

毕竟俞舟只是一个本科生。虽然她曾获得一个小会议(2010年互联网多媒体计算与服务国际会议)的最佳论文奖,但研究内容也不是自然语言处理,而是数据挖掘。

那时候,俞舟的科研经历中,与自然语言处理最相关的,也许是跟着外语学院的瞿云华老师做机器翻译,但也没有进行深入的学习。

“我当时也不了解NLP的具体研究内容。那时候和实验室的同学一起申请,我们就是单纯按照学校的排名从高到低递交(申请文书),没有做详细的功课,也没有与任何老师事先联系。”俞舟回忆,而且,这还是她当时拿到的第一个offer。

直到后来担任教职,俞舟才明白:正是因为她有不同的学科背景,所以才能得到招生委员的注意,尤其是在自然语言处理领域。在这个领域里,许多泰斗级的人物都是同时拥有计算机与语言学的学科背景,比如Dan Jurafsky与Chris Manning。

俞舟介绍:“自然语言处理和计算语言(Computational Linguistics)其实基本是一样的, NLP 最好的会议就是Association for Computational Linguistics (ACL)。在早期,计算语言是语言学的一个分支,因为语言数据非常多,没法手工标注,所以研究员就思考能不能用计算机来帮助大家标注数据、学习数据,将语言学中的规则做成可以执行的命令,以帮助大家更好地处理海量数据。”

深度学习兴起之后,神经网络的应用使NLP的研究门槛降低了许多,研究人员即使没有语言学的知识基础,也可以研究NLP。但在俞舟开始读博时(2011年),神经网络还没有那么火,语言学在NLP的研究中占了很大的比例,如果不具备语言学的基础,研究人员在NLP研究中可能寸步难行。

后来,俞舟研究多模态对话系统,早期的语言学知识也成为了她的研究助力源。因为打造以社交为中心的多模态对话系统,不仅涉及到自然语言处理,还需要语义分析、人机交互、基于知识的数据挖掘等不同学科的支持。

俞舟提到,了解人们交谈时的对话结构,并利用这个结构训练对话系统,能够更好地理解对话流,为不同的个体提供不同的答复。

比如,一个人在表达自己对猫的喜欢时,可以很多不同的表达方式。Ta可以说:“我有只猫,我很喜欢它”,这句话中的“它”是指Ta的猫;也可以说“我有只猫,我可喜欢了”,没有说明宾语,但根据上下文语境,人类可以理解“我”喜欢自己的猫。第一种表达用了指代(co-reference),第二种表达用了省略(ellipsis)。

自然语言理解(NLU)是对话中的核心要素之一。如果机器能够轻易理解人类的表达,那么人与机器的对话就会容易许多。而对话结构中的语义与句法,本质上是语言学的知识。

2 读博两次换导师

虽然以本科生的身份幸运申请到CMU的读博机会,但俞舟的博士生涯可能比任何人都更波折:读博六年,换了两次导师,并因此要面临读博学费中断、科研随时可能中断的风险。

这段曲折的读博经历,一是与她本科毕业就直接读博有关,二是与运气有关。“情感上不够成熟,也缺乏科研经验。”俞舟谈道。

图注:卡内基梅隆大学校园

正如前面所述,俞舟在本科期间曾学习计算机视觉,又热爱语言学习,所以在博士刚开学时就确定了自己的研究方向:多模态(视觉 语言)。在匹配导师时,俞舟选择了研究多媒体分析的Alex Hauptmann教授。

Alex Hauptmann在多媒体信息检索方向有着卓越的成就,此前也带过许多中国留学生,比如阿里巴巴数据科学研究院的现任副院长金榕、Dada Group的创始人杨俊(同时也是浙江大学计算机科学与工程系的本硕校友)。

而俞舟想要换组的原因是,觉得Alex Hauptmann的小组研究内容偏工程,而非学术研究,且科研的压力非常大。

博士第一年,22岁的俞舟经验较浅,并不能理解导师的难处,也不能理解项目组的难处:

Alex Hauptmann的科研经费主要来自于DARPA(美国国防部高级研究计划局),是一个非常大的项目,经费要求参加该项目的小组要进行一年一度的评比。如果评比得分不高,那么整个小组的经费就会被“砍掉”,组内学生第二年读博的学费与生活费也就成了问题。

在这种情况下,组内的成员自然要牺牲自己的一些时间去研究工程技巧来提高系统的整体性能,其次才是做一些长期的、前沿的基础性研究。

这让俞舟很不解:“如果第一年不成功,第二年就不能继续做这个项目了。那我们做研究还有什么意义呢?”在她看来,读博就是要做一些长期的、前沿的研究,而不是炒快饭、搭工程。

追求前沿研究的科研品味,与俞舟在浙大读书期间跟着何晓飞与蔡登做研究时得到的科研启蒙有关:当时两位海归老师便是偏向于做前沿课题,而不是工程项目。

而且,在他们的指导下,俞舟有机会学习到了浙大当时还没有正式设置的机器学习课程,阅读最新的研究论文与书籍,与实验室里的研究生一起参加讨论。这个过程让俞舟觉得科研很有意思,因为每次讨论都会学习一些新的知识,见证科研者取得新的成就。

在科研节奏紧迫与科研内容“无趣”的双重压力之下,俞舟产生了一些小情绪,与导师和组员也产生了一些争论和冲突。想到CMU还有很多从事多模态的学者,俞舟想到了换博士导师,不再从事偏工程化的研究。

在多模态研究方向,她有两位导师可以选择:一个是机器人研究系的 Abhinav Gupta,他的组里主要研究视觉-语言;另一个是人机交互系(HCII)新入职不久的系主任Justine Cassell,研究虚拟人类。权衡之下,俞舟选了Justine Cassell。

由于Justine Cassell属于HCII,而俞舟属于LTI,所以Justine Cassell就让俞舟再去找一位LTI的教授当合作指导老师(co-advisor),俞舟就联系了研究语音合成的Alan Black。所以,从CMU读博的第二年开始,俞舟就跟着Justine Cassell与Alan Black一起做研究。

但过了大约一年,俞舟又产生了换组的念头,因为她发现自己很难与Justine相处,两人在性格方面不是很合得来。此外,在专业指导上,Justine是纯粹的语言学出身,对前沿的计算机知识几乎不了解,她要求研究的内容也跟俞舟的想法不太一样。

于是俞舟就去跟Alan Black说:“我们能不能不要跟Justine合作?就我和你两个人研究就好。”虽然Alan没意见,但这一变动会产生一个比较棘手的问题:俞舟读博的资金主要来自Justine,Alan没有多余的费用来承担她的学费与生活费支出。Alan就让俞舟仔细思考这个决定,确定后再跟他说。

到了博士第三年快结束的时候,俞舟实在受不了了,很确定地向导师Alan提出了自己的想法:“我真的不行。”Alan无可奈何,就说:“那好吧,你就跟着我好了。但是我没有钱,我们要一起想办法帮你找到一份资金来支持你读PhD。”

对俞舟来说,频繁换导师所带来的最直接影响并不是经费,而是论文成果的低产。因为科研项目的中断,俞舟在前三年的论文成果比其他的同级博士生落后了许多。

心理压力自然有,但俞舟却没有被打垮。她当时的想法是:“就算不读博,我也能找到一份很好的工作。要继续读,就要做我喜欢的研究。”

图注:俞舟与CMU的吉祥物苏格兰梗(Scotty)。CMU的创始人Andrew Carnegie认为,苏格兰梗有一种坚定与沉稳的气质,是许多CMUer的个性特征,因此选择它为CMU的吉祥物。

那时候,她也许已经为自己做了最坏的打算。

3 为读博经费奔波

“要不你先出去实习,因为我们交不出学费。”导师Alan建议。

所以,与大多数博士生不同的是:从博士四年级开始,俞舟就要提前承担起属于一位导师的大部分责任,一边是单枪匹马地往少人问津的科研领域冲刺,一边是想方设法地“搞钱”,去企业做科研,向别人“推销”自己的研究内容,取得他人的信任,争取能够支持自己继续学业的科研资助。

2014年秋天,在Alan的牵线下,俞舟去了微软雷德蒙研究院实习。当时,在微软研究院里,其他学生都是暑期实习生(summer intern),只实习两个月,而她是学期实习生(in-semester intern),“因为我们没有钱。”俞舟调侃自己。

幸运的是,在微软实习期间,她遇到了两个非常好的mentor,一个是Dan Bohus,他在CMU读博的导师是俞舟后来的导师Alexander Rudnicky;一个是Eric Horvitz,当时Eric Horvitz已经是整个微软雷德蒙研究院的部门负责人,后来又晋升为整个研究院的主任。

在微软实习期间,俞舟第一次正式接触多模态对话系统:此前,她在Alex Hauptmann的门下是研究多模态的表征学习,在Justine Cassell的组里是研究多模态分析。在博士三年级时,她虽然上了一门对话系统的课,但却没有条件开始正儿八经的对话系统研究。

当时距离微软推出“小冰”不到4个月,对话系统的研究也还处于起步阶段。俞舟在项目中的表现很出色,能力得到了两位mentor的肯定。在Dan Bohus的推荐下,俞舟接触到了他的博士导师Alexander Rudnicky。Alexander Rudnicky在语音对话系统研究上有30多年的经验,在他的指导下,俞舟才开始有机会学习研究对话系统的系统方法。

微软的4个月实习快结束时,Eric Horvitz了解到俞舟正面临读博资金短缺的难题,决定伸出援手。Eric与LTI当时的系主任Jaime Carbonell关系很好,于是就跑去Jaime那里给俞舟当说客:“我觉得俞舟很优秀,我们能不能想想办法,先帮她解决一年的学费?我们微软出一部分钱,你们系里出一部分钱?”这个提议得到了Jaime的同意,俞舟因此得以纾解博士四年级的学费难题。

图注:俞舟与Dan Bohus(右)、Eric Horvitz(左)

那么博士五年级呢?导师Alan Black一直记得俞舟读博的经费问题。从微软实习结束后,俞舟回到CMU跟着Alexander Rudnicky研究对话系统的用户参与度,即如何让用户与机器进行更长时间的交流。Alan听了,觉得很有意思,就说:“我们可以看看有没有人对你的研究感兴趣,然后愿意资助你。”

2016年的暑假,Alan给俞舟介绍了ETS美国教育考试服务中心。ETS主要做托福考试培训与面试训练,俞舟的多模态对话系统正好可以用于教育测试服。于是俞舟就利用暑假的3个月时间,在ETS跟着David Suendermann-Oeft实习。她与ETS的研究员合作地非常愉快,ETS愿意资助她第二年的学费。

值得一提的是,俞舟与ETS合作的研究成果HALEF(一款用于帮助用户提高对话能力的面试培训系统)后来成为她最引以为豪的工作之一。

博士五年级结束的时候,俞舟已经可以博士毕业,但她还想再留多一年,寻找学术界的工作机会,于是就主动与Alan Black提出再留一年。当时正赶上亚马逊在2017年举办的Alexa Prize挑战赛,俞舟以学生的身份报名参赛,第六年的读博费用就是从这个比赛中来的。

对俞舟来说,这段独自争取读博经费的经历有很多早已淡忘的难处,但也有一个影响深远的好处,就是:她在学生时代就提前体验了做导师的责任,所以,在担任教职后,她很快就适应了“青椒”的身份,也许比其他青年教师更早熟一些。

4 如何选导师?

读博的一切困难,根本原因都是在于俞舟因为信息闭塞与不慎重而选错导师。在俞舟去到CMU的那一年,她没有浙大直系师兄师姐的信息披露,也没有意识与能力去了解系里每位老师的研究风格、学术声望与具体研究内容,所以吃了许多亏。

相比之下,其他本科便就读于美国高校的学生消息要灵通地多。比如,她有位同学,来自新加坡,本科是在美国读的。当俞舟问他要选哪位导师时,他就非常确定地说:“我要选Noah Smith(现在在华盛顿大学),其他老师我都不愿意选。”

再谈选择导师,俞舟的想法是:一个老师的能力固然非常重要,但更重要的是,这个导师的为人好不好。

不懂的科研问题并不是只能从导师那里获得答案,也可以请教周围的其他老师与同学。但如果与导师的相处十分困难,那么5-6年的读博生涯就会显得非常漫长、度日如年。

而虽然Alan Black的研究方向是语音,能够给予俞舟的具体研究建议非常少,但他会尽最大的努力给予俞舟支持。俞舟形容他是一个“cheer leader”:“无论与他说什么,他都会给予快速的反馈。倾听你,关注你的研究。”

图注:俞舟与博士导师Alan Black(右)

“当然,如果在人好的前提下,能够选择到一个在学术界非常有建树的导师,那是最好的,这样你能从导师那里继承到一些connection(人脉关系)。”俞舟继续谈道,“比如我的导师Alan,他的所有学术影响力都集中在语音研究领域,但我并不侧重于研究语音,我在NLP的会议投稿要多得多,这就要靠我自己去开拓影响力,去跟别人介绍自己的研究内容。”

但这也有一个好处:因为别人记住的是你本人,而非你是谁的学生。有一次,Alan与俞舟说起,他去参加一个NLP的会议,大家都不认识他,也不知道他的研究内容。然后他介绍他是俞舟的老师,别人才开始与他搭话,Alan便调侃自己:“原来我去NLP混还要靠你呀。”

也正是因为这段奇葩的换导师经历,俞舟担任教职后,招收学生前一定会讲清楚自己的研究风格与研究内容,也十分注重为学生创造一个能够顺利做科研的环境。同时,她也建议学生能够开诚布公地与导师交流读博的目的:

“毕业后无论是想往业界发展,还是往学术界发展,或是不确定,都要提前跟老师说,因为老师会为你的目标制定适合你的培养标准,选择适合你的项目。”

此外,在选择学生时,俞舟也会十分注重学生是否已经做好读博的准备,是否具备读博的基本能力,是否拥有比较成熟的情商与沟通能力。这一标准源于她对自己的反省。

在刚开始读博时,俞舟不愿意做做工程上的“脏活”、“累活”,眼高手低,导致与Alex Hauptmann的合作不顺畅。后来她开始搭建对话系统,才明白Alex Hauptmann的苦心:要做比较前沿的研究,具备工程能力是基本要求。“你首先要学会如何做工程,才能做应用配置。”

后来俞舟自己带团队时,再与Alex Hauptmann交流,发现Alex在管理团队上其实非常有见地,也给了她很多建议与帮助。“导师要去思考如何把团队里的10位同学更好地凝聚起来。很多工程方面的努力与管理团队的能力是非常相似的,也是相通的。”

历经风雨,俞舟比22岁时更加懂得自省。事实上,经历挫折也不一定是坏事,因为俞舟后来明白:其实很多事情都要慢慢学习,如果没有经历挫折,也许她也学不会踏踏实实地做工程、建系统,算是“塞翁失马,焉知非福”吧。

5 对话向善,机器成为人类的伙伴

在2015年刚进入对话系统研究领域时,俞舟就思考:是否可以在没有任务的情况下研究用户的参与度?比如单纯从社交的角度看人机对话。

所谓“参与度”,就是指人类用户愿意与机器交流的时长。用户参与度一直是评价一个对话系统性能的重要指标,但在任务导向的对话系统中,因为每个任务的框架都会略有不同,所以研究者无法专注于研究参与度。

这也与人机交互的思维有关。刚到CMU时,俞舟因为没有浙大直系师兄师姐的带领,基本就是跟着苏州中学的学姐朱海一玩。朱海一研究的方向是人机交互,久而久之,俞舟也耳濡目染。

俞舟认为,既然人工智能的最终目标是做一个natural agent(自然智能体),那么机器也应该有人的“感知”能力。在人与人的交往中,我们往往要先进行一番寒暄,然后再提出恳请对方帮忙的要求。比如,如果你想让你的同事帮忙做一个PPT,你会先问一句:“你有没有时间?最近忙不忙?”

亲密关系的建立大多是从社交语言开始的。但在此之前,许多研究员是纯计算机的角度:“我有一个要求,机器是来帮我实现这个要求的”。这与现实生活不符,也与人类的天性(对社交的需求)相悖。

于是,俞舟便思考从社交语言的角度提升对话系统的用户参与度。

打造对话系统的耗时很长。俞舟回忆,他们当时做对话系统要从头开始写,用时大约两年。比较幸运的是,转到Alexander Rudnicky的门下后,俞舟从Alexander以前的学生那继承了一部分系统,再基于他们的研究做改进,增加不同模态的对话功能。

2015年,俞舟开始在社交对话系统的用户参与度研究上发表了许多出色的论文成果。读博期间,她的主要成果是创建了TickTock、Direction-giving Robot与HALEF这三个对话系统。

其中,TickTock就是俞舟团队获得2018年亚马逊Alexa Prize的机器人“Gunrock”的原型,后被部署到Amazon Alexa 上,产生了非常重大的社会影响。他们的系统支持上千用户同时与机器对话,俞舟的团队得以收到很多反馈。

令俞舟感到最温暖的是,有些小朋友会把对话机器人当成自己的小伙伴。他们会说:“Alexa is my sister. I'd like to talk to her every day before I go to sleep. ”(Alexa是我的姐妹,我希望每天睡觉前都可以跟她聊天。)

这让俞舟感到自己作为研究者的社会责任感。随着现代人越来越容易接触到对话系统,她也开始考虑自己设计出来的系统在道德层面的义务。比如,当机器人在与小朋友聊天时,至少不要教坏小朋友。

图注:社交对话系统让机器成为人类的伙伴

而HALEF是一个工作面试系统,结合了视觉与语言,帮助用户练习口语等,甚至在用户学习受挫、感到沮丧时,用夸奖肯定的语言鼓励学生。

图注:HALEF系统能够实时观察男生回答问题时的面部神情、音量,判断“他走神了”。

在俞舟看来,多模态对话系统的研究价值在于:在人与人的对话中,我们不可能只基于一个人的说话内容来做决策,还有根据Ta的行为、反应等。因此,凭借单一的信息源是不够的,这也是为什么相机越来越普遍、语音识别越来越可靠之后,多模态对话系统会成为大势所趋。

多模态对话系统的应用场景非常广泛,在销售领域,可以推荐电影、推销商品;在教育领域,可以实时对话,训练个人技能,甚至帮助初步筛选面试者;在医疗领域,可以与用户进行半预先设定对话(semi-constructive dialogue plan),检验用户是否有心理问题;或做一个虚拟人类和有自闭症的小孩互动,给予老年人关怀,等等。

俞舟当初的研究内容也慢慢被大家接受。加入社交语言,对话系统既可以创造商业价值,也可以实现人文关怀。她也因为在多模态对话系统的研究成就入选2018年“福布斯30为30岁以下科学精英榜”。

2017年从CMU博士毕业后,俞舟加入UC Davis担任助理教授,开始在任务上将研究拓展到社交 任务导向相结合的系统。这一新型的系统被称为“劝说型对话系统”(Persuasive Dialog Systems)。

劝说型对话系统也有许多应用场景,比如劝慰抑郁症患者,劝说有自杀倾向的病人,推荐产品,劝说大家在疫情期间不要出门,甚至是给慈善机构捐款。这也是俞舟小组目前的一个重要研究方向。他们的工作“Persuasion for Good”(劝说向善)获得 ACL 2019 最佳论文提名。

图注:劝说向善的一个示例

亲历社交对话系统从冷清到火热,俞舟认为多模态对话系统仍处于一个蓬勃发展的阶段。多模态对话系统的上升在俞舟身上也可见一斑:“很多企业希望与我们合作,或者希望我们的博士生毕业后能够去他们的公司工作。”

她的工作也获得了越来越多大厂的关注,比如亚马逊、英特尔、Facebook、腾讯等,不久前,俞舟获得Facebook资助200万美元,支持推荐对话系统研究。此外,她的研究也获得了NSF、DARPA等权威机构的支持。

对此,俞舟认为是“因为他们看到多模态对话系统在未来会有非常强大的影响力。”

6 加入哥伦比亚大学

今年1月,为了迎接一个新的小生命,俞舟从UC Davis转到了哥伦比亚大学计算机系担任助理教授。从人工智能重镇到金融业繁华的纽约,俞舟继续多模态对话系统研究。

从懵懂天真的学生,到独当一面的大学教师,俞舟跌跌撞撞,唯一不变的是从事科研的初心:在对话系统中结合文本、视觉、语音等不同模态的算法,打造一台能够与人类在智识与情商上无障碍交流的机器。

再看当年读博的曲折时光,俞舟也从来不是一个人孤军奋战。她不是很在意来自外界的质疑与打击,因为她知道自己有来自父母、老师、同学与其他合作伙伴的支持。

图注:俞舟在CMU读博时与同学们

对她来说,读博是一个跳出温室的过程,她成长、突破、思考,学习与挫折面对面。这是科研人的必修课,也是攀登更高峰的通行证。

除了科研与指导学生,俞舟也开始将一部分重心放在了对话系统的教育上。

近日,俞舟与中国人民大学的闫瑞老师、苏州大学的李俊涛开始合写一本关于对话系统的教科书。此外,她还在哥伦比亚大学开设了一门对话课程,叫做《Conversational AI 》,主要教授对话系统的各个方向最新的研究成果。

这里分享这个课程的阅读材料和对应的课件:https://docs.google.com/.../1nSKcnM5r9x82BdyPgn.../edit...

有想要与俞舟老师进行交流的高校、企业或学生,可以通过以下邮箱联系:echoyuzhou@gmail.com。

最后俞舟老师希望大家在读博之前做好思想准备,多了解一些各方面的知识。一旦开始后,也不要因为不顺利就一直自己默默隐忍,要积极的学会向不同的同学老师朋友寻求帮助。不要总是和同学攀比论文数量有没有获奖什么的,要有自己坚持的喜爱,做自己觉得有意义的工作。祝大家科研顺利!


作者注:人物采访、交流、爆料、抬杠,欢迎添加微信(302703941)。

0 人点赞