机器之心报道
编辑:杨德泽
在对谈中,俞舟不像其他创业者那样大谈 ChatGPT 对于行业的巨大影响力,她更加关注产品、更加关注使用产品的人,她不相信 AI 可以替代人类,而是帮助人类提升技能。
在俞舟开始她的对话系统创业的时候,大模型的热潮还没有到来,她只是认准了要做一个好产品。在公众都对于大模型的能力惊叹不已的时候,俞舟认为,关键是产品和客户服务。
俞舟本科毕业于浙江大学竺可桢学院,在拿下了计算机和语言学双学位后赴美攻读 PhD,俞舟认为社交语言在人的日常交往中占了极大的比例,如果要打造一台能够与人进行无障碍交流的对话系统,那么社交语言的研究一定是不可避免的。
在俞舟身上,有两个特点十分突出:“倔强” 和对于 AI 研究的坚韧,在卡内基梅隆大学读博士期间,曾二度更换导师,还因此差点学费中断,最终靠实习找来经费才得以完成学业。
2017 年,俞舟博士毕业进入 UC Davis 执教,研究方向是多模态对话系统,次年,俞舟入选福布斯 U30 in Science,2021 年又再次进入哥伦比亚大学,职业生涯可以说是一片大好,如今她的身上又多了一层身份 —— 创业者(Articulate.AI 创始人)。
当年执着选择对话系统的俞舟肯定没有想到今天 ChatGPT 的大火。过去 6 个月,ChatGPT 完成了破圈、增长、大众化,如今它的用户总量已经超过 5 亿。“iPhone 时刻”、“所有行业都值得用 GPT 重新做一遍”,这些宣言似乎都预示着 AI 的好时代到来了,而问题的另一面在于,我们并不十分清晰地知道 GPT 是什么,也不知道 ChatGPT 能干什么。一个对技术有着深刻了解的人转向创业,她的意见或许是一个有效参考。
按照俞舟的想法,ChatGPT 更像是一种产品主义的成功。
在 AI 学术界,ChatGPT 的技术突破似乎并没有想象中那么大。OpenAI 的成功更大程度上在于产品而非技术,这是一个利用产品向全球播报技术进步的故事。俞舟的产品想象则更为智能化,“Imagine a 24/7 AI coach who trains you for new skills and supports your work and life.” 这是俞舟写在商业计划书中的产品愿景。
无可否认,ChatGPT 的成功促进了当下 AI 大爆炸的繁荣,随之而来的是资本、技术、人才的投入,也包括俞舟的公司。在对谈中,俞舟不像其他创业者那样大谈 ChatGPT 对于行业的巨大影响力,她更加关注产品、更加关注使用产品的人,她不相信 AI 可以替代人类,而是帮助人类提升技能。她曾经开发的雅思学习产品已经拥有了 5000 用户。
在当下这样的一个大模型遍地的时刻,它可能人类创造生产力的一次变革,抑或是一个资本泡沫。在这个机会和危险并存的时刻,俞舟既是技术的研究者,也是创业者,对于回答 “AI 将向何处去” 提供了一个样本。
俞舟
以下是机器之心和俞舟的对话:
关于 ChatGPT 和对话系统
机器之心:作为行业内人,你是什么时候开始感受到大模型带来的冲击力?当时的观感是什么?
俞舟:其实大模型相关的研究在很早之前就出现了。这里主要的原因是量变引起了质变,当模型参数带到一定程度的时候,它确实有一些非常好的表现。在公众了解之前,我们已经做了很多这样的工作,如果关注我们的研究成果,就会看到在疫情之前我们就在做一相关的工作了,就是说如何去预训练对话模型才可以得到更好的表现。
只不过 GPT 一类的大模型有一个特点就是:面向公众,具有非常强大的舆论功能。在此之前我们做的工作很多都是基于一些开源模型,但是这些模型普通人是用不了的,因为你没有硬件设施。Open AI 推出 ChatGPT 以后所有人都可以用,相当于做了非常大的推广。然后大家都突然意识到这个东西好像挺有点意思,说不定可以在自己领域应用一下。
机器之心:它和 AlphaGo 当年的影响相比呢,哪个观感更强烈一些?这次 AI 浪潮又出现了哪些新机遇?
俞舟:首先这次大模型浪潮影响的人更多一些,AlphaGO 它只是一个应用,而且它只做了下围棋这一件事情。现在大模型你可以跟他聊各种各样的东西,他可以解决不同的问题,但是虽然它的精确度也有各种各样的问题等等,但它是更融入到人们的日常生活中的,所以它会有更大的影响力。
在学术界外我们确实也看到了一些影响力,有意思的是很多相关领域的人都更愿意跟我们合作,认为我们这是一个突破,也就是说给大家带来了一些新的机遇。
机器之心:在此之前,其实国内外一直都有很多人在做 AI 方面的研究和创业,为什么等到 ChatGPT 出来之后大家才恍然大悟,大家原来都忽略了什么?或者说不敢想?
俞舟:其实 AI 一直在进步,特别是在 17 年前后 Transformer 出来了以后,很多东西它其实做得非常好。OpenAI 只是把它产品化之后放开了,让每个人都可以用,大家瞬间意识到这个东西已经做得这么好了。
比如机器翻译,谷歌在很早之前就做的挺不错的了,但是公众对其不够了解,突然 GPT 就破圈了,然后所有人都知道了这件事情,这也打开了很多可能性,就相当于做了一个百亿公关,让大家重新意识到了 AI 的可能性,这样子也让大家对它重新建立起了一些信心。
机器之心:对于你们的研究产生了怎样的影响,您最近的研究方向有哪些方面的进展?
俞舟:首先它提升了整个的自然语言包括文字生成、图片生成、图片理解、视频理解等各种各样的能力,整体观感上带来了一些提升。
我们组主要还是在对话系统,怎么样更好的用更少的资源,比如更少的数据、更为 efficient 的模型,来完成不同的对话的任务。然后我们也会做很多一直在做的博弈和谈判研究,我们称之为影响对话系统(Social influence dialog system)。
俞舟和图灵奖得主 Raj Reddy 在 CMU speech 50 years 的合照
注:Raj 是最早一批人工智能的开拓者,也是李开复、洪小文等 AI 领军人物的导师
机器之心:从理解人类意图、做出决策方面来看, 它的表现似乎比 GPT 更为智能?
俞舟:其实任务有一些不同,我们是做一个对话系统,GPT 是通用系统。我们是为对话训练的系统,在这个系统里面不仅包含对话,还包括决策,是一个非常大的强化学习系统,比如有一部分是如何去理解用户意图,然后据此选择更好的策略去优化他的博弈行动中的行动。
之前有很多对话系统,能够做到的只是交换信息(exchange information)。比如说有一个机器是用来做订票订酒店的,人知道这个机器只能做这件事情,然后人和机器通过交互式对话的方式之来交换信息,然后完成一个任务。但是 social influence dialog system 和这些都不同,除了信息交换还有影响人的行为和想法,它多了一层更难的部分。如果要做到这些事情的话,机器就需具有更好的理解人类对话的能力,因为人类的语言在不同语境之下代表的意思是不一样的。
比如我跟我的孩子说,You have to behave yourself,意思是你要乖一点,如果我跟我的博士生或者员工说 You have to behave yourself 代表的完全是不同的意思,孩子听到这句可能会不耐烦,如果是员工可能就会觉得肯定是老板特别不满意我做的事儿。其核心是在不同的语境同一个人对不同人说的同一句话,也会代表不同的意义,需要更全面的去理解。特别是在这一种比较复杂的任务中,它是需要有更好的理解才能做出准确的应对。
OpenAI 做的最好的是产品
机器之心:从技术实现的角度来说, 大模型主要是哪方面的技术的进步?
俞舟:其实说实在的,比如 GPT3.5,它首要的进展是把这个模型的参数数量变大了,其次他们有很多比较好的训练数据,通过人工收集了这些数据,数据是它的一个壁垒。其次它也用我们称之为它称之为人类反馈强化学习(RLHF)的东西把很好的跟数据结合在一起,然后做一些很不错的功能 。
但是它的基础,比如架构都是之前以 Tansformer 为基础的模型,我觉得他最重要的创新就是说他自己 Houst 这些模型,可以通过网页的方式来直接用这个模型,再比如说 instruction tuning 等等也不是新的,之前都有不同的人做过。
机器之心:你刚才提到 Transformer 的作用,是不是意味着谷歌已经把一些伟大的创新做完了,OpenAI 只是在这个基础上向前推进?
俞舟:Transformer 只是一个基础架构,OpenAI 还是做了很多技术上的贡献。但是我觉得最重要的一点是 OpenAI 认真地把它作为这个是一个产品来做的,它做了很好的工程创新,比如说 ChatGPT 的回应速度是非常快的,这么多人同时做他也都不会有问题。让所有人可以来用它,我觉得这个是他非常重要的贡献。
机器之心:OpenAI 更像一个伟大的产品经理?
俞舟:对。
创业:其实产品到最后也是一种服务
机器之心:你们在产品化上做了哪些努力,以及为什么选择创业?
俞舟:现在我们自己是有一个公司,主打的产品是一个对话系统的模型,与其他模型不同的是,我们的产品不是简单的指令问答系统,我们可以做一些类似角色扮演的职业培训。
通过这种交互式的方式,通过即时反馈,对话系统可以针对不同人群给出个人化的反馈。比如说做企业培训,如何增强业务人员的营销能力,我们通过角色扮演的的方式围绕一个产品展开对话,从而更灵活、更快捷获得一些谈判和博弈的社交能力。
我们想做的是职业培训,在一个大家都觉得这 AI 是要代替人类的时刻,其实 AI 也可以成为一个工具,让人可以更容易的学习一些新的技能,应用到一些高级技能的获取之中,可以让你的学习更加高效。
机器之心:您当时是如何选择培训这么一个细分的行业?主要基于哪些方面的考虑?
俞舟:在一年半之前我们的公司就成立了,但是当时语言模型技术并不是很成熟,最近这段时间得到快速地发展。最开始我们是做英语培训,通过对话的方式来训练应试英语,比如雅思,用户可以和对话系统自由对话,然后你跟他对话了以后它也会给你评估打分,告诉你说你语法上面有没有哪些错误的。在这个过程中我们首先有对话的练习,然后反馈。我们在销售这个英语学习产品的时候发现,在现在经济环境下,各个公司都想降本增效,更注重如何增加营收。于是我们发现,最直接帮助这些企业的还是培训他们的销售人员,让培训时间变短,让成单率变高,从而带来更多的营收,这个是解决他们的核心痛点的事儿。然后结合我们之前做过的角色扮演的工作,我们可以让机器人扮演销售人员会遇到的不同类型和职业级别的客户来训练销售人员。同时机器人也会给出合理的评价和提高的建议。从另一个角度来说,销售培训正好很好的结合了我们之前的角色扮演、问答和谈判的研究工作。大语言模型让这些研究问题有了一个突破,正好是可以做相关产品的时候。
机器之心:对于普通人而言,为什么谈判和博弈这方面是重要的?技术和场景的契合点在哪?
俞舟:比如学生群体,当他拿到了一个工作的 offer,这个时候就需要去跟公司谈薪资,很多人是之前没有做过经过谈判的训练,他很容易做的不好,而谈判的结果对你的人生有非常大的影响力。我见过很多女孩子害怕谈判,心理压力大,就会回避谈判,接受比较低的薪资,其实对职业发展是很不好的。我们看到的痛点就是如何去教大众如何去做正确的谈判。因为生活中充满了谈判,小到你要劝说让小孩每天刷牙,大到国家贸易合同的签订,都是谈判。我们说的谈判不是争执,而是通过共同来达成一个双赢局面。
在中国,我发现有很多人完全没有接受过任何谈判训练,其实这是一个通识教育,是非常重要的一个日常技能。在美国也是一样,现在只有 MBA 和律师专业是有这个课程的,其他系都是没有的,我觉得这个能力是需要慢慢在全球被普及的。
机器之心:和几位合伙人是怎么认识的,是什么让你们决定做这么一家公司?
俞舟:我的合伙人其实都是科研上的伙伴,比如我的 CTO,他是以前跟我读过硕士,在这之前他已经在业界工作过很久,有很多业界积累。我们一起合作过很多。
我所在的环境是鼓励做新意的而且实用的工作。我做东西并不是为了发论文的。发论文是一个副产品。我的追求一直是一个有影响力的技术创新,要做对整个学术界和产业界都有影响的工作。发论文,给演讲都是帮助我们传播这个技术创新的手段。让更多的人了解我们这个创新,然后以我们的创新为基础上做更多的创新或者应用。当我觉得这个创新在实用度上已经有一个飞跃的时候,就是落地的时机了。
机器之心:目前有寻找投资吗?你用来打动对方的最有说服力的话是什么?
俞舟:最近我们也在接触不同的投资人,计划是能够融 2-5 个 million。
首先,我们看到企业培训的这一个需求很大,用我们对话模型是实际可以给它产生利益的,比如说销售培训,就是说你用更短的时间更有效的去培训销售,能够得到更好产出,这样子的话它可以帮你拿到更多订单,是有非常实际回报的。
其次,我们之所以用以大模型为基础的东西来做,就是因为它不需要做太多的调整,就可以降低成本,同时使用大模型的对话完成度也会更高一些。
机器之心:所以创业在美国的大学里面是一种很普遍的现象吗?在美国创业和国内有什么不同?
俞舟:对,我有挺多同事也在创业。在学校里本身就是一个非常好的环境,大家都对很感兴趣。
我觉得美国一直是创业氛围非常好,中国是近 10 年才兴起创业,在美国则有很悠久的创业传统,比如说我们拿到的 NSF 的一个 SBIR 基金,它支持中小型企业已经很多年了。在美国一直是政府和民间都非常支持创业的,它有一个非常深厚的传统。比如,父母听说你要去创业,就不会觉得说你很奇怪为什么不做一个稳定的工作,在社会上的看来创业是一个非常好的事情。包括硅谷、纽约等,都是有比较好的创业氛围,有各种各样配套的活动,可以让你认识其他想要一起创业的朋友,它具备一个非常好的圈子。
机器之心:对于公司的未来、规模、发展路径有设想吗?你想做一家怎样的公司?
俞舟:我们最终的梦想是做一个培训方面的私人教练,可以教你不同技能,可以跟你一起练习,跟你一起成长,就像一个老师 24 小时跟在你身边,你想要学什么他就可以教你什么。另一方面,还可以根据你自己实际情况和个性推荐你更适合学的东西,以及哪些技能在你现在的生活、工作中是有一些缺失的,可以给出建议。这是我目前想做的。
当然我们会从企业培训开始,因为这个是最能看得到盈利的。然后我们会从博弈和说服扩充到其他领域,使其他技能也可以通过对话系统习得。我希望它不仅局限在职业领域,以后可能科学研究、兴趣爱好中间的许多技能都可以通过对话系统习得。
机器之心:现在无论海内外,有很多大公司、创业公司和再创业公司,你们在这一波浪潮中的角色是什么,你们的机会在哪里?
俞舟:首先,在时代背景下,一定要抓住这个机遇,我们是非常幸运的,在有一个新的技术在日渐完善的过程中,可以依靠技术突破来去做一些之前没有的产品,而且可以抢先占领市场。同样地,因为大家的关注,也让更多的企业愿意尝试去尝试我们的产品。
其次比如说在金融市场,对大模型的重视,也让我们更容易融到一些钱去做我们想做的事情,让我们有更多空间来发展我们的企业,也让我们有更大的更多的认知去做一些比较铺的比较开的东西,所以说我们觉得这些都是一些机遇了。
当然我们也必须要知道,AI 的热点就说这个事情可能过了一阵子它就过去了,对个人的挑战就在这个过程中,怎么样做好一个公司的长期发展,这是我们要面对的问题。短期计划和长期计划都是应该有一些调整,为应对市场未知风险做一些准备。
机器之心:在 AI 领域创业,投入和创新哪个更重要,底层创新来自何处?
俞舟:我觉得底层创新包含底层的模型能力、自己的数据积累,这两点是跟其他公司差异化的地方。此外,对行业的理解、业务的拓展等等,这些都是要通过不同的团队来磨合,然后找到自己技术驱动的产品到底是什么,其实做产品到最后也是做服务。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com