在刚刚过去的2021年里,中国人工智能界最受人瞩目的一件事,莫过于被誉为「AI四小龙」之首的商汤科技在香港联交所成功上市,成为「中国AI第一股」!
对于许多正在奔跑的「AI科创家」来说,这无疑是一个振奋人心的消息——它让人们看到,AI创业并非登不上台面的儿嬉戏语,也全非「寒冬」一说。早年间创立的「AI四小龙」,在摸爬滚打中尝到的,也不仅是开辟AI产业化的苦果,还有AI落地先锋的甜头。
2018年「深度学习三巨头」Yoshua Bengio、Yann LeCun与Geoffrey Hinton获得图灵奖后,人们普遍认为,未来十年,人工智能领域不会再出现重大的理论突破;相反,人工智能的发展将越来越多地体现在AI技术的应用及其与产业的结合上。
换言之,「AI 能赚多少钱」成为了新的关注点。而随之出现的,是越来越多的AI创业公司。
与老一辈以「AI四小龙」为代表的80后创业者相比,新一代的90后青年科学家在AI创业上有些许不同之处。
比方说,投资环境。老一代频频赶上AI投资热潮,而随着深度学习的瓶颈突现、AI技术成果转化难等等问题的出现,新一代创业者在找钱的问题上越来越多地遇到投资者的质疑与防备,同时也面临越来越多的竞争对手。
技术发展上,原先AI的落地集中在感知智能上,后来AI兼并了更多领域的知识(图形学、统计学、强化学习、演化计算等等),新一代科学家的创业方向也开始更加多元化。除了计算机视觉,还有语音识别、自然语言理解、图形学、芯片……
为此,我们策划了「AI科创家」系列,邀请年轻一代的AI创业者与我们分享他们的创业故事。第一位创业者,是一位在学术界与工业界均十分有名的90后青年学者,他就是循环智能(Recurrent AI)的联合创始人、Transformer-XL与XLNet一作杨植麟。
作者 | 陈彩娴
编辑 | 岑峰
1
「激进」的AI落地法
「我想有一条更激进、更彻底的路径去打破学术界与工业界的壁垒。」被问及创业的原因时,杨植麟这样答道。
在投资人的眼里,杨植麟与循环智能的其他创始人一样,有一份绝对拿得出手的光鲜履历:
本科就读于卧虎藏龙的清华大学计算机系,师从IEEE Fellow唐杰,2015年以年级第一名的优异成绩毕业;
随后,赴自然语言处理(NLP)研究全球排名第一的卡内基梅隆大学语言技术研究所(LTI)攻读博士,师从知名学者Ruslan Salakhutdinov与William Cohen;
博士期间,他与图灵奖得主Yoshua Bengio合作发布「火锅问答」数据集HotpotQA,又以一作身份发表的 XLNet 与 Transformer-XL在NLP领域产生重要影响,成为 NeurIPS 2019 与 ACL 2019 的最高引论文之一,谷歌学术引用次数直接破万……
图注:杨植麟的谷歌学术论文被引主页
一般来说,卡内基梅隆大学计算机专业的博士生往往要经过六年的学习才能毕业,而杨植麟只用了四年(2015-2019)就从CMU出师,一度成为学术圈的风云人物。
作为一名佼佼的青年AI学者,杨植麟确定自己志在推动人工智能技术在现实生活中的大规模应用。
一般来说,年轻博士生参与技术落地的途径是进入资金雄厚、牛人云集的大厂,在其中谋得一官半职,比如他的两位博士导师Ruslan Salakhutdinov与William Cohen并分别在搞学术之余担任苹果 AI 研究负责人与谷歌首席科学家。
但杨植麟认为,「科学家加盟大厂」的模式在组织架构上存在局限性,并不能令他更深入地参与到AI落地中,也无法从根本上解决工业界进行AI落地的瓶颈:
「我觉得AI行业面临的共同问题是学术界与工业界之间的Gap。我们看到老师们在工业界有一些title,但其实本质上他们还是在做研究工作。基础研究固然重要,但无法打破这种壁垒,研究内容与实际落地之间还有很多步骤。」
具体的表现有:一,高校教师往往更偏向学术研究,与工业界的联系较少,也缺少工业界落地的思考与驱动力;二,与此同时,虽然许多互联网大厂也会招入杰出的科学家去解决技术难题,但它们的首要出发点是赋能业务,而非推动AI落地。
从大厂运作的组织架构上来说,这些杰出的科学家没有足够的资源或权利去推动产品落地。公司的业务方向会调整,即使科学家有意愿去推动一项产品的落地,成本与代价也会大幅增加,技术的转化率与效率也会受到企业组织架构的影响。
在杨植麟看来,这是一个非常大的限制,这也造成了在大厂中,许多AI技术的落地周期十分漫长,也不够敏捷。因此,2019年博士毕业时,他拒绝了谷歌、Facebook与华为等大厂的高薪offer,选择了回国创业。
图注:杨植麟与两位博士导师Ruslan Salakhutdinov(最右)、William Cohen(最左)合影「创业的好处是我们可以自己决定公司的组织架构。人生苦短,精力有限,优化公司的组织形式可以有效减少中间损耗,缩小技术转化与社会价值之间的距离。」杨植麟谈道。
杨植麟对AI科技评论回忆,他的本科与博士导师都十分看重技术的实际价值,这给他带来了很大的启发。不同的是,他会更激进地去追求落地的结果,深入业务中进行研究。他的计划是同时进行学术研究与技术落地,并同时取得成果。
循环智能成立于2016年。也就是说,杨植麟从博士二年级开始就一边搞学术研究、一边创业。
正是有感于「大厂科学家」的尴尬处境,他一直强调「我们需要新的思考」。在循环智能,他不仅是AI技术负责人,还是产品经理,这无疑是一个「范式层面的革新」,是他心中能够有效打破技术与价值之间壁垒的最优途径:
「一方面,我们会去做基础的研究,如预训练、多模态等;另一方面,我们也要去进行落地。这两个事情可以互相提升与促进。」
2
研究与落地,双轮驱动
循环智能最早的三位创始人陈麒聪、杨植麟与张宇韬相识于清华大学的知识工程实验室,都有一股「用AI创造社会价值」的热血。三人都是技术出身,后来因为业务发展,循环智能在2018年又引入了另一位擅长技术产品运营的「第四把手」揭发。
自成立以来,杨植麟就是团队的核心技术骨干。2016年与2017年,他与陈麒聪、张宇韬开始摸索技术的应用方向。
对新一代AI创业者来说,2017年是一个重要的时间节点。
那一年,谷歌团队在“Attention is All You Need”一文中提出Transformer模型,该模型没有采用卷机网络与以往RNN的时序结构,采用编码机制,编码端同时包含语义信息(Multi-Head Attention)和位置信息(Positional Encoding),能够并行计算,大大提升了语言模型的训练速度。
对于专注技术落地的创业者来说,这无疑是一项利好消息,能够减少预训练的时间,节约研发成本,加速技术与场景的匹配速度。Transformer的出现,打破了计算机视觉凭借深度学习在AI创业圈一统天下的垄断局面,使一大批基于NLP技术的创业公司开始崭露头角,循环智能便是其中之一。
循环智能的主要业务是运用NLP、语音、多模态、大模型等人工智能技术打造「销售科技」方案,帮助企业的销售团队提升销售业绩。
杨植麟谈道:「我们认为,AI产生价值的过程可以分为几个阶段,而其中一个阶段就是帮助每个人变得更好,提升人的能力,从而提升整个社会的运行效率。这个Vision(愿景)是我们公司成立之初就有的想法。」
据他介绍,循环智能选择将AI用于「提升人的沟通能力」,也是经过了很长时间的探索,与客户交流、不断迭代才确定。最终,他们抉择的原动力是客户的诉求,以及对整体市场的判断。比如,根据CB Insights的数据统计,2016年销售科技初创企业的投资额就超过了50亿美元,此后逐渐递增。这也表明了市场对这个赛道的信心。
图注:Gartner的销售科技(SalesTech)技术成熟度曲线2021显示,销售赋能一支已经渡过「技术萌芽期」(Innovation Trigger),进入「期望膨胀区」(Peak of Inflated Expectations)
如前所述,杨植麟认为,AI系统的组织架构会影响产品的能力,而组织架构的灵活设置可以帮助他们以一个更好的模式去推进产品落地。在创业的过程中,杨植麟实现了学术研究与工业落地的双轮驱动模式。比方说,他被 ACL 2019 接收 Transformer-XL 一文,早在发表之前就已应用在了循环智能的 ASR 产品中。
对于这项基础技术的快速转化,杨植麟引以为豪:
「在预训练的过程中,我们将技术部署在产品系统上,让它能以实际数据集的运行效果为最终目标,驱动中间的研发过程。在将挖掘系统落地时,系统也是以最终的业务结果为目标进行学习与优化。同时,中间过程又可以迭代出很多AI问题与基础技术,使得之后的产品可以进一步改善。」
AI模型的落地中,一个常见的问题是数据集的真实性与完备性。
一般来说,研究者在改进模型时,往往是基于特定的、人工创造的数据,但这些数据也许并无法完整、正确地描述模型在实际场景中遇到的情况。因此,尽管预训练的若干技术都已在学术界的许多数据集上得到了测试,且性能优异,但在实际应用中,却仍需要非常多的技术改进才能部署落地,因为模型会遇到更多更复杂的问题。
目前,在解决这一问题上,学术界仍未有突出进展。但在创业的过程中,由于杨植麟与团队的预训练技术研究从一开始就是在实际的数据集中测试,直接与AI产品框架匹配,因此,类似的落地问题便能从根拔起。
3
谈谈「NLP 销售」
除了2017年的Transformer,近年来,人工智能领域又涌现出了许多基于Transformer的大规模预训练语言模型,比如Bert与GPT-3。此外,还有许多新兴技术对AI创业者产生了积极影响,比如少样本与零样本的研究突破。
从NLP技术落地的角度来看,这将是一个个革命性时刻。因为通过将这些研究成果有机结合,AI模型的效果与效率能够得到大幅提升。在某些场景中,研究者甚至只需要通过非常少的样本、甚至零样本就可以取得跟以往一样好的效果。
对于循环智能来说,这意味着,在用AI提升销售转化率的过程中,他们能够做到很多以前做不了的事情,比如会话洞察与分析引擎。随着NLP落地技术的逐渐成熟,加之企业服务在全球范围内成为新的投资热点,杨植麟与团队憧憬,通过「NLP 销售」的路径,循环智能也有成为「中国Gong.io」的可能。
图注:循环智能
具体来说,用人工智能提升销售效率的过程可以分为三步:一是对销售与客户之间的会话数据进行采集;二,对有价值的会话内容进行挖掘并建模,将非结构化数据转为结构化数据;三,分析会话数据,找出销售人员在与客户沟通的过程中存在的问题,更精确地分析客户意愿,并给出解决问题的关键要素。
归根到底,就是对大规模的文本数据进行高效分析。
听来简单,但事实上,「AI 销售」是一条同时具备市场刚需与高技术壁垒特征的赛道,因为这要求AI系统具备综合分析的能力, 除了算法,会话洞察能力、数据分析能力、行业营销知识等等也缺一不可。这很符合循环智能创始团队的创业风格:既要创造价值,也要拥有一定的技术门槛,提高竞争难度,减少对手。
从刚需的角度来看,业绩增长是每一家企业的发展根基。销售作为市场营销中的一环,其会话流量的转化率对业务目标的影响至关重要。据杨植麟观察,流量转化率在许多行业中都是一个突出的痛点问题,尤其是金融行业。
他们曾接触过一个国内的头部保险公司X,旗下有一家分公司Y。Y的销售困境是:虽然Z的销售团队卖出了许多保单,数量远远高于X位于邻城的另一个分公司Z,但所收的保费总和却比Z要低。经过分析,原因很简单:因为Y的均件保费远远低于Z。
这时,他们需要通过分析手中已有的数据,来找到拯救萎靡业绩的方案。而回顾已有数据,企业的唯一法宝,是保存了大量的沟通语音或文本数据。
对于计算机来说,未经解码的语音数据犹如黑盒,同时是非结构化的。这时,NLP与语音技术的结合可以对这些非结构化数据进行高效解析,并管理一个企业销售团队的沟通过程。换言之,此时AI产品还是一个「管理抓手」的角色,分析销售人员与客户的沟通情况,洞察客户需求,提高销售管理能力和销售团队的工作效率。
「我们提供的产品可以把每位销售人员在每一天的开口率以非常清晰的、精确的方式呈现出来。它能定位到每一个团队成员的每一通电话、每一次沟通,据此便可以做很多报表分析,从而知道每个团队的问题在于何处。」杨植麟介绍。
图注:循环智能AI产品的原理示意图
根据实战的结果,循环智能打造的AI系统每天可以处理超过 1 亿次的对话数量,帮助Y将保单的均件保费提升了大约20%。目前,他们已与数十家销售人员超过一千人的企业合作,主要覆盖银行、保险、房地产、汽车等四大行业。
杨植麟解释:「这几个行业都有一个共同的特点,就是对销售技能的要求高,销售过程非常复杂。同时,相对来说,这些行业有精细化运营的需求,它们的精细化程度达到了一定的阈值,足以支撑他们应用AI系统来优化效率。」
在这个过程中,他们的AI系统后台也积累了数千个来自不同行业的语义模型,构成了循环智能AI大脑的强大知识库,有利于NLP模型的进一步落地。去年,他们与华为云合作,开发了大规模中文模型「盘古」,在部分实际场景中达到了优于Bert与GPT系列的效果。
目前,循环智能已进行到B轮融资,连续三年实现了超200%的营收增长。不过,杨植麟谈道,创业必须深入业务:「我们现在还属于将产品打磨成熟的阶段,主要任务是扩展与提升销售沟通场景的覆盖面。」
4
创业感想
杨植麟认为,决定一家技术创业公司是否能立足的两个因素,一是具备多维度的综合能力,二是深耕行业,能够将通用产品与细分的行业方案进行有机结合:
「当我们拥有了一个通用的技术品牌后,我们可以用较低的边际成本将其扩展到新的行业、新的公司与新的细分场景中。因此,我们需要一个成为『行业专家』的团队,能够提供专业的行业方案,再用这个专业方案包装产品,进行落地。」
循环智能拥有明星创始人团队,在吸引综合人才方面并不难。杨植麟也强调,打造用于提升销售的AI系统并不能仅靠一群「NLPer」或「CSer」的力量,还需要有硬件人才、营销人才、行业分析师等等。
在科技赋能数字经济的进程中,NLP的核心价值往往体现在最后一公里。对于任何行业来说,只要有沟通数据与文本数据的场景,NLP技术就可以发挥价值。传统的NLP场景最大的瓶颈是规模化,但随着Transformer、少样本/零样本学习等研究的突破释放了极高的边际价值,杨植麟相信,在未来几年,NLP的规模化赋能将成为可能。
创业五年,杨植麟总结了自己在技术以外的成长:一是有机会学习到商业逻辑,加深了对行业与场景的认知;二是学习到如何建立与运营一家公司;三则是能有一种更彻底的方式缩短了技术与价值之间的鸿沟。
十年前,也许很多人会认为,进入大厂才是研究实用AI的最佳途径。但随着近一两年来越来越多的技术大牛从互联网大厂离职,或回归学术界,或自主创业,人们开始意识到:要推动人工智能技术的大规模落地,需要一种新的运作模式。从这点来看,杨植麟的选择颇有先见之明。
据了解,目前,杨植麟除了在循环智能创业,同时也在清华大学、智源研究院等机构主导了多个AI研究项目,继续践行他对如何打破研究与应用之间壁垒的思考。在创业与学术的双轮驱动下,杨植麟等新一代实干家,给中国人工智能的未来带来的不仅是「激进」的应用,还有培养从研究端就开始思考技术转化的青年人才。
薪火相传,未来可期。
参考链接:
1. https://www.gartner.com/en/documents/4004056/hype-cycle-for-crm-sales-technology-2021
2. https://mp.weixin.qq.com/s/huaJLRecOoV-gWzL0ZjEAQ
最后,再自我介绍一下,我是陈彩娴,长期关注AI人物、前沿研究动态与技术落地,欢迎与我聊天、交流(302703941)。
推荐阅读
国产EDA觉醒时代:从港中文走出来的ICCAD竞赛冠军
普林斯顿大学王梦迪:从基础理论到通用算法,看见更大的AI世界观
IEEE Fellow姚新:在多目标动态优化问题中,演化计算仍有独特优势