浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
此行向远:他们为人工智能雕刻灵魂
文 | 史中
历史的穹隆上,总是闪烁着孤星。
孩子坐在田埂旁,一颗星一颗星地数着,也就看到了银河。
(一)历史的星河
1942年夏,烟波浩渺的太平洋上,在目睹了四艘日军航母沉没后,约克城号背靠它的母港中途岛,缓缓倾覆在晨曦中。
与此同时,伦敦远郊的布莱切利园正值黄昏,日后被尊为计算机之父的阿兰·图灵正站在一群数学家、填字游戏高手和密码大师中间,眉头紧锁。一排排“炸弹机”正在他们身后全速破解德军密码,发出织布机般铿锵的鸣响。
而在万里之外的佛罗里达,空气里正弥漫着香甜。
神经科学家唐纳德·赫布带着妻儿来到世外桃源般的橙子公园(Orange Park)。为了帮助耶鲁大学探究大脑的秘密,他开始了与黑猩猩、海豚为伍的生活,还亲手养了一群会走迷宫的老鼠。
赫布和妻子孩子在林间小屋
他的笔尖在暗哑的纸面上沙沙响动,一个惊天发现正喷薄而出:特定的刺激,会加强两个神经元之间的联系,而亿万个神经元之间联系实时而微妙的改变,难道就是人类智慧的究极奥义?
隔着厚厚的镜片,赫布双眼望穿,恨自己尚不能了然大脑的全部秘密。但是这张草图却像一枚定时炸弹,十多年后,在千里之外的“人工智能”领域陡然掀起巨浪。
1958年的一天,康奈尔大学心理学教授罗森布拉特原地跳起来。他和同事们用400个光电单元模拟人类的神经元运作,用50组“左”“右”箭头的图片,竟然教会了计算机自己判断方向。
罗森布拉特(右)和他的感知机
罗森布拉特把这个宝贝称为“感知机”。感知机也在日后被人们追认为“人工神经网络”的 1.0 形态。
纽约时报上,巨幅评论热情洋溢:“这是一个能够行走、拥有视觉、能够写作、能自我复制,且有自我意识的电子计算机的雏形。”
美国记者们豪情万丈,睥睨群山。他们也许猜不到,当时意气风发的人工神经网络,即将在未来经历两度低谷,在人们心中与炼金术和骗子为伍;他们更猜不到,就在他们视野之外,一个强大的玩家正在悄然登场,六十多年后,无数繁星将在大洋彼岸闪耀。
1956年,五十三岁的陈光熙教授受哈尔滨工业大学校长李昌的邀请,挥别首都,千里赴冰城,创建了哈工大计算机系。
就在罗森布拉特发明感知机的那一年,哈工大依靠自己的力量研制出了中俄互译的机器翻译系统。虽然现在看起来这套系统很幼稚,但在当时它翻译的外文资料,却化成火箭的尾焰,把卫星托举上天;化成潜艇的螺旋桨,把堤岸守卫在身后。
陈光熙
在随后的几十年,中国第一台并行数据库机、第一台并行推理机、第一台会下棋的数字计算机、第一台容错计算机,都诞生在这片校园。
在101大楼的报告厅里,系主任李仲荣深情地对每批新生回忆他那一辈计算机学者为了打破帝国主义封锁青丝白发的光荣故事,成了同学们毕业几十年都难以磨灭的共同记忆。
1994年,摇摇晃晃北上的绿皮列车上,“花生瓜子矿泉水”的吆喝声里,一个年轻人看着远处,脑海里如数家珍地回忆着那些面孔,热血难凉。
他就是哈工大计算机系学生王海峰。
在他身边放着一个几十斤重的背包,里面都是宝贝——受他的老师李生嘱托从北京图书馆、清华大学、北京语言大学花了上千块钱复印的最新外文期刊资料。
资料都是“食粮”,他和同学们要靠这些把机房里那些“带屏幕的铁皮儿盒子”喂得更聪明一些,让它们把人类的语言翻译得更明白一些。
这一阶段,人工智能翻译技术恰好遇到了瓶颈。靠着背包里这几十斤的资料,未来究竟能把翻译做到什么程度,研究生王海峰当然不敢下结论。但是和很多哈工大人一样,他至少可以确信一点:只要坚持往前走,自己总有一天可以找到突破点。
他去车厢接缝处洗了把脸,转头望向窗外,沃野千里,稻麦纵横,这片土地似有万语千言。火车就这样不疾不徐地摇向远方,把昔日的景色也一并带进泛黄的照片。
多年后,王海峰也经历了属于自己的故事。
1995年,王海峰在哈工大机器翻译实验室。
(二)等风来
人工智能的演化史,像极了生物大脑的演化史。
从罗森布拉特连接了400个节点开始,几十年间随着计算机芯片的进步,神经网络中的“节点”增加到几万个,到后来增加到数亿个。这才有了今天你所用到的各种人工智能应用。
卡斯帕罗夫输给“深蓝”
如果说人工智能科学是一座城堡,那么每个应用方向都是一个房间。这些房间有:语音识别、图像识别、自然语言处理、知识图谱等等等等。。。
王海峰当年心心念念做的“翻译”,其实属于“自然语言处理”这个房间,它的英文简称叫做 NLP(Natural Language Processing)。
用通俗的语言说,NLP 干的事情就是两样:1、让机器听懂人话;2、让机器用人话表达。
说到这,你脑海里肯定会出现那些科幻电影中的机器人,例如《2001漫游太空》里的 HAL 9000,或者《终结者》里的 T-800,或者《星球大战》里的 3PO 和 R2D2。没错,这些钢铁和硅片拼成的机器人之所以能够跟人类对答如流,甚至拥有情感,就是因为背后有 NLP 技术加持。
你看,在科幻电影里都堪称“扛把子技术”,NLP 的难度有多大,可想而知。实际上,自然语言处理被公认为人工智能最难的分支没有之一,也被称为人工智能皇冠上的明珠。
随便抓来一个 NLP 领域的科学家,Ta 一定会告诉你,自己拥有两个终极梦想:
第一,让不同语言的人无障碍地交流,也就是“机器翻译”; 第二,让人和机器能够无障碍地交流,也就是“人机对话”。
站在2020年的世界,看上去这两个梦想也没那么遥不可及。可是在上世纪末,NLP 可谓是有一颗藏獒的心,却配了一个泰迪的身:
大规模的神经网络需要搭配大量的计算力和数据才能拥有智能。可是你想想,那时候“486”、“586”的电脑才刚刚问世,什么云计算根本就是天方夜谭。 结果就是:很多学术算法看上去很有潜力,可是如果放在当时的计算机上就得跑几十亿年,就算好使也得搭配长生不老药使用。。。
这里不妨插播一个故事。1980年代,国力扶摇直上的日本不信邪,尝试独立开发出性能爆棚的“第五代计算机”用以支持人工智能,进而可以对美国说“不”。
结果,由于目标设定得太猛,超越人类科技能力,第五代计算机最终宣告失败,日本继续对美国说“爸爸”。
有了这些前车之鉴,90年代中国人工智能研究也转入低潮。如果那时计算机专业的人跟别人说我的理想是“人机对话”,对方看你的关爱眼神就跟看一个误入传销组织的无知青年别无二致。技术突破希望渺茫,科研机构的经费也被迫削减。那时节,很多学校里研究了十几年人工智能的老教授,有的转岗,有的下海经商,有的甚至被派去看机房。。。
王海峰并不准备转行。他的直觉告诉自己:“这东西对国家有用。既然是对国家有用的东西,总要有人继续坚持。”
正如六百年前生在繁华港口热那亚,从小就浸染在对马可波罗笔下“华贵天城”杭州的憧憬里的哥伦布,滔天巨浪也不能让他放弃航海梦;一个毕业于校歌中唱着“民主和科学是我们的追求,忠诚和报效是我们的选择”的哈工大,目睹了前辈们为了祖国科学付出韶华的王海峰,字典里恐怕也难寻“退却”二字。
哥伦布用漫长的青春游说各国国王支持他的远航,每天在海岸边研习水文星象,等待有一天浪潮来了自己要第一个冲进大海;毕业后王海峰辗转十年在微软研究院、东芝研究院这样的研究机构中,如达摩面壁一般每日精进着研究,向学术组织一篇一篇地投递论文。
时光的河流映照着斗转星移,2009年,王海峰已经成为了 NLP 学界鼎鼎大名的大牛。那时节,哪怕是最谨慎的人,也会判断王海峰的余生是板上钉钉的衣食无忧、众星捧月,可以坐享人生了。但王海峰并不这样想,眼前的一切成绩都只是他梦想的前奏:“十年面壁图破壁,实业报国方英雄。”
上天眷顾,在港口张望多年的船长终于等来了浪潮。
这个浪潮名叫互联网。
严格来说,互联网浪潮在2000年左右就已经在中国掀起,可那时大多数互联网企业为了跑马圈地,关心的是“流量”、“转化”这些词汇,别说和人工智能,甚至和“技术”都没那么贴边。
2009年8月18日的百度世界大会上,王海峰听到百度创始人李彦宏说出了一个惊艳的词:“框计算”。
他被吸引了。
根据李彦宏的介绍,未来你不用在搜索框里输入准确的关键词,而是输入一句话,一个短语,或者随便什么要求,百度都可以经过理解,努力给出你想要的结果或者服务,这就是“框计算”的涵义。
当时有关“框计算”的报道
王海峰的脑海里瞬间闪过三件事:
第一件:原来搜索引擎还能做成这样! 第二件:如果真想把框计算做深,没有 NLP 的加持是不可能的。 第三件:NLP 这件事儿我做了十几年,我有信心做好。
这件小事,让王海峰和百度即将超越普通用户的关系,发生事业上的“亲密接触”。
故事讲到这里,我们不妨先让王海峰的故事定格,调转镜头,看看在北京西北角的百度大厦里发生着什么。
我们把时间倒卷几年。2006年,一位叫做吴甜的浙大毕业生提着行李来到北京。让一个女生放弃咖啡江景落地窗的外企,下定决心俯冲进这座浩瀚的北方城市的理由,居然只是一张招聘海报。
海报上有一句话:是做一条舒服的虫,还是骄傲的龙?
百度2006年的招聘海报
她坚信,自己读懂了百度传达的“暗号”。
如果回到那个历史现场,百度其实正处在“战争状态”。
就在一年前,李开复就任谷歌大中华区总裁,鼓足风帆,杀气侧漏,直奔百度而来。李彦宏发起“闪电战”全力反击。
当时,百度采取的策略是一艘航母加无数艘驱逐舰的战法:
“航母”就是搜索产品,内部称为 PS 业务; “驱逐舰”就是百度知道、百度贴吧、百度百科、百度MP3、百度地图这些产品,内部称为 NS 业务。
当时百度同学肩扛手提,一夜之间在机房里上线了几十台服务器,百度搜索的索引量逐渐超过 Google,而有了“知道”“百科”这些产品护航,中文信息质量一下子变得更高更丰富,当时就连 Google 搜出来的结果都是百度知道的内容。
在这样一支舰队上,所有的技术人都如同战士,扛着代码的钢枪,享受着他人发自内心的尊敬。吴甜分明感觉到自己的每一行代码都闪着光,无数像她一样的人,正在把这个舰队装点得雄姿勃发。
她爱这种感觉。
2007年的百度之星程序设计大赛
哦忘记介绍了,吴甜的研究生专业正是人工智能。在当时的百度,有人工智能专业背景的人凤毛麟角。
一日,人们一大早过来,发现坐在角落里的吴甜正在嘿嘿傻笑。
原来,她“擅自”在百度知道里加入了一个“NLP 模块”。这个模块的工作原理是酱的:
1)先为所有的问题回答者打上标签——例如有的人善于股票问题,有的人善于美食问题; 2)然后再为提问者的问题打上标签——有的是在问股票,有的是在问做饭; 3)最后把这些问题和答案智能匹配,把适合的问题推荐给适合的答者。
那天早晨,吴甜打开后台日志,发现在这个推荐模块的加持下,人们使用百度知道的记录像瀑布一样奔涌而出,飞流直下,银河九天。
自己的技术通过一根根网线,同时触摸到了几千万活生生的人,那种感觉真的太开心了。
吴甜对我回忆。
吴甜
那一刻的感觉像打开窗迎面而来的沁人花香,直到今天还让吴甜沉醉其中。几年间,吴甜辗转了几个岗位,都试着把人工智能的技术像奶油一样装点在各个产品的”蛋糕“上,效果奇佳。
当然,吴甜不是孤例。当时在搜索、地图、MP3等等部门,其他几位有人工智能专业背景的同学也在各自的岗位上进行着探索。
每一次微小的技术改进,都像一枚重炮,呼啸着奔向敌军的甲板。
27岁的吴甜沉浸在一场场战斗中,暂未认真思考终局。她并不知道,自己的职业生涯将会像一颗行星,即将遇到巨大的“技术引力场”而改变轨道。
(三)新大陆上的据点
2009年,百度在中文搜索领域完成绝杀,市场份额暴涨至谷歌的三倍多,股价从100块飙到了将近400块,李开复宣布辞任谷歌大中华区总裁,在历史的刻度盘上,此时距离谷歌退出中国仅剩几个月的时间了。
百度宜将剩勇追穷寇,形势好得不能再好。李彦宏也像明星一般,所到之处是鲜花、粉丝、尖叫、荧光牌。
李彦宏
可是他心里却隐约觉得不安稳。
这种感觉总结成一句话就是:百度的技术护城河还不够高。
就像越强壮的人越会去健身,越仰仗技术的公司越觉得技术还有提升的空间。在百度的理想中,自家的搜索引擎必须能够让用户“哇”地一声叫出来——这样才能让黑暗中蛰伏的对手知难而退。
于是,百度开始鼓励各个业务部门——也就是吴甜他们——加大力度在人工智能技术上投入。
不过问题很快出现了:人工智能如果作为蛋糕上的裱花奶油,大家都能玩转,但要真刀真枪成为生产力时,各个部门立刻显出了疲软,由于缺乏理论指导,东一榔头西一棒槌,收效不好。
领导层意识到,为了迎接“框计算”的时代到来,百度需要找到一位能在人工智能领域统领全局的将领。
2009年的百度世界大会不久,王海峰与百度人相见了。简短沟通,他就确定了加入百度的意向。
“当时你有没有其他选择?”我问王海峰。
“那时的产业界,能有人提出来人工智能就很好啦!百度提出来,我第一个就来了。”王海峰说。
“你有没有担心过,人工智能这件事儿,百度可能只是说说而已?”我问王海峰。
“这其实不重要。只要我用行动把它做出来,就不是说说而已了嘛。”王海峰笑。
1492年,西班牙女王赠送给哥伦布三条船,哥伦布还给了西班牙一个美洲;2010年,李彦宏把信任给了王海峰,在未来,他将还给百度比这份信任更超值的回报。
早晨七点半,一个笔直的背影坐在电脑前,衬衣系到第一个扣。
一些未曾谋面的同事经过,都上来搭讪:“你就是新来的王海峰老师吧?”“你怎么知道?”王海峰诧异地问。“一猜就知道,我们一般。。。不这样穿衣服。。。”对方说罢,趿拉着拖鞋走了。
说实话,最开始我们确实看上去不太一样,但是和同事合作之后我就确信,我们都是尊重技术,信仰技术的人,本质上是相同的。至于衣着,很快我们就一样了,你看我现在,跟别人有区别吗?
王海峰笑着对我说。
王海峰
按照之前的计划,王海峰会组建一个 NLP 部门,把散落在各个业务中的人工智能人才都拢在一起,兵合一处,统一为百度所有的业务提供弹药(当然,主要是为“航母”搜索提供弹药)。
那年春节后上班的第一天,吴甜的主管找到她:“百度新组建了NLP部门,你要不要转过去?”
“我思考了两点。第一点:当时我特意看了海峰老师的履历,他的专业背景很强,而且有无数成就。那时候我才毕业三年,懵懵懂懂,我觉得需要一个能带领我向前走的导师。第二点:那时候公司经常组织一些技术交流活动,我都会参加,我明显感觉到人工智能会是公司未来发展的重要方向。”
即使是回忆往昔,吴甜也用这种“小标题”模式,满满的工程师风格。但不得不承认,毕业三年就能看清这两点,她的远见已经是碾压式的了。
就这样,吴甜几乎没有犹豫就加入了王海峰的队伍。彼时散落在各个业务的田浩等一批技术信徒也选择加入。
就在前后脚,还有另一个重磅人物加入了百度 NLP 团队,她就是吴华。吴华和王海峰是老相识了,在东芝(中国)研发中心的时候,吴华就是王海峰团队的一员。
要我说,吴华是一个有着少女心的学霸,科学就是她最大的浪漫。年少上学的时候,她只喜欢一件事儿——躲在角落里推理数学题,看着那些线段拼成的几何图案,心里就能感觉到宁静和美丽。。。
别笑,这世界上真有这样的人。
吴华
学院派的吴华加入百度,当然有一半原因是王海峰。另一半原因,是李彦宏。
来之前,我看过李彦宏的采访,也看过他跳舞,跳得还挺好。他说话很客观,很冷静,不煽动,既不热情,也不冷漠,带有一种技术人的单纯。。。不过这在我看来都是靠谱的特征。
吴华笑。
有了三五杆枪,队伍算是基本成型了。这时,王海峰又想起了学术界的朋友们。
他先给各个大学教授挨个打电话,鼓励他们推荐学生来百度,再给自己十年来一起共事过觉得不错的年轻人打电话。在黑暗里举起火把,自然有同路人循光而来。王海峰并没有费很大的力气,就组建起了一支精悍的 NLP 团队。
“你邀请他们的时候,用不用请他们吃个饭?”我问。
“印象中还真没有。”王海峰说。
“就打个电话?”我问。
“就打电话。”他确定。
根据吴甜的回忆,比自己大十岁的王海峰刚刚带队的时候,有一种大叔的萌气,连最基础的网络用语,像“萝莉”、“正太”、“卢瑟”这些都不知道。
不过,这完全不影响团队被王海峰的引力场所折服。在团队组建早期的一次全体会议上,王海峰讲了一套 PPT,里面满是他对团队未来的想象和周密的计划。
我截了两张图,你感受一下。
而吴甜的印象中,有一次王海峰给他们开季度会,标题就是:仰望星空与脚踏实地。回到当时,团队恐怕并没人深究这句话的意涵。而如今,当这群人回望来路,发现自己竟然用了十年时间践行了句话,才愈发感觉到这几个字的炙热和浓烈。
这张幻灯片也被找到了。
吴华记得,当时最难的就是给别人介绍自己的工作。
“我说我们是搞人工智能的,人家问什么是人工智能?我就说我们是搞 NLP 的,人家问什么是 NLP?我就说我们是搜索团队的创新小组。人家才似懂非懂地走了。”吴华笑。
不过,这种格格不入反而成为了一种凶猛。像星火燎原。
没过很久,人们就意识到百度搜索发生了变化。
2010年,百度上线了“即搜即用”。在搜索框里搜索一些应用或者游戏的名字,不用下载到电脑就可以直接在网页版上运行。例如搜索“植物大战僵尸”,就可以在网站上玩这个游戏。
2011年,百度上线了新首页。就是每个人在百度上搜索,看到的信息是给这个人量身定制的。后来通俗的说法把这种技术叫做“千人千面”。
一片“人工智能”的新大陆,隐隐然出现在这些水手面前。
但是,“新大陆”上仅有“NLP”这一个据点,王海峰还觉得远远不够。他专门跑到李彦宏办公室去做汇报,讲的不是 NLP,而是人工智能的另一个方向:语音识别。他的理由是:这些年语音识别的准确率一直在攀升,马上就要到产业化的临界点,一旦突破很快就会大规模商用,此时布局,才能占尽先机。
李彦宏凭借自己对技术的信仰和判断,决定再次支持王海峰。
依靠这样的逻辑,王海峰陆续建立了与“NLP 部门”平行的“语音识别部门”和“图像识别部门”(当时叫多媒体部)、“知识图谱部门”(当时叫互联网数据研发部)。
讲真,当时王海峰的这波操作,把很多百度同学看得一愣一愣的:“这些技术和百度现在的产品也没关系啊,一股脑创建这么多部门,是攒着过年吗?”
不过,当几年以后百度陆续进入“自动驾驶”,推出“小度机器人”,进军“产业智能化”的时候,这些答案也就顺次揭晓了。此乃后话,略去不表。
我们还是回到 NLP 部门。
除了用 NLP 技术改善搜索体验,王海峰和团队同学心里还有一个亟待实现的小梦想,那就是心心念念了十几年,NLP 学者的终极理想之一——“机器翻译”。
不得不承认,在机器翻译这件事儿上,百度的老对手谷歌可是占了先机的,早在2006年就推出了谷歌翻译,并支持中文。当时正准备毕业的吴甜还饶有兴趣地体验了一把,输入了“蚍蜉撼大树”这种“送命题”来难为谷歌翻译。当然,受限于数据和技术,当时的翻译结果并不好。
不过,有吴华、王海峰这样做了几十年机器翻译的国际大咖坐镇,后期直追并不难。
十年前的翻译结果没有图了,我找来2020年谷歌翻译的结果。
2010年底,这群中国人终于要做属于自己的“百度翻译”了。
王海峰发现,在百度做翻译和之前做翻译,有两点很大的不同。
第一,百度翻译可依靠的数据空前广阔,凡是搜索引擎能抓到的中外文对照页面,都可以成为驱动翻译引擎的石油。 第二,因为这些网页都不是为了你做翻译引擎而准备的,所以这些“石油”的质量其实参差不一,需要先用技术“精炼”一下才可以使用。
在石油产业中,石油精炼的技术含量远比开采原油要大;同理,把海量的数据进行“精炼”的技术才是最有挑战的地方。讲真,当时的中国还没有人踏足过这个技术领域,原因也很简单——除了百度,别人没有这么多数据。这就等于 NLP 团队拥有了对这片处女地的“独家开采权”,这更让他们心潮澎湃。
在研发的过程中,王海峰不断亲手测试百度翻译的效果,越测越激动。说到当时的感受,他的原话是:“可以用惊艳来形容。”
“2011年6月30日,百度翻译上线。”
王海峰坐在我对面,这个时间几乎是脱口而出。对于普通用户来说,这只是百度的一个产品。对于王海峰来说,这是他的一个梦。
在百度翻译刚上线的阶段,王海峰一遍遍地刷着后台的使用数据,无数用户涌进来,翻译着五花八门的句子——那些用户无比真实的细节堆叠跃迁为浪潮涌动,如迁徙的角马群一样掀起隐天蔽日的尘土。
一贯冷静的王海峰此时却抑制不住兴奋,高兴得像个手握崭新的变形金刚的孩子。
而吴甜也输入了“蚍蜉撼大树”来难为百度翻译。得到的结果让她很满意。用更广阔的中文语料训练出来的翻译系统,果然可以更准确地翻译出这个民族的文化内涵。
这是我在2020年截的百度翻译的结果。
在团队庆祝的宴席上,已经在机器翻译领域摸爬滚打了十八年的王海峰举起酒杯:“过去一个礼拜,用到我们翻译技术的人,比过去十八年的总和都多!”
短短一句话,却让十八年的岁月如狂风扫过旷野。在这六千多个日夜里默默雕刻一个梦想,其间会遭遇多少内心的困境,一次次把自己从荆棘里拽出来继续向前,身上会留下多少伤疤,这些恐怕王海峰永远不会与人诉说。
2015年,王海峰牵头的“基于互联网大数据的机器翻译核心技术及产业化”获得了国家科技进步二等奖,和京沪高铁、油田勘探技术同台领奖。这个荣誉,被王海峰小心地放在记忆里。在他讲述的时候,我依然能感觉到满满的虔诚。
这是当时在人民大会堂领奖的留念。
短短三四年间,NLP 团队为百度贡献了很多果实。但是,百度这条“大船”也教会了 NLP 团队很多东西。
为了让百度翻译能吸引更多用户使用,NLP 团队不断向其他老百度团队学习——什么是用户需求;什么是迭代升级;什么是庞大的人口之下复杂而真实的中国;什么是在互联网这个丛林里躬身入局所要承担的风险和代价。
在百度的积累和成长,在那个深夜,帮王海峰做出了一个重大的决定。
(四)上前线
2012年8月15日,360 低调上线综合搜索。百度心里清楚,怀揣十年搜索梦的“颠覆者”周鸿祎很可能比当年温文尔雅的“外来和尚”李开复更难对付。
果然,360 来势汹汹,一周就砍下全中国搜索份额的10%。8月28日双方短兵相接,上演了“3百大战”,而后双方转入拉锯战。
没想到,在持久战中360依然表现顽强,在未来的一年半,人们将会见证它的股票狂飙近十倍。虽然彼时市场份额还相差悬殊,但已经有一群赌徒在球场边疯狂地押注落后一方逆风翻盘的可能性。
2014年1月,春节将至。李彦宏邀请公司管理层到家里聚餐,日常每天七点半出现在办公室里的王海峰,那天也发挥稳定——是第一个到的。
等待其他人的过程中,李彦宏把当时百度搜索遇到的具体问题都和王海峰讲了。说者也许无意,但听者却走了心。
当天回家的路上,王海峰心绪难平,他意识到百度搜索可能面临的危机,而与这个危机相关的无数种可能性在他心里反复推演,暗潮涌动。
那天晚上,他决定“主动请缨”。
在王海峰建立的几个团队中,只有和搜索贴合最紧的“NLP 团队”和“知识图谱团队”跟随他一起进入了搜索业务部,吴甜和吴华她们均在此列。
春节回来,NLP 核心团队就集体上阵,他们对搜索的全面改造主要从两个方面下手:
1、搜索的结果
当时各家的网页搜索,都会有一个右侧边栏,会根据你的搜索关键词联想一些相关的问题。但是在这方面,百度做得优势并不明显。
这个右侧的“相关电影”就是基于人工智能的推荐。
技术上,根据已有的信息做联想,其实非常考验“知识图谱”的能力。
通俗来说,知识图谱是知识的集合,包括常识——打雷要下雨,天冷穿棉袄,刘德华的老婆叫朱丽倩,成龙的儿子叫房祖名。从天文地理到娱乐八卦,都是知识图谱的范畴。
由于之前知识图谱团队和搜索团队分属两个不同的部门,所以搜索对于知识图谱的利用并不好,这下,知识图谱终于有了施展的舞台。
知识图谱当时的负责人是现任百度CIO李莹,吴华也作为成员参与和见证了知识图谱的研发攻坚。
这里科普一下,知识图谱的生成,不是你想的那样要靠人来一条条写,而仍然是需要从全世界五花八门的网页集合里提取的。只要是从互联网的内容里提取,就难免会收录奇葩的错误。就好像当年微软用 Twitter 上的数据训练的机器人 Tay 一样,上线一天就学会了骂人,甚至满嘴阴谋论。
于是,吴华他们绞尽脑汁改进算法,剔除错误的图谱。
后来他们还想到了一个好办法,用用户的请求来做“交叉验证”。举个例子,假如自动生成的知识图谱认为巴西的首都是里约热内卢,但是用户经常会把“巴西首都”和“巴西利亚”放在一起搜索,这时就会触发机制,第一时间修正知识图谱。
知识图谱示意图
2、搜索的速度。
很少有人意识到搜索速度的重要性。但从指标上看,搜索结果每快0.1秒,都会大幅增加人们对于搜索引擎的好感度。
而为了增加搜索速度,需要对搜索引擎底层架构进行重写。这套架构的重写,虽然不是 NLP 团队的任务,但是新架构却给了 NLP 技术更大的舞台。
例如,后来百度上线了一个“搜索预测”的功能,就是你还没输完关键词,它就预测出你想搜什么,你就可以直接点选,不用费事输完,这同样提高了搜索速度。而要做到这一点,就必须依靠新的架构。
搜索预测大概就是这样
那时候搜索团队像打仗一样,每两周就要开一次全体会议校正航向,每周都会根据指标来改进搜索技术,而王海峰更是每天盯着搜索结果,站在一线指挥战斗。
搜索的体验其实是很细节的。例如,某个新词刚开始流行的时候,会有大量的人开始搜索。这时,百度就必须第一时间感知到这是个新词,并且为这个词专门优化搜索结果。这个过程越快,识别得越准确,用户的体验就会越好。
吴华说。
而让吴甜惊讶的是,那段时间,王海峰莫名学会了很多最新的网络流行词。“有很多新词我没听过,他却能顺口说出来。后来我知道,他是天天研究搜索后台的 Badcase,学会了。”吴甜笑。
一顿操作,成绩究竟如何?
到2014年3月6日,在王海峰出征一个多月的时间里,百度搜索右侧推荐的体验和覆盖率已大幅提升,反超竞品。有趣而巧合的是,这一天,不偏不倚正好是360在美股的市值巅峰,之后便一路下滑,它对于百度搜索地位的挑战,就此画上了长长的休止符。
经此一役,百度在搜索领域又击退了一波进攻。王海峰镇守搜索技术边疆,和平维持了相当长的时间。
然而,在技术护城河的加持下,广告收入像黄金河流一样流入百度的城池。正如五百年前美洲的黄金流入西班牙一样。
也许金钱是诅咒。众所周知的问题,正在前方等待着百度的每一个人。
(五)荒野求生
后来百度的一系列危机,坊间各路传闻和评价历历在目。不过,这个世界上,逃离战火永远是最简单的选择。而站在此地,让脚下的土地鲜花重新盛开,才是勇敢者的游戏。
正如哥伦布的那次探险,在所有船员都干渴无助“逼宫”要求返航的时候,他仍然鼓足风帆,在看不到希望的情况下星夜兼程,才终于在最后一个清晨抵达美洲。人工智能的征程,才刚刚上路,星辰大海在前,返航不可能成为选项。
那几年,百度有人走了。但王海峰没有走,吴华没有走,吴甜没有走,NLP 团队没有走。还有千千万万的老百度人没有走。
于是,在凌乱和迷茫的秩序下,涌动着一场盛大的“荒野求生”。
在 NLP 团队的视野里,这场荒野求生有两个重大的节点。一个是小度助手的出生,一个是信息流业务的创建。
先说小度助手。
不知你还记不记得,前面我们说过,NLP 研究者有两个夙愿:1)机器翻译;2)通用对话机器人。
早在2011年,在这群 NLP 疯子的努力下,百度翻译已经面世。可对话机器人却迟迟没能降生人间。
这里面至少有两个原因:
1)技术不到家,做出来的通用对话机器人智障得厉害,拿不出手。 2)场景不明确,不知道做出来给谁用,怎么用。
当然,不仅是中国,全世界都面临同样的问题。这两个问题必须一个个解。
先说技术不到家的问题。
其实,今天之所以人工智能这么火热,街边随便一个大爷都能上来点评两句,是因为在2014-2016年间,人工智能技术领域“天降猛男”,这位猛男就是“深度学习技术”。记住这个名字,今天我们用到的绝大多数人工智能,都要拜深度学习的成熟所赐。
你还记得罗森布拉特的“感知机”吗?感知机的神经网络,就可以称为浅层神经网络。通俗理解,把浅层神经网络用特定的形式堆叠起来,就是更像人类大脑的“深度神经网络”,用深度神经网络做人工智能的方法就叫做“深度学习”。
在数据充足的情况下,深度学习相比传统神经网络的优势,就像是坦克碾压战马。
其实深度学习模型早在1980年代就被提出来了,但由于之前反复说到的“计算力不足”和“数据量不够”这两个钢铁天花板,深度学习技术一直像丑小鸭一样备受排挤,没看出来多厉害。
但是到了百度,突然转角遇到爱。取之不尽的数据,用之不竭的计算力,让王海峰长期技术积累锻炼出来的直觉一下子被触动,很快就看出来深度学习的优势巨大,于是在2013年他就力荐李彦宏建立了百度深度学习研究院(IDL)。在深度学习的研究上,百度并不比公认的人工智能巨头谷歌晚。
当然,深度学习也并没有神到“让机器人瞬间就能出口成章”的那种程度。NLP 团队决定,先把自己的梦想缩小——之前他们一直“妄图”要做一个上知天文下知地理对答如流的“通用对话机器人”,后来他们现实了一些,主要让机器人从做“任务执行”和“资讯检索”这类简单事情开始。
深度神经网络示意图,通过一系列神经卷积,识别这个图像是数字“7”。
再说场景不明确的问题。
其实早在王海峰负责搜索之前,就已经带领语音和NLP的创新团队做出了这个机器人的雏形,分别是“音箱”和“蓝牙耳机”的形态。可以直接问这个音箱:“中国有多大?”云端的人工智能就会通过语音回答你:“960万平方公里。”
只不过,那时候王海峰主动请缨进入搜索,没办法把这个部门也带进搜索,于是慢慢搁置了。
直到2014年9月16日的江苏卫视《芝麻开门》节目上,百度冷不丁带来了一个很厉害的机器人,在知识问答上碾压一众选手。没错,这个机器人就是王海峰在搜索团队内部重新孵化的,采用深度学习技术做出的“小度机器人”。
当时各大媒体争相追捧,把背后的百度技术人当成明星一样崇拜。
小度机器人
可是亮相之后怎么办呢?小度到底能干什么?
当时百度搜索的产品总架构师景鲲,绞尽脑汁要把小度派出去“打工”,先是把小度放在PC搜索框旁边,鼓励人们通过语音搜索;后来又放到手机百度里,让人们通过它订餐订服务;后来又放到合作伙伴生产的冰箱、电视里;直到最后,才辗转做回了智能音箱的形态——“小度音箱”。
那小度音箱是用在什么场景的呢?它被百度认为是每个人的“秘书”,坐镇每个人的客厅和卧室,主要工作恰恰就是刚刚所说的“任务执行”和“资讯检索”。
这里还有一个有趣的插曲。
2014年王海峰带着景鲲他们去黑龙江雪乡开会,探讨未来搜索应该朝哪个方向发展。大家一致认为未来搜索的下一个形态就是“秘书”。景鲲开玩笑说:“未来的搜索就是姬然。”姬然就是当时王海峰的秘书。
既然“秘书”是搜索的下一代产品,那小度音箱可就是百度搜索的继承人啊,分量不言自明。
我们从来没有这么多人压上去做一个技术。在做小度助手的时候,NLP团队的一半人都去了,知识图谱也有一半人去了。
吴华回忆。
那之后,小度经历了悠长的暗夜,直到2018年才异军突起,此乃后话。(小度的故事,我写在了另一个万字长文里,感兴趣的浅友可以去看看:《吾儿,小度》)
在小度独自探索的日子里,另一场荒野求生也在紧锣密鼓地进行。
景鲲和蔡康永,在小度音箱的发布会上。
接下来就说“信息流”。
2016年,李彦宏亲自挂帅,秘密研发了百度的新产品——信息流。
现在你打开手机百度 App,可以看到搜索框下面像瀑布一样向下排列的文章,这就是信息流。在外界看来,这个产品既是百度对标今日头条的产品,又是百度在搜索之外开辟的第二个盈利战场。
吴甜告诉我,信息流产品的核心技术正是 NLP,主要包括两大方面:
第一,是对文章的理解。通过 NLP 技术,好像做一次“阅读理解”,把这篇文章的领域、主旨、关键词、观点、情绪分别提取出来。 第二,是对人的理解。通过 NLP 技术对人的搜索关键词、对于文章的观看和滑动行为来判断ta的品味、性格、观点和关注领域。
有了对文章的理解和对人的理解,只要把特定的文章推荐给特定的人,就完成了。(当然推荐的时候,不会使用“你喜欢什么就只给你推什么”这么傻的策略,百度和今日头条都不会。这里面涉及更复杂的知识,此处就不详细说了。)
其实,当时百度高层“要做信息流产品”这个决定一下来,推进执行非常快。整个信息流产品从研发到上线,只用了25天。
项目组第一时间找到 NLP 团队做技术支持时,没想到,NLP直接把信息流所需要的核心技术“对人的理解”和“对文章的理解”拿了出来。原来,NLP 团队早就在内部把这些技术做了预研,没什么原因,就是觉得将来肯定有产品能用到。
站在今天回望,在摇摇欲坠的艰难时刻,真正帮百度稳住阵脚的,恰恰是“小度音箱”和“信息流”这两款产品——小度音箱贡献了搜索之后人们对于百度产品的想象空间;而信息流业务则帮助搜索业务撑住了营收。
而在这两个产品背后,NLP 团队的凶猛和远见功不可没。
然而,仅仅稳住阵脚还远远不够。
在绝大多数人眼中,BAT 是一个存于底层记忆的词汇,在人们的脑海里,BAT 这三家互联网“开国先贤”应该而且必须永远是那个没有道德瑕疵的,遇事冷静游刃有余的,能够把互联网以及中国科技带向公平和开放的神。
每一句嬉笑怒骂,每一次冷嘲热讽,从本质上都是亿万国民对百度的鞭策,百度不仅无权争辩,而且需百倍努力。
荒野尚在,求生未止。
这是2010年时 NLP 团队同学们的合影。
(六)实业报国
几千年的荣辱浮沉,让中国士人总结出了真言:穷则独善其身,达则兼济天下。
2018年后,百度是否走出了泥潭,每个人都有自己的判断,但百度对自己的的判断是:他们必须刻不容缓地离开独善其身的自救思维,强行走上兼济天下的道路,用人工智能为全社会服务。
这就是百度的人工智能产业化战略。
这是救赎,也是新生。
虽然从历史的星河俯瞰,人工智能技术尚处在襁褓中,但不管了:进一步,有进一步的欢喜。
2017年,百度迈出兼济天下的第一步:宣布整合包括NLP、KG、IDL、Speech、Big Data 等在内的百度核心技术,组成百度人工智能技术平台体系——AIG。
王海峰也终于告别了搜索这个给了他们三年浓重记忆的荣耀与纷争之地,出任 AIG 负责人。
而后的2018年,百度的基础体系 TG 归于王海峰统领,一年之后的2019年,百度智能云事业群 ACG 也归于王海峰统领。同年,王海峰出任百度 CTO。
这意味着,从人工智能所需要的基础计算力,到人工智能技术本身,到人工智能对这个国家服务的出口云计算,形成了统一的集团军。
从1994年的绿皮火车,到2010年“仰望星空,脚踏实地”的演讲,到2015年人民大会堂的奖状,到2018年的小度音箱,到2019年的人工智能产业化,王海峰的梦想始终没变,变的是他手中越来越强大的武器。
据此,百度开始马不停蹄地把人工智能送进各行各业,而在这个过程中,NLP 技术仍然占据着重要的地位。
在人民日报,百度的 NLP 阅读理解能力帮助记者整理热点信息,寻找错别字,把记者宝贵的时间用来集中在纯粹的创作上。
在北京平谷马坊社区,NLP 可以学习经验丰富医生填写的病例,成为一套诊疗系统,为基层卫生站的医生提供最专业的诊疗辅助。
在中国联通,百度 NLP 技术支持的客服机器人为用户提供服务,把用户等待的时间节省了70%以上,人员成本也降低了10%。
在浦发银行,在百度的帮助下推出了“数字人”客服机器人,这个客服机器人以一个人类形象示人,可以帮助用户来办理业务,答疑解惑。
到了2020年,新冠疫情突然袭击全世界。在这个紧急的场景中,NLP 技术也发挥了巨大的作用。
由于疫情,百度地图上显示的很多商户采取了临时关门的措施,很多顾客都吃了闭门羹。百度地图紧急调用 NLP 技术支持的客服机器人,用语音电话的方式向所有商户查询最新的营业时间调整情况,更新到了地图上。
而在中国疫情最严重的时候,国家疾控中心火速上线了疫情问答系统,全国很多人都会登录这个官方咨询系统去咨询防护知识,人工客服回答不过来。这时百度就用 NLP 技术做了一个疫情问答机器人,不仅分担了很多人类客服的工作,还让无数焦急的人得到了科学的答案。
而在疫情防控中,中国医生的表现惊艳全世界。很多国外官方机构都在向中国寻求标准的治疗流程手册。而这些如果纯粹依靠人类翻译,会需要几个星期时间,患者的救治就会被耽误,百度翻译提供了医学领域的翻译模型,免费提供给翻译志愿者,让翻译的进程大大加快,只用了不到一周就翻译成世界各国语言。
现在在百度翻译上,还有生物医药的专用词库。
这样的例子还有很多。人工智能和 NLP 正在走出孕育他们的互联网大公司,化成涓涓细流进入各个传统产业的海洋。
在时光的河流岸边,王海峰心心念念将近30年的实业报国,仿佛初见端倪。
而作为一群理想主义者科学家,百度 NLP 团队也会用另一种方式报国——把自己的发现和全球学术界共享。
2015年,国际计算语言学协会 ACL(The Association for Computational Linguistics)年会上,百度发表了探讨用NMT技术(基于神经网络的翻译方法)解决多语言翻译及语料稀疏的问题的论文《Multi-Task Learning for Multiple Language Translation》,受到业内的极大关注。Google 和 Bengio 的研究团队都在此论文的基础上进一步扩展了研究。
而这些只是百度在国际顶级学术会议上的高光时刻之一。早在2013年,王海峰就出任了国际计算语言学协会 ACL的主席,这是 ACL 历史上首任华人主席。2014年,吴华出任ACL 2014程序委员会主席。
2013年,保加利亚首都索菲亚,ACL 的年会上,王海峰出任ACL主席。
这些荣誉和名头似乎对普通人来说有点陌生,但是它们却是一支科技队伍需要十年如一日的默默前行才能得来的,它们代表了中国在 NLP 领域已经开始领导世界。
在王海峰之前,有一任 ACL 主席曾经半开玩笑地说过:“再过50年,也许所有 NLP 领域的论文都会是用中文写的。”
无论是 CTO 王海峰,还是百度研究院科学家 Ken Church、技术委员会主席吴华、集团副总裁吴甜、人工智能技术委员会主席何中军……他们如今都在学术界、产业界获得了很高的认可,但他们身上却散发着一种谦卑而淡定的气息。
我猜,也许正是这些气质护佑着他们穿越时光。
他们身处一个巨大的战局,却更关心每一场微小的战役,甚至关心每一个据点的建立,每一片高地的夺取,每一颗子弹的方向。
他们在漫长的战争中时刻警醒,靠着专业自信预判技术的走向,让每一次机会来临时,做出的选择都足以让天平倾向自己一点点,让微小的胜利成为欢喜,再让欢喜带来更多的胜利。
今天,NLP 团队都只有一两百人,可谓精兵强将。而遥想当年,做出百度翻译的,只有王海峰、吴华等四个人,做出知识图谱的,也只有几个人。
他们在顺风的时候,并未赌上全部粮草杀伐四方;他们在逆风的岁月安住自己,但并未停止脚步。他们用尽全力影响着百度的一个个真实的人,使他们安住在合适的位置,让百度的技术火种在风雨飘摇中依然如心脏跳动。
他们终于等来了春天。
每个人都有不同的信条,每个人都要走好自己的路。我们这代人,从小接受的教育就是要当科学家,我们相信的哲学是“科技是第一生产力”。我的家国情怀也许就是这样慢慢生长的。我希望我不只是做了一件事儿,而是这件事儿能够对国家有贡献。这一直没有变,也不会变。
王海峰说。
从1956年达特茅斯会议至今,人工智能从科幻电影里一点点降落凡尘。
如今它可以让老人也可以通过语音控制播放相声、戏曲,扔掉那些用了几十年的磁带。
如今它可以让英语不好的普通人也能无障碍阅读世界的消息,让知识不再是少数人的特权。
如今它可以清楚地辨别每个人脸的轮廓,只要一秒钟,就可以证明“我是我”。
如今它可以穿梭于气候恶劣的荒原、沙漠、无人区,用火眼金睛辅助人类巡检输电塔的工作状态。
而它前面的路,还有亿万年。
人工智能是第四次工业革命的核心驱动力量,你如果要把它放到历史长河里,上升到一次工业革命的高度,它的发展至少是几十年、上百年的,现在只能说还处在早期。每个人都会有危机感,但我通常不会去思考自己走到了那个阶段。这么多年的困难教会了我,遇到问题,解决问题,也就是了。
王海峰说。
告别王海峰和 NLP 团队,我脑海里突然冒出一个有趣的问题:
如果没有哥伦布和那艘圣玛利亚号,欧洲人还能否发现新大陆?如果没有这群坚定的科学家,百度又是不是今天的百度?我没有得出答案。但我知道的是,在风起云涌的历史中,总要有人第一个踏上美洲,用血肉之躯去独自面对未知、艰险和随之到来的一切结局。
我脑海里浮现出哥伦布的一句话:
发现只孕育在勇往直前的坚持之中。我想,它大概与懦夫永远无缘。