一场会议,两场棋局,三门学派,5个阶段带你了解波澜壮阔的人工智能发展史(中)

2024-04-15 12:23:50 浏览数 (2)

1.6三门学派

人们在成人之后,就不再相信武侠故事,也知道现实世界没有什么武林。但是有人的地方就有江湖,今天的学术界就特别像武侠小说中的武林。原因如下:首先,科研人员给人的感觉和武林人士一样,他们都不食人间烟火。看武侠小说,大家可能偶尔会纳闷,剑侠天天行走江湖,哪里来的那么多钱,靠什么生活。科研人员给人的感觉也是一样;其次,在当今社会,除了少数行业,很难找到像武林中这样的师承关系了,而科研人员之间的依然有师承关系。武林中的师承关系代表江湖门派,那么科研人员之间的师承关系就代表了学术学派,在科研界,一说到物理学界的哥本哈根学派,数学界的布尔巴基学派,大家都知道都有什么样的学术观点;再次,学术界偶尔有像牛顿、爱因斯坦那样的不世出天才横空出世,开宗立派,睥睨武林,笑傲江湖,像极了武林中总有神秘高手,写成了《九阴真经》、《葵花宝典》等武林秘籍,指导武林发展数百年;最后,学术界的竞争其实最激烈,因为学术界“只认第一,不认第二”。在其他行业,你做一个产品,我也做一个产品,哪怕后者是山寨的,也可能获得超额收益。而科学是不承认第二的,即使你今天真的是独立发现万有引力,也没人会承认你和牛顿一样伟大。

科学只认第一,不认第二。既然都想争第一,必然有纷争。当然,学术界其实既有纷争,也有合作,但是互相合作的故事不吸引人,纷争的故事才有戏剧性。这里,讲一下人工智能领域学派纷争的故事(主要参考自文献[9-11])。

1.6.1 无可奈何花落去-符号主义

在人工智能的早期研究中,符号主义学派在这个领域是占有统治地位的。

符号主义学派一直在不断发展中,早期重点解决的问题是利用知识去做复杂的推理、运算和判断等。这些技术一些公理的基础上,通过一些谓词逻辑,根据规则,进行演绎运算,进而建立智能,这些想法颇具欧几里得《几何原理》的哲学思想。这个时候的数理推理、逻辑证明等都取得了不错的成果。但是后来发现仅仅依靠推理能够解决的问题很少,研究重点就转变为如何获取知识、表示知识和利用知识,进入到“知识期”,这段时期人们已经意识到,以当时的条件,实现通用人工智能是不可能的,因此,研究的重点变为利用某些领域的知识,构建“知识系统”,其中“专家系统”是这段时期比较典型的科研成果,例如,由费根鲍姆和莱德伯格等人合作主导开发的“DENDRAL”,根据化学专家的专业知识和质谱仪相关知识,能够根据给定的有机化合物的分子式和质谱图,从几千种可能的分子结构中挑选正确的那个,而“MYCIN”专家系统利用医学领域的知识,可以辅助医生做简单的辅助诊断。再后来发现世界上的知识好像是无穷无尽的,符号学派研究重点转化为如何让机器自己学习、发现知识,这个时候,机器学习又成为研究前沿。

符号主义学派早期一直是人工智能领域的研究主流,达特茅斯会议的参会者几乎都可以算是这个学派的人物。但是这个学派内部也有派系。例如,司马贺和纽厄尔两个人是亦师亦友的关系(二人共同获得了1975年的图灵奖,而在此之前,图灵奖都只颁发给一个人),他们算是一派;麦卡锡和明斯基一直是好朋友,他们是达特茅斯会议的实际召集人(名义召集人是香农),他们是一派。在会议期间,司马贺和纽厄尔就不赞成“人工智能”这个名字,他们希望起的名字是“复杂信息处理”,而且这次会议公认比较有实际结果的是他们发布的程序“逻辑理论家”,他们认为这次会议没有太多干货,只呆了一周就离开了。在这次会议之后,这两派的交流也不多,这两派之间的交流主要通过他们的弟子(研究生)进行。他们的研究思想相近,交流却不多,不得不说是学术界的遗憾。

早期人工智能的发展,符号主义学派所起的作用功不可没。这个领域也出现了若干图灵奖,包括明斯基、麦卡锡、司马贺和纽厄尔(他们都参加了1956年的达特茅斯会议)以及费根鲍姆等。

无可奈何花落去。不得不说,今天的人工智能的大热和符号派没有太大关系。这是因为人类的智能是如何形成的,人们还不得而知,智能只有少部分能够被形式化,试图通过公理系统推演出一切智能,这条路暂时失败了。1986年,美国哲学家John Haugeland的Artificial Intelligence:The Very Idea一书中将“用原始人工智能的逻辑方法解决小领域范围的问题”称为“有效的老式人工智能”(Good Old-Fashioned Artificial Intelligence,GOFAI)。这个定义很快就为学界所广泛接受,所以很多后来出版的书中为了划清界限,在出版的书籍中,纷纷加上了“现代的”,“新的”等字样,例如,目前人工智能最为广泛应用的教材——《人工智能:一种现代方法》一书就特意强调了“现代方法”一词。(这本书是本书的参考书之一,不要被它的书名所蒙蔽,这本书主要讲的还是GOFAI)。

“三闾大学校长高松年是位老科学家。这“老”字的位置非常为难,可以形容科学,也可以形容科学家。不幸的是,科学家跟科学不大相同:科学家像酒,愈老愈可贵,而科学像女人,老了便不值钱。”--钱钟书《围城》

1.6.2 似曾相识燕归来-连接主义

当前,站在人工智能舞台中央的是连接主义学派。但是在早期,连接主义学派可被符号主义学派打得找不到北。连接主义学派的发展,也上演了一幕似曾相识燕归来的故事。

连接主义可以追溯到更早的时候,1943年。生物学家麦卡洛克和一个穷人家的天才皮茨共同提出了M-P神经元模型,试图应用莱布尼茨的机械大脑设想来建立一个大脑思维模型,他们在1943年发表了论文《神经活动中内在思想的逻辑演算》,首次提出了神经网络的概念。值得注意的是,这篇论文早期是为了研究生物大脑学的,试图通过神经元之间与、或、非等基本逻辑,来解释大脑的工作模型。但是大脑的模型如此复杂,这个模型并不能解释大脑的工作,在生物大脑学研究上并未得到推广。但是,这个模型为机器模拟大脑打开一扇门,它的出现推动了神经网络技术的出现,人工智能中连接主义的哲学思想也发源于此。

大家都爱听故事,提出神经元模型的皮茨的故事就非常传奇。皮茨12岁就读完了罗素的巨著《数学原理》,并且发现了其中的几处错误,和罗素通信并得到罗素的赞许。皮茨是如此之天才,以至于控制论之父维纳称赞皮茨,“毫无疑问他是我见过的全世界最厉害、最杰出的科学家”。皮茨和维纳也共同工作了一段时间。因为皮茨在中间沟通,麦卡洛克和维纳一度关系不错,但是因为家庭原因(八卦故事,网上可查),麦卡洛克与维纳关系决裂,麦卡洛克是皮茨的早期导师与伯乐,皮茨站在麦卡洛克这一边;再加上后来根据青蛙的蛙眼实验证明,大脑的工作不是通过神经元互相之间简单的各种运算完成,M-P神经元模型不能解释大脑工作原理(至少是不完整的)。因此,皮茨在抑郁症中去世,年仅46岁。皮茨去世几个月后,麦卡洛克也在医院过世了。

神经网络这一生物学想法,在人工智能领域被广泛的借鉴。比如明斯基的博士论文题目就是关于神经网络[1]。而神经网络真正得到应用是在1957年,康奈尔大学的实验心理学家罗森布拉特在一台IBM-704计算机上模拟实现了一种他发明的“感知机”(Perceptron)神经网络模型。这个模型把M-P神经元平铺排列在一起,就可以不依靠人工编程,仅仅靠学习完成一些简单的视觉处理和模式识别方面的任务。这种连接主义思想其实已经独立于“图灵机”,成为了另外一种体系结构。罗森布拉特还制造了世界第一台硬件感知机MARK-1,其输入端是20×20的感光单元矩阵,将光信号转换为电信号,再通过物理连线与后面的字母分类的神经元层连接。经过训练后,确实能够成功识别出多个字母。罗森布拉特1962年出版的书籍[2],也成为了连接主义学派一本重要的书籍。

但是这个时候,由于种种原因(文献[11]介绍一个原因,网络也有各种解读),明斯基和罗森布拉特的矛盾公开化了,甚至在一次会议上已经公开争吵。明斯基和派珀特于1969年出版了《感知机》一书[3]。书中通过数学方法证明了单层感知机处理线性可分的问题是可行的,但是也仅仅能够解决线性可分问题。这本书直接指出了单层感知机存在的问题,甚至不能解决计算机科学领域一个非常简单的问题——异或(XOR)问题。同时,这本书中也提到了,多层感知机虽然理论上有可能解决非线性可分问题,但是实际上不具备可行性,因为每增加一个新的层,新引入的连接数会急剧膨胀,研究两层乃至更多层的感知机是没有价值的。在1969年,明斯基获得了图灵奖,不再是1956年组织达特茅斯会议的初出茅庐者。在学术界,权威人士的影响力巨大,书中提到的问题以当时的技术条件确实无法解决,因此,神经网络技术被打入冷宫,得不到经费,很多研究人员纷纷转方向。

这次纷争,是学术圈阴暗面的一次爆发,也是人工智能历史上的最大一次纷争,罗森布拉特于1971年他生日当天,“意外”落水,很多人相信他死于自杀。IEEE于2004年设立了罗森布拉特奖(Frank Rosenblatt Award),奖励神经网络领域的杰出人员,以纪念罗森布拉特。

不过还有人在坚持神经网络方面的研究,1982年,物理学家霍普菲尔德发明了Hopfield神经网络,能够对非常复杂的旅行商售货问题求解,1986年,深度学习之父辛顿等人提出了一种适用于多层感知器的反向传播算法,这意味着多层神经网络可以进行训练了。但是受限于计算能力和数据数量,神经网络效果一直不算太好,利用当时的计算机也难以实现大规模神经网络。所以,这一波算是小高潮,并没有引起太多人的注意。以至于后来的深度学习网络,虽然本质上就是多层神经网络,但是涉及到神经网络的项目,都很难申请到经费,因此研究人员才对这类技术起了一个新的名字:深度学习。

似曾相识燕归来,随着计算机硬件能力的提升,互联网带来的海量数据,连接主义学派的技术越来越获得人们的关注,连接主义的发展进入到了加速阶段,深度学习技术在图像识别上大杀四方,在AlphaGo中大放异彩,在ChatGPT中引起全世界的轰动。这一学派终于站到了舞台的中央,以至于人们今天一提到人工智能,首先想到的就是深度学习。

2018年,图灵奖被授予辛顿、本吉奥、杨立昆,这三位是连接主义学派的代表性人物。

1.6.3 小园香径独徘徊-行为主义

虽然符号主义学派和行为主义学派的人工智能领域都取得了不错的研究成果,但是离大众期待的人工智能还很远。大众期待的人工智能,应该像人一样。这里的像人一样,不止是计算能力上,最好外表上、行为上也表现得像人类一样。这不就是机器人吗?

机器人的英文是Robot,这个词最初来自于捷克语。1920年,捷克作家凯佩克发表了科幻剧本《罗萨姆的万能机器人》。在剧本中,凯佩克把捷克语“Robota”写成了“Robot”(“Robota”是奴隶的意思,所以“Robot”的原意也是奴隶的意思)。1950年,麻省理工学院戏剧小组在波士顿的一个剧场重演了这个剧本,在这次表演前,维纳来到了舞台中央,他对观众说:“凯佩克的戏剧预测了不远的将来,要求我们像理解人类一样理解机器人,否则我们会变成他们的奴隶,而不是相反。”同时,他拿出一个感光机器人(一个能够追逐光跑的小车),当场演示。虽然现在看来,这只是一个感光传感器控制电机的小车,但是在维纳那个时代,在昏暗的剧场中央,有一个能够自动追光运行的小车,舞台效果可想而知。

虽然有人更早做出了更好的小车,但是影响力远不如这次,因为维纳名气太大。维纳被称为神童,十岁时维纳的照片出现在《纽约世界报》的头版(原因只是因为他是神童),标题是《全世界最杰出的男孩》(The Most Remarkable Boy in the World)(互联网上现在还能找到这张照片),他18岁哈佛博士毕业。维纳最重要的贡献就是提出了“控制论”,被称为控制论之父。1948年,维纳出版了《控制论:或关于在动物和机器中控制和通信的科学》(Cybernetics Or Control and Communication in the Animal and the Machine)。Cybernetics被翻译为“控制论”,是不达意的翻译之一。Cybernetics最早引入中国的时候被翻译为“机械大脑论”。但是由于受当时的影响,苏联认为《控制论》中宣扬的“人类与机器的行为可在理论上统一”、“自学习”、“自复制”、“可进化”等观点是反对唯物主义,在西方中,控制论将动物与机器相提并论,已引起了包括宗教人士在内的不满。因此,引入中国的时候被翻译为“控制论”。王飞跃老师这样评价“控制论”这个翻译,他说:“‘机械大脑论’这个名字其实至少能表述Cybernetics原文75%的含义,但是‘控制论’似乎只能传递原意的25%”[12]。

行为主义学派把一个研究对象作为一个开放系统,一个系统从系统外部探知的变化即为行为。如果环境对系统的作用称为“输入”,系统对环境的影响称为“输出”,可以通过分析输出对输入的响应关系了解系统的属性。这种方法既适用于动物,也适用于机器及其他系统。这种“输入-输出”方法,现在也被经常称为“感知-行为”方法。这个系统关心的不是单独一次输入后产生的动作,而是对全部输入能够做出合乎期望的预期动作。控制论的另一个先驱阿什比说到:“判断机器是否有资格成为大脑的关键指标,并不是这台机器是否具有思维能力,更重要的是它是否能做出某些行为”。

行为主义中还有一个观点,认为人工智能应该和人类智能一样,依靠进化、通过遗传过程中的随机变异和对环境适应情况的自然选择,逐代筛选出更快速、更健壮、更聪明的个体。既然需要变异,那么首先就需要能够自我复制,冯·诺依曼曾经与维纳共同研究过机器生命。冯·诺依曼于上个世纪40年代在伊利诺伊大学做过关于自我复制机器的一系列报告,报告讲述了自己的研究成果,后来结集出版[1],总体上概述了机器应该如何从基本的部件中构造出与自身相同的另一台机器。根据冯·诺依曼定义的自我复制机架构,自我复制机应该有两个部分,一部分是“描述器”,描述机器本身的信息,一部分是“通用构造器”,用来根据“描述器”的描述来制造。这个思想提出的时候,人类还没有发现DNA的结构,而人类遗传的过程,也可以把DNA看做“描述器”。自我复制机这个思想很深刻,早期在编程领域流行一种比赛,即编写程序,其唯一的功能即是自我复制,即程序的输出就是这个程序本身。

这些理论的发展也带动了机器人学,虽然直到今天,还没有听说哪个机器人达到和人类一样的水平了。不过上世纪,人们一直相信,这样的机器人能够制造出来。上世纪8、90年代,布鲁克斯提出了“无表征智能”的概念,利用行为主义学派的思想,成功的设计出了若干能够自主移动的机器人,今天广为使用的扫地机器人,就是这类机器人的实际应用。

这一派涉及到的学科更多,不止是计算机科学,还涉及到控制学、机械学、材料学以及声、光、电等一系列细分学科。因此,这一学派和前两个学派几乎没有纷争,反而合作较多。事实上,实现人工智能,绝不是计算机、控制等一两个学科的事,它需要来自不同学科的技术,任何学科的人,都可以为人工智能贡献力量。

行为主义学派其实可以追溯到更早。图灵在1948年的文章《智能机器》(这篇文章当时未公开发表,1992年出版图灵论文集时才公开出现)中即提出了智能的研究方向有两个Embodied intelligence(嵌体智能)和Disembodied intelligence(离体智能)[2]

2020年,帝国理工大学研究人员在《Nature Machine Learning》上发表新研究,定义术语“物理人工智能(Physical AI,下简称PAI)”,并提出通过整合学科来缩小机器人与人类之间的距离,以帮助未来的研究人员创建具有与智能生物体的相关功能,比如能够进行身体控制、具有自我意识和感知能力的“逼真”机器人。

类人机器人的研究虽然没有取得让人眼前一亮的成果,但是,类人人工智能的研究一直在进行。

现在的科技还不能造出和人一样的机器人。其实,虽然人类在进化过程中遗留了很多缺点,但是,优点更多。例如,一个人一天消耗的能量也就几千卡路里,能耗大概相当于100多度的灯泡,如果要造出一个和人形状一样的机器人,能够做和人类一样的活动,比如下围棋,那么即使他身体里有一个小汽车大小的高能电池,也仅仅能支持几分钟。

这三个学派,其实并没有那么严格区分,科研的圈子很小,大家平时的交流很多。研究人员也比较少在公开场合谈论它们。学术纷争历史上并不少见,如牛顿和莱布尼茨的微积分第一人之争。但是,也正是因为他们太伟大了,这些纷争就像“房间里的大象”,谁也不愿挑明,讳而不言。事实上,科学家是人不是神,无论什么样的学术纷争,并不影响这些科学家的伟大。科学研究的特点之一就是不断试错,既然试错,肯定有不同的方向,因此,学术纷争不可避免。明斯基在2006年的AI@50大会的总结报告上说:

“当下太多人工智能研究只想做那些最流行的东西,也是发表那些成果的结果,我认为人工智能之所以能成为科学,是因为之前的学者不仅发表哪些成功的结果,也发表了那些失败了的。”

人工智能的发展,走过很多弯路,这些失败的尝试,一样伟大。

一曲新词酒一杯,去年天气旧亭台。夕阳西下几时回?无可奈何花落去,似曾相识燕归来。小园香径独徘徊。--晏殊《浣溪沙》

本文内容节选自《人工智能:是什么?为什么?怎么做?》,由张恩德编著

待续......

版权声明

版权属于原作者,仅用于学术分享

0 人点赞