2020年3月23日,在北京大学招生办举办的云开讲中,北京大学董彬教授给广大中学生带来主题为“浅谈人工智能与数学”的网络报告。本文是根据视频整理的图文,经董彬教授授权发布,供大家参考。
1 什么是人工智能
当今时代,我们需要很多的机器,比如汽车、飞机、电脑还有手机等等。为什么需要这些机器呢?
这些机器是我们人类肢体或者器官的一个延伸,比如说汽车和飞机,其实是我们人类腿的延伸,使得我们能够更快地从出发地到达目的地。
电脑其实是我们记忆的延伸。过去很多事情我们需要记在脑子里,过了一段时间就忘了。现在很多东西可以记在电脑里。以前计算,编辑东西都需要用手来做,现在通过电脑可以很容易地完成这些事情。
手机其实是我们嘴和耳朵的延伸,使得我们能够跟物理上不在一起的他人进行交流。智能手机实际上是把电脑的一些功能融入进来,我们可以快速跟别人交流,汲取资讯。
那么这些机器和人类相比,优势在哪里?汽车不用多讲,它跑得更快。无人机飞到天空俯瞰大地,使得我们可以从一个很不一样的视角来探索世界。潜水艇可以下潜到很深的海底。我们人类光靠自己不能够做这样的事情,必须得借助机器才可以。
再举一个例子,相信很多同学都用过手机导航。以前,我们想去某个地方首先要查看地图,搞清楚到底在什么样的位置,然后再规划路径怎么去。现在完全可以通过导航的卫星定位知道你在哪里,然后通过数字化的地图,优化算法能够告诉你一条最便捷的路径。有了机器的帮助,我们不但能够做以前做不到的事情,而且可以非常高效地去做以前需要花费很长时间才能够做的事情。
人工智能其实跟这些机器没有本质的区别。人工智能可以说是大脑或者智力的一个延伸。人工智能和人类是什么样的关系呢?其实跟上面这些机器是一样的,它可以辅助我们去做决策和判断,最终服务于人类。
2 人工智能的历史
人工智能的发展最早可以追溯到三千年前。当时还没有人工智能这个概念,基本上就是对人工智能的一个憧憬或者是幻想。
《列子汤问》中记载,三千年前的周穆王时代,有一个匠人名叫偃师。周穆王到西边巡查的时候,碰到了偃师。偃师告诉周穆王他制造了一样东西,想献给周穆王。第二天偃师去拜见周穆王,周穆王看到随行的还有另外一个人,就问这人是谁。偃师回答道:“这个就是我制造出来的能歌善舞的‘人’”。周穆王左看右看,发现这个能歌善舞的“人”,舞蹈合律合拍,千变万化,自然优美,真假难辨。当然,这只是一个传说。
偃师机器人
在欧洲也有类似的传说。1580年,布拉格的Rabbi Loew(Rabbi意为犹太教的学者)使用泥土和魔法创造了一个会动的泥人(Golem)来保护住在犹太区的犹太人免遭反犹主义的暴力侵扰。当然这也只是一个传说。
Rabbi Loew和泥人Golem
近期有历史记载的还有土耳其的下棋机器人。1770年,有人设计了一个会下棋的机器人。它不仅能够下赢人类,同时还可以进行骑士巡逻,意思是将马放在棋盘上,使它走遍棋盘上每一格。但后来被证明是一场骗局,机器人实际上是被藏在机器里的人操控的。
土耳其的下棋机器人
还有日本的端茶机械人,其实也不是真正的我们所想的人工智能机器人。它是以日本传统工艺制造出来的一种人偶,人偶内部设置自动机械(机关),可以使人偶做出一些人类的动作。
日本端茶机械人(15-17世纪)
这些机器其实都没有大脑。要让这些机器有大脑,我们就需要计算机。所以计算机的出现,使得我们可以去真正制造人工智能。第一台图灵完备的计算机是一个德国的工程师康拉德·楚泽负责设计的。
康拉德·楚泽(Konrad Ernst Otto Zuse,1910-1955)
1935年,楚泽获得了土木工程学士学位,在柏林一家飞机制造厂找到了工作,主要任务恰好是他最挠头的飞机强度分析,繁琐的计算现在变成了他的主要职业,而辅助工具只有计算尺可用。楚泽想制造一台计算机的愿望愈来愈强烈,他在这家工厂里只呆了短短的几个月,便辞职回家做他的“发明梦”,并最终在1941年完成第一台图灵完备的计算机Z3。
现存在德国慕尼黑博物馆的Z3计算机的复制品
人工智能的思想源泉来源于人类对大脑的研究,特别是对神经元的研究。早期神经科学发现大脑是由神经元组成的,组成形式像一个电子网络。
有一位非常有名的数学家Nobert Wiener,提出一个概念叫Cybernetics,中文翻译叫控制论。Cybernetics是一个什么样的学科呢?它包含两个很重要的元素。一个是控制(control)。一个是交互(communication)。
Nobert Wiener认为任何一个智能体都具有这两个关键的功能。一个是控制肢体,另外一个是通过各种各样的感知能力,如眼睛、嘴、耳朵和触觉来感知世界。根据对世界的感知做出相应的决策,继而控制肢体。这是Cybernetics的核心概念,人工智能的一个很重要的理论基础就来自于Cybernetics。
假如我们设计了一个人工智能,怎么来判断它真的是智能呢?有很多种方式去评判,比较经典的叫图灵测试。那么图灵测试是什么呢?假如把一个人工智能A一个人B放在两个屋子里面。然后另一个人C在外面分别和A、B交互问答。如果C无法分辨A和B哪个是机器人,那么就说明系统通过了图灵测试。
图灵(Alan Mathison Turing,1912年—1954年)
图灵测试
当然,也有很多人对图灵测试产生一些质疑,因为有些并不真的是智能的系统也能通过测试,但这个是最早最经典的测试。
人工智能(Artificial Intelligence,简称AI)的概念,最早提出是在1956年的达特茅斯夏季研讨会。参会的是当时非常著名的数学家和计算机科学家。其中一个发起人叫John McCarthy,是一名应用数学家。
人工智能在发展的过程中几经起落。在达特茅斯会议之后其实有很多人开始研究人工智能,但是很快就到了第一次寒冬。那么为什么出现了低潮呢?是因为大家发现计算资源是非常匮乏的,无法算很复杂的东西。于是就出现大量的失败案例。
一个例子是机器翻译。在冷战期间,美国希望训练一个人工智能的算法,去自动翻译大量的俄文文件,这是他们研究机器翻译的动机之一。但是当时机器只能够翻译非常简单的一些文件,还是需要大量的人为介入才能够翻译的比较好。
另一个例子是图像识别。在制造机器人时,比如设计一个简单的机械手臂去做一些挪动物体的任务,如果这个机器不能识别物体,那么何谈把物体从一个地方挪到另外一个地方?所以图像识别也是一个非常关键的任务。但那时图像识别做的还非常不好,我们也知道图像识别也是在最近这几年,用神经网络深度学习才得到比较好的解决。
在经历了寒冬之后,人工智能在1980-1987年间开始回暖,为什么呢?因为那个时候出现了一个新的东西叫专家系统(expert system)。专家系统其实就是一个程序,基于一些领域的知识和逻辑规则,来做一些问答。
但是短短七八年的时间人工智能又进入了寒冬。因为专家系统是有相当的局限性的,比如比较难维护、很难更新、不能够学习和可扩展性差等。
1993年到2011年,人工智能开始回暖,进入了人工智能的春天。有两个非常关键的因素。一个原因是计算能力和数据量。计算能力大幅提升使得我们可以去计算非常复杂的模型。数据量的大幅增加使得我们可以用大量数据拟合一些非常复杂的模型。
另外一个原因是这个英文叫” Victor of the neats”。其含义就是,研究人员开始大量大范围的使用已有的和发展新的数学工具。在1956年提出人工智能时,计算能力有限和能够用到的数学工具也非常有限。2000年左右,我们开始有大量的数学工具可以用,这也是人工智能开始回暖的一个重要的因素。
1997年诞生了一个比较大的一个新闻,一台名叫深蓝(Deep Blue)的机器在国际象棋比赛中战胜了世界冠军卡斯帕罗夫。深蓝利用超强的计算能力和搜索技术战胜了人类,当时人们在想如果要在复杂度更高的项目中比如说围棋战胜人类还需要很长时间。
深蓝对战卡斯帕罗夫
但经过短短20年的发展, Google的DeepMind在围棋上战胜了人类。它用的方法不是穷举,而是比较前沿的方法,是用了深度学习神经网络,然后在大量的数据集上进行训练,最后战胜人类。
AlphaGo相继战胜韩国棋手李世石和中国棋手柯洁
3 人工智能的今天
如今,人工智能获得了很大的进展,完成很多有价值的任务。例如它可以与人类对话、玩游戏、自动驾驶,还可以做一些简单的数学题,甚至可以完成帮助人类工作。下面我们通过几个视频来简单了解一下:
3.1 自动驾驶
谷歌旗下Waymo在自动驾驶技术方面的展示如下。
http://mpvideo.qpic.cn/0bf254aacaaahqabjn3xpzpfb36dahxqaaia.f10002.mp4?dis_k=9d0f657b4d582e67d74af44d4e8b7739&dis_t=1648711621&vid=wxv_1262827828664467456&format_id=10002&support_redirect=0&mmversion=false
3.2 玩游戏
人工智能能够玩游戏,甚至能够超过人类玩家。例如下面是人工智能打超级玛丽的视频演示。
http://mpvideo.qpic.cn/0bf25yaacaaazuabka3xpfpfb3wdahxaaaia.f10002.mp4?dis_k=699b91478a1f834aff363d732c064e29&dis_t=1648711621&vid=wxv_1262820583557955585&format_id=10002&support_redirect=0&mmversion=false
3.3 机器人
波士顿动力公司的机器人,能够帮助人类完成一些工作。
http://mpvideo.qpic.cn/0bf2ymaacaaaveabj2lxpjpfbq6dahbqaaia.f10002.mp4?dis_k=66af68ad1b16144e5e9565d7e7c9cd0c&dis_t=1648711621&vid=wxv_1262826069590147075&format_id=10002&support_redirect=0&mmversion=false
4 人工智能中的数学
4.1 图像识别
图片来源:李千骁
以图像识别为例描述AI的任务,可以用一个函数F 来表示识别系统的AI。它的输入是图像,输出是识别的结果(例如规定猫为1,狗为0)。当输入图片为猫时,输出为1;当输入图片为狗时,输出0。
图片来源:李千骁
那怎样找到这样的一个函数呢?我们需要对函数F 进行某种参数化,通过算法去拟合这些参数,使得在现有数据上让机器识别猫为1,识别狗为0。
图片来源:李千骁
这样参数化的模型是可以用神经网络来表示。虽然其形式复杂,但在真实的场景下其实际性能表现非常好。
4.2 图像识别中的数学
从数学上来讲,现在人工智能比较标志性的技术是深度学习。可以用最优控制的语言,或者用微分方程的语言来描述、刻画、分析模型和算法。这些模型和算法所涉及到很多数学问题。比如逼近理论,实际上是为了分析深度学习或者人工智能系统到底不能干哪些事情。再比如控制理论和优化理论,是为了解决能不能训练出一个模型的问题,使得AI在一个具体任务上更接近人的表现。除此之外,人工智能中的数学还包括微分方程、概率统计等等。
图片来源:李千骁
4.3 图像感知中的挑战:幻觉
在图像感知中存在非常多的挑战,比如幻觉。在下面左边的图中,有A和B两个方格。人眼看起来好像A的颜色比B的颜色要深一些。实际上,如果把周围挡住,直接观察像素的灰度值,A和B的值是一样的。其实是幻觉让我们感觉A比B要暗一些。那么怎么从数学上去刻画它呢?
奥尔德森方格阴影错觉
有一个非常著名的数学家叫David Mumford,他在1974年获得了数学界的最高奖项菲尔兹奖(相当于数学界的诺贝尔奖)。他在世界数学家大会做一小时报告的时候,专门讲了怎么用数学来描述感知(perception)。
4.4 图像感知中的挑战:小样本学习
图像感知中的另外一个挑战,称为小样本学习。我们这里举个例子来说明什么是小样本学习。我们来做一个关于Steampunk的测试(来源于Rodney Brooks),首先下面的两幅图都是Steampunk:
下面我们来做测试,下面的图是不是Steampunk呢?
这些图都不是Steampunk。
那这些图是不是Steampunk呢?
这些图都是Steampunk。
Steampunk的中文名称叫蒸汽朋克,其实就是一种穿衣风格。这就是一个小样本学习的例子。给大家两个样本去学习,告诉你它的标签是Steampunk。之后给出的所有的图全部都是测试集。
刚才大家成功地进行了小样本学习。我也给我六岁的儿子做过同样的测试,他的识别准确率也是百分之百但是对于我们人类来说很容易的任务,对于现代的人工智能来讲,经常会出现很多问题。
小样本学习在机器学习里是一个非常重要也非常严峻的挑战。在很多科学领域(如医疗),样本通常并不是非常多。人类在做识别的时候,并不是基于大样本的,而是基于相对比较小的样本。
怎么让现在的人工智能算法能够基于很少的样本做出准确的识别呢?现在有大量的研究工作,基本上是在数据、模型和算法三个层面引入先验知识,这需要使用大量数学工具。
5 人工智能的未来
我们展望一下未来。从现有阶段来看,人工智能未来能做什么?不能做什么?同学们可以自己来思考一下。
至少从现在来看,要想让一个机器能够达到跟人有一样的情感是相对比较难的任务。人工智能可以利用计算能力的优势,去做一些识别,做一些计算,做一些规划。但是如果要有情感或者实现人的意识,则是非常困难的。因为我们人对自己意识的理解,其实还是停留在非常粗浅的层面。如果完全从技术的角度来考虑,我们想实现或者说能实现什么样的人工智能,这个其实我也没有答案。
希望同学们自己去想一下:你希望未来机器人或者任何一种形式的人工智能能够帮你做什么样的事情?我曾问过一些同学。有的同学就说:“我希望人工智能能够帮我写作业”。当然这个我觉得是不行的,因为写作业其实是对我们人类智能的一个训练。如果你让人工智能来做这些事情,那么我们人类自己得不到训练,万一有一天人工智能真的超过了我们怎么办?人工智能可以协助我们做一些以前做不好的事情。例如可以借助人工智能来帮我们操作残疾人的假肢。
大家可以开动脑筋去思考一下,未来的十年、二十年、三十年会出现什么样的人工智能呢?