博雅大数据学院院长欧高炎负责主讲北京师范大学珠海校区走近数据科学课程。本系列文章精选同学们就课程主题写的心得体会。
一. 论文由来
假期时我曾看过电影《模仿游戏》,对阿兰·麦席森·图灵的故事产生了浓厚的兴趣。而现在在大学里,无论是在走近数据科学、信息处理基础的课堂上,还是在这几次的专题讲座报告中,我都经常地能够听到图灵的名字。我想,不妨就把他当做我的一个论文的研究方向吧,也能让我收获一种小小的满足。
二.图灵测试解释
图灵测试来源于图灵写于1950年的一篇论文《计算机器与智能》。内容是,如果电脑能够在5分钟内回答由人类测试者提出的一系列问题,且超过30%的回答让测试者误认为是人类所答,则电脑通过测试,可以被认为是拥有了人类的智能。
三.对图灵测试的反驳——中文房间
1. 介绍:
美国哲学教授约翰·希尔勒提出了一个名为“中文屋”的思想实验,这个实验的内容是:一个只懂英文但完全不会说中文的人在一个小房间里,房间里有一盒中文字的卡片和一本书,这本书并不是汉英字典,只是告诉这个人如何操作中文字卡片的规则,但并没有告诉这个人任何中文字词句表示的含义。这本书写得非常详尽以至于这个人只要按照这本书去做,就可以完美地回答输入的问题。于是这个人完美地通过了关于“理解中文”的图灵测试,然而这个人其实并没有真正地掌握中文。
2. 我的理解:
其实一开始的时候,我觉得这个问题更加偏向于一个哲学问题。也就是说,这个人和房间,实际上可以相当于一台电脑。这本书的文字规则其实相当于电脑的代码。比如我们看到“红色”,我们的脑里浮现的是“红色”,而电脑在内部显示的是10100,那么这个10100是不是可以相当于在另外一种语言系统中的“红色”呢?但是在这次讲座中,当我听完贾教授说完人工智能的定义时,再结合我个人的理解,我明白了图灵测试实际上只是完成了人工智能的第一层定义,那就是“类人行为”。
其实,图灵建议的是:不是问“机器能否思考,而是问机器能否通过关于行为的智能测试”。在完成图灵测试之后,我们还要把人工智能一步一步地完善为拥有类人思考的机器程序到与人类相同甚至最后会远高于人类的理性智能体、感性智能体。
「我想,这也是一种从弱人工智能到强人工智能的过程。」
今天,我们已经差不多生活在了一个充满着弱人工智能的时代。我们已经有了能够打败人类围棋、象棋世界冠军的机器人、能够在一秒中进行一万亿次运算的超级计算机,但是我们仍然没有创造出能够读懂并理解六岁小朋友图书中文字、词汇意思的机器。
贾教授说,其实想要通过图灵测试实际上就已经非常的艰难了,这还需要自然语言处理(NLP)、知识图谱、自动推理、机器学习、机器视觉等等的技术。即使突破了图灵测试,这个机器程序还要能够具有自控操作,能够自主地感知环境和适应变化的能力。
四.图灵测试的未来可行性—智能爆炸
然而,我们不必对人工智能发展速度而感到悲观,甚至相反,之后人工智能的发展速度可能会大大超过我们的预期。人类发展的速度的日益加快。1990年的中国人来到现在的2020年,会震惊于我们有别于他们大哥大、BP机的智能手机,会震惊于我们现在拥有的发达的互联网、会震惊于我们现在拥有的密集的高铁网络和高楼大厦。当1960年的中国人来到1990年,震惊的程度是肯定要小于1990年到2020年的。有人提出这样一个有趣的概念“震惊单位”。从十万年前狩猎时代的第一个震惊单位,到一万五千年前农耕时代的第二个“震惊单位”,再到公元一千五百年的文艺复兴时期的第三个“震惊单位”,再到如今相对过去非常密集的多个“震惊单位”,可以看到,每一次的震惊单位的时间间隔都在不断地缩短。不仅如此,实际上,由于我们现在只有过去500年人类飞速发展的经验来作为判断的依据,这可能会使得我们目前作出的判断要远远慢于未来的实际增速。!
(夸张的示意图说明)
人类的发展速度可以相似地引申到人工智能上来,这便来到了“智能爆炸”的概念。
虽然,图灵期待最迟2000年出现能够通过图灵测试的机器程序,但今天,在面对训练有素的鉴定人,没有一个程序能够接近30%的标准。然而,很可能当我们看到现在的人工智能已经开始逐渐向人类的智力靠拢时,我们会觉得这个智能很可爱,但是可能很快,他们就会在非常短的时间里,从“弱人工智能”达到“强人工智能”,甚至,达到”超人工智能”的水平。
这时,图灵测试作为一个测试的标准已经远远落后,因为,这时并不是人工智能能否通过图灵测试,而是人工智能是否愿意通过图灵测试。抑或说,那时的人工智能,可能已经成为了一个上帝了...
五.我的发散思维
在我们又开始担忧起人工智能的威胁时,这时,我不由地由想起了尤瓦尔·赫拉利的《未来简史》中的“神人”的概念。那就是,在未来,特权阶层中的极少一部分人,通过封锁和利用生物工程、人工智能、大数据等技术从与我们相同的“智人”变成了“神人”。那时,人与人之间的区别,不再是只有现在后生的财富等因素,因为有着基因编辑的技术,那可能便是从基因上就有了差异。过去,无产阶级还能够与资产阶级抗争,而在未来,这样的阶层差距会依托着这些技术而变得永远无法横跨。那时由于发达的人工智能技术,绝大多数的我们可能只能够配做最低级最无用的工作,生活的城市被用奢侈品、石工、科技、渔业、能源、交通运输业、林木业、纺织业、谷物业、牲畜业、农业、矿业这些产业来进行生硬地划分...如同《饥饿游戏》里生死沦为都城人们的娱乐、尊严被任意践踏的十二个行政区中的人们一样。甚至,我们可能不会被要求工作,而是像《铳梦》里一样,我们与特权阶层分割开,他们在天空中声色犬马,我们在地上自生自灭,他们拿走地上的资源,然后丢下垃圾...所以,或许我们真正应该担心的,是目前社会上那前0.1%的人...
参考文献:
[1]《一个故意不通过图灵测试的人工智能》,大熊随想,2017,10,12
[2]《图灵机和图灵测试》赵忠文,曾峦,张永继,2006-03-02
[3]《从图灵测试到深度学习:人工智能60年》万赟,科技导报,2016-04-13
[附录]
课堂记录
在《人工智能赋能智慧城市》的讲座上,来自人工智能与未来网络研究院的贾维嘉教授首先给我们提出了三个问题:
1.什么是人工智能/机器学习(AI/ML)?
2.为什么AI这么hot?
3.AI正在、将会带来什么?(投资,就业。生活,失业。国家对抗,控制人类)?
贾教授接着问我们AI会给我们带来什么感受?是兴奋,还是Neutral,还是担忧呢?有一位同学表示非常担忧,因为他觉得人工智能会取代人类,而贾教授坦言,虽然很多领域中人工智能会取代人类,然而,教育者难以被人工智能取代。
之后,贾教授举了非常多的关于人工智能的例子来引入主题,如AI主播、脑电波(随着持续的发展可能距离十几米远都可以不用笨重的装备来读取你的思维思想)、TIkTok的[For you]界面,通过分析用户的行为来推荐下一个视频,虽然不同的人可能会看到相同的视频,但是总的来看,每个人接到的推荐是独一无二的、运用图神经网络按照宇宙的物质分布以及哈佛望远镜能够看到的最远的地段来发现宇宙的边缘以及莫斯科公交网络司机在疫情期间接令人工智能识别中国乘客、以及AL复活已故漫画家手冢治虫,日本半导体公司Kioxia发起了项目[TEZUKA2020]来用人工智能技术来绘制手冢治虫风格的漫画,希望延续他的作品,还有俄罗斯亿万富翁的[全息永生]、还有人工智能耶稣以及英球赛AL摄像头只对准边裁光头的糗事。
贾教授对人工智能最直观的想法是造出与人类相同的大脑。他首先在slide上提出智能体的概念。他想让我们来思考这样的两个问题:作为智能体的人类为什么能够思考?怎么感知、理解、预测和应对庞大和复杂的世界?其后,slide上显示了AI的两个目标,第一是近期目标,包括理性思维和行为,研究人脑功能,第二个是远期目标,包括类人思考和行动,研究人脑微观结构和宏观功能,他还介绍了两个学派,一个是数学一个是心理学。
之后他引入了四种不同定义,第一是类人行为,以图灵测试为代表,图灵建议,不是问“机器能否思考”而是问机器能否通过关于行为的智能测试,测试过程是让机器和人进行5分钟对话,猜测交谈的是人还是程序?如果在30%的测试中程序成功地欺骗了询问人,则通过测试。然而可惜的是,图灵期待2000年出现这样的程序,但今天面对训练有素的鉴定人,没有一个程序接近30%的目标。分别是类人思考和理性智能体、感性智能体。
贾教授还为我们介绍了AI简史,AI的历史只有六十多年,分别是
- 孕育(1943~1955) 神经网络是一种运算模型,由大量的节点(或称“神经元”)和之间相互的联接构成。每个节点代表一种特定的输出函数,称为激励函数、激活函数,人脸识别和语音识别超过人类
- 诞生(1956) 达特茅斯夏季研讨会
- 期望(1952~1969)
- 寒冬(1966~1973) 是西伯利亚的冬天 问题难以解决,政府拨款少,缺乏资金,科学家们难以继续运行实验
- 专家系统 DENDRAL(1969~1979) 人工智能的小阳春 早期的通用搜索机制称为弱方法,通用但不能扩展到大规模
- 成为工业(1980~现在)
- 成为科学(1987~现在)/神经网络的回归(1986~现在:深度学习)/智能体出现(1995~现在)
贾教授详细地讲了讲他对机器学习的理解。他说,机器学习目前是人工智能的核心,有机器学习就有人工智能,有人工智能不一定有机器学习。而机器学习的简单定义就是拿一些数据来给机器学习做分析和总结,最后它会告诉你是怎么回事。他还提到了机器学习目前对国家的重要意义:以前人们只是把它当做一个学术研究,就像数学和心理学,然而现在已经有非常多的国家把它作为一项国家战略,即使未来真的再次有寒冬出现,政府一定会伸出援手。
再之后,他提及机器学习的核心基础是数学和地理,核心数学理论是线性代数、微分方程、概率论和统计,然而它们目前仍然过于浅薄。接着他讲述了机器学习的几种类型,比如监督学习、无监督学习、半监督学习、强化学习、表示学习、迁移学习、联邦学习等等。接着,他说其实机器学习的目的很简单,就是使得人工智能达到两个总目的,一个是预测,一个是分类,其它很多的其实都只能算是子目标。
最后,他以机器学习中的监督学习作结,为我们介绍了一些公式与算法,如Softmax和高斯分布。他还调侃道,人工智能的工作其实就是调整参数,所以很多人工智能从业者其实又被称为调参师。