博雅大数据学院院长欧高炎负责主讲北京师范大学珠海校区走近数据科学课程。本系列文章精选同学们就课程主题写的心得体会。
学习了多个主题讲座,我了解到了许多关于人工智能的历史进程与发展前景。其中我了解到其发展竟然可以追溯到上个世纪,距今的社会热潮还经历过两次潮起潮落的跌宕。而在第三次讲座《AI赋能智慧城市》中,主讲老师在课件中详细列举了第一次低谷的原因,描述精炼扼要,缘于时间问题也未能详细阐释,(由于疏忽没能拍到第一类困难,急需!!)以至于对此一知半解。为此想要通过资料查询深入了解。
第二类困难
第三类困难
第一次低谷发生于1966-1973年间,存在三类困难:
一、 未知
二、 AI试图解决的很多问题是不可操作的(NP类):
计算复杂性理论不现实。因为“问题放大”(从玩具到现实)的认识局限于速度和存储容量,使得原则上能解的问题实际上不能找到解决机制,例如早期(1958-1959)遗传算法实验,其中包含超过几十条事实的定理证明。
三、基本结构存在限制:
简单的神经网络能表示的东西很少,例如1969年Minsky和Papert证明了单层感知器无法解决XOR函数。
这导致政府终止了绝大部分的AI研究资助,由此人工智能陷入寒冬。
由上述我大致了解了第一次低谷是源于技术的不成熟,但是当时的技术能力是什么,不成熟的原因又是什么?通过查阅资料,我按自己现有知识理解为:
一、当时的技术能力:
真正的开端源自程序的类人对话模拟不再简单用if句式建构,而是采用了计算机代数系统,使程序能够有“推理”这一运算过程。这相较于之前每一个输出结果都需要人工提前预判并编写而言,是一次跨维度的飞跃。
那么,如何进行推理呢?
人工智能的定义为:系统正确解释外部数据,从这些数据中学习,并利用这些知识通过灵活适应实现特定目标和任务的能力。我们知道机器语言与人类的自然语言是截然不同的,前者具有清晰严密的逻辑性,而后者的模糊表达特征性能够包含多种情感指向和语义。推理能够进行,首先需要AI能正确提取操作者的指令信息,由此搭建两者间的沟通桥梁是当时科学家促进人工智能技术进步的重要路径。
计算机代数系统的发明,第一次使计算机能够“辨别”符号的含义并进行纯数值以外的计算,而符号操作的人类思维的本质之一。例如其中的代表系统Macsyma,能够处理多项式以及不定积分,Logic Theorist 证明了《数学原理》前52个定理中的38个。
感知器模型的发明,是早期人工神经网络的一大进步。相比于验证型的第一代神经元模型,感知器模型是可学习的线性分类器,而非一个中间过程已经定义好的二进制逻辑门电路。其输入可看作是n维度上的多个坐标,模型对应一个超平面基准将它们进行分类。
除此之外还有如:针对搜索式推理的弊端开发的优化方式启发式算法,计算机自然语言(如英语)的交流尝试以及环境模型视觉化的为世界程序等技术创新。
二、不成熟的原因:
(一)计算机运算能力限制。主要在于内存与处理速度的有限。硬件在当时还未发展成熟,大量的机器占地面积却仅有极小的运行与储存内存。搜索式推理(为实现一个目标(例如赢得游戏或证明定理),程序一步步地前进,就像在迷宫中寻找出路一般;如果遇到了死胡同则进行回溯)的优化尚未完善使程序在大量规则与条件的设定下需要演算指数爆炸般的线路总数。
(二)计算机仍未具备人类的常识与理解能力。例如符号处理的发展没有得到部分人的买账,他们认为“人类推理实际上仅涉及少量“符号处理”,而大多是具体的,直觉的,下意识的“窍门”,而符号对机器而言甚至尚未存在思考的意义与过程,它们则更无法理解人类所谓的“窍门”以及更多思维方式。当时,没人能够做出如此巨大的数据库给机器视觉与自然语言的学习提供大量对世界的认识信息,也没人知道如何让它们学习这些信息。
(三)计算机的学习能力还停留在初步。前文提及的感知器模型,无法解决异或计算,线性不可分问题。实际上Minsky等人在提出这个问题的同时也指出异或运算可以通过多层感知器实现,但是由于当时学术界没有有效的学习方式去学习多层感知器模型,所以神经网络的发展迎来了第一次低谷。
以上是经多方资料查阅后我梳理出的个人理解,如有表述不严谨之处希望指正。人工智能发展早期的历史学习,对于初学者的我来说能从更简单的原理着手,了解如今已发展至枝繁叶茂、技术门槛极高的“黑科技”,它最开始的理论框架基础。希望在以后具备更多数理基础的储备后,能够更加轻松且深入地了解更多相关知识。
参考资料:
(1)https://www.jianshu.com/p/a422436847d6
(2)维基百科词条:人工智能
(3)https://www.zhihu.com/search?type=content&q=人工智能第一次低谷东音