《人工智能》（笔记）

1.无处不在的人工智能

苹果Siri、百度度秘、Google Allo、微软小冰、亚马逊Alexa等智能助理和智能聊天类应用，正试图颠覆你喝手机交流的根本方式，将手机变成聪明的小秘书；新闻头条等热门应用依赖于人工智能技术向你推送最适合你的新闻内容，甚至，今天的不少新闻稿件根本就是由人工智能程序自动撰写的；谷歌照片（Google Photos）利用人工智能技术快速识别图像中的人、动物、风景、地点等，快速帮用户组织和检索图像，美图秀秀利用人工智能技术自动对照片进行美化，Prisma和Philm等图像、视频应用则基于我们拍的照片或视频完成智能‘艺术创作’；在人工智能的驱动下，谷歌、百度等搜索引擎早已提升到智能问答、智能助理、智能搜索的新层次；以谷歌翻译为代表的机器翻译技术正在深度学习的帮助下迅速发展；使用滴滴出行时，人工智能算法不但会帮助司机选择路线、规划车辆调度方案，不远的将来，自动驾驶还将重新定义智慧出行、智慧交通和智慧城市；使用手机购物时，淘宝、亚马逊等电子商务网站使用人工智能技术为你推荐最合适你的商品，而先进的仓储机器人、物流机器人和物流无人机正帮助电子商务企业高效、安全地分发货物......

人工智能已经来了，而且它就在我们身边，几乎无处不在。

2.AI复兴：深度学习大数据=人工智能

2.1图灵测试与第一次AI热潮（20世纪50年代到60年代）

图灵测试即让测试者和计算机通过键盘和屏幕进行对话，测试者并不知道与之对话的到底是一台计算机还是一个人。如果测试者分不清幕后的对话者是人还是机器，即，如果计算机能在测试中表现出与人等价，或至少无法区分的智能，那么，我们就说这台计算机通过了测试并具备人工智能。

针对图灵测试，人工智能领域还专门设立了一个每年一度的罗布纳奖（Loebner Prize），专门颁发给在图灵测试中表现最优秀的计算机程序。

2.2语音识别与第二次AI热潮（20世纪80年代到90年代）

让计算机听懂人们说的每一句话、每一个字词，这是人工智能这门学科诞生第一天科学家就努力追求的目标。

李开复和同时代的彼得•布朗等研究者一道，将语音识别从符号主义时代推动到了统计时代。今天，语音识别和更广泛意义上的自然语言处理已经走进了统计方法和深度学习相结合，甚至是深度学习方法独立起主导作用的新时代。

2.3深度学习携手大数据引领第三次AI热潮

20世纪40年代，唐纳德•赫布（Donald Hebb）尝试将人工神经网络用于机器学习，创造出早期的“赫布型学习”（Hebbian Learning）理论。1954年，计算机科学家韦斯利•A.克拉克（Wesley A.Clark）在麻省理工学院尝试在计算机上实现赫布型学习的基本模型。1958年，弗兰克•罗森布拉特（Frank Rosenblatt）提出了“感知机”（Perceptron）的概念，这是一个基于人工神经网络的两层计算结构，用于简单的模式识别。1965年，A.G.伊瓦赫年科（Alexey Grigorevich IvaKhnenko）提出建立多层人工神经网络的设想，这种基于多层神经网络的机器学习模型后来被人们称为“深度学习”，伊瓦特年科有时也被称为“深度学习之父”。

深度学习能够大展身手的两个前提条件——强大的计算能力和高质量的大数据，都是在2010年前后逐渐步入成熟的。

从根本上来说，深度学习和所有机器学习方法一样，是一种用数学模型对真实世界中的特定问题进行建模，以解决该领域内相似问题的过程。

用专业术语来说，计算机用来学习的、反复看的图片叫“训练数据集”；“训练数据集”中，一类数据区别于另一类数据的不同方面的属性或特质，叫“特征”；计算机在“大脑”中总结规律的过程，叫“建模”；计算机在“大脑”中总结出的规律，就是我们常说的“模型”；而计算机通过反复看图，总结出规律，然后学会认字的过程，就叫“机器学习”。

简单的说，深度学习就是把计算机要学习的东西看成一大堆数据，把这些数据丢进一个复杂的、包含多个层级的数据处理网络（深度神经网络），然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合，就保留这个网络作为目标模型；如果不符合，就一次次地、锲而不舍地调整网络的参数设置，直到输出满足要求为止。

深度学习大致就是一个用人类的数学知识与计算机算法构建起整体构架，再结合尽可能多的训练数据以及计算机的大规模运算能力去调节内部参数，尽可能逼近问题目标的半理论、半经验的建模方式。

目前深度学习主要是建立在大数据的基础上，即对大数据进行训练，并从中归纳出可以被计算机运用在类似数据上的知识或规律。

根据马丁•希尔伯特（Martin Hilbert）的总结，今天我们常说的大数据其实是在2000年后，因为信息交换、信息存储、信息处理三方面能力的大幅增长而产生的数据。

谷歌的分布式处理三大利器——GFS、MapPeduce和Bigtable就是在大数据的时代背景下诞生并成为绝大多数大数据处理平台的标准配置。

从应用角度来说，今天的大数据越来越多地呈现出以下一种或几种特性：

1. 大数据越来越多地来源于生产或服务过程的副产品，但在价值上却往往超过了为了特定目的专门采集的数据；

2. 大数据往往可以取代传统意义上的抽样调查；

3. 许多大数据都可以实时获取；

4. 大数据往往混合了来自多个数据源的多维度信息；

5. 大数据的价值在于数据分析以及分析基础上的数据挖掘和智能决策。大数据的拥有者只有基于大数据建立有效的模型和工具，才能充分发挥大数据的价值。

人工智能时代，深度学习和大数据成了密不可分的一对。深度学习可以从大数据中挖掘出以往难以想象的有价值的数据、知识或规律。简单来说，有足够的数据作为深度学习的输入，计算机就可以学会以往只有人类才能理解的概念和知识，然后再将这些概念或知识应用到之前从来没有看见过的新数据上。

任何拥有大数据的领域，我们都可以找到深度学习一展身手的空间，都可以做出高质量的人工智能应用。任何有大数据的领域，都有创业的机会。

金融行业有大量客户的交易数据，基于这些数据的深度学习模型可以让金融行业更好地对客户进行风险防控，或针对特定客户进行精准营销；电子商务企业有大量商家的产品数据和客户的交易数据，基于这些数据的人工智能系统可以让商家更好地预测每月甚至每天的销售情况，并提前做好进货准备；城市交通管理部门拥有大量交通监控数据，在这些数据的基础上开发的智能交通流量预测、智能交通疏导等人工智能应用正在大城市中发挥作用；大型企业的售后服务环节拥有大规模的客服语音和文字数据，这些数据足以将计算机训练成为满足初级客服需要的自动客服员，帮助人工客服减轻工作负担；教育机构拥有海量的课程设计、课程教学数据，针对这些数据训练出来的人工智能模型可以更好地帮助老师发现教学中的不足，并针对每个学生的特点加以改进......

需要注意的是，大数据和人工智能的结合也可能给信息流通和社会公平带来威胁。有效、合法、合理地收集、利用、保护大数据，是人工智能时代的基本要求，需要政府、企业、个人三方共同协作，既保证大规模信息的正常流动、存储和处理，又避免个人隐私被滥用或被泄露。

3.不同层级人工智能的基本定义

3.1弱人工智能（Weak AI）

也称限制领域人工智能（Narrow AI）或应用型人工智能（Applied AI），指的是专注于且只能解决特定领域问题的人工智能。毫无疑问，今天我们看到的所有人工智能算法和应用都属于弱人工智能的范畴。

3.2强人工智能（Strong AI）

又称为通用人工智能（Artificial general intelligence）或完全人工智能（Full AI），指的是可以胜任人类所有工作的人工智能。

一般认为，一个可以称得上强人工智能的程序，大概需要具备以下几方面的能力：

1. 存在不确定因素时进行推理，使用策略，解决问题，制定决策的能力；

2. 知识表示的能力，包括常识性知识的表示能力；

3. 规划能力；

4. 学习能力；

5. 使用自然语言进行交流沟通的能力；

6. 将上述能力整合起来实现既定目标的能力。

3.3超人工智能（Superintelligence）

假设计算机程序通过不断发展，可以比世界上最聪明、最有天赋的人类还聪明，那么，由此产生的人工智能系统就可以被称为超人工智能。

今天的AI至少在七个领域还很“稚嫩”：

1. 跨领域推理；

2. 抽象能力；

3. 知其然，也知其所以然；

4. 常识；

5. 自我意识；

6. 审美；

7. 情感。

4. AI时代：人类将如何变革

4.1 从工业革命到文艺复兴

从18世纪至今，300余年间，这个世界通过三次工业革命，完成了自动化、电气化、信息化的改造。如果说在21世纪，还有哪一种技术可以和历次工业革命中的先导科技相提并论的话，那一定是正步入成熟增长期的人工智能技术。

如果我们关注的是未来科技影响下的人类整体，是人与AI之间的相互关系，是人类社会在新技术革命的背景下如何转型和演进，那么，将今天这个时代称为人类历史上的第二次文艺复兴也许就是恰如其分的。

人工智能不仅是一次技术层面的革命。人工智能因为对生产效率的大幅改进、对人类劳动的部分替代、对生活方式的根本变革，而必然触及社会、经济、政治、文学、艺术等人类生活的方方面面。人工智能的未来必将与重大的社会经济变革、教育变革、思想变革、文化变革等同步。

4.2 AI会让人类大量失业吗？

如果把这里的“失业”定义为工作转变的话，那么答案是“会的”。从短期看，这种转变会带来一定程度的阵痛，我们也许很难避免某些行业、某些地区出现局部的失业现象，特别是在一个适应人工智能时代的社会保障和教育体系建立之前，这一阵痛在所难免。但从长远来看，这种工作转变绝不是一种以大规模失业为标志的灾难性事件，而是人类社会结构、经济秩序的重新调整，在调整基础上，人类工作会大量转变为新的工作类型，从而为生产力的进一步解放，人类生活的进一步提升，打下更好的基础。

哪些工作容易被取代？

李开复的“五秒钟准则”：

一项本来由人从事的工作，如果人可以在5秒钟以内对工作中需要思考和决策的问题做出相应的决定，那么，这项工作就有非常大的可能被人工智能技术全部或部分取代。

反之，如果你的工作涉及缜密的思考、周全的推理或复杂的决策，每个具体判断并非人脑可以在5秒钟的时间内完成，那么，以目前的技术来说，你的工作是很难被机器取代的。

基于“五秒钟准则”，李开复预测，从事翻译、新闻报道、助理、保安、销售、客服、交易、会计、司机、家政等工作的人，未来10年将有约90%被人工智能全部或部分取代。如果就全人类的工作进行一个粗略的估计，约50%的人类工作会受到人工智能的影响。

人工智能对人类工作的可能影响包括三种类型：

1. 人类某种工作被人工智能全部取代；

2. 人类某种工作被人工智能部分取代；

3. 人类某种工作转变为新的工作形式。

技术发展将造成一部分简单工作、底层工作的消失或转变，但由此也会催生更多新型的、更需要人类判断力和创造力的工作类型。如设计师、架构师、建筑师、流程设计和管理者、艺术家、文学家等其工作不但不会被取代，反而会成为未来的稀缺资源，吸引更多在社会和经济转型中愿意尝试新领域的人来从事类似工作。

AI只是人类的工具。技术本身不是问题，问题是我们如何使用技术以及如何围绕人工智能这样一种革命性的新科技，建立与之配合的社会和经济结构，用制度来保证人人都可享用人工智能带来的巨大收益，同时不必担心失业等潜在风险。

4.3 自动驾驶：AI最大的应用场景

4.3.1 自动驾驶系统的基本概念模型

4.3.2 自动驾驶的六个级别

为了更好地区分不同层级的自动驾驶技术，国际汽车工程师学会（SAE International）于2014年发布了自动驾驶的六个分类体系。今天绝大多数主流自动驾驶研究者已将SAE标准当作通行的分类原则。

SAE标准将自动驾驶技术分为0级、1级、2级、3级、4级、5级，共六个级别：

在SAE的分类标准中，目前日常使用的大多数汽车处在第0级和第1级之间，碰撞告警属于第0级的技术，自动防碰撞、定速巡航属于第1级的辅助驾驶，自动泊车功能介于第1级和第2级之间，特斯拉公司正在销售的Autopilot辅助驾驶技术属于第2级技术。

从商业化的视角来看，第2级或第3级的自动驾驶技术，将来只会被用于有限的场合，而直接面向第4级甚至第5级的自动驾驶，才是未来最大的商业机会。

4.4 智慧金融：AI目前最被看好的落地领域

人类交易员大量被机器算法所取代，这只是人工智能正在智慧金融建设中发挥重要作用的冰山一角。事实上，包括银行、保险、证券等在内的整个金融行业，都已经并正在发生着用人工智能改进现有流程，提高业务效率，大幅增加收入或降低成本的巨大变革。

放眼各垂直领域，金融行业可以说是全球大数据积累最好的行业。银行、保险、证券等业务本来就是基于大规模数据开展的，这些行业很早就开始了自动化系统的建设，并极度重视数据本身的规范化、数据共享的平台化。

根据高盛公司的评估，金融行业里，最有可能应用人工智能技术的领域主要包括：

1. 量化交易与智能投顾；

2. 风险防控；

3. 安防与客户身份确认；

4. 智能客服；

5. 精准营销。

银行业中，人工智能相关应用场景：

4.5 智慧生活：从机器翻译到智能超市

2016年年底，亚马逊宣布了一个几乎震惊整个科技界的大新闻：亚马逊开办了一家不用排队、不用结账、拿了东西就可以走人的小超市，名字叫亚马逊Go！

这是一家利用人工智能技术管理的小超市。你只要走进去，拿你想拿的东西，然后大摇大摆地走出去就好了。超市的每个货架都布满摄像头等传感器，利用机器视觉技术记住每个顾客到底都拿了哪些商品，顾客出门时，再根据人脸识别辨认出来顾客的身份，自动到顾客预先关联的结算方式（如银行卡）上结账。顾客的整个购物体验，完全可以不用排队，不用亲自结账。

从机器翻译到智能家电，再到智能超市，人工智能技术给我们生活带来的巨大变化才刚刚开始。其实，如果回到10年以前，2007年苹果才刚刚发布第一代iPhone手机，那时谁会想到只用了10年的时间，智能手机就无处不在了呢？类似地，从现在算起，再过10年，大家可以看看我们的生活细节发生了哪些变化。今天的我们绝对没法准确预测，未来10年中人工智能可以给我们的生活带来多么巨大的改变。

4.6 智慧医疗：AI将成为医生的好帮手

今天，世界医疗资源分布严重不均衡，很多国家医生数量不足，发展中国家社区医生的水平与顶尖医生相差甚远。在AI的帮助下，我们看到的不会是医生失业，而是同样数量的医生可以服务几倍、数十倍甚至更多的人群。医疗资源分布不均衡的地区，会因为AI的引入，让绝大多数病人享受到一流的医疗服务。更重要的是，在AI的帮助下，顶尖的医生和科学家可以腾出时间来，从事那些真正有挑战性的科学研究。

4.7 艺术创作：AI与人类各擅胜场

我们通常说，目前的人工智能更擅长从大量数据中发现规律，帮助人类完成那些人类只需要简单思考就能做出决策的重复性工作。而人类相比人工智能的一个优势是人类有情感、明善恶、懂美丑，更擅长从事对创造性要求很高的文艺类工作。但这只是从普遍规律的角度来区分机器与人的最大不同。在一些特定的案例中，其实机器也可以用非常有趣的方式，完成某些足以令人类刮目相看的“艺术创作”。

人类艺术或者紧密结合人类的真情实感，或者深刻反映历史积淀的厚重久远，或者清晰折射社会现实的复杂多样，或者自由发挥艺术家天马行空的想象力……相比之下，人工智能算法的“艺术创作”，只是在大量学习人类作品的基础上，对人类某种特定创作风格的简单模仿。二者之间的区别，还是非常明显的。

4.8人类将如何变革

在未来，工厂机器流水线留给机器人，人会以更加富有创造性的方式与流水线竞争。人的独特性会体现出来：思考、创造、沟通、情感交流；人与人的依恋、归属感和协作精神；好奇、热情、志同道合的驱动力。根本不是计算能力和文书处理能力，而是人的综合感悟和对世界的想象力，才是人和机器人最大的差别和竞争力。创造者的个性化才是产品的价值所在” 。只有人的精神个性，才是人工智能时代里人类的真正价值。只有用开放的心态，创造性地迎接人工智能与人类协同工作的新世界，才能真正成为未来的主人。

5. 机遇来了：AI先行的创新与创业

5.1 大时代，大格局

今天，“互联网＋”的理念已经向各行业、各应用的纵深不断渗透、落地，逐渐积累起来的高质量大数据为许多前沿行业打下了全面运用人工智能的基础。我们有理由说，“AI＋”或“＋AI”的模式已经步入蓬勃发展的大好时机。

大多数情况下，人工智能并不是一种全新的业务流程或全新的商业模式，而是对现有业务流程、商业模式的根本性改造。AI重在提升效率，而非发明新流程、新业务。未来10年，不仅仅是高科技领域，任何一个企业，如果不尽早为自己的业务流程引入“AI＋”的先进思维方式，就很容易处于落后的追随者地位。

5.2 AI成为国家科技战略的核心方向

2016年11月，第三届世界互联网大会在乌镇召开。名为互联网大会，但从议程的设置以及媒体报道的关注热点来看，这几乎已经是一届“人工智能大会”了。

2016年5月，国家发改委、科技部、工业和信息化部、中央网信办就联合制定了《“互联网＋”人工智能三年行动实施方案》。2017年3月，第十二届全国人民代表大会第五次会议所做的政府工作报告更是明确提出，国家将加快人工智能等新兴产业的技术研发和转化。

当前的人工智能热门研究领域，包括大规模机器学习、深度学习、强化学习、机器人、计算机视觉、自然语言处理、协同系统、众包和人类计算、算法博弈理论与计算机社会选择、物联网（IOT）、神经形态计算等。

5.3 从谷歌的“AI先行”看科技企业的AI战略

谷歌开源的TensorFlow框架，已经成为业界深度学习的标准框架之一。谷歌在过去的几年时间里，连续开源YouTube 8M、Open Images、AudioSet等包含数百万份视频、图片、音频的标注数据集，为人工智能领域的科研发展提供“原材料”。

5.4 AI创业的五大基石

5.5 AI创业的六大挑战

概括来说，目前的人工智能产业发展面临六大挑战：

1. 前沿科研与产业实践尚未紧密衔接；

2. 人才缺口巨大，人才结构失衡；

3. 数据孤岛化和碎片化问题明显；

4. 可复用和标准化的技术框架、平台、工具、服务尚未成熟：虽然TensorFlow、Caffe、MXNet等深度学习框架已被数以万计的研发团队采纳，相关开源项目的数量也在飞速增加，但一个完整人工智能生态所必备的，从芯片、总线、平台、架构到框架、应用模型、测评工具、可视化工具、云服务的模块化与标准化工作，尚需3年或更长时间才能真正成熟；

5. 一些领域存在超前发展、盲目投资等问题；

6. 创业难度相对较高，早期创业团队需要更多支持。

6. 迎接未来：AI时代的教育和个人发展

6.1 AI时代该如何学习

李开复觉得，人工智能时代最核心、最有效的学习方法包括：

1. 主动挑战极限；

2. 从实践中学习；

3. 关注启发式教育，培养创造力和独立解决问题的能力；

4. 虽然面对面的课堂仍将存在，但互动式的在线学习将愈来愈重要；

5. 主动向机器学习；

6. 既学习人—人协作，也学习人—机协作；

7. 学习要追随兴趣。

6.2 AI时代该学什么

人工智能时代，程式化的、重复性的、仅靠记忆与练习就可以掌握的技能将是最没有价值的技能，几乎一定可以又机器来完成；反之，那些最能体现人的综合素质的技能，例如，人对于复杂系统的综合分析、决策能力，对于艺术和文化的审美能力和创造性思维，由生活经验及文化熏陶产生的直觉、常识，基于人自身的情感（爱、恨、热情、冷漠等）与他人互动的能力......这些是人工智能时代最有价值，最值得培养、学习的技能。而且，这些技能中，大多数都是因人而异，需要“定制化”教育或培养，不可能从传统的“批量”教育中获取。

比如，同样是学习计算机科学，今天许多人满足于学习一种编程语言（比如Java）并掌握一种特定编程技能（比如开发Android应用），这样的积累在未来几乎一定会变得价值有限，因为未来大多数简单的、逻辑类似的代码一定可以由机器自己来编写。人类工程师只有去专注计算机、人工智能、程序设计的思想本质，学习如何创造性地设计下一代人工智能系统，或者指导人工智能系统编写更复杂、更有创造力的软件，才可以在未来成为人机协作模式里的“人类代表”。

再比如，完全可以预见，未来机器翻译取得根本性突破后，绝大多数人类翻译，包括笔译、口译、同声传译等工作，还有绝大多数从事语言教学的人类老师，都会被机器全部或部分取代。但这绝不意味着人类大脑在语言方面就完全无用了。如果一个翻译专业的学生学习的知识既包括基本的语言学知识，也包括足够深度的文学艺术知识，那这个学生显然可以从事文学作品的翻译工作，而文学作品的翻译，因为其中涉及大量人类的情感、审美、创造力、历史文化积淀等，一定是机器翻译无法解决的一个难题。

未来的生产制造行业将是机器人、智能流水线的天下。人类再去学习基本的零件制造、产品组装等技能，显然不会有太大的用处。这个方面，人类的特长在于系统设计和质量管控，只有学习更高层次的知识，才能真正体现出人类的价值。这就像今天的建筑行业，最有价值的显然是决定建筑整体风格的建筑师以及管理整体施工方案的工程总监。他们所具备的这些能够体现人类独特的艺术创造力、决断力、系统分析能力的技能，是未来最不容易“过时”的知识。

人工智能时代，自动化系统将大幅解放生产力，极大地丰富每个人可以享有的社会财富。而且，由于人工智能的参与，人类可以从繁重的工作中解放出来，拥有大量的休闲时间。这个时候，这个社会对文化、娱乐的追求就会达到一个更高的层次，而未来的文娱产业，总体规模将是今天的数十倍甚至上百倍。那么，学习文艺创作技巧，用人类独有的智慧、丰富的情感以及对艺术的创造性解读去创作文娱内容，显然是未来人类证明自己价值的最好方式之一。

当绝大多数人每天花6个小时或更多时间去体验最新的虚拟现实游戏、看最好的沉浸式虚拟现实电影、在虚拟音乐厅里听大师演奏最浪漫的乐曲、阅读最能感动人的诗歌和小说……作家、音乐家、电影导演和编剧、游戏设计师等，一定是人工智能时代的明星职业。

6.3 AI时代的教育要关注什么

我们过去专注于培养数理化人才，为了训练符合上个时代需求的工程师、医师、会计师、律师等专业人才，我们已经投资庞大的社会资源，导致很多人从学习阶段起就开始偏离了他们的核心潜能而毫不自知。人们将从人工智能时代的大变革、大演进中被释放，真正投入我们擅长、我们热爱的领域。

基本上，人工智能时代的教育要注重以下几个重点问题：

1. 个性化、定制化的教育该如何设计，如何满足不同学生的需要，如何评估定制化教育的效果？

2. 教育如何做到可持续化？最有效的再培训和再教育体系是什么？

3. 教育体系的设计必须更早、更充分地考虑全社会的公平性。

人工智能时代，学习或教育本身不是目的，我们真正的目的，是让每个人在技术的帮助下，获得最大的自由，体现最大的价值，并从中得到幸福。

6.4 AI兴起的未来时代里，我们怎样才能在时代竞争中立于不败之地？

不断提高自己，善于利用人类的特长，善于借助机器的能力，这将是未来社会里各领域人才的必备特质。

在AI时代里，只会在某个狭窄领域从事简单工作的人，无论如何都无法与AI的效率和成本相比，必然会被机器所取代。如果不想在AI时代失去人生的价值与意义，如果不想成为“无用”的人，唯有从现在开始，找到自己的独特之处，拥抱人类的独特价值，成为在情感、性格、素养上都更加全面的人。此外，人生在世，无论是理性还是感性，我们所能知、能见、能感的实在是太有限了。AI时代，我们可以更多地借助机器和互联网的力量，更好地感知整个世界、整个宇宙，体验人生的诸多可能——这样才不枉我们短暂的生命在浩瀚宇宙中如流星般走过的这一程。

大数据学习方法自动驾驶无人驾驶智能交通

0 人点赞