万言谈 | 智能时代、深度学习与未来:人类与人工智能的博弈之道

2020-05-13 16:09:26 浏览数 (1)

近期刚刚读完吴军博士所著《智能时代:大数据与智能革命重新定义未来》以及特伦斯·谢诺夫斯基所著《深度学习:智能时代的核心驱动力量》两本书。这两本书前后间隔接近三年,而所讲内容从吴博士对智能的大众科普,到谢诺夫斯基对于人工智能重点领域之一的深度学习发展的历程介绍,令读者对当下科技变迁有一个由浅入深的认知。

两本书所偏重的内容不尽相同:《智能时代》偏重的是对科技当下发展现状、趋势以及未来预测有一系列调研白皮书似的宏观观点,这跟吴博士一直以来《浪潮之巅》、《数学之美》等著作有异曲同工之处;而《深度学习》则更因为其作者谢诺夫斯基作为深度学习中经典算法——玻尔兹曼机的共同发明者——另外一位是杰弗里·辛顿,即2018年图灵奖获得者——而更偏向于学术专著一般的科普读物。当然说句实话,后者虽说是科普读物,但如若没有对神经网络和高等数学的基础功底,可能阅读起来有些磕绊。

不过,两本书都提到了关于未来智能带给人类的改变,同时两位作者在未来的变化上的观点也有许多一致之处。

《智能时代:大数据与智能革命重新定义未来》和《深度学习:智能时代的核心驱动力量》

划重点

  1. 人工智能必须发展,且人工智能终将造福于人类。
  2. 智能时代最终将走出与普通人遥距千里、高高在上的学术与科技发烧友的圈子,逐步被商业和社会所接受,从而与电气时代、信息时代一样,同现有产业融合,形成新的产业。而现在的产业,已然开始与大数据和机器智能开始融合,智能时代,已在我们脚下。
  3. 在深度学习发展方向的曲折上,后人对待这段历史,不应站在上帝视角来评判。历史局限让当时的人们无法看清未来发展的道路是否正确与否。
  4. 现今流行的深度学习算法,其实最早都在五六十年前提出来了,半个世纪前的算法,却能指导现在翻天覆地的智能时代,难以想象到底是天才科学家领先世界,还是普罗大众落后世界太多。
  5. 今天的技术是由算法驱动的:在21世纪,我们试图通过离散数学和算法来理解计算机科学和生物学复杂的本质。
  6. 是否整个自然界存在一个“元算法”,能够派生一切行为的算法。或许,元算法存在与限制,导致人类无法逾越这个已知的鸿沟也不是不可能的。
  7. 大数据、云计算,将在未来成为像现在水电煤网一样,成为最为基础的公共设施:一个作为数据源,而另一个作为软硬件基础设施,来推动科技互联网发展。
  8. 未来可能有两种可能:一个是我们通过智能时代进入理想共产主义,那种生产力依靠智能高度发达,人人均等发展的理想社会。而另外一个,就是——98%的人被2%的人与机器智能控制。

智能时代:信息时代的后生,人类生存的新领地

在《智能时代》中,吴博士所指出的“智能时代”是指当下及未来一段时间之内的,基于随时随地、无处不在生成中的数据所汇集而成的大数据,并通过一系列数据挖掘、机器学习等手段将大数据分析为知识与商业信息,并将此过程逐步日常化的一个时代。其与之前的第二次工业革命进入的电气时代与当下谈及的信息时代不同的是,智能时代给人类带来了新的思维方式与新的处事途经——大数据思维与智能化举措。

这里,吴博士所提到的“大数据思维”,是与电气时代的“机械思维”相比较而产生的。与“机械思维”相比,“大数据思维”的特点是:处理问题上确定性与数据量、分析算法与数据相关性有直接关系确定的问题可能在统计学上会有多种可能性的结果,且结果可能性随着数据量与关联性的变化而变化,而并不是在机械思维时代的完全肯定结果。通俗的讲,就是“数据最终说了算,结果全靠统计‘猜’”。可以说,“大数据思维”是以数据为中心的数据驱动思维方式,没有了持之以恒与可靠可信的数据以及分析数据工具,“大数据思维”就无从谈起。

而智能化举措,与大数据思维是相辅相成的,通过大数据思维所形成的,就是从海量数据挖掘出来的信息乃至知识,即数据相关性与关联性形成的信息、数据仓库信息累计形成的知识。比较著名的例子是代表前者的沃尔玛啤酒尿布货架理论和代表后者的AlphaGo的围棋挑战。

两者在智能时代的作用,在吴博士的书中概括为两个公式“现有产业 大数据=新产业”、“现有产业 机器智能=新产业”。可以这么说,智能时代最终将走出与普通人遥距千里、高高在上的学术与科技发烧友的圈子,逐步被商业和社会所接受,从而与电气时代、信息时代一样,同现有产业融合,形成新的产业。

而吴博士认为,现在的产业,已然开始与大数据和机器智能开始融合,智能时代,已在我们脚下。

书中吴博士举了小米智能硬件布局、GE智能冰箱打造家庭智能中心以及以色列智能灌溉农业、特斯拉汽车无汽车工人、NBA球队通过数据分析从三流到一流以及IBM“沃特森”以及其他医疗科技公司在智能医疗与智能手术上的应用等等例子。种种现在已经存在且使用和已经设想并准备付诸实现的智能化商业,都是对这个智能时代到来的完美证明。

当然,智能时代同信息时代一样,带给我们的不仅仅是美好,还有一些忧虑与恐惧。刚才已经讲过,智能时代是建立在大数据基础上的,那么现在嗅到这样变化的公司,通过各种渠道不断获取自己想要或不想要、合法或不合法的数据,渐渐的,数据的膨胀会让每一个在互联网上的人变成“透明”——公司掌握的个人数据太多了,如何才能让他们恪尽职守保护好我们的数据,如何才能约束他们使用这些用户的数据,成了智能时代的担忧之事与监管难题——这跟电气时代担心污染一样重要,因为这些事早晚会发生在每个人身上。

当然,对于当下的个人,还有一点变化更为重要:一切的一切都将被机器智能所替代,虽然社会生产效率提升,但这必然会带来一定人口的就业与生存问题。当然,吴博士也给出了自己的观点。不过,这个问题我将留在文章最后讨论。

深度学习: 从历史回忆造未来, 从未来视角看当下

《深度学习》这本书中译版出版其实刚刚一个月,就赶上了2018年图灵奖颁奖,其三位获得者杰弗里·辛顿、约书亚·本吉奥、杨立昆均被称为“深度学习”之父,而本书作者特伦斯·谢诺夫斯基,作为同杰弗里·辛顿共同发明玻尔兹曼机——一种神经网络神经元训练算法,是随机神经网络和递归神经网络的一种——的美国“四院院士”,其著作的重磅程度不言而喻。

书从上世纪50-80年代的机器学习发展路线之争开始——“符号表示”还是“统计学习”成了当时机器学习发展路线的争论焦点,而那时信息时代才刚刚初见端倪,谁都无法想象信息时代会带给我们一个什么样的未来。所以能够迅速出结果的符号表示阵营率先赢得了时代的支持——IBM的深蓝打败国际象棋手证明了符号表示是当时应该被确立的发展方向。当然,代表这个方向的人群,其实仅仅是当年的机器数学科学家——也是当下的计算机科学家的先辈们了。而作为统计学习阵营的坚信者,谢诺夫斯基同辛顿以及由语言学家、神经学家、生物学家、统计学家、物理学家以及一些当时看来“不开窍”的数学科学家和计算机科学家组成的圈子,一直坚守着这个资助寥寥,进展缓慢的领域方向。

1997年,Garry Kasparov与深蓝对抗,深蓝最终以 3.5 比 2.5 的成绩赢得了比赛。深蓝作为符号表示领域的机器智能产出成果,在当时受到了热烈追捧。

2016年,韩国围棋九段棋手李世石与AIphaGo对弈中。AlphaGo在与李世石对弈前通过深度学习算法训练,已具备挑战世界围棋大师的能力。

后人对待历史,不应站在上帝视角来评判。在五六十年后的今天,现代人来看当时人的种种决定,可能有些惋惜甚至嗤之以鼻。然而书中谢诺夫斯基也提到过,当年机器学习与神经网络领域没有发展起来的原因其实都很现实,且很致命。例如没有实质性的研究成果——前文提到的IBM深蓝是敌方阵营的有利发展证明,以及神经网络学习训练的条件无法满足——要知道互联网真正的数据爆炸和大数据的形成还是21世纪初社交网络的兴起才瞬间爆发。历史局限让当时的人们无法看清未来发展的道路是否正确与否——这很像大刘《三体》中航天飞船是否为工质推进为发展方向的桥段。

《我的三体》动画中地球战舰编队场景,在大刘笔下,作为无工质推进的方向才是未来星际战舰的发展方向

不过,即使历史有所遗憾,但当下的蓬勃繁荣仍然归功于历史在遗憾之中对希望独株的保护。而杰弗里·辛顿、约书亚·本吉奥、杨立昆以及特伦斯·谢诺夫斯基们的角色,正是这希望之花的“护花使者”。

在此期间,从视神经网络的解剖与研究当作起步,到单个神经元计算的发明,再到单层、关联神经网络的发明,“统计学习”领域在算法上领先于时代,发展迅猛。从达特茂斯人工智能夏季研究计划开始,到NIPS主导世界神经网络学术研究,学术圈子日益壮大。自20世纪50年代至本世纪头十年,无论是作者同辛顿共同发明的玻尔兹曼机,还是元胞自动机、卷积神经网络(CNN)、 循环神经网络(RNN)、生成对抗网络、强化学习(其中包含奖励学习)的发明、发现与应用,实质上在理论上早先几年、十几年甚至几十年对现在的智能时代的到来做好了基础工作。这些无不是谢诺夫斯基这代人为人类所带来的精神财富。

神经网络分类主要分为前馈神经网络、反馈神经网络、自组织神经网络、随机神经网络

深度学习本质是复杂的非线性模型的学习,从机器学习的发展史来看,深度学习的兴起代表着机器学习技术的自然演进。1957年,Rosenblatt提出了感知机模型(Perceptron),是线性模型,可以看作是两层的神经网络;1986年,Rumelhart等开发了后向传播算法(Back Propagation),用于三层的神经网络,代表着简单的非线性模型;1995年,Vapnik等发明了支持向量机(Support Vector Machines),RBF核支持向量机等价于三层的神经网络,也是一种简单的非线性模型。2006年以后的深度学习实际使用多于三层的神经网络,又被称为深度神经网络,是复杂的非线性模型。深度神经网络还有若干个变种,如卷积神经网络(Convolutional Neural Network)、循环神经网络(Recurrent Neural Network)

当然,有可圈可点之作,就有令人警醒之处。现今流行的深度学习算法,其实最早都在五六十年前提出来了,半个世纪前的算法,却能指导现在翻天覆地的智能时代,难以想象到底是天才科学家领先世界,还是普罗大众落后世界太多。另外还有一点,也是作者在书中提到过的:现在的神经网络,仅仅是作为应用来提供给深度学习和人工智能使用,其绝大部分仍然参考的是视神经模型研究结论。但无论是人还是其他动物,神经元体系成亿上兆,仅仅一个视神经就让人类研究了半个多世纪仍然在研究,一些未解之谜仍未解开——例如神经网络内部到底是如何处理数据并且做出决策,这个问题的解决可以让现在只能用统计学解释的理论能够在未来有确凿的解释——那更多的语言神经、运动神经的研究是否会让机器学习、神经网络、深度学习和人工智能打开新的领域之门呢?更进一步说,量子计算在未来不长时间即将进入计算机领域,他又会给深度学习大家庭带来些什么呢?谢诺夫斯基这本书其实更多的不是带来解答,而是带来更多的疑问——毕竟相比数学和物理学,这门称作“深度学习”或者“人工智能”的学科,才发展区区半个世纪。

历史之鉴在眼前,如何避免一叶障目丢失正确的发展方向,这是摆在现在人的考卷,而这份考卷的评阅人,是我们的后代。可谓真的是,从历史的回忆造未来,从未来的视角看当下。

人工智能:信息时代孕育给下个时代的新生命

不论是《智能时代》还是《深度学习》,两者都必然会谈论起人工智能这个话题。作为两个科技从业或者在计算机科学从事多年的两个权威人物,对于人工智能的态度都是十分正面且肯定的:人工智能必须发展,且人工智能终将造福于人类。

当然,两个人的角度却有些不太一样:吴博士作为在科技行业发展里做洞察的专家,对于人工智能上在商业的发展有所点拨——当然,他提到的最多的仍然是机器智能而不是人工智能。据我分析来看,吴博士可能对“人工智能”这个词会更谨慎的提及,因为现阶段的机器智能是否能上升到“人”的层次还是个疑问——这也是我的观点。当然,或许我仅仅班门弄斧,可能人家吴博士就不想写这个词而已呢?

吴博士对机器智能上的发展,从行业和社会上分为两章来做了分析,在行业上,他对农业、体育、制造业、医疗、律师、记者和编辑进行了举例与预测,而这本书是2016年出版的,三年后再看,其中的些许未来,到现在已成现实——例如智能编辑,现在智能写作已然成为一个正在国内兴起的方向。而在社会上,机器智能对社会的影响有智能化、精细化和无隐私化。而对个人来说,吴博士提到了两个议题“机器抢掉人的饭碗”和“争当2%的人”。在下面一节再详细讨论。

智能写作将成为辅助依靠文字产出的文化传播行业未来发展的方向,图为写作机器人示例

在我看来,吴博士所写机器智能与产业和社会的结合基本上是没有什么疑点的。不过在精细化方面,我觉得仍有些许补充的部分。在书中吴博士提到了精细化的例子是“追踪每一次交易”和“从标准化到个性化的服务”前者是区块链应用,而后者是作为专家推荐系统应用的体现。不过我觉得这两个例子并没有体现社会的精细化,毕竟这两个例子在所谓的“信息时代”其实是可以存在的。并没有智能时代的特例。我觉得精细化方面反而举例是各种智能家居电器的分工合作上,毕竟未来的智能家居是一句话就能根据你的习惯以及指令进行相关家电的启停的。在智能时代,你的言语内容以及语气轻重都是要通过智能去分析并解析成家电的工作状态指令的。这样的操作,在信息时代并不能真正的实现。

而谢诺夫斯基在《深度学习》提到的却是学术的发展,毕竟搞了一辈子研究,侧重点固然是不同的。谢诺夫斯基提出了一个名词“算法驱动”,他指出“在过去,技术是由物理定律驱动的;20世纪,我们试图用微分方程和连续变量的数学原理去理解物理世界,这些变量在时间和空间上平滑地变化。相比之下,今天的技术是由算法驱动的:在21世纪,我们试图通过离散数学和算法来理解计算机科学和生物学复杂的本质。”他还设想,是否整个自然界存在一个“元算法”,能够派生一切行为的算法。而我的理解是,若这个算法存在,那么其本身将并不局限于数学或计算机理论,类似于物理学的原子、质子、电子等粒子定义,算法是否也会有一个“原子算法”来定义每个物种和每个生命的轨迹步骤?当然,这已然是一个哲学上的问题,但是越深入的了解深度学习,这种感觉确实也越像而越深。

回到现实,算法驱动本身是存在的,因为各种各样的算法,从图灵机到冯诺依曼体系结构,将计算机的发展引入了繁荣的康庄大道,而从数据存储理论到神经网络,才让人工智能变为可能。一切计算机发展的基石,离不开算法的发展。那么未来算法要引向何处?是神经学生物学研究进展,指导计算机算法发展,将人类甚至其他生物的进化与算法融为一体?还是量子计算突破算法极限,带领算法进入量子领域?种种未知静待人工智能这个新生命带领我我们进入智能时代解开。

人类与AI:博弈之道共发展,孰是孰非难定断

CNN、RNN、多层深度学习、边缘计算、云计算、仿生行为……在这个时代,越来越多机器拟人化产业逐步衍生出来,但不论怎样,目前到未来一段时间的机器智能——或者说人工智能——已确定其明确的发展方向为神经学和生物学的结合。而对于神经网络现在的发展,谢诺夫斯基在《深度学习》提到了其原理中,我发现其实神经网络与人类有着十分相似的学习路径,现在的网络可能仅是“三岁小孩”的水平——只能干一件事而且干的并不怎么样——但随着时间的推演,训练样本越来越多,这样的网络会逐步成长为一个成人的水平。而这时,谁拥有了这样的神经网络模型,谁就是胜者。而同一个神经网络模型,在不同的环境下成长,在同一个事件上的判断也会不一样。这与人类自身发展情况十分相似:环境决定基因表达。每个人对一件事的判断是不一样的,在不同的机器上、不同样本集训练的神经网络其实就是一个个不同的“人”,不一样也很正常的。

所以,当下的机器智能经常被人说为“人工智障”也是情有可原的。毕竟现在的神经网络仍然处在自我学习、自我修正的循环状态。而且目前神经网络的发展出现了一个非常严肃的问题——我们知道人工神经网络能给我们干活,通过多层神经元计算得到我们想要的,然而我们并不知道神经元内部到底是怎么解决的问题——尤其是计算机界注明的P-NP问题和NPC问题,例如邮差问题——在我们的大脑看来有些问题并不是问题,但到计算机上实现却是在算法复杂度上出现严重的门槛。神经元的工作模式不论是计算机学者还是生物学者,目前都还未解释。这,也是限制机器智能发展到下一个阶段的制约。

而,这也是人类刚刚步入智能时代的体现——正如当年信息时代刚刚到来时那样,计算机犹如庞然大物、互联网只能传输几个文字——这些问题的解决,将会把我们带入下一个更智能阶段。而现在已经被提的烂大街的大数据、云计算,将在未来成为像现在水电煤网一样,成为最为基础的公共设施:一个作为数据源,而另一个作为软硬件基础设施,来推动科技互联网发展。

不过这是理想情况,前文提到过,谢诺夫斯基提出了一个类似“元算法”的概念,若世间万事的解决,都有一个通用的解决流程去衍生——类似万物都由分子和质子组成一样——那么,这个元算法是否设置了一个屏蔽,让人类无法接近神经元工作的本质?要知道神经元工作机制的总结也是一种算法的总结。或许,元算法存在与限制,导致人类无法逾越这个已知的鸿沟也不是不可能的。要知道离世的霍金近两年警告过人类两件事:一个是不要与外星人联系,另外一个就是警惕人工智能发展。

霍金警告:人工智能可能让人类灭绝

而在《智能时代》吴博士还提出了人工智能使得产业变化会让仅仅2%的人将控制未来,剩下的98%的人会成为“咸鱼”一样的存在。虽然这句话有一定夸大的成分,不过这句话的意思并不是说未来不学习人工智能就完蛋了。很显然,自工业革命开始,每次科技革命都会解放一定的生产力,同时也会让一部分工作消失,又会让一部分工作创造出来。吴博士这句话表明,智能时代的工作变化比前几次革命的工作变化更为夸张。很有可能未来几乎所有我们从事的岗位都将被智能取代。等到那个时侯,人的的确确犹如“咸鱼”一般存在了——现在的工作到那时候都没了,我们能干什么呢?

当然无论怎么替代,有一个工作肯定替代不了——那就是创造智能或使用或维护高端智能的工作机会。而这些工作第一不是所有人都能轻易上手,第二也并不需要特别多的人去干这个。因此只有2%的人控制未来也不是不可能的。

那么问题来了:剩下的98%的人的出路是什么?

吴博士在书中并没有说怎么样,只说了一句宛如鸡汤一样的口号:“争当2%的人吧!”

而我,思考了些许,发现未来,可能有两种可能:一个是我们通过智能时代进入理想共产主义,那种生产力依靠智能高度发达,人人均等发展的理想社会。而另外一个,就是——98%的人被2%的人与机器智能控制。

或许,霍金担心的就是后者这种情况吧?

不过,我们也不必担心这样的时代在我们当下发生,吴博士在书中也提到,人类消化信息时代和智能时代的速度会变得比社会发展速度慢。毕竟现在信息时代的发展还有很多领域没有消化和产出,紧接着智能时代又到来了,又带来了新的发展方向与机遇。这样类似大刘在《三体》中提出的“技术爆炸”的情形,确实在现在给人类带来了一个新的难题:知识过多,一个人不可能把所有东西都学完,因为没有任何一个领域知识在信息时代与智能时代的当下是停滞不前的。所以,只有人类解决了这个“消化知识”的矛盾,前一段提到的人类机遇问题才成为主要矛盾。

现在的我们,只要用好现在已有的机器智能,给我们自己和下一代创造更美好的生活就够了。如果聪明一点的那就去创造新的智能算法与成果。其余的事考虑也没用,毕竟,给子孙去考虑比我们瞎操心要好很多呀~

0 人点赞