【新智元笔记】反伊莉莎效应,人工智能的新概念

2018-03-14 15:00:03 浏览数 (1)

【立委按】隆重推出立委版人工智能新概念【反伊莉莎效应】,以后如果进了AI历史,各位都是见证人,发明权属于立委。

我: 人工智能里面有一个著名的现象,叫伊莉莎效应(Eliza Effect),说的是人可以过度解读机器的结果,读出原来不具有的意义。维基百科对“伊莉莎效应”定义如下:

“计算机科学中所谓伊莉莎效应,指的是人有一种趋向,在下意识中以为电脑行为与人脑行为相似。其实只是以简单的语言模式识别为基础的巧妙运用。从具体形式上看,伊莉莎效应指的是,‘人们阅读由计算机把词串成的符号序列,往往读出了这些符号并不具备的意义’。更一般地,伊莉莎效应描述这样一种情形,仅仅依据系统的输出,用户就把计算机系统理解为具有‘其控制(输出)软件完全不可能取得的内在素质和能力’,或者,‘以为(输出)反映了实际上不存在的更大的因果关系’。”

其实,对于人的所谓智能也有类似的一个效应,可以叫做【反伊莉莎效应】(Anti-Eliza Effect),就是很多时候我们把人类的能力神话,忽视了其中 90% 以上的成分其实很水,情不自禁地把所谓脑力劳动归于人类独有的灵性。它实际上是同一个效应的另一面。

拿最近讨论的微软的机助对联诗词来说。在大众的心目中,文学艺术在人类心智活动中具有崇高的地位。电脑作诗作曲听上去就有点亵渎神明,这一切背后其实都有“反伊莉莎效应”的影子。诗词和对联这类很高级的智能活动里面的一些要素,包括押韵、对仗、格律、词序等,这些本来以为是很神,非艺术家不能掌握的能力,其实都可以分解,可以形式化,可以模拟得比人还强。

人的智能其实经不起分解,分解几次以后就发现,人的神性或灵感不超过 1%,99% 是水货。糅合在一起就容易被我们膜拜为大师或天才。人工智能(AI)的目标从来就不是对准那 1%,既不可能,也无必要,总得给人类留点面子。

拿对联来说,属于 1% 的绝妙好联还有:因荷而得藕 (因何而得偶),有杏不须梅 (有幸不须媒)。老友还给了一个“绝对”:莲子心中苦(怜子心中苦), 梨儿腹内酸(离儿腹内酸)。这类 “机巧”可遇不可求,没办法也无必要去 model 它。没有可重复性的东西不具有AI价值。证明“绝妙好联”不具有可重复性很简单,对于这些对联,基本可以肯定,没有哪个大师还可以找到第二个下联,可以对得同样“机巧”。而机器要做的事情不是唯一,而是一组。这组结果如果排序,second best 与首选通常也不会一落千丈。

宋: 那倒不一定。大师找不到,机器也许能找到。你说的荷杏联,如果有一定的语音知识、百科知识,也许能湊出来。

我: 机器搜索空间大,撞大运的概率会高一筹?不好说。难的不在某一个层面的形式化。

宋: 字形的困难更大一些。

我: 难的是,但不同层面相交的时候,人偶然可以“巧遇”一个最佳组合拿出来说事儿。但机器模型化的时候为了总体效应所给的不同权重,往往在结果中需要排除那种“巧遇”。在所有的路径中,虽然理论上可以把尽可能多的选项输出来,但实际上对于机助系统总要卡一个 threshold,而那些拿出来说事的绝妙好联基本上就淹没在 threshold 下面的某个角落了。不能为了它万分之一的可能性,把一个工具弄得让人受不了,太多的选项人不愿意用或无法穷尽。

宋: 不过这些都是在可以形式化、可以演绎的范围内,困难的只是计算复杂度。真正麻烦的是归纳。现在说的机器学习,都是演绎。

我: 的确,比起演绎,归纳不好形式化。

准备正式提出这个新概念 “反Eliza效应”,谈的是人类自我神话的习惯与本能。人类的自我神话表现在读出原来没有的意义和无限夸大人类的灵性。同样一件作品,如果告诉你是机器做的,人会本能地贬低它,以维护万物之灵的自尊或不屑与机器为伍的傲慢。而如果这个作品被相信为文物,便会引来无数解读和赞赏,挖掘出本身完全不具有的各种意义来。

文学评论中的一多半都有这种效应的反映。对抽象派的艺术、行为主义的艺术,这类效应被合理化了,读出作品不具有的意义,每个人读出不同的意义,被认为是作品本来的价值,甚至被认为是学养和素质的必需。指出皇帝没穿新衣,作品没有意义,不仅需要勇气,而且也破除不了这个魔咒,因为美学的理论在抽象派中已经无需新衣的装饰。

反伊莉莎效应是神秘主义的表征,而神秘主义是人类的一种本性。这是一个巨大的题目,有的可挖。这个效应是一个很好的概念,将来有望成为AI领域的基本概念之一。

不是要否定人类的至高无上,也不是要否定人类的 1% 的灵性和天才。只有最蠢的人才会如此自我否定,糟蹋人类。但是,无论科学还是工程,讲的都是丁是丁卯是卯。我们在 AI 的道路上和实践中,第一件要做的事儿就是剥离。把笼统的 “智能” 像外科医生一样用手术刀层层解剖,把 99% 的物质与 1% 的灵性剥离开来,然后我们才会让机器去 AI 99%,在人类日常智能活动中杜绝和取代平庸,并自觉地保持与 1% 的距离及其对真正“人智”的尊崇。

人工智能应用的一个大方向就是机助人工,不必盲目追求全自动,勉强机器去拼 1%,而是把人的智慧交给人,尽量最大化机器逼近那 99% 的苦力。这一原则在微软机助对联和诗词系统得到了初步而有效的体现。

换一个角度,凡是机器可以实现的AI本质上都是水货。很明显,随着时间的推移,越来越多的水货会从我们认为的万物之灵的智能里面剥离出来,一定会有剩下的,永远无法剥离的部分,那就是真实“人智”(同义词是,灵性、灵感、灵魂、悟性、神明)。

宋: 机器智能与人的智能的区别在于,机器只能在有限封闭的范围内进行搜索,这种搜索本质上是演绎。人的智能是归纳,归纳中又使用连想、类比,所涉及的范围是没有边界的,无法形式化。立委说的剥离,就是人找到了解决问题的套路,告诉了机器。至于人没找到套路的,则还属于尚未剥离的部分。但是如何找套路,需要人的归纳,机器没办法。学数学据说是要训练演绎能力,我觉得更重要的培养(不是训练,而是悟)归纳能力,如何在没有套路可循的情况下引入新的概念、新的引理,最终导致解决问题。从这个意义上说,让机器去解高考题,对于人脑智能的研究不会有本质的帮助,因为这个任务的实质是让人找出解答高考题的各种套路告诉机器。

我: 是啊,人找套路或算法的过程需要调用人的“高级智能”,也许这才是 1%。

宋: 人有可能找出各种复杂问题的求解套路,但是找不出“悟”的套路。

我: 但是,套路只要一个个去找,就会像蚕吃桑叶一样,一点点扩大形式化的疆域。疆域的每一个进步,就是智能的进一层剥离。也就意味着以前认为的“智能”不再属于人独有的智慧。所以说,如果人是 1%的神 和 99%机器的 杂交物,总有一天会让机器取代人的 99% 知识(智能)活动。

宋: 剥来剥去,还是有极限,“悟”是剥不动的。

雷: 有魂才有悟。

宋: 什么是魂?

雷: 智能之上。

我: 剥不动就承认其边界,归到 1% 的神手里,供起来。

现在的困难是,每一个具体的所谓 “智能” 任务,大多数还是一坨泥巴,没有被剥离。只有在剥离工作积攒得越来越多以后,再回头看那不可剥离的 1%,才能最后确定到底什么是神圣不可侵犯不可模拟的灵魂或神明。在此之前,人类往往在神话自己的能力,把根本不属于属灵的悟性,归到人类独有的智能里面。看一下历史。

在前电脑时代,计算能力被普遍认为是人的了不起的智能。记忆能力也是不得了的能力。一个人如果有超常的心算能力或过人的记忆能力,很容易成为人中杰,作为高智能的天才被人尊崇膜拜。

计算器和电脑出现以后,打破的第一个神话就是计算。现在就是最反智的人,也把计算排除出智能的外延了。电脑在计算上完胜人,是如此理所当然,没有人因此把机器看成是智能机。

计算之外是记忆。说记忆当然不仅仅是存储能力,还有配套的检索能力。很多的智能在剥离以后,就变成一个 customized 的检索算法加上存贮。于是智能的神秘面纱就被非神秘化,物质化,机器化了。

譬如自然语言理解(Natural Language Understanding,NLU)。语言理解是公认的人类关键智能。幸好,我一辈子就做这个活儿,有一点发言权。为了避免无谓的口水战,咱们先把语言理解缩小成语言的结构分析 (parsing)。这种缩小是合理的,因为至少 parsing 被认为是语言理解中的核心的环节,也一惯被认为是人的语言能力的一个重要的部分,这是有共识的。可以负责地告诉大家,parsing 这种智能里面,最多有 1% 的东西暂时不好剥离,99% 的 parsing 能力不过是语言学算法 语言知识库(存贮)。 我现在的 parsers,无论英文中文,就接近或达到这个水平了。特别是开发更久一点的英语 parser,我随机从网上 copy 英语句子,parse 出来的结果,50% 以上的时候,超出了我的预期或我的能力。不到 50% 的时候显示出还有些许的改进余地。99% 的语言现象能结构化。结构化是一个可以测量的目标。

D: parsing只是结构的分析,或者说一种语言学上的结构定义和分析,只是一种识别或者说系列标注方法,这种结构机器无法理解,而理解更多是从语义上来说的,需要支持推理,支持新知识的产生。

我: “这种结构机器无法理解”,很误导。无法理解为什么要做,难道 parsing 做了是就是为了好玩?根本上还是为了机器的“理解”啊,理解了才有动作,才可以测量。

理解有不同的定义,在NLP应用的真实世界,理解的落脚点是 grounding,是与特定应用的某个目标接上。接上了就是理解了,接不上就不能认为是理解了,这是自然语言理解的 AI 真义。针对这个,parsing 提供了理解的坚实基础。

现实的做法是,把理解留到产品语用的层面去定义,因为那是NLU的终极目的,定义不会扯皮。在语用层面定义的理解,可以实现为parsing结构化以后的应用层面的开发。实践表明,这个应用层开发的理解对接是短期可以完成的。也就是说,NLU 已经到了这个地步,只要产品对理解有一个明确无误的要求,在靠谱 parsing 的支持,一般没有做不成的。包括情感分析,这是我们过去五年的主打。也是 NLU 中几乎是最难的部分了。

从 NLU 或 deep parser 回到形而上,我想说的是,我们原先以为的人的智能,经不起剥离。每次剥离的实践,都让我们一次次有跌破眼镜的体验。很多智能有一种天然的【反伊莉莎效应】, 不仅是对普罗百姓,而且对我们这些业内人士也是如此。在你没有钻进去之前,你会觉得这个智能很神妙。但你剥离了大部出来以后,开始算法化,形式化,知识存贮化以后,妈呀,原来就是这么个机械玩意儿呀,怎么以前那么神秘它呢?只能说,神秘主义是人类的本性之一。

0 人点赞