很久以前,读到吴军老师的一个观点,说现代人类和老虎狮子这类猛兽最大的优势区别是什么?有的说是会用工具,能思考,但是,真正成百上千倍地拉开人类和动物区别的,恰是那本身没有价值,却为所有能力赋能的信息。
这个观点当时让我醍醐灌顶,似乎瞬间打通了我的任督六脉,让我突然从理论到实践地重新认识到信息这一概念对人类现代文明的巨大作用,遂想和大家聊聊。
信息怎么就这么神奇?
举个例子,一只老虎从它还是幼崽开始到成为猛兽,练就一双火眼金睛,厉害不,厉害极了,能够让它轻易地称霸森林。一个人类在森林里研究好几年,发明了一支步枪,能够对老虎一击毙命,那更厉害了。但是这一点点的厉害,还不能成为人类可以统治地球的理由。我们用发展的眼光往下看,这只老虎所有的捕猎的技巧,到它衰老死亡那一刻,也就戛然而止了,它的幼崽需要几乎从零开始去重新达到或者只能接近这一高度,如果能跟着父亲学几次,那都是幸运了。但是人类不一样,当第一把枪被发明出来以后,就可以绘制图纸,写下制作方法,说明材料,以至于当他死去或者枪坏掉,后来者可以相对轻易地复制一把枪出来。后代的每一个人都可以站在前人很高的肩膀上继续发展,这种累积的式的发展与每次从头再来的老虎相比,慢慢地就能累积出不可弥补的鸿沟了。
这便是信息的力量,它虽然没有直接价值,但却为所有价值发挥最大的价值发挥着作用,互联网正是这一信息价值放大器的时代产物。
感谢这个叫信息的时代,让我等能分到一杯时代的红利。
信息的起源
那我们不妨从本质上想想,信息的来源究竟为何?我们人类处理信息的方式又有怎样的优越性呢?
我们人进行高级思维所接收信息的大部分来源于视觉,少部分听觉,而嗅觉,触觉,味觉等很少在其本身含义基础上进行更多的编码,但是动物却会更多地利用他们,使得比看到听到得到更多的信息,比如狗撒尿的标记,蚂蚁留下的记号还有蜜蜂跳的八字舞等等。至于人类为什么这些能力退化了,我想,应该是进化过程让我们把这部分能力交给外部工具去解决而不是自己去干这脏活累活,而且这样的人获得了生存优势而得到了繁衍,在群体看来就是进化了。
人类的视觉以及听觉,和其他感觉还有一个本质区别,就是这二者是高度抽象编码的甚至还共享很大一部分目标空间。当然不是说其他感觉就不能编码了,比如盲人也可以通过触摸的方式来读书,动物也是用气味等来编码一些哪里来敌人了或者有吃的之类的信号的。而是实践表明视觉和听觉效率是最高的,暂时没必要改了。且最关键的是,信息可以编码,编码出来的那个抽象的语义才是我们进行思考运算的内容的话,这才是抽象思维产生的根本,而并不是臭味就是臭味,疼就是疼这么通信代价巨大却信息量极少的内容了。于是,我们的视觉听觉,都只是传感器,通过眼睛和耳朵传递的,说白了就是像素点和振动频率,计算机存音视频存的就是这玩意。而大脑哪怕容量极大,也绝不会花一个细胞去记忆频率值和像素RGB的(无奈部分应试教育就是要求孩子干这样的事情)。大脑处理的,是经过图像和声音编码的信号,再解码出来构建对真正客观对象的认知。而到了计算机里,就全部统一成仅有1个bit容量的电位,开关,通断这样的最简单但是可以高置信度保存和复制的内容。再经历编码和解码去复现给人类。于是计算机就像大脑的一个拓展,把海量杂乱的信息交给它,自己编码最抽象的部分。
所以,现代信息的本质,是具体信息的数学抽象,剥离了千奇百怪的到实际信息内容的映射,而二进制的计算机和网络,就是实现这些统一信息编码,存储,传输的工具。
从认知到编码
我们自己也偶尔斗胆猜测上帝是怎样构建我们的大脑认知的,比如抽取特征,比如数据强化,多层级的抽象等等,这些猜想也都反映到了我们AI研究的深度学习中的各种网络结构和数据处理方法中,算是人类对自己的一次突破吧,虽然遥不可及,也可能一开始就走错了方向。
于是,一边是借助工具不断进步的观察手段,另一边则是大脑可以借助构建起的认知模型认识事物,并且进一步归纳然后推理。而这个效率比较于真实发生过程,是降维的打击。比如地球围绕太阳转一圈要一年,而想象则只需要1秒,虽然漏了很多细节,可是你随时可以根据你对地球围绕太阳公转的知识来补充这些细节,甚至比直接观察获取信息要靠谱多了。
这里最抽象的对信息的认知就是编码了,它使得我们对信息的使用可以完全剥离于其原始意义而表达几乎无限的对象,可以作为一切信息的底层表示。接着,用这样的思路,我们便可以把这些信息进行存储和传输,像发明的步枪说明书一样,永远传递下去。那人类具体是怎么做的呢?
有了信息源和加工的结果以后,人类将这些推理思考的精华全都再次用文本符号,示意图等重新记录下来并很轻松地传递。毕竟摩尔定律下,记录和传输信息的效率和成本都在肉眼可见地发展。后人再看到这些文字之后,只需要花义务教育这么长的时间学会说文解字,就可以读懂前辈几代人留下的智慧了。这种可积累和传承的智慧是动物遥不可及的,也是人类拉开差距的根本因素。
代际信息的传承能更快吗?
但是,哪怕我们记录传输信息的效率和成本是摩尔定律的级别,但是离理想的知识,能力传承的效率以及错误率还有着天壤之别。虽然我们不一定能进化成那样,如果进化到那个打游戏一样的级别也可能会变成电影里大结局一样的灾难,但不妨碍我们反思人类自己。我们还是要花18年的基础教育时间父母一点点带,老师一点点教,才能学会基本阅读和实践能力,再4年的通识教育以及5年以上才能成为一个专业的专家。在一些如数学,计算机等理科领域可能有天才,我想是因为他们基础明确简单,更多是抽象逻辑,脑子对这些东西的思考的速度几乎可以看作是无穷的。而像法律,文学,历史这类,得靠大量的信息积累,缓慢的沉淀,你敢说谁一出生就能是天才?所以,对这些学科来说,知识传承是不是有点慢了?
另一方面,噪声信道模型告诉我们,经过传输后还原的信号,信息损失是一个绕不开的问题。我们用语言沟通时候,天天都会有各种误解和歧义,说话也经常容易一大堆抓不到重点,文字理解起来千人千面作为文学作品虽美,可以一直研究下去,但是作为精准的通信就太差了,到目前,考古也依然是一件及其困难的事情,很多历史只能连蒙带猜。用杂乱的文本单一线性地这么一直写下去来记录,是不是有点低端了?
不是说扎实努力不重要,而是说,也许我们信息传递的水平可以更高,在不损害人类体验的情况下,编码我们信息需要的基础可以更少,我们构建认知模型的速度可以更快?
我觉得是有可能的,因为我看到了时空上拉开差距的样子。比如在唐朝,你能考中进士以前计算十以内的加法就很了不得了,而现在只是小学生水平。你现在大街上拉一个人问整数有怎样的数学结构?估计碰上科班专业的人才可能懂,可是在把数学作为国民爱好的法国,一个学龄前儿童可能就会开始分析其对加法的封闭性,有幺元,逆元,对加法有交换律和结合律,进而说这是一个阿贝尔群了。虽然现在不懂这些不会对生活有什么影响,但是懂了的话对那些人就是降维打击了,而以后有一天,不懂数学结构就恰好像今天买菜算不清账一样无奈吧!
欣慰于人类的飞速进步,也随时保持冷静,避免妄自菲薄。毕竟也不能到了某一天,每个个体都沉迷于收集前人留下的信息,因为这确实是效率最高的方式,而不再有人绞尽脑汁去创造新的信息了,人类又会把信息技术作为基础设施放着,而去更加重视实业了。不过这样的轮回一般都要几十年,敬请期待这个变化多端的世界吧!
我们是谁:
MatheMagician,中文“数学魔术师”,原指用数学设计魔术的魔术师和数学家。既取其用数学来变魔术的本义,也取像魔术一样玩数学的意思。文章内容涵盖互联网,计算机,统计,算法,NLP等前沿的数学及应用领域;也包括魔术思想,流程鉴赏等魔术内容;以及结合二者的数学魔术分享,还有一些思辨性的谈天说地的随笔。希望你能和我一起,既能感性思考又保持理性思维,享受人生乐趣。