原来 Hello World 是他发明的!

2022-10-27 12:50:39 浏览数 (1)

八股文网站:xiaolincoding.com

来源|丰色/衡宇/量子位(ID:QbitAI)

不久前,“Linux三剑客”中一个非常古老的工具突然登上了GitHub trending榜:

——这竟是因为80岁的原作者更新了。

是的你没听错,有人都 80 岁了还在改代码!

这位大神,就是加拿大计算机科学家——布莱恩·柯林汉 (Brian Kernighan)。

与比尔盖茨、Java之父、Python之父等大佬齐名的他,开创的“Hello World”范式让每一位学编程的同学刻烟吸肺:

不管你学的什么语言,第一个程序就是学会输出它。

代码语言:javascript复制
printf(“Hello World!n”);
cout << “Hello World!n”;
print “Hello World!”
……

此外,C语言的第一本编程著作,作者之一有他;

Unix系统的早期开发人员、AWK(Linux及Unix中的文本数据处理工具)的共同创造者名单中,他也赫然在列。

如今老爷子已经满头白发,还活跃在“一线”——

今年5月,AWK的GitHub仓库中,老爷子提交了新的pull request,给AWK添加了一直没法做到的Unicode支持。

对此,网友的态度是这样的:

是什么让这位大佬常年保持编程热情的呢?

免试进入贝尔实验室

事情还得从柯林汉的大学时代说起。

柯林汉于1942年出生于加拿大,本科就读于多伦多大学工程物理学。

他形容这是一个给那些自己也不知道想学什么的人准备的“大杂烩”专业,但很幸运,刚上大一他就对编程开始感兴趣,学起了Fortran语言。

当时,计算机的发展还处于初期。他直到大三才见到全校唯一的一台晶体管计算机:IBM 7094。

由于太贵(时值300万美元),学生们并没有机会碰到它。

由此可见彼时工具的稀缺,所以正在学编程的柯林汉也就只是拜读了丹尼尔·麦克拉肯的大作,获得了“颇丰”的理论知识,实际并没有真正上手写过一行代码。

大一暑假,不知道他如何在一家石油公司找了个实习,任务是用COBOL语言给精炼厂开发优化软件。

鉴于这个语言他不熟,也没有编程经验,所以最后也没写出个像样的程序来。

虽然受了一点小挫折,但他对编程的热情并没有退却,回到学校继续研究。

大四毕业后,柯林汉决定继续深造,并拿到了MIT和普林斯顿大学的offer。

由于去MIT要7年才能完成博士学业,且每周需做30小时的研究助理工作,而普林斯顿只要3年且提供全额奖学金,再加上柯林汉的好友就在普林斯顿,他毫不犹豫地选了后者。

在普林斯顿大学,柯林汉读的是电子工程专业,因为当时同样还没有专门的计算机系。

这完全没妨碍他前进。

读博期间,他先是得到了MIT的实习机会,有幸在后来的图灵奖得主费尔南多·科巴托(Fernando Corbató)门下干活,给一种叫作Multics的分时操作系统项目写代码。

转年夏天,他又得到了贝尔实验室的实习机会,在那里写汇编语言。

为了方便在Fortran程序中做列表处理,他还写出了一套函数库,他形容这份工作“十分过瘾”。

转眼到了博士毕业,柯林汉被直接留校任教,并在没有进行面试和研究成果展示的情况下,成为了贝尔实验室的正式成员,足以见其优秀。

而他和Unix的渊源也就此展开。

Unix命名人

我们现在的大部分服务器、手机系统和物联网系统的底层基本都是基于Unix。

而三大系统之一的Linux也是一种类Unix系统,可以说,Unix是现代操作系统的源头之一。

说起来比较意外,这么一个重要的操作系统,其初代版本被后来的图灵奖得主Ken Thompson仅花3周的时间就搞定了。

当时的Unix还叫UNICS (Uniplexed Information and Computing System),后来被柯林汉改成了现在的名字。

Unix中有一个核心工具,叫做AWK,柯林汉就是其发明者之一(名称中的“K”正是代表他)。

AWK作为一种文本处理语言,只做过滤和转换文本行这一件事,却成为Unix/Linux平台上现有功能最强大的数据处理引擎之一。

在Linux系统中,它和grep、sed命令并称为“三剑客”,并占据“老大”席位,掌握了它,处理日常操作可以6到飞起。

如今,AWK已经分化出三个版本,依然受到人们的欢迎,诞生45年仍未“退休”。

除了AWK,柯林汉还发明了AMPL,一种描述并求解大规模复杂数学问题的建模语言,支持世界上大部分的求解器。

还有编译器Ratfor、文档编制预处理器Pic、Grap和数学排版语言Eqn等这些重要研究成果背后都有他的身影。

除了写代码,柯林汉还很爱写书,且诞生了不少经典之作。

比如你想了解Unix的历史,就可以看《Unix传奇》,作为参与者和见证人之一,他写的这本书可以让没有足够专业技术背景的人也能欣赏Unix的思想。

而文章开头所说的“Hello World”范式,则是出自于他与C语言之父丹尼斯·里奇(Dennis Ritchie)合写的开山之作《C程序设计语言》。

再比如柯林汉的第一本著作《The Elements of Programming Style》(《编程格调》),则留下了一个以他名字命名的定律——柯林汉定律,即:

调试一段代码的难度是编写它们的两倍。按照这个定义,如果你的代码写得非常巧妙,那你可能没有足够的能力来调试它。

(相比于复杂代码,简单的代码更可取。因为调试复杂代码的过程中,任何问题都会十分棘手,甚至无法解决。)

解决问题靠拖延?

那么,柯林汉本身是个什么性格的人呢?

2021年他接受《程序员》采访时,曾被问了这么一个问题:

肯(Ken)用3周创造了Unix,道格(Doug)在几天内就提出了“管道(pipe)”的想法,你们工作效率这么高,有什么诀窍吗?

(以上两人都是他在贝尔实验室的同事)

对此,柯林汉连连摆手:

他们是“别人家的程序员”,我可从没这么高效过!

老爷子说了,遇到新问题,他的解决方案通常简单粗暴,那就是尽可能地拖延,以及祈祷问题消失,或者祈祷问题自己解决自己。

这个玄学办法本身是不能解决问题的,但这样做,柯林汉有足够时间消化问题,然后想出对策。

而且,他其实会选择直接动手搞定问题。

今年1月1日,柯林汉刚好过80岁生日。

上个月,油管频道Computerphile对他进行了采访,大伙儿才知道,老爷子还在改代码!

柯林汉说,没有任何一种计算机语言或工具是万能的,AWK也不例外。

此前,AWK只适用于ASCII或8位输入,不能处理Unicode。

几个月前,柯林汉花了点时间,折腾了一下AWK——他称它是“一个非常古老的程序”——现在AWK可以处理UTF-8输入和输出了。

现在,用户已经能用正则表达式提取日语字符以及类似的东西。

除此之外,柯林汉还顺口提了一嘴,他修补了一些“又快又脏”的东西,让AWK可以处理CSV文件。

老爷子依然健谈,精神面貌也不赖。话说回来,精力充沛的他,对几十岁的“古老程序”改改改,还有啥原因呢?

柯林汉的回答是这样的:

今天的计算环境,和三、四十年前非常不同,内存量也大大扩充了,“这会改变你对AWK的思考方式,尤其是AWK运行不起来的部分”。

所以,老爷子一直偷偷在后台玩儿新版本的AWK,目的是尽可能做拓展,让AWK更容易实践和使用。

这其实是柯林汉一以贯之的行事准则,此前,他就在播客CoRecursive中表示过:

如果做些能对自己有帮助,又对他人工作有所改善的事,何乐而不为呢?

有意思的是,世界上没有万能工具,也没有万能通才。老爷子自己就承认说,他的bug是还没完全搞懂Git怎么用。

所以他只能通过电子邮件,把更改发送给当前的维护人员。

One More Thing

最后,回到“Hello, world”。

这句“万物开头”其实最早是在柯林汉1974年撰写的《Programming in C: A Tutorial》中首次出现,后来才被合写进那本经典之作。

该书中两位作者形成的写代码风格,也被称为K&R风格 (K&R即指柯林汉Kernighan和里奇Ritchie)。

有意思的是,柯林汉表示这本书是自己强行拉着丹尼斯写的。

至于为什么选择用“Hello, world”而不是别的,柯林汉自己都记不清了。

在接受福布斯杂志访谈时,他模模糊糊回忆:

可能是因为看了个动画片,里面有一个鸡蛋和一只小鸡,小鸡说了句:Hello,World!

参考阅读:

[1]https://arstechnica.com/gadgets/2022/08/unix-legend-who-owes-us-nothing-keeps-fixing-foundational-awk-code

[2]https://www.theregister.com/2022/08/23/universal_unix_tool_awk_gets/

[3]https://www.cs.princeton.edu/~bwk/

[4]https://corecursive.com/brian-kernighan-unix-bell-labs1/

[5]https://baijiahao.baidu.com/s?id=1696979082867013424

[6]https://github.com/onetrueawk/awk/commit/9ebe940cf3c652b0e373634d2aa4a00b8395b636

0 人点赞