我们总是把生物精确复制自身基因组的能力视为理所当然的,但这项能力却是生命最非凡、最根本的特质。
DNA复制的错误率,也就是我们所说的变异,通常小于1/109。为了让我们对这个高到令人震惊的精确度有些概念,我们可以想象一下本书中所包含的约几十万字、标点符号和空格,现在,假设图书馆中有约1000本篇幅相近的书,你的任务是如实地抄写这些书中的每一个字、标点和空格。你觉得你会犯多少错误?这正是在印刷机发明之前,中世纪的抄写员们所做的工作。他们必须尽最大努力用手抄写文本。
他们抄写的文本满是错误,这其实并不奇怪,我们从中世纪那些充满分歧的不同手抄本中可见一斑。当然,计算机能以非常高的准确度复制信息,但计算机完成任务靠的是基于固体硬件的现代电子数码技术。假设用“湿软黏糊的材料”制成一台复印机,你觉得如果用这台机器来读取和书写要复制的内容会犯多少错误呢?不过,如果“湿软黏糊的材料”是你体内的一个细胞,要复制的信息以DNA的形式编码,那么错误的数量就会少于一个字,也就是 1/109。
高精度的复制对生命至关重要,因为活体组织高度的复杂性要求指令的设置必须同样复杂,每一个错误都有可能是致命的。我们细胞内的基因组由约30 亿个“基因字母”组成,编码了约 1.5万个基因。但是,就连最简单的、进行自我复制的微生物,其基因组也有数千个基因,由几百万“遗传字母”写成。虽然大多数生物每一代都能容错极少数的变异,但允许下 一代中拥有超过一掌之数的变异将引起严重的问题,比如形成人类的遗传病,甚至诞下是无法存活的子代。此外,无论什么时候,只要我们体内的细胞进行复制,包括血细胞、皮肤细胞和其他细胞等,都必须同时复制细胞内的 DNA 并注入到子细胞中。这个过程如果出了差错,会引发癌症。
◆ ◆ ◆
为什么量子力学对遗传极为重要
为了理解为什么量子力学对遗传极为重要,我们必须先回到 1953 年的剑桥大学。1953年2月28日,弗朗西斯·克里克冲进剑桥的鹰酒吧,兴奋地宣布他和詹姆斯·沃森发现了“生命的秘密”。当年晚些时候,他们联合发表了具有历史意义的论文,在文中展示了一个结构并给出了一套简单的规则,为两个最根本的生命之谜提供了答案——生物信息是如何编码的, 又是如何遗传的?
许多文献在描述遗传密码的发现时,习惯强调一个可以说是次重要的特点:DNA具有双螺旋结构。这个发现确实引人注目,DNA优美的结构实至名归,并由此变为科学界最具标志性的形象,出现在T 恤衫、网页, 甚至建筑设计中。但双螺旋结构本质上只是一个“脚手架”,DNA 真正的秘密在于脚手架上安装的物质。
我们曾简要介绍过,DNA的双螺旋结构由糖–磷酸骨架支撑,上面携带着 DNA真正的信息:核酸碱基链,包括鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和腺嘌呤(A)。沃森和克里克发现,碱基的线性序列组成了某种密码,而他们认为,这正是遗传密码。
在他们具有重要历史意义的论文最后,沃森和克里克表示,DNA的结构也为第二大生命之谜提供了解答方案,他们写道:“这并没有逃出我们的关注范围:我们提出的配对假说,同时为遗传物质的复制提供了一种可能的机制。”没有逃出他们关注范围的,是双螺旋结构的一个重要性质:螺旋双链其中一条链上的信息,或者说碱基序列,可以视为与另一条链上碱基序列对应互补的拷贝——一条链上的 A 总和另一条链上的 T 配对,同理, G 总是和 C 配对。对应链上碱基的特殊配对(A-T对或 G-C对)实际上是由一种弱化学键促成的,被称为氢键。像“胶水”一样将两个碱基分子结合在一起的氢键,本质上是两个分子间共用的氢原子。氢键对我们的故事 很重要,稍后,我们会更详细地讨论它的性质。
配对 DNA 双链间的弱结合顺理成章地为基因复制提供了一种机理:双链解旋分开成为两条单链,每一条单链可以作为模板,分别在自身的基础上形成互补的新链,使最初的一条双链变为两条,完成复制。这正是细胞分裂时基因复制的过程。双螺旋结构的两条链及其携带的互补信息解旋分开后,一种被称为 DNA聚合酶的酶类得以靠近分开的单链。随后,DNA 聚合酶与一条单链结合,并顺着该链的核苷酸链滑动,读取每个遗传字母,并以分毫不差的准确性,在对应的位置插入与之互补的碱基,使新链逐渐形成:只要遇到A,DNA聚合酶就在对应的位置插入一个T,只要遇到G, 就插入一个 C,直到完全形成一条互补的单链。同样的过程也发生在刚刚分开的另一条单链上,使原先的一条双螺旋链,变成了两条:每个子细胞中各一条。
这个看起来简单的过程,构成了我们星球上所有生物繁衍增殖的基础。但是,薛定谔在1944年坚持认为,遗传过程高得惊人的精确度无法用经典物理定律来解释——他认为,基因太小了,基因的规则性不可能基于“来自无序的有序”原理。薛定谔提出,基因一定属于某种“非周期性晶体” (aperiodiccrystal)。那么,基因真的是非周期性晶体吗?
◆ ◆ ◆
基因真的是非周期性晶体吗?
晶体,比如盐粒,有其特殊的形态。氯化钠晶体(普通的盐)是立方体, 而以冰的形式存在的水分子会组成六方体,并形成形态各异的雪花。晶体的形态是分子在晶体内部有序堆积的结果,因此,归根结底,决定晶体形状的还是量子规律,因为量子规律决定了分子的形状。然而,虽然标准晶体高度有序,但是无法编码信息。因为每一个重复的晶体单位都完全一样—— 有点像棋盘格子样式的壁纸,一条简单的规律便足以描述整个晶体。
薛定谔提出,基因属于他所谓的非周期性晶体:也就是说,这类晶体既具有和标准晶体类似的重复分子结构,但又经过某种调整,在重复单位之间有不同的区间或周期(因此称为“非周期”),或是重复单位本身具有不同的结构——更像是花纹复杂的挂毯而非壁纸。薛定谔认为,这些经过调整的重复结构编码了遗传信息,而且像晶体一样,它们的秩序也应该处于量子级别。注意,薛定谔提出这些主张时,比沃森和克里克的发现还要早十年:基因的结构,甚至基因的组成,多年之后才逐渐为人所知晓。
那么,薛定谔是对的吗?很显然,DNA密码确实是由重复的结构—— DNA 碱基——组成的。DNA 碱基非周期性地出现,每个重复单位中一定包含四种不同碱基中的一种。正如薛定谔的预言,基因确实是非周期性晶体。但是非周期性晶体并不一定在量子级别编码信息,比如,照片底版上不规则的颗粒是由银盐造成的,而非量子现象。为了检验薛定谔关于基因是量子主体的预测是否同样正确,我们需要更深入地观察DNA 碱基的结构,特别是 A 与 T、C 与 G 之间互补的碱基配对。
携带遗传密码的 DNA配对靠的是将互补的碱基结合在一起的化学键。我们之前已经提到,这些键叫作氢键,是由两个原子共用一个质子(也就 是氢原子核)形成的,两个原子分别属于在对应的两条单链上互补的碱基: 正是这些氢键让碱基配对结合。碱基 A 与碱基 T 配对, 因为每一个 A上的质子都恰好处于正确的位置,可以与T 形成氢键。碱基 A 无法与碱基 C 配对,因为质子的位置不对,无法形成氢键。
以质子为媒介进行配对的核苷酸碱基就是在一代又一代生命之间复制和传递的遗传密码。而且,这可不是一次性的信息转移,不是用一次性密码本加密的信息,用后便要销毁。遗传密码的可读性必须要能够贯穿细胞的一生,以便指挥细胞完成蛋白质的生产过程,制造出生命的引擎——酶, 并通过酶来编排细胞所有其他的活动。这个过程由一种叫作 RNA聚合酶的酶来完成。像 DNA聚合酶一样,RNA 聚合酶会读取沿着 DNA 链进行 编码的质子的位置。就像一条信息要表达的意思或是一本书的谋篇布局是 由书页上字的位置所决定的一样,双螺旋结构中质子的位置决定了生命的 “故事”。