Nat. Com. Sci.|稳定维护隐藏开关以提高基因表达的稳定性

2021-02-02 11:36:49 浏览数 (1)

编·译作者 | 王建民

今天给大家介绍的是沙特阿卜杜拉国王科技大学(KAUST)高欣教授课题组(http://sfb.kaust.edu.sa)2021年1月14日发表在《Nature Computational Science》的一篇文章,“Stable maintenance of hidden switches as a strategy to increase the gene expression stability”。严重的压力下,野生型生物体可以释放出在正常条件下隐藏的替代表型,这些表型与潜在的遗传变异有关。研究人员通过使用计算模拟,分析了稳定化选择下基因电路的适应性进化。发现在最佳表达水平周围,不同的策略演化都降低了基因表达噪声的水平。为了从一个具有双稳态个体的创始种群中逐步提高基因表达稳定性,进化的方向始终是沿着提高双稳态系统潜在屏障高度的方向进行。结果表明,隐藏的表型开关可以在环境静止期间稳定地维持,有利于在发生实质性扰动时释放潜在的适应性表型选择。

1

背景

通过缓冲潜在的遗传变异来实现离散表型的渠道化,被认为是自然选择生物体的一般属性。然而,野生型生物体中的实质性扰动可能会破坏其遗传发育系统的正常运作,并释放出本来不会表达的替代表型。例如,Suzuki和Nijhout通过对烟草角虫进行基因扰动,并应用热休克的方法,能够衍生出一种根据温度表达黑色或绿色幼虫的多表型物种。为了释放这样的隐性表型,野生型生物在某种程度上保持了预期的表观遗传切换能力,并在严重的扰动下降低了切换的阈值。这种 “隐性”阈值性状在自然选择的生物体中的稳定维持表明,这些陈旧的开关机制的丧失可能会以某种方式产生巨大成本,并可能对生物体有害,这可能是由于例如对表达表型的共生效应。然而,与隐性表型相关的基因集在正常条件下很可能是不表达的,似乎对生物体的适性没有贡献。因此,虽然在野生型生物中通常假定存在表型切换能力,但究竟如何使控制替代表型表达的废弃切换能力在种群中长期有益和维持,仍然是未解的问题。

研究人员通过使用计算机模拟,在自然选择下,向高水平基因表达稳定性的进化方向可以解释过时开关能力的稳定维持。研究人员模拟了一个有可能表现出双稳态开关的基因电路模型的进化。计算进化过程中,首先将生物体置于稳定选择的静态环境中,然后将它们置于波动环境中,最后将它们放回静态环境中。研究人员观察到,在波动环境中进化出的双稳态性状表现出随机切换,在随后的静态环境中,其在种群中维持的可能性很大。通过分析模拟结果,研究人员发现在波动环境中进化出的双稳态性状与在后续静态环境中维持的性状具有相反的特征;前者具有低阈值切换,以保证种群中一小部分人能够适应对抗性环境,而后者具有较高的阈值切换,以降低基因表达的变异性。研究结果给出了这样的隐藏开关能力可以在静态环境中建立和维持的证据。有趣的是,这并不是因为双稳态切换在稳定化选择下具有选择优势,而是因为提高稳定态之间的屏障比恢复到单稳态基因表达系统更容易解决小突变转变的情况下提高基因表达的稳定性。

2

方法

2.1 基因回路模型

蛋白质X表达的基因回路模型由两个变量组成:m和x分别代表mRNA和蛋白质形式的分子拷贝数,以及四个反应过程:转录;mRNA降解;翻译;蛋白质降解。转录过程采用基于热力学的方法进行建模,其动力学规律如下:

其中,参数kb和ka分别为基础转录率和活化转录率,a为这些转录率的缩放系数,而Kd和n分别代表结合亲和力和合作力。

mRNA降解过程采用动力学规律的一阶反应:kmdegm来建模,而翻译过程则采用另一个动力学规律的一阶反应:ktransm来建模。那么,由一份mRNA转录本产生的蛋白质分子的平均数,由b=ktrans/kmdeg给出。蛋白质降解过程采用一阶反应建模,动力学规律为:kdegx。为了模拟这个基因电路模型的一个细胞生成,我们运行Gillespie的随机模拟算法2000秒,这是在典型的细菌生成时间范围内。

为了将每个个体的遗传构成与其表型进行映射,需要一种方法来获得给定参数组合的基因回路模型的动态特性。通过连续态近似,代表这个基因回路的随机过程可以用下面的Fokker-Planck方程来描述:

其中P(x,t)是蛋白质水平在时间t时为x的概率,由这个公式可知,在静止制度下,蛋白质丰度水平的时间不变概率分布Ps(x)由以下公式给出

其中 C 是一个归一化常数,φ(x)是势函数。通过用一个小而有限的Δx来逼近dx,我们可以使用这个方程将参数映射到蛋白质丰度分布,而不需要进行随机模拟。

2.2 进化模拟

连续在三种不同的条件下,分别模拟了1000个具有该基因回路的个体的种群的演化1万代。即在前1万代中,该种群在环境E1中进化,在后1万代中,在环境每20代在E0和E1之间切换的波动条件下进化,在最后1万代中,该种群在环境E1中进化。本次模拟中,研究人员设置kb=0.02,ka=0.2,kmdeg=0.1,kdeg=0.002,同时设置参数a、b、Kd、n为可进化。创始种群中的个体将这些可进化的参数设置为a=1,b=1,Kd=50,n=0,每个个体的基因表达过程都有一个组成型启动子,没有反馈环调节。通过向可进化参数添加小的扰动来捕获遗传突变。具体来说,a、b、Kd和n中的扰动首先使用来自零均值高斯分布的随机变量进行建模,σ分别为0.2、0.2、1和0.2。在后续的模拟中,研究人员改变了这种扰动设置,以检查结果的一致性。随机向每个个体引入突变,每代基因回路的突变率为0.01。通过假设基因回路的大小在1Kb左右,可以表明,人口乘以每代每碱基对的突变率为0.01,这与已经报道的以及那些基于估计有效人口大小和估计原核生物每代每碱基对的突变率的报道具有相同的数量级,并具有可比性。

个体的适应性取决于其环境,研究人员有两个适应性函数W0和W1,分别用于环境E0和E1。这些函数有如下形式:

其中xθ设为50,xc设为1000。在环境E0中,最佳蛋白质水平μlow为0,而在环境E1中,最佳水平μhigh为135。

为了测试主要结果是否可以重现,独立于使用的特定健壮函数,研究人员用以下健壮函数进行了进化模拟:

新一代个体的选择采用轮盘选择法。即从1000个个体中选择每个个体作为新的种群,用当前种群中所有个体的归一化适配度作为选择的概率分布,从这个分布中随机选取每个新世代的个体。

2.3双稳态和单稳态的分类

为了将群体中的每个个体划分为双稳态或单稳态基因表达表型,研究人员注意到,具有稳定状态(即Ps(x)具有峰值的蛋白质水平)或不稳定状态(即Ps(x)具有底部的蛋白质水平)的充分条件是嵌入式图像。Ps(x)的第一导数可以表示为

从这个方程可以看出,稳定和不稳定的稳态一定是α(x)的根。研究人员采用寻根法来寻找稳定状态的数量,并对给定基因型编码的是单稳态基因表达过程还是双稳态基因表达过程进行分类。

2.4 稳定性衡量标准

为了量化古种群和衍生种群中个体的稳定性,研究人员通过高斯函数g(x)来近似地描述Ps(x)在高表达稳定状态xhs周围的形状,其中:

为了得到宽度w的值,研究人员设置了一个约束条件

,这个约束条件要求嵌入图像,即设置两个函数之间的上位表达式稳定状态周围的凹凸度相同。在这个约束条件下,可以将w表示为

对于每个个体来说,xhs>xθ,那么,其基因表达过程在有利于蛋白X较高表达的环境下的稳定性由xhs/w给出。因此,该值越高,围绕较高表达稳定状态的基因表达稳定性越高。

3

结果

3.1 基因回路模型和进化模拟

模拟中该种群在不同条件下进化了3万代。在前1万代的进化过程中,种群被置于E1中。研究人员将这第一种环境条件下的进化种群称为古种群。在接下来的1万代进化中,该种群又被放置在一个波动的环境中,每隔20代就会在E0和E1之间切换环境。研究人员把在这第二种环境条件下进化的种群称为中间种群。最后,在最后1万代的进化过程中,该种群又被放回E1中。研究人员把这个最后环境条件下的进化种群称为衍生种群。从这个模拟过程中产生了50个样本进化轨迹。

3.2 由环境条件决定的表型特征

从模拟结果来看,研究人员首先分析了三个种群在各自环境中进化后的适度和表型特征。对于每个样本演化轨迹的演化种群,研究人员测量了健壮度和蛋白质丰度水平的平均值和标准差。由于古种群和衍生种群是在同一个静态环境中进化了很长时间的代数,研究人员预计这些种群中的许多个体都是经过调整的,表现出这种环境环境下的高度优化表型。事实上,研究人员观察到,这两个种群在每个样本轨迹中始终进化出具有非常高的平均适应性,个体间的变异度很低。相比之下,中间种群则表现出大相径庭的模式,在50个轨迹中具有较高的变异性,而且在这些轨迹中的每一个轨迹中,经常发现该种群具有较高的健壮变异性。尽管变异性较高,但是,其平均适性大多与静态环境下进化的同类相当或更高,这说明在波动选择下,中间种群能够适应E1。

从蛋白质丰度分布数据中,还观察到在静态环境中进化的种群和在波动环境中进化的种群之间存在明显差异。通过比较蛋白质丰度分布,研究人员发现中间种群在平均蛋白质丰度水平低于衍生种群的情况下,经常有相对较高的表型变异。这解释了在中间种群中观察到的高适应性变异,以及较低的平均适应性。个体之间如此高的表型变异性水平在波动的环境中是有利的,它可能来自于异质种群或具有随机切换能力的更均匀的种群。

3.3 中间种群对衍生种群基因型进化的影响

古代种群和衍生种群的进化个体具有类似的表型,这些表型是针对静态环境进行优化的。衍生种群要达到这样的表型特征有两种可能,它可以走复归路线,拥有与古种群相似的基因型,也可以向新的方向进化,拥有针对E1优化的新基因型。为了区分这两种可能性,研究人员将代表衍生种群中最常见基因型的进化参数与古种群和中间种群的进化参数进行比较。对比古种群和衍生种群的进化参数发现,它们之间具有微弱的相关性,说明衍生种群中的进化基因型与古种群中的进化基因型存在较大差异。

是什么原因造成了远古种群和衍生种群的基因型差异?研究人员的模拟环境中,二者唯一的区别是其种群的初始基因型,衍生种群继承了中间种群的基因型,而远古种群一开始就有一个均匀的基因型,表现出单一的基因表达。因此,在波动环境中演化出的基因型一定在引导衍生种群采取不同的策略,形成针对E1环境优化的新基因型方面起到了关键作用。事实上,衍生种群中的进化参数与中间种群中的进化参数表现出更强的正相关关系。利用进化参数的平均值对其进行比较,也表明三个种群之间的关系模式相似。

为了分析中间种群的基因型如何促进衍生种群中新基因型的进化,研究人员考察了三个种群中每个可进化参数的分布。由此得出的最明显的规律是,中间种群和衍生种群往往具有高水平的结合合作性,这表明高度非线性的转录过程具有很强的正反馈,而古种群的结合合作性水平很低。

3.4 稳定选择下的双稳态维持

由于具有强正反馈的非线性转录可以引起双稳态和随机表型切换,研究人员着手研究进化个体的蛋白质丰度水平分布形状,并对其基因调控过程是单稳态还是双稳态进行分类。为此,研究人员分析了进化的参数集,并统计了古种群、中间种群和衍生种群中单稳态和双稳态个体的数量。研究人员发现古种群和衍生种群,这两个种群是在相同的静态选择方案下进化出来的,其基因表达控制的特征存在统计学上的显著差异。正如预期的那样,在所有的样本进化轨迹中,古种群都没有观察到双稳态基因表达性状。相反,衍生种群反复表达双稳态性状,具有双稳态性状的进化个体往往占种群的很大一部分。事实上,研究人员观察到60%以上的样本进化轨迹中,具有双稳态性状的衍生种群占多数。

为了了解中间种群在衍生种群中双稳态性状的表达中的作用程度,研究人员分析了中间种群和衍生种群的基因表达性状之间的关系。通过计算条件概率,研究人员发现,当双稳态性状在中间群体中进化时,该性状很可能在衍生群体中得到维持。另一方面,当中间种群只具有单稳态性状时,衍生种群进化出双稳态性状的几率要低得多。结果表明,双稳态性状在衍生种群中的表达强烈地依赖于中间种群中该性状的进化。

为了检验这些结果是否强烈地依赖于研究人员对健壮函数的具体选择,研究人员用不同类型的健壮函数进行了进化模拟,模拟了静态环境中的稳定选择。同样观察到,当中间种群表达双稳态个体时,衍生种群有很高的表达倾向,这说明这些现象与健壮函数的具体选择无关。研究人员进一步考察了结果是否取决于对突变转变大小的具体选择。因为较大的结合合作性变化可以自发地将单稳态个体变成双稳态个体,反之亦然,研究人员对该参数进行了不同大小的突变转移的额外进化模拟。研究人员发现,虽然较大的结合合作性突变转移导致了古种群中双稳态性状的表达,但在衍生种群中观察到的双稳态性状的分数要高得多,而且衍生种群中双稳态性状的表达对中间种群的依赖性很强。从这些额外的实验中,研究人员证实了在各种进化模拟设置下定性结果的一致性。

3.5 静态环境下基因表达的稳定性提高

但是,中间种群中进化出的双稳态性状如何能在衍生种群中稳定地保持呢?在波动选择下,双稳态性和随机表型切换可以作为副产品来提高进化性。由于随机切换允许一部分个体在没有遗传突变的情况下适应对抗性环境,种群可以迅速提高整体的适应性。因此,研究人员期望这样的策略一旦进化后就固定在中间种群中。然而,在静态环境中,替代表型之间的随机切换将导致种群中没有任何明显优势的不适应个体。也就是说,在稳定化选择下,更有利的角色是那些基因表达水平稳定性增加的角色,以不断表达优化的表型。

因此,研究人员怀疑静态环境下的进化方向与最佳基因表达水平附近的基因表达过程稳定性增加有关。降低基因表达噪声的机制之一是提高转录效率,降低翻译效率,有趣的是,研究人员观察到,一旦基因表达率达到最佳水平附近,古种群就会进化出较高的转录效率,较低的翻译效率。因此,这就有证据支持了古代群体中选择了具有较高基因表达稳定性的个体的观点。然而,研究人员并没有能够在衍生种群中检测到类似的较高基因外排稳定性的明显特征。这可能是由于在较高的非线性水平下,基因调控参数与动态行为之间存在复杂的关系。

为了更好地理解基因表达稳定性与稳定化选择下的进化之间的关系,研究人员对古种群和衍生种群中个体的基因表达过程的稳定性水平进行了量化。为此,研究人员定义了一个围绕较高表达稳定状态的稳定性度量,假设稳定状态周围的蛋白质丰度分布可以很好地用高斯函数来逼近。利用这个稳定性度量,研究人员计算了50个样本轨迹中每个种群的平均基因表达稳定性的平均演化。由此,研究人员发现,古种群和派生种群在进化过程中都相似地提高了它们的基因表达稳定性水平,然后才在相似的基因表达稳定性水平上稳定下来。由于衍生种群的初始稳定性水平远低于古种群的最终稳定性水平,研究人员也可以推断出,随着中间种群在波动选择下的进化,稳定性水平会有所下降。事实上,通过比较中间种群和衍生种群中进化个体的平均稳定水平,研究人员发现,在50个样本轨迹中,衍生种群的平均稳定水平都高于相应的中间种群。因此,稳定性水平的提高是一种鉴别性特征,只在稳定化选择下的进化中观察到。

3.6 维持双稳态性是提高基因表达稳定性的一般方法

研究人员研究了基因表达稳定性在静态环境中的进化机制。为此,研究人员从衍生种群具有高水平平均基因表达稳定性的样本中,测量了最适个体的基因表达过程的潜力。由此,研究人员发现,虽然在派生种群中进化出了多样化的单稳态和双稳态个体,但它们有一个共同的表型特征,即在稳定态周围加深了潜能井,使基因表达稳定性提高到最佳基因表达水平附近。

为了检验维持双稳态性状以提高基因表达稳定性是否是一种通用的策略,与底层基因回路模型的具体结构无关,研究人员使用了一个基于高斯分布的更通用的模型。这个抽象模型代表了一个使用高斯分布的单稳态基因表达过程和一个使用两个高斯分布混合的双稳态基因表达过程。单稳态和双稳态过程之间的过渡使用高斯宽度建模。在进化模拟中,研究人员将每个基因表达模型的稳定状态固定在一个比较接近稳定化选择下的最优状态的水平,基因表达稳定性的变化由高斯宽度值的变化来表示。研究人员在不同的设置下演化了单稳态和双稳态创始人的克隆种群。在所有的模拟设置中,一致观察到高斯宽度随着种群的进化逐渐减小。当创始种群由单稳态个体组成时,单稳态性状被保持,较低的高斯宽度在进化过程中被选择并保持。同样,当创始种群由双稳态个体组成时,双稳态性状得到维持,并且在进化过程中进化出较高的基因表达稳定性水平。

4

讨论

研究人员的研究结果表明,高水平的基因表达稳定性在稳定化选择下进行进化,为了获得这种表型特征,根据创始种群的基因型特征采取不同的进化策略。在由单稳态个体组成的种群中,进化偏向于单稳态基因型,在稳定态周围加深势井。相反,在具有双稳态个体的群体中,进化的方向是提高分离双稳态势井的势垒,增加高表达稳定态周围的稳定性。在研究人员的进化模拟下,从双稳态到单稳态的复归过程被选择反对,因为这样的移动将不可避免地降低基因表达稳定性暂时过渡。作为获得高水平的基因表达稳定性的的方法,因此,保持复杂的分子机制,以具有双稳态提供了一个更好的和更简单的解决方案。这些结果证明了一个可信的进化方案,其中一个宽型种群可以在长期的环境静止期间稳定地保持开关机制。也就是说,在波动选择中作为对选择压力的反应而诱导的低阈值开关可以逐渐进化为建立高阈值开关,以缓冲基因表达变异性,从而持续产生适应给定静态环境的表达水平。

有证据支持,由隐性开关机制促进的高水平基因表达稳定性在发育过程中起着至关重要的作用,这包括酵母半乳糖信号网络和Xenopus卵母细胞成熟决定网络的正常工作。最近,Raj等人观察到野生型Caenorhabditis elegans肠道发育回路中的一些突变导致了细胞命运决定的高度随机性,一些突变胚胎不能发育出肠道细胞。他们发现,肠道分化的主调控因子elt-2通过其基于反馈的双稳态调控的激活对肠道的正常分化至关重要,该网络中上游基因的突变会增加elt-2的表达变异性,导致发育异常。研究结果表明,在自然选择下,一些这样的隐性开关可能已经被维持,以促进更高的表型稳定性。

虽然结果表明,高水平的基因表达稳定性在静态环境中是有利的,但进化后的稳定性水平清楚地表明存在一个上限。由于研究人员的基因回路模型捕捉了基因表达过程的内在波动以及基因表达变异性的其他来源,研究人员在古种群和衍生种群中观察到的基因表达稳定性的高原可能反映了包含基因表达噪声的基本极限。虽然这个极限的水平取决于基因调控过程的具体结构,但一个适用于所有生物系统的重要约束条件是,某种程度的内在波动的变异性总是不可避免的,而进化将处理这种物理约束。研究人员的结果表明,当平均表达水平接近最优时,基因表达稳定性的提高是有利的,并且在自然选择下是正向选择的。这与之前的一项研究并不矛盾,该研究考虑了基因平均表达水平被设定为固定且远离最优水平的进化情况,得出的结论是,较高的基因表达噪声水平在稳定化选择下是有利的,是被选择的。也就是说,研究人员的研究关注的是允许基因表达过程通过模型参数的有利突变转移来调整其平均表达水平的进化。研究人员的模拟中,如果当前的基因表达水平与最优水平相去甚远,进化可以简单地选择突变体,使基因表达水平在静态环境中向最优水平靠近。因此,研究人员的关注点更多的是在平均表达水平接近最优水平时,基因表达稳定性的进化。这些差异可以大大改变基因表达稳定性的效果。事实上,最近在酵母中的实验研究证实,基因表达噪声对适应性的影响取决于平均蛋白丰度水平与最优丰度水平之间的距离,当平均蛋白水平远离最优水平时,较高的噪声水平是有利的,而当平均蛋白水平接近最优水平时,较低的噪声水平是有利的。

研究人员发现,表达高阈值双稳态表型的基因型与低阈值表型的基因型非常相似。因此,“隐藏的”双稳态开关稳定地维持在一个种群中,以缓冲静态环境中的基因表达变异性,可以通过相对较小的遗传漂移重新激活,以极大地改变基因表达谱,并释放隐蔽的表型。这种表型的切换可能在揭开隐性遗传变异、促进适应性新事物的进化中起到至关重要的作用。1942年,Waddington用 "canalization "一词来描述一般的观察,即自然选择的生物体在发育过程中不管条件的微小变化,都会产生一种确定的最终产品。虽然在他的运河化模型中没有考虑随机基因表达,但最近基于单细胞实验方法的研究表明,在野生型中控制基因表达噪声的能力对发育程序的恒定性和表型的完全通透性至关重要。因此,基因表达噪声的调控对于潜在变异的缓冲和离散表型的发育管化至关重要。研究人员的研究表明,这种扩展的运河化观点可以解释隐藏阈值性状从随机开关性状的进化,以及高阈值双稳态开关在静态环境中自然选择的生物体中的稳定维持。

参考资料

Kuwahara, H., Gao, X. Stable maintenance of hidden switches as a strategy to increase the gene expression stability. Nat Comput Sci 1, 62–70 (2021).

https://doi.org/10.1038/s43588-020-00001-y

0 人点赞