通量平衡分析是基于约束的
FBA的第一步是用数学方法表示代谢反应。这种表示的核心特征是以数值矩阵的形式列出每个反应的化学计量系数。这些化学计量对代谢物通过网络的流动施加了限制。诸如此类的限制是FBA的核心。
约束以两种方式表示,作为平衡反应输入和输出的方程,以及作为对系统施加边界的不等式。化学计量矩阵对系统施加了通量(即质量)平衡约束,确保生成的任何化合物的总量必须等于稳定状态下消耗的总量(图1c)。每个反应也可以给出上界和下界,它定义了反应的最大和最小允许通量。这些平衡和边界定义了一个系统允许通量分布的空间,也就是说,每个反应消耗或产生每种代谢物的速率。还可以添加其他约束条件。
图1
(a)首先,构建一个代谢网络重构,由一系列化学计量平衡的生化反应组成。(b)接下来,通过形成矩阵(标记为S)将该重构转换为数学模型,其中每一行代表一种代谢物,每一列代表一种反应。(c)在稳定状态下,每个反应的通量由方程Sv = 0给出。因为在大型模型中,反应比代谢物多,所以这个方程有不止一个可能的解。(d)目标函数定义为Z = c Tv,其中c是权重向量(表示每种反应对目标函数的贡献)。在实践中,当只有一个反应需要最大化或最小化时,c是一个0向量,在感兴趣的反应位置有一个1。在模拟生长时,目标函数在生物质反应的位置有一个1。(e)最后,在观察质量平衡方程和反应界所施加的约束时,可使用线性规划来确定使该目标函数最大化或最小化的特定通量分布。
图2
从约束到优化表型
FBA的下一步是定义与正在研究的问题相关的生物学目标(图1d)。在预测生长的情况下,目标是生物量产量,即代谢化合物转化为生物量成分(如核酸、蛋白质和脂质)的速度。数学上,目标是用“目标函数”来表示的,它表明每个反应对表现型的贡献程度。通过目标函数选择一种“生物质反应”,即从系统中以其相对化学计量量排出前体代谢物以模拟生物质生产,以预测生长速率。该反应经过缩放,使通过该反应的通量等于生物体的指数增长率(µ)。
总的来说,代谢反应和表型的数学表示定义了一个线性方程系统。在通量平衡分析中,这些方程用线性规划求解。存在许多计算线性规划算法,它们可以非常快速地识别大型方程组的最优解。COBRA工具箱是一个免费的Matlab工具箱,用于执行这些计算(工具箱2)。
在生长的例子中,假设我们对大肠杆菌的有氧生长感兴趣,假设葡萄糖的摄取,而不是氧气,是生长的限制条件。这包括将最大葡萄糖摄取速率限制在生理上实际的水平(例如18.5 mmol葡萄糖gDW−1 hr−1),并将最大氧气摄取速率设置为不切实际的高水平,这样就不会限制生长。然后,使用线性规划来确定通过代谢网络的通量,使增长率最大化,从而预测指数增长率为1.65 hr−1。(参见计算机代码补充教程)。
大肠杆菌的厌氧生长可以通过限制最大吸氧速率为零并求解方程组来计算,结果预测生长速率为0.47 hr−1。研究表明,这些预测的好氧和厌氧生长速率与实验测量结果非常吻合。
虽然生长很容易通过实验测量,但通量平衡分析等计算方法在预测代谢反应通量和模拟不同基质或遗传操作上的生长方面发挥了重要作用。FBA不需要动力学参数,即使对于大型网络也可以非常快速地计算,因此它可以应用于表征许多不同扰动的研究。补充例6中给出了这种情况的一个示例,该示例探讨了删除136个大肠杆菌基因的每一对组合以找到对细菌生存至关重要的双基因敲除对生长的影响。
然而,FBA也有局限性。因为它不使用动力学参数,它不能预测代谢物浓度。它也只适用于稳态通量的测定。除了一些修改过的形式外,FBA没有考虑到诸如蛋白激酶激活酶或基因表达调节等调节作用,因此它的预测可能并不总是准确的。
通量平衡分析的许多用途
由于通量平衡分析的基本原理很简单,该方法在生理学研究、填补空白的努力和基因组规模的合成生物学中有多种用途。通过改变某些反应的界限,可以模拟不同培养基(补充实施例1)或多个基因敲除(补充实施例6)上的生长。然后,FBA可用于预测重要辅因子如ATP、NADH或NADPH13的产率(补充示例2)。
虽然这里描述的例子产生了单一的最佳生长表型,但在大型代谢网络中,通常可能有不止一种解决方案导致相同的理想最佳生长速率。例如,一个生物体可能有两个产生相同数量ATP的冗余途径,因此当最大ATP产量是期望的表型时,任何一条途径都可以使用。这种替代的最优解可以通过通量可变性分析来确定,这种方法使用FBA来最大化和最小化网络中的每个反应 (补充示例3),或者使用基于混合整数线性规划的算法。可以进行更详细的表型研究,如稳健性分,其中可以分析改变特定反应通量对目标函数的影响(补充示例4)。更高级的稳健性分析形式涉及同时改变两种通量以形成表型相平面 (补充示例5)。
所有基因组规模的代谢重建都是不完整的,因为它们包含“知识空白”,其中没有反应。FBA是几种算法的基础,这些算法通过比较硅生长模拟和实验结果来预测哪些反应缺失。基于约束的模型也可用于代谢工程,其中基于FBA的算法,如OptKnock20,可以预测基因敲除,从而使生物体产生所需的化合物。
工具箱1:新陈代谢的数学表示
代谢反应用大小为m*n的化学计量矩阵(S)表示。这个矩阵的每一行代表一个独特的化合物(对于一个有m个化合物的系统),每一列代表一个反应(n个反应)。每一列的条目是参与反应的代谢物的化学计量系数。每一种消耗的代谢物都有一个负系数,每一种产生的代谢物都有一个正系数。对于不参与某一特定反应的每一代谢物,化学计量系数均为零。S是一个稀疏矩阵,因为大多数生化反应只涉及几种不同的代谢物。网络中所有反应的通量用向量v表示,其长度为n。所有代谢物的浓度用向量x表示,长度为m。稳态(dx/dt = 0)时的质量平衡方程组如图1c所示。
任何满足这个方程的v都在s的零空间中。在任何现实的大规模代谢模型中,反应比化合物多(n > m),换句话说,未知变量比方程多,所以这个方程组不存在唯一解。
尽管约束定义了一系列的解决方案,但是仍然可以识别和分析解决方案空间中的单个点。例如,我们可能有兴趣确定哪个点对应于生物体的最大生长速率或最大ATP产量,给定其特定的限制条件。FBA是在受限空间中识别此类最优点的一种方法(图2)。
FBA寻求最大化或最小化目标函数Z = c Tv,它可以是通量的任何线性组合,其中c是权重向量,表示每个反应(例如模拟最大生长时的生物质反应)对目标函数的贡献。在实践中,当只需要一个反应来实现最大化或最小化时,c是一个0向量,在感兴趣的反应位置为1(图1d)。
这种系统的优化是通过线性规划完成的(图1e)。因此,FBA可以定义为在给定v的一组上界和下界以及以通量的线性组合为目标函数的情况下,利用线性规划求解方程Sv = 0。FBA的输出是一个特定的通量分布v,它使目标函数最大化或最小化。
工具箱2:通量平衡分析工具
FBA计算属于基于约束的重建和分析(COBRA)方法的范畴,可以使用几种可用的工具进行。COBRA工具箱是一个免费的Matlab工具箱(http://systemsbiology.ucsd.edu/Downloads/Cobra_Toolbox),可用于执行各种COBRA方法,包括许多基于fba的方法。COBRA工具箱的模型以系统生物学标记语言(SBML)格式保存,可以用readCbModel函数加载。本引物中使用的大肠杆菌核心模型包含在工具箱中。
在Matlab中,模型是带有字段的结构,例如' rxns '(所有反应名称列表),' mets '(所有代谢物名称列表)和' S '(化学计量矩阵)。函数“optimizeCbModel”用于执行FBA。要改变反应的边界,使用函数changeRxnBounds。补充教程包含执行FBA的COBRA工具箱代码示例。