减少 大肠杆菌 基因组尺度模型 本节旨在证明我们的 NetworkReducer(网络缩减器) 算法使用了一个实际的应用示例。 网络简化问题的典型场景如下:给定一个具有数千个反应的基因组级代谢网络,目标是将该网络简化为一个核心网络(约有80–150个用户定义的反应),通常是中心代谢, 同时保持虚拟生物体生长或/和产生特定代谢物的能力。 作为基因组规模网络的来源,我们使用 我 AF1260型号 大肠杆菌 Feist等人[ 7 ]它包含2382个反应和1668个代谢产物,是最常用的代谢网络模型之一。 我们将网络缩减程序的结果与 大肠杆菌 Orth等人提出的岩芯模型[ 12 ]. 后一种模型,如下所示 大肠杆菌核心 ,涵盖了 大肠杆菌。 它包含95个反应和72个内部代谢物,由Orth等人用手工推导得出 我 AF1260作为起点。 因此, 大肠杆菌核心 和 我 AF1260对代谢物和反应使用相同的标识符。
我们考虑了由包含在 大肠杆菌核心 模型作为网络缩减要达到的“目标网络” 我 AF1260.在我们开始还原过程之前,必须进行一些小的调整,以使两种模型保持一致。 第一, 大肠杆菌核心 使用富马酸还原酶反应与泛喹啉-8作为氧化还原载体 我 AF1260),我们还将此反应添加到 我 AF1260允许在还原过程中保护此反应。 此外,我们在基因组模型中引入了代谢物“生物量”,将其作为化学计量系数为1[gram]的产物整合到生物量合成反应中,然后添加一个反应以“导出”该生物量化合物。 这种配置使得更容易将生物质合成配置为受保护的功能,并在网络压缩期间跟踪生物质化合物的化学计量系数。 基因组规模模型的最终化学计量矩阵(以下表示为 科利格斯 )因此略微扩展到2384 x 1669。 中的通量约束 科利格斯 模型被指定为葡萄糖作为唯一的碳底物。
这个 大肠杆菌核心 该模型包含葡萄糖和其他底物(包括一些氨基酸)的摄取反应。 由于我们的目标是将葡萄糖作为唯一的碳底物,我们从 大肠杆菌核心 参与这些底物吸收的模型。 类似于 大肠杆菌属 模型中,我们还包括生物质合成反应中的生物质代谢产物和相应的“生物质输出”反应。 通过这些更改 大肠杆菌核心 模型为88个反应和69个内部代谢产物。 的关键属性 科利格斯 和 大肠杆菌核心 表中总结了 1 .
表1的属性 大肠杆菌 本文中讨论的网络模型。 科利格斯 和 大肠杆菌核心 是稍微修改过的版本 我 AF1260型[ 7 ]和中所示模型的[ 12 ]分别是。 所有型号均以SBML格式提供,网址为 http://www2.mpi-magdeburg.mpg.de/projects/cna/etcdownloads.html
经过这些初步步骤后 科利格斯 网络无法启动。 将保留在简化模型中的基因组规模模型的表型和元素规定如下。 所有88个反应 大肠杆菌核心 模型被标记为保护反应( P(P)
R(右) )在中 科利格斯 模型,我们还要求所有这些反应在简化的网络中都是可行的(畅通的)。由于参与这些反应的所有代谢物都受到了隐含的保护,我们没有明确指定受保护的代谢物( P(P)
M(M) = ∅ ). 关于受保护的表型,我们要求(i)至少99.9%的最大生长速率(0.9290小时 −1 ; 表 1 )在中 科利格斯 有氧条件下的模型和(ii)至少99.9%的最大生长速率 大肠杆菌属 厌氧条件下的模型(0.2309h −1 )应能在简化网络中达到(见方程式( 6 )和( 7 )). 如方法部分所述,最大葡萄糖摄取率设置为10 mmol/gDW/h,最小ATP维持需求设置为8.39 mmol/gDW/h。最后, 自由度
最小值
和 n个
最小值
都设置为1,因此,我们的目标是尽可能减少网络,同时保持受保护的反应和表型。
在后处理中不应用网络压缩的网络简化(仅修剪)产生了简化的网络模型( 科利普鲁内德 )这已经将基因组规模网络的维数从2384个反应/1669个内部代谢产物降低到455个反应/438个内部代谢物。 根据要求 科利普鲁内德 与基因组模型中各自的最大速率相同(厌氧)或非常接近(需氧)。 这个 自由度 属于 科利普鲁内德 (26)明显小于in 科利格斯 (753)并且已经接近 自由度 属于 大肠杆菌核心 (24)表示解空间的类似复杂性 科利普鲁内德 和 大肠杆菌核心 。尽管如此 科利普鲁内德 仍然包含400多个反应,这个网络的(1410332)基本模式可以完全列举出来。
的结构 科利普鲁内德 网络类似于图中所示的第二个网络 1 :在保留(受保护的)核心子网络的同时,许多通往生物质成分的冗余(和次优)路径已被删除。 如方法部分所述,从中央代谢到生物量组分的剩余线性路径可以进一步压缩为单一(集总)反应,而不会丢失信息(即,不会丢失溶液或表型)。 将网络压缩例程(考虑到受保护的反应)应用于 科利普鲁内德 生成完全简化的网络 大肠杆菌群 ,其结构现在类似于 大肠杆菌核心 并且类似于图中所示的第三网络 1 . 大肠杆菌群 (105个反应)比 科利普鲁内德 (455个反应),而 自由度 也没有改变基本模式的数量和可能的表型。 尺寸 大肠杆菌群 现在非常类似于 大肠杆菌核心 (参见表中的属性 1 )然而,我们仍然详细分析了一些差异。
大肠杆菌群 比含有更多17个反应和16个内部代谢物 大肠杆菌核心 由于交换反应的不同描述,这些额外元素中有很大一部分(15个反应和15个代谢物)产生。 这个 大肠杆菌核心 考虑代谢产物平衡的两个隔间(细胞质和细胞外空间)和(隐含的)环境。 因此,需要3个反应和3个平衡物种来描述代谢物M(M 环境 ➔ M(M) 细胞外间隙 ➔ M(M) 细胞质 )在中 大肠杆菌核心 模型(类似于导出)。 相反, 科利格斯 另外还包含一个周质室,因此,交换代谢物M的摄取涉及4个交换反应和4个物种(M 环境 ➔ M(M) 细胞外间隙 ➔ M(M) 周质 ➔ M(M) 细胞质 ). 由于15种代谢物可以在 大肠杆菌核心 ,15个额外的物种和反应(周质空间)必须保持在 大肠杆菌群 模型; 它们也不能被压缩,因为它们被受保护的反应所包围。
另一个观察结果是,基因组规模网络及其衍生的简化模型允许比 大肠杆菌核心 我们确定了两个原因。 首先,生物质合成的不同化学计量可能导致不同的生物质产量(下文讨论)。 其次,我们发现 科利格斯 模型不包含在 大肠杆菌核心 模型允许更高的最大增长率; 这些反应由剪枝算法保持,以保持最大生长的受保护表型 大肠杆菌群 模型(事实上,这两个反应解释了 自由度 在里面 大肠杆菌群 与相比 大肠杆菌核心 ). 这两个反应中的第一个与制氢有关,而制氢是获得最大厌氧生长速率所必需的。 第二种反应与呼吸途径有关。 这个 科利格斯 模型包含两种细胞色素氧化酶(细胞色素 bd公司 和细胞色素 博
三 氧化酶)。 二者都能氧化泛喹啉,但易位(泵送)质子的化学计量比不同:
$$2\{H}^{+}+0.5\ {O} _2 + {Q} _8个 {H} _2 = {H} _2O型 +2\ {高}_ {周质}^{+}+ {Q} _8个 $$
(8)
$$4\{H}^{+}+0.5\ {O} _2 + {Q} _8个 {H} _2 = {H} _2O型 +4\ {高}_ {周质}^{+}+ {Q} _8个 $$
(9)
显然,第二个反应( 9 )在呼吸过程中会产生较高的ATP产量,因此在有氧条件下会有较高的生长速率。 相比之下 大肠杆菌核心 模型只包含反应( 8 )转运两个质子,同时ATP和生物量产量较低。 此反应(作为 大肠杆菌核心 )减少时受到保护 科利格斯 然而,为了实现最大的增长,第二个反应也必须保持在 大肠杆菌群 事实上,反应的积分( 9 )在中 大肠杆菌核心 模型将最大生长速率提高到0.9647h −1 甚至比 μ
最大值
属于 大肠杆菌群 (和 科利格斯 ).
这些剩余的差异可归因于生物量合成反应(BSR)中不同的化学计量系数 大肠杆菌核心 和 大肠杆菌群 .对于以下情况 大肠杆菌核心 ,BSR中前体代谢物(如丙酮酸、乙酰辅酶A等)的化学计量系数必须根据基因组BSR中单体(氨基酸、核苷酸、脂肪酸等)的已知需求手动计算。因此,Orth等人写道[ 12 ]: “ 由于细胞大分子的大多数亚单位,如核酸和氨基酸,在核心模型中不存在,因此不能直接解释生物量反应。 这些大分子亚基合成的核心模型中的代谢物被包括在内。 这些是前体代谢物。 例如,氨基酸L-丙氨酸是由丙酮酸和L-谷氨酸合成的,因此这两种代谢物都是在生物质反应中消耗的 .”
因此,基因组级BSR中包含的氨基酸等分子必须转化为简化模型中存在的化合物的化学计量需求。 在基因组规模的模型中手动进行这种翻译是一项容易出错且乏味的任务,也是一种自动化的方法,因为我们的方法支持这一步骤,并提供了一种严格的方法来在压缩网络中获得与完整模型的BSR一致的BSR。 我们直接比较了 大肠杆菌核心 和 大肠杆菌群 以识别和理解不同化学计量的可能来源。
表 2 显示了BSR中代谢物的化学计量系数 大肠杆菌核心 和 大肠杆菌群 模型(所有模型的BSR都可以在 附录 ) . 乍一看,我们可以看到 大肠杆菌核心 也出现在的BSR中 大肠杆菌群 在许多情况下,金额相当。
表2生物量合成反应中代谢物的化学计量 大肠杆菌核心 以及 大肠杆菌群 网络模型。 负值表示消耗,正值表示生物质合成期间的生产
一个主要区别是 大肠杆菌群 含有许多外部代谢物,特别是钙、硫酸盐、钴、铜、镁等微量元素 科利格斯 网络中,微量元素被细胞吸收,产生这些元素的细胞内代表,然后在基因组模型中被BSR消耗。 生物量的这些基本成分保存在 大肠杆菌群 然而,网络压缩迫使该模型通过将所需数量的外部微量元素直接集成到BSR中,将微量元素摄取和消耗的两个步骤压缩为一个步骤 大肠杆菌群 尽管这些外部代谢物不会改变可行的网络行为(原则上可以从BSR中删除),但我们算法的一个优点是,这些浓缩物质平衡是自动计算的,并且在简化模型中仍然可见。 注意,凝聚BSR中消耗的周质质子(H_p)的(累积)量 大肠杆菌群 与微量元素的反转运吸收有关。
由于参考点不同,前体化学计量的非独特表示方式可能会导致BSR的进一步差异。 例如, 大肠杆菌核心 使用3-磷酸甘油醛(G3P)作为前体(−0.129),而 大肠杆菌群 使用类似量(−0.141)的二羟基丙酮-磷酸。 由于这两种代谢产物都可以通过三糖异构酶反应转化为彼此,因此这两种代谢产物实际上都可以用作前体。 5-磷酸核糖(R5P)和5-磷酸核糖核糖(Ru5P)也存在类似的关系。 Ru5P仅出现在 大肠杆菌群 但是,由于两种代谢物之间的简单异构酶反应,也可以整合到两种BSR中消耗的R5P的值中。
尽管存在这些可解释的差异 大肠杆菌核心 似乎略微低估了对大多数前体的需求,在更大程度上,还低估了对能源(ATP)的需求。 另一方面,核心模型消耗了大量NADPH和NADH,在最终平衡和生物产量中,这可以部分补偿对某些前体的较低需求。 如上所述,我们是否可以添加高效氧化酶反应( 9 )在中 大肠杆菌核心 模型,生长速率(0.9647 h −1 )将略高于 大肠杆菌群 模型(0.9288小时 −1 ). 我们强调,我们不主张 大肠杆菌群 必须比BSR“更好”或更现实 大肠杆菌核心 中的模型[ 12 ]. 作者可能在计算BSR时使用了一些特定假设 大肠杆菌核心 该模型可能导致与本文计算的浓缩BSR不一致。 尽管如此,使用 NetworkReducer网络还原器 算法与完整模型一致,并允许进行定量比较。 因此,我们的算法有助于从简化网络模型的基因组规模表示中对浓缩BSR化学计量进行无偏和可重复的计算。
为了进一步测试 大肠杆菌群 我们对三种不同的生长场景进行了通量变异分析,并将结果与原始基因组规模模型进行了比较(参见附加文件 1 ). 我们发现通量范围非常一致 大肠杆菌群 和 科利格斯 虽然通量的趋势在 大肠杆菌核心 和 科利格斯 也有相似之处,可以观察到几个较大的差异。
将蓝藻基因组规模模型简化为模块 在第二个案例研究中,我们使用了光养蓝藻的基因组模型 协同孢子虫 sp.PCC 6803和应用 NetworkReducer(网络缩减器) 以获得描述CO的小型代谢核心模块 2 通过卡尔文·本森循环进行详细固定,可以合成生物质和生物燃料(乙醇)。 这种高度简化的模型可能有助于研究基本原理和化学计量学,例如,生物量和生物燃料的耦合合成(参见[ 13 ]). Knoop等人的基因组规模模型[ 19 ](Erdrich等人使用的变体[ 13 ])作为起点。 异养(夜间)代谢被忽略,我们再次将生物量作为内部物种添加,并为其输出添加相应的伪运输反应。 经过这些小的调整后,整个模型包含599个反应和519个内部代谢物(96个自由度;参见附加文件 2 ).
由于目标是提取代表卡尔文循环的网络模块,并实现最大光营养生长和最大乙醇产量,因此我们保护了卡尔文循环、乙醇途径、生物量和乙醇排泄以及光吸收的所有反应(总共26个反应;见附加文件 2 ). 这两种受保护的表型由
$$\开始{array}{c} {右}_ {照片 {无}_ {up}}\le100\\{}-\mu\le-0.999{\mu}{max},\end{array}$$
代表最大光营养生长( μ
最大值 是光子吸收100 mmol/gDW/h的最大增长率),以及
$$\开始{array}{c} {右}_ {照片 {无}_ {向上}}\le 100 \\{}- {右}_ {乙醇}\le-0.999 {右}_ {\max乙醇}\end{array}$$
最大乙醇产量( 第页
max乙醇 是光子吸收100 mmol/gDW/h时的最大乙醇生成速率)。
正如预期和期望的那样,由于将重点放在较小的子网络上,简化模型(修剪和压缩)的维数比 大肠杆菌 核心模型,包含37个反应和38个内部代谢产物。 化学计量矩阵的秩为33,表示剩余四个自由度。 简化模型产生了10种基本模式,不仅再现了纯生物质或乙醇合成的受保护功能,还再现了生长耦合乙醇生产(附加文件 2 ). 浓缩生物质合成反应从构建生物质所需的卡尔文循环模块中提取代谢物(前体、ATP、NADPH)。 因为只有“正常”前体的子集是简化模型的一部分(例如,TCA的反应和代谢物完全缺失) 简化模型BSR中前体的各自化学计量系数相对较大,因为它们不仅需要作为BSR的直接前体,而且还需要作为生产其他前体的起点。 再一次, NetworkReducer(网络缩减器) 确保简化模型的BSR与基因组规模模型的BSR一致,从而产生相同的最大生长速率和生物产量。