所有肿瘤都有一个不受控制的细胞增殖的共同表型。为了支持生物质能成分的合成和产生细胞生长、癌细胞所需的能量必须重塑其代谢网络的调节和功能特性。80多年之前,奥托·沃伯格1确定了从氧化-发酵代谢是肿瘤细胞的一种常见生理特性。在此之后对癌症代谢的早期见解,癌症研究的主要焦点通常转向不同肿瘤的信号转导、基因调控和基因扰动分析2,三然而,最近,人们对癌症新陈代谢的兴趣重新抬头4-6.促成这一点的一个重要因素《复兴》指出,癌症中许多信号通路的改变是人类代谢网络5。此外癌症代谢靶点的治疗潜力也被重新发现7,8.
利用大量基因表达谱概要过去十年的积累9,10在本研究中,我们全面分析了肿瘤诱导的mRNA变化人类代谢基因在22种不同癌症类型中的表达。尽量减少混淆组织培养条件可能引起的代谢适应,我们只分析了微阵列数据来自原发性肿瘤的活检。我们比较了肿瘤和在生物化学组织的几个概念层次上对应的正常组织:在全球网络层次,在单个生化途径层次和单个酶层次反应。关注人类代谢网络并分析大量肿瘤和正常样本使我们获得了统计能力,并为许多以前没有报道过的表达模式。
结果
代谢基因表达的全球变化
为了了解代谢基因在不同癌症中的表达,我们组装了一个全面收集了跨越22种不同肿瘤类型的2500多个微阵列测量结果(在线方法和补充表1).虽然我们只分析了使用最全面的人类表情获得的表情数据阵列平台(HG U133 Plus 2.0;补充的表2)、对独立研究获得的相同肿瘤类型的数据进行比较,以及使用不同的微阵列平台(补充的表3)表现出表达变化的高度相关性(平均斯皮尔曼等级相关系数=0.63),确认观察到的表达模式的普遍性(参见补充图1).
使用汇编的表达式概要,我们首先研究了不同肿瘤及其相应正常组织的代谢基因表达组织。在这项分析中,我们使用了1421个分配给KEGG代谢途径的人类基因数据库11.使用两种不同的测量方法一对表达式配置文件之间的分歧12,欧氏距离和相关距离(在线方法),我们比较了肿瘤与正常组织的整体表达模式(补充表2). 为了说明由于实验室条件和测量的变化而产生的批量效应,估计批贡献量从中测量的表达谱之间的表达距离中减去不同的研究(在线方法)。
对于以下两个指标,分布之间的相对差异是一致的表达式发散(和补充图2). 表达式距离在肿瘤和相应的正常组织之间(肿瘤n个-正常n个)明显更大而不是同一正常组织不同样本之间的距离(正常n个-正常n个; Mann-Whitney U试验P值=10−8;)或在不同之间相同肿瘤(肿瘤n个-肿瘤n个;P值=4*10−7). 距离肿瘤n个-正常n个然而,这是非常重要的小于不同肿瘤之间的距离(肿瘤n个-肿瘤米; P值=2*10−7)而这又大大小于不同的正常组织(正常n个-正常米;P值<2*10−16). 两个不同的表达式之间的平均距离肿瘤约占两个不同正常组织之间平均距离的82%,而肿瘤与相应正常组织之间的距离约为肿瘤与正常组织之间距离的63%两种不同的正常组织。因此,尽管代谢表达模式不同肿瘤变得比相应的正常组织更相似,一般的代谢表达原始组织的程序大多保留在肿瘤中。
肿瘤和正常组织之间代谢基因表达的全球差异。颜色表示不同样本之间欧氏(RMSD)表达式距离的分布相同的正常组织(正常n个-正常n个,品红色),相同肿瘤的不同样本(肿瘤n个-肿瘤n个、青色)、肿瘤和相应的正常组织(肿瘤n个-正常n个,蓝色),不同肿瘤(肿瘤n个-肿瘤米,绿色),以及不同的正常组织(正常n个-正常米,红色)。这个图中显示的分布仅用于显示目的。插图总结了成对组织之间的平均距离占两个组织之间平均距离的百分比不同的正常组织。
个体生化途径的表达变化
接下来我们分析了与个别生化途径相关的表达变化在KEGG数据库中定义11(请参见补充表5路径信息和编号)。为了确定每个代谢途径上调和下调的模式,我们确定其在肿瘤样本中的表达变化相对于使用Wilcoxon符号秩检验的相应正常样本,经多重假设调整测试(在线方法)。基于此分析,我们计算了肿瘤样本的平均比例其中每个代谢途径显著上调(FDR-校正P值<0.05)并下调跨越22种癌症类型().为了评估观察到的通路行为的统计意义,我们计算了零的分布()和()代谢途径的值在并证明了观察到的模式的统计意义(在线方法和补充图3). 这个KEGG通路观察到的一般表达模式与使用BioCyc途径定义13(补充图4a;补充表6),表明了稳健性关于替代途径定义的结果。
肿瘤中个体代谢途径的表达。在KEGG数据库(参见补充表5路径编号)显示在(,水平轴)和(,垂直轴),其中是路径所在的肿瘤样本的平均分数显著上调,以及是路径显著的平均分数下调。平均值和计算了所有22个肿瘤。向上(向下)调节采用Wilcoxon符号秩检验确定显著性(FDR校正的P值<0.05,看见补充图4b为了同样的目的FDR=0.2的分析)。使用不同的颜色高亮显示几个路径。虚线划定区域小于20%和仅用于可视化目的。代谢途径没有明显表达变化的主要聚集在图的左侧。路径通常显著上调(高值)占据右上角的位置,而路径主要是下调(高值)占据右下角的位置。高度异质性通路显示,在不同的肿瘤中,显著的上调和下调都是在垂直轴上靠近零的右侧聚集。
正如预期的那样,负责生产至关重要的生物质成分的途径对于细胞分裂,如嘧啶(18)和嘌呤(16)的生物合成在许多肿瘤样本中上调(). 连同这些在两种途径中,糖酵解(86)在许多样本中也显著上调,这与肿瘤中常见的葡萄糖摄取增强14。其他表现出频繁和显著上调的途径包括与蛋白质合成(氨酰-tRNA生物合成(81))和糖蛋白相关的途径生物合成(N-聚糖生物合成(40))。在肿瘤样本中上述途径没有显著改变,整体代谢基因表达主要是下调或无明显变化。具体来说,72%的84%的肿瘤标本糖酵解途径表达无明显变化嘌呤生物合成途径表达无变化,88%的肿瘤样本无变化嘧啶生物合成途径表达的变化。整体的下调代谢基因表达在来源于人类组织的肿瘤中很常见代谢功能(见下面的主成分分析)。
与生物合成途径相反,负责降解必需氨基酸(缬氨酸、亮氨酸和异亮氨酸降解(22))、辅因子(视黄醇代谢(75)和脂肪酸(9)经常显著下调。有趣的是,两种代谢途径在不同的肿瘤是外源性(82)和药物(83)代谢。这些流程负责对细胞正常生物化学外来化合物的解毒和处理。几个以前的研究表明,细胞色素P450基因的多态性与癌症相关不同类型癌症的易感性,包括肺、膀胱和乳房15,16尽管外源性途径表达减少的具体原因在需要进一步研究的癌症中,这种下调可能有助于肿瘤细胞对化疗的敏感性增加。
氧化磷酸化(15)和TCA循环(1)的异质行为路径也值得注意(). 有趣的是,氧化磷酸化是所有代谢途径中最异质的行为。在参与氧化磷酸化的脑、结肠、肾脏、胰腺和甲状腺癌基因显著下调,而在乳腺癌、白血病、肺癌、淋巴瘤和卵巢癌中基因显著上调(补充表7). 这种模式表明氧化磷酸化的作用是并非所有肿瘤都通用,但可能反映了不同癌症对组织特异性生理条件,如缺氧、营养物质可用性或补体导致特定肿瘤类型的遗传病变。
我们还探索了不同代谢途径表达的异质性相同(或类似)肿瘤类型的样本。此类分析(在线方法和补充图5)表明氧化作用磷酸化基因的表达不仅在不同的肿瘤类型之间是异质的,而且同一肿瘤的不同样本之间经常存在差异。这一观察表明氧化磷酸化不仅受不同环境的可变性影响肿瘤类型,还取决于特定的生理条件和/或基因组成每个癌症患者的单个肿瘤。相反,其他代谢途径表现出类似的情况同一肿瘤不同样本的表达模式。
代谢途径与信号基因的相关性
接下来我们研究了代谢途径的表达与信号和调节基因的表达经常参与肿瘤的发生。尽管有几个以前的研究17证明了相关性表达模式通常不能等同于调节因果关系,即一个基因在另一方的调节下,显著的相关性仍然可以揭示重要的功能关系。为了评估表达相关性,我们使用了关联性的上下文可能性(CLR)方法18,基于相互表达模式和对照之间的信息,以确定每个发现的关系的特异性(在线方法),以确定重要的交互作用(Z-score>2.0,补充表8)在214之间KEGG信号/癌症途径中注释的非代谢基因(补充表9)以及87种代谢产物我们分析中考虑的路径;CLR确定的重要关系表明相应基因和通路的表达模式之间的信息。
CLR分析揭示了几个有趣的关系。氧化磷酸化途径与缺氧诱导因子(HIF1A)具有高度的相互信息其负调节器RBX1。值得注意的是,氧化磷酸化的表达是反相关的与HIF1A的表达相关,并与RBX1的表达相关。观察到的氧化磷酸化和HIF1A之间的反相关性表明氧化磷酸化基因的表达()是可能受肿瘤氧利用率的影响。此外HIF1A和糖酵解不高,可能是因为HIF1A参与了尽管许多肿瘤表现出强烈的氧化性表达,但糖酵解是在缺氧条件下进行的磷酸化,可能不缺氧。相反,在糖酵解和CDC42,细胞周期进展所必需的基因。糖酵解作用也很强与RAS和MAPK通路基因的表达相关与促进有氧糖酵解有关19.除了糖酵解,CDC42的表达也与其他途径有高度的相互信息对细胞快速生长至关重要(如嘌呤、嘧啶和氨基酸生物合成)。打开另一方面,CDC42的表达与氧化磷酸化的表达无关,提示在快速生长的肿瘤细胞中,葡萄糖发酵占主导地位。这一观察结果同意主成分分析结果如下所述。
通路表达变化的主成分分析
单独的代谢途径不能单独发挥作用。相反,它们显示高度相关和相互依赖的基因表达模式。因此,我们使用了本金成分分析(PCA)20以便更好地理解癌症代谢途径的联合行为().为了减少与个体通路异质表达相关的噪音,我们考虑了代表主要代谢过程的九个meta-pathways空间的表达变化(在线方法)。综合起来,前三个主要组成部分能够捕获大约85%的meta-pathway表达差异。
表1
主要代谢过程中基因表达的主成分分析(PCA)。PCA是使用形成代表主要生化过程。路径权重表示每个元路径的相对贡献主要成分;具有相同符号的权重表示分量的路径,而符号相反的权重表示不相关的贡献。该表显示了前三个主成分的每个元路径的主成分分析权重。这个前三个主成分解释了约62%、约16%和约7%的方差表达式数据,分别
变量 | 涉及的基因数量 在每条路径中 | 第一节中的重量 成分 | 第二节中的重量 成分 | 第三节中的重量 成分 |
---|
氧化磷酸化 | 135 | −0.40 | 0.21 | 0.67 |
糖酵解 | 24 | −0.33 | 0.65 | −0.01 |
柠檬酸循环 | 21 | −0.50 | −0.10 | 0.02 |
氨基酸生物合成 | 70 | −0.27 | −0.11 | −0.17 |
脂肪酸和脂类生物合成 | 66 | −0.28 | 0.05 | 0.09 |
核苷酸和核苷生物合成 | 54 | −0.35 | 0.34 | −0.67 |
氨基酸降解 | 123 | −0.31 | −0.40 | −0.15 |
脂肪酸和脂质降解 | 80 | −0.22 | −0.35 | 0.17 |
核苷酸和核苷降解 | 9 | −0.26 | −0.34 | −0.04 |
各自解释的差异比例 成分 | | − 0.62 | 0.16 | 0.07 |
第一主成分约占meta-pathway表达改变。由于此组件的所有路径权重具有相同的符号和相似的值,它代表了代谢的整体表达的大致一致的变化基因。癌症样本在第一和第二主平面上的投影组件(补充图6)显示消化系统肿瘤(结肠、肾脏和肝脏)沿此方向有高阳性转移成分,表明代谢基因表达总体下降。相反,其他肿瘤(例如,宫颈和淋巴瘤)显示代谢基因表达总体增加。它是很可能沿第一主成分观察到的变化反映了,至少对一些程度,相应正常组织所需的特定代谢功能的丧失,以及转向新陈代谢计划主要关注生长和增殖。这可能说明胃肠道肿瘤中代谢基因表达的总体下降通常具有这些分化组织特有的高代谢基因表达的系统。
沿着第二个分量移动,解释了约16%的表达方差,伴随糖酵解和核苷酸生物合成表达的改变三种分解代谢途径的表达发生相反变化。因为核苷酸生物合成在核糖体生物发生和染色体中特别重要重复,我们的结果表明,分裂细胞似乎越来越依赖糖酵解。氧化磷酸化也与第二组分有关,尽管与重量明显小于糖酵解(0.21比0.65)。因此,沿着这一部分糖酵解与氧化磷酸化同时发生。沿第三条主线移动成分,解释了约7%的差异,主要涉及核苷酸中伴随相反变化的氧化磷酸化表达生物合成。因此,沿着该成分的氧化磷酸化强烈上调可能与较慢的增长率有关。
个体生化反应和同工酶
接下来,我们关注与个体生化反应相关的表达变化,它们构成了人类代谢网络层次结构中最基本的层次。我们使用2307个反应,每个反应与人类模型中至少一种已知酶相关(在线方法)新陈代谢21.在人类代谢网络和在其他生物的网络中22,a给定生化反应通常由几种不同的同工酶催化。同工酶可能是由单独的基因编码或由同一基因的剪接变异体产生。在网络模型中,我们习惯于21,约30%的代谢反应包含至少有两种已知的同工酶,对于中心碳代谢。同工酶的不同动力学和调节特性通常是微调以满足各种人体组织的特定代谢需求22.由于新陈代谢需求和约束不同于对于天然组织,肿瘤可能优先表达同工酶促进生存和不受控制的扩散23,24.
同工酶在肿瘤中表达的异质性从对中枢代谢(). 尽管编码糖酵解的基因酶在肿瘤中经常上调,一些同工酶在特异性肿瘤中下调癌症。戊糖磷酸途径关键酶的基因表达显著增加(PPP),包括氧化和非氧化分支。乳酸脱氢酶(LDH)也是强烈上调,与许多人观察到的高水平乳酸生成相一致肿瘤25PDH频繁下调复合物可能导致丙酮酸进入TCA循环的流量减少,在许多肿瘤。嘌呤和嘧啶合成所必需的酶,以及谷胱甘肽合成酶(GSS)26,被强烈上调。虽然谷氨酰胺酶(GLS)是一种对TCA循环回补很重要的酶,但一般来说下调,已经证明这种酶被强烈上调MYC介导的miR-23a/b转录后抑制27值得注意的是,最近的一项研究28提出了谷氨酰胺转化为谷氨酸的替代途径,也许通过核苷酸生物合成酰胺转移酶,可能在谷氨酰胺依赖性贫血。这一假设与跨肿瘤的相应酶(PPAT和CAD)。
肿瘤诱导的mRNA表达在中枢代谢的个体生化反应中发生变化。(一)每个代谢反应都标有肿瘤的数量(在22个考虑中在我们的分析中),其中至少有一种同工酶催化相应的反应显著上调(FDR-校正P值<0.05)(红色)和下调(蓝色)。(b条)显著上调(红色三角形)或下调的反应(蓝色三角形)当所有同工酶和相应蛋白质复合物的成员综合考虑所有肿瘤(深红色或深蓝色,FDR校正的P值<0.05;淡红色或淡蓝色,FDR校正的P值<0.1)。如果未标记,则无统计学意义mRNA表达显著改变。
我们使用Kullback-Leibler(KL)研究了相对同工酶表达的变化分歧(在线方法);KL散度是用于量化的信息理论度量两种概率分布之间的差异。对于每个生化反应,KL散度用于测量肿瘤和肿瘤之间同工酶表达分布的变化相应的正常组织。该分析表明,平均而言相同正常人的不同样本的同工酶模式大约相似两倍同一肿瘤不同样本的组织(). 但更重要的是,这两个距离都明显小于平均值肿瘤同工酶表达模式与相应正常组织的距离(Mann-Whitney U试验P值<2*10−16). 这表明,对许多人来说生物化学反应肿瘤转化导致相对同工酶的表达。
癌诱导的相对同工酶表达的变化。(一)库尔巴克雷伯乐(KL)散度用于表征同工酶相对表达的差异具有多种同工酶的所有生化反应。颜色代表KL的分布同一正常组织不同样本同工酶表达的差异(正常n个-正常n个,蓝色),不同样品相同肿瘤(肿瘤n个-肿瘤n个,红色),肿瘤和相应的正常组织(肿瘤n个-正常n个,绿色)。插入摘要成对组织之间的平均KL差异占平均KL偏差的百分比在相同正常组织的不同样本之间。(b条)的相对表达式肾、肝、胃、脑(GBM)肿瘤和相应正常人醛缩酶同工酶组织。
人类醛缩酶是一种表达模式受到干扰的酶的显著例子在肿瘤中(). 这种酶有三种主要亚型A、B尽管醛缩酶A(ALDOA)优先在肌肉细胞中表达,但它也强烈表达在大多数其他人体组织中表达。醛缩酶B(ALDOB)优先在肝脏中表达和脑中醛缩酶C(ALDOC)。表达分析表明,ALDOA的表达,相对于其他醛缩酶同工酶,肿瘤中显著增加。值得注意的是,ALDOA也在发育中的胚胎中高度表达29,以及因此,可能特别适合于快速细胞分裂期间的代谢需求。的确,k个猫ALDOA的值明显高于其他同工酶的值30.
具有紊乱表达模式的酶的另一个例子是乌头酶。我们的分析表明,TCA循环的柠檬酸外排可能通过以下方式在癌症中增强顺乌头酸酶(ACO2)线粒体亚型的频繁下调(). 细胞溶胶柠檬酸盐用于生成乙酰辅酶A,这是一种重要的前体许多涉及脂肪生成的生物合成反应所必需的31.抑制正常人体组织中的线粒体乌头酸酶32和酵母33之前的研究表明,TCA柠檬酸外排显著增加。强者肿瘤中ATP柠檬酸裂解酶(ACL)的上调()为这些变化促进脂肪酸的观点提供了额外的支持肿瘤中的生物合成。最近的一项研究表明,脂肪合成的一条重要途径是缺氧条件下乙酰辅酶A34是通过还原细胞溶质异柠檬酸脱氢酶(IDH1)和细胞溶质对α-酮戊二酸的代谢乌头糖(ACO1/ACO3)。观察到的表达模式也支持这一途径,因为与线粒体顺乌头酸酶相比,细胞质顺乌头酸酶经常上调在特定癌症中(),类似的模式是观察到IDH1(见下文)。
为了确定表达谱经常受到干扰的特定同工酶,我们计算每个生化反应中的每个同工酶催化同一反应的所有同工酶中同工酶的分数表达为显著上调(在线方法)。多假设检验修正后(在线方法),919同工酶在至少一种肿瘤类型中相对上调,322在我们分析中考虑的22种肿瘤类型中,有25%以上上调(补充表12).
肿瘤复发突变酶的表达
接下来我们研究了已知肿瘤相关代谢基因的表达变化突变。最近的测序研究已经确定了几个相关基因的复发突变TCA循环35,36异柠檬酸脱氢酶两种同工酶的杂合体细胞突变(细胞质IDH1和线粒体IDH2)经常在胶质瘤和急性髓细胞性疾病中检测到白血病(AML)。这些获得功能突变影响IDH活性位点,并使其成为可能突变酶催化α-酮戊二酸转化为2-羟基戊二酸(2HG),已被提议用于促进癌症发展37我们的分析表明,IDH1和IDH2同工酶在癌症(),但另一种异柠檬酸的表达脱氢酶同工酶IDH3(在肿瘤中不常见突变)未受到明显干扰。A类癌症中IDH表达的详细分析(补充表13)表明IDH1和三种脑癌的IDH2和AML是五种最重要的肿瘤之一类型。最近的测序工作38也证明外周T细胞淋巴瘤中存在类似的IDH活性位点突变,我们研究中的另一种肿瘤IDH表达显著上调(补充表13).
富马酸水合酶(FH)和三个基因的种系和体细胞功能丧失突变琥珀酸脱氢酶亚单位(SDHB、SDHC、SDHD)也存在于多种肿瘤中,包括肾细胞癌36,39这些有害突变导致代谢物的积累富马酸和琥珀酸调节缺氧诱导因子(HIF)蛋白水平和染色质影响肿瘤生长的状态40,41我们发现SDH亚单位(SDHB、SDHC、SDHD)和FHRCC中特异性下调(补充的表14和15). 唯一的癌症在我们的分析中,一种更显著的下调是结直肠癌,其中SDH的表达以前有报道42.尽管在结直肠癌中未观察到SDH或FH的体细胞突变43,44,的与其他肿瘤中的有害突变类似,它们的表达显著下降可能导致促肿瘤TCA循环中间产物的线粒体流出,并有助于肿瘤发生。
结肠癌TCA循环代谢物分析
证实我们对结肠中TCA循环中间产物的计算预测癌症,我们测量并分析了10例结肠癌特定代谢物的浓度患者。使用GC/MS或LC/MS(在线方法)获得代谢物水平,并包含每个患者的肿瘤和正常样本相匹配。
与氧化磷酸化途径基因的显著下调一致(威尔科森符号秩检验P值=10−9,补充表7)PDH复合物的下调(P值=0.02)控制进入TCA循环的大多数葡萄糖碳通量肿瘤样本中的柠檬酸盐浓度(Wilcoxon符号秩检验P值=0.01)和伴随的乳酸浓度增加(P值=0.001)。尽管柠檬酸盐浓度(平均下降~65%,中位数~90%),平均浓度下游代谢物琥珀酸的平均浓度仅比正常值低33%富马酸比正常样品高50%以上(P值=0.03)。这种模式浓度变化与FH和SDH酶的显著下调一致在结肠癌表达谱中观察到。这种下调应该会导致相对于可用柠檬酸盐,底物富马酸和琥珀酸盐。值得注意的是,之前已经证明了这一点40即使富马酸浓度略有增加也足以稳定HIF1A通过抑制α-酮戊二酸二加氧酶调节其降解41富马酸浓度的平均增加(约50%)约为之前观察到的FH双等位基因缺失量的一半酶(~90%)40。我们的四名患者样品中,富马酸的浓度比匹配的正常样品和三个样品中的富马酸浓度高50%以上高于100%。因此,我们观察到的表达变化应该模仿癌症相关杂合FH突变对大肠癌的影响患者。
讨论
代谢网络的重新编程现在被认为是肿瘤的标志转型2.我们的总体结论研究表明,癌症引起的代谢基因表达变化是非常异质的在不同的肿瘤类型中,即没有统一的代谢转化与所有肿瘤。我们从全球范围内观察到生物化学组织各个层次的异质行为个体反应代谢途径和相应同工酶的表达模式。这个癌症代谢的异质性行为让人联想到在信号和调节通路中基因和表达变化对肿瘤的影响三.
值得注意的是,尽管癌症之间存在异质性,但代谢表达发生了变化与单个肿瘤相关的不是随机的。相反,观察到的许多变化是在相同肿瘤的独立样本中可重复。我们可以看出几个统一的原则观察到的肿瘤诱导的表达扰动。首先,肿瘤通常保留显著的在相应的自然组织中存在的代谢表达模式的印记。这可能是是相似的当地环境的结果或表明新陈代谢的相对刚性在原始组织中建立表达程序。这种行为在概念上类似于微生物代谢遵循的代谢调节最小化(MOMA)原则遗传扰动45第二,很大一部分主要生化过程表达中的差异可以通过以下方面进行合理化几个主要成分,代表关键代谢过程的重要表达模式。虽然,与生理学研究一致14,46,我们没有观察到普遍的上调或下调对于与氧化磷酸化相关的基因,集体表达沿着第二和第三主成分表明快速生长的细胞越来越依赖葡萄糖发酵。第三,我们发现数百种同工酶具有显著的肿瘤特异性表达式更改。这些变化中的很大一部分可能在功能上很重要并且,至少在某些情况下,模仿(如SDH和FH)或可能增强(如IDH病例)复发性肿瘤促进基因突变的影响。
除了了解肿瘤诱导的表达变化外,我们认为我们的分析对抗癌治疗学的发展具有重要意义。功能重要具有癌症特异性表达变化的同工酶可能成为药物靶点。这个靶向特定同工酶的可能性,如GLS18和PKM27,已经已经证明,但我们的分析表明,在类似的方式。由于观察到的表达模式具有肿瘤特异性需要重点分析和了解每种药物的基本代谢转化特定癌症类型。
在线方法
微阵列表达数据集
已发布的基因表达数据集来自GEO9和ArrayExpress10数据库(补充表1). 除非否则,我们只分析使用最全面的人类获得的表达数据表达阵列平台(HG U133 Plus 2.0;补充表2). 用于涉及全局网络属性和比较的计算不同研究之间的表达数据(),个样本所有数据集中的数据一起处理。对于所有其他计算,来自同一项研究同时进行。Bioconductor的affyQCReport包(www.bioconductor.org)用于搜索劣质芯片。对于通过质量控制(QC)检查的基因芯片阵列,我们使用了GCRMA算法47从Bioconductor执行分位数归一化并提取log2尺度上的基因表达值。
代谢基因差异表达(DE)的计算
对于每个数据集,生物导体方法极限48基于修正的t统计量,用于分析差异肿瘤标本和相应的正常标本之间。使用该方法,我们计算了log2量表上每个代谢基因的差异表达。微分表达式使用Benjamini和Hochberg的多假设检验对P值进行了调整方法49,控制错误发现率(FDR)5%。
一对表达式配置文件之间全局散度的计算
在一对表达谱之间使用了两种不同的差异测量我们的研究:(1)欧几里德距离,,其中x个我和年我是基因的表达我over two表达式配置文件第页和q个样品(x个1,x个2,…,x个第页),(年1,年2,…,年q个),n个=1421是在KEGG数据库中至少有一条代谢途径,(2)基于相关性的距离d日cor公司= 1–第页(平均日志2
x个),平均(log2
年)),其中第页是斯皮尔曼等级相关系数在两个表达谱中对应基因的平均log2表达值之间。
在比较不同研究的数据集时,重要的是要考虑批次由于实验室条件和测量的变化而产生的影响。探索和解决批处理效应,我们从多项独立研究(补充表4). 中的所有样本补充表4一起进行处理和规范化。为了估计批量效应的影响,我们计算d日1,肿瘤之间的平均表达距离(肿瘤n个)和相应的正常组织(正常n个)测量单位:不同的研究,以及d日2,肿瘤之间的平均表达距离(肿瘤n个)和相应的正常组织(正常n个)在中测量相同的研究。差异(d日1–d日2)代表平均值不同研究之间的比较导致的批量效应。为了说明批处理效果差异(d日1–d日2)已减去不同研究之间计算的所有表达距离。
具有显著表达变化的代谢途径的鉴定
我们使用两种不同的方法来确定代谢途径表达式更改。这两种方法产生了非常相似的结果。在第一种方法中,它用于论文中给出的所有计算,对于每个基因一,我们计算其在肿瘤标本中的表达变化我相对于相应的正常样品,,其中是肿瘤样本中的表达我,以及年一是中的表达式秒对应法线样品(年1,年2,…,年秒). Δ的Wilcoxon符号秩检验E类为所有人然后使用代谢途径中的基因来确定向上或向下的重要性-肿瘤样本中通路的调节。在第二种方法中,对于每个基因一,我们计算了其在肿瘤样本中表达的z评分我相对于其表达式值在秒对应法线样品,,其中σ(日志2 年一)是标准偏差。Wilcoxon签名等级测试z(z)然后用于确定每种药物的上调或下调的重要性肿瘤样本中的通路。基于第二种方法的通路表达异质性是如所示补充图4c.
观察到的代谢途径表达模式的统计意义
我们使用随机表达数据来评估报告的通路表达模式(). 要生成的null分布()和()我们使用真实表达式数据并随机排列的值代谢基因标记同时保留路径大小。然后我们计算了空分布使用与实际数据相同的程序。补充图3显示了空分布对于10条受调控程度最高的路径(最高的路径()中的值)基于1000表达式数据的随机排列。
同一肿瘤类型肿瘤样本的通路表达异质性
研究相同肿瘤样本之间的通路表达异质性肿瘤类型,我们引入了路径特异性异质性度量H(H)= ∣n个 − 米∣ ∕ (n个+ 米),其中n个是特定肿瘤样本的分数途径显著上调的肿瘤类型,以及米是通路显著下调的样本比例。根据这个定义,高H(H)该途径显示出一致的表达变化在同一肿瘤类型的不同样本中,即通路主要上调或主要上调下调。另一方面,对于小型H(H)路径表达值为可变,即在一些肿瘤样本中,该通路显著上调,而在其他样本中同一肿瘤类型的样本该通路显著下调。The distribution ofH(H)不同来源组织的22种肿瘤类型或16种肿瘤类型的10条受调控程度最高的路径(n个+米)值),是如所示补充图5.16通过考虑样本,从22种肿瘤类型中获得了不同组织来源的肿瘤类型在三种脑癌中,两种乳腺癌和四种淋巴瘤分别放在一起。
代谢途径表达和表达之间重要关系的计算非代谢性癌症/信号基因
上下文相关性似然(CLR)方法18基于表达式配置文件之间的相互信息。CLR用于确定214个非代谢性癌症/信号转导基因之间的显著关系KEGG数据库和87条KEGG代谢途径(补充表5). 组装了214个非代谢性癌症/信号基因使用以下两个标准:(1)来自14KEGG癌或25KEGG信号的基因路径(请参见补充表9)、和(2) 不在87条KEGG代谢途径中的任何一条内。对于每个基因一在每个肿瘤中样品我,表达式更改已计算。以及每个之间的相互信息(MI)非代谢性癌症/信号基因我和每个代谢途径j个在我们的研究中计算了所有肿瘤样本:,其中n个j个是一通路j个。所有互信息值均使用10计算Δ的箱子E类; 计算值对使用的箱子。每个基因的CLR相互作用Z评分我和路径j个一对使用(I)z分数计算(z(z)我)属于医疗保险ij公司相对于{医疗保险我,1,医疗保险我,2,…,医疗保险我,87}和(II)z分数(z(z)j个)第页,共页医疗保险ij公司相对于{医疗保险1,j个,医疗保险2,j个,…,医疗保险214,j个}. 在补充表8我们展示了确定了每个代谢途径的显著关系(Z评分>2.0)。
主成分分析
用于主成分分析的9个meta-pathways由结合KEGG和BioCyc数据库中相应代谢途径的基因。要执行主成分分析(PCA),我们计算了第页-由-q个矩阵D类meta-pathways的肿瘤-正常表达变化,其中第页=466(我们研究中的肿瘤样本总数)和q个= 9(meta-pathways的数量)。我们使用了两种不同的方法来计算D类. The这两种方法产生了非常相似的主成分。在第一种方法中(我,j个)-矩阵元素D类ij公司是平均的基因特异性肿瘤标本中的表达变化我穿过n个j个基因在meta-pathway内j个:在第二种方法中,D类ij公司是平均值基因特异性z评分:然后使用协方差方法获得主成分,即我们首先将D类减去列平均值,然后根据以下公式计算协方差矩阵D类。协方差矩阵为对角化并计算出特征向量和特征值。
基于第一种方法的PCA分析结果如所示以及基于第二种方法的结果补充表10。我们还探索了meta-pathways之间共享的基因对PCA结果的影响。当所有排除重叠基因(补充的表11)与所有meta-pathway基因的结果非常相似。
用于同工酶表达分析的人类代谢注释
Duarte编译的人类代谢网络等。21用于同工酶表达分析。网络包含1496个基因、2712个室特异性代谢产物和3743个内部和交换反应。在分析中,我们使用了2307个与至少一个相关联的网络反应已知代谢基因。负责催化相同反应的蛋白质同一复合物的成员被认为是同工酶。总的来说,Duarte的网络等包含至少两种同工酶的667个代谢反应。
同工酶表达模式之间距离的计算
Kullback-Leibler(KL)散度用于量化相对成对表达谱的同工酶表达。对于每个样本,分数一种特殊同工酶的表达我是首次计算的(n个是催化反应的同工酶数量和x个我是同工酶的表达值我). 这个然后使用R中的flexmix包估计离散变量之间的Kullback-Leibler散度分配{米((f)1),米((f)2),…,米((f)n个)}和{克((f)1),克((f)2),…,克((f)n个)},哪里米((f))和克((f))是两个表达式配置文件的平均值第页和q个样品(x个1,x个2,…,x个第页), (x个1,x个2,…,x个q个).
特异性肿瘤中优先表达的同工酶的鉴定
对于每个考虑的同工酶,我们使用非参数Mann-Whitney U检验确定其在肿瘤样本中的部分表达变化相对于正常样品。特别是同工酶我我们计算了它的分数与同一反应相关的所有同工酶的表达:,其中n个是催化相同的反应,以及x个我是同工酶的表达值我然后,我们使用Mann-Whitney U统计数据来测试以下假设:的分布(f)我与特定肿瘤样本相关的值癌症类型的平均值明显大于(f)我对应正常样本的值。考虑到检验假设的总数为22704(1032同工酶乘以22种癌症类型)。同工酶通过显著性阈值(P值<0.05)的报告补充表12。我们确认了使用从TCGA独立收集的表达数据得出的同工酶结果联合体50; 为了确认,我们使用了四个TCGA的肿瘤类型(多形性胶质母细胞瘤、乳腺浸润癌、结肠腺癌、,卵巢浆液性囊腺癌)。使用相同肿瘤类型70%的同工酶补充表12显示出相同的TCGA中的上调行为与本文分析的数据集相同。
统计显著性和多重假设检验
对于涉及多假设测试的途径和同工酶计算使用BH程序调整相应的P值49(使用R中的multtest包)将错误发现率(FDR)控制在0.05. FDR校正的P值用于分析统计显著性,除非否则,报告调整后P值的显著性<0.05。
结肠癌中TCA循环中间产物的定量代谢物分析。样品采集和代谢物提取
从10个结肠中获得肿瘤和周围大体正常的组织手术治疗后的癌症患者。切除的组织立即存放在−80°C。提取样品并使用Metabolon’s进行分析标准溶剂萃取法。提取的样品被分成等份进行分析在GC/MS和LC/MS平台上。
气相色谱/质谱
用于GC/MS分析的样品在真空干燥条件下重新干燥在干燥氮气下衍生之前至少24小时,使用双三甲基硅三氟乙酰胺(BSTFA)。GC柱为5%苯基,温度梯度在16分钟内从40°C到300°C。样品在采用电子碰撞的Thermo-Finigan Trace DSQ快速扫描单四极质谱仪电离。
液相色谱/质谱
平台的LC/MS部分基于Waters ACQUITY UPLC和Thermo-Finigan LTQ质谱仪,由电喷雾电离(ESI)源组成和线性离子阱(LIT)质量分析仪。将样品提取物分成两份,干燥,然后在酸性或碱性液晶兼容溶剂中重新配制,每个溶剂中含有11个或更多固定浓度的注射标准。使用酸性正离子对一份样品进行分析优化条件和另一种使用碱性负离子的优化条件在两个独立的使用单独的专用柱进行注入。在酸性条件下重组的提取物用水和甲醇(均含有0.1%甲酸)梯度洗脱,而碱性提取物,它也使用水/甲醇,含有6.5 mM碳酸氢铵。MS分析交替进行在MS和数据相关的MS2扫描之间使用动态排除。
数据提取和化合物识别
原始质量等级库数据文件的数据提取产生了以下信息:加载到关系数据库中并在不借助BLOB操作的情况下进行操作。一次进入对数据库中的信息进行了检查,并施加了适当的质量控制限值。峰值是使用Metabolon的专有峰值集成软件进行识别,组件存储在单独且专门设计的复杂数据结构中。TCA循环中间产物为通过与纯化的标准品的文库条目进行比较来鉴定。以下各项的组合色谱特性和质谱表明与特定化合物相匹配或等压实体。收集的代谢物数据见补充表16.