跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
2014年11月20日5:5274。
doi:10.1038/ncomms6274。

来自RNA-seq的选择性聚腺苷酸化的动态分析揭示了7种肿瘤类型的3'-UTR图谱

附属公司

来自RNA-seq的选择性聚腺苷酸化的动态分析揭示了7种肿瘤类型的3'-UTR图谱

郑霞等。 国家公社

摘要

选择性多聚腺苷酸化(APA)是大多数人类基因调控的普遍机制,其在包括癌症在内的疾病中的意义才刚刚开始被认识。由于传统的APA分析尚未被广泛采用,全球癌症APA研究非常有限。在这里,我们开发了一种新的生物信息学算法(DaPars),用于从标准RNA-seq中从头识别动态APA。当应用于7种肿瘤类型的358对TCGA Pan-Cancer肿瘤/正常对时,DaPar揭示了1346个具有复发性和肿瘤特异性APA的基因。大多数APA基因(91%)在肿瘤中具有较短的3'-非翻译区(3'-UTR),可以避免微小RNA介导的抑制,包括谷氨酰胺酶(GLS),这是肿瘤增殖的关键代谢酶。有趣的是,选定的APA事件除了常见的临床和分子变量外,还增加了强大的预后能力,表明其作为新的预后生物标记物的潜力。最后,我们的结果表明CstF64是一种重要的多聚腺苷酸化因子,是多种肿瘤类型中3'-UTR缩短的主要调节因子。

PubMed免责声明

数字

图1
图1。DaPars算法及其性能评估概述
()图中描述了用于识别肿瘤和正常样本之间动态APA的DaPars算法。顶部面板显示了延伸10kb的外显子上的RNA-seq覆盖率,而无需事先了解APA位点。远端APA位点直接根据肿瘤和正常组织的RNA-seq联合数据推断(中间面板)。底部面板的Y轴是回归模型的拟合值,具有最小拟合值的轨迹(垂直箭头下方的红色点)对应于预测的近端APA位点(红色水平条)。(b条)DaPars的一个例子从TCGA RNA-seq数据中鉴定了动态APA。较短的3′UTRTMEM237号机组是BRCA和LUSC肿瘤的首选。(c(c))动态APA的另一个例子,这里的远端APALRRFIP1号机组在BRCA和LUSC肿瘤中几乎不存在,而近端APA不变。(d日)演示DaPars性能的模拟研究。根据不同的测序覆盖率绘制恢复的APA事件百分比。分位数框显示了基于1000个模拟事件的DaPars预测的变化。每个方框中的黑线是回收率的中位数。(e(电子))通过RNA-seq和PolyA-seq的DaPars分析检测到MAQC UHR和大脑之间的动态APA示例。3条底线是RefSeq基因结构、袖扣预测和DaPars预测。(如果)基于相同MAQC UHR和BRAIN样本的RNA-seq的PolyA-seq和DaPars分析之间的文氏图比较。
图2
图2。7种TCGA肿瘤类型中3′UTR的广泛缩短
()中央热图显示358个肿瘤(列)中每一个肿瘤(行)中发生3′UTR缩短(蓝色)或延长(红色)的基因(行),与7种肿瘤类型的匹配正常组织相比。上面的直方图显示了每个肿瘤的APA事件数。侧面直方图显示每个APA基因3′UTR缩短(左)或延长(右)的肿瘤百分比。(b条)条形图显示了DaPars预测的APA和从3′UTR区域随机选择的APA与四个数据库(Refseq、UCSC、ENSEMBL和PolyA_DB)的注释APA重叠的百分比。这个P(P)-值的计算方法为t吨-使用50倍的数据自举进行测试。(c(c))MEME从DaPars预测的近端polyA位点上游(-50bp)确定了具有非常显著E值(1.8e-135)的典型polyA基序AATAAA。(d日)DaPars的一个例子预测,LUSC肿瘤中的新polyA位点(红条)远离任何注释的polyA部位。(e(电子))通过添加更多样本对APA事件进行饱和分析。每个点都是各种较小尺寸样本的随机子集。所有的点都由一条平滑的读取线拟合。(如果)通过添加更多肿瘤类型进行饱和度分析。每条灰线代表7种肿瘤类型的随机排序,红色曲线是拟合线。动态APA事件的百分比随着肿瘤类型的增加而增加。
图3
图3。肿瘤中3′UTR较短的基因易于上调
()由于3′UTR缩短而丢失miRNA-结合位点的基因数量。这里我们选择了TargetScanHuman V6.2预测的miRNA结合位点,和miRanda,作为更保守的miRNA靶点列表。括号中的数字表示失去至少1个miRNA结合位点的基因的百分比。(b条)肿瘤中3′UTR较短的基因在3′UTR区的miRNA结合位点密度高于所有RefSeq基因。我们使用RefSeq基因模型进行所有计算,而不考虑APA检测。Y轴是按3′UTR长度(每Kb)标准化的miRNA结合位点的数量。这个P(P)-值的计算方法为t吨-测试。(c(c))对于肿瘤中3′UTR较短的基因,根据其ΔPDUI值绘制肿瘤和正常组织之间的折叠变化表达。将同一基因的所有亚型组合用于表达测量。肿瘤中显著上调或下调的基因分别以红色和蓝色显示,通过配对识别t吨-Benjamini-Hochberg(BH)假发现率为5%。因此,红色和蓝色条形图分别表示上调和下调基因的数量。
图4
图4。动态APA事件的预测能力
(a-d公司)高(红线)和低(蓝线)风险组的Kaplan-Meier生存曲线仅由临床(a)、临床有mRNA表达(b)、临床肿瘤与正常mRNA表达翻倍变化(c)和临床有动态APAs(d)分开。P(P)-通过log-rank检验计算值。(e(电子))APA、mRNA表达和mRNA肿瘤与正常表达的额外预后能力超出临床变量。这个P(P)-该值通过相似比检验计算。(如果)APA临床模型分离的风险组与显著突变基因(SMG)突变谱之间无相关性。垂直虚线表示P(P)-值(Mann-Whitney检验)截止值为0.05。所有SMGP(P)-数值低于该临界值,因此不显著。
图5
图5。路径分析
()显著丰富(P(P)-值<0.05;Fisher精确测试)1346例动态APA事件中的灵巧性典型途径。(b条)GLS公司UTR从KGA公司正常到中的长亚型GAC公司肿瘤中的短亚型。(c(c))GAC公司LUAD、LUSC和KIRC肿瘤的百分比明显较高。这个P(P)-每个框中的值通过配对计算t吨-测试。(d日)根据GAC比率分层的两个KIRC肿瘤组的Kaplan-Meier生存曲线,每组患者人数相等。P(P)-通过log-rank检验计算值。
图6
图6。肿瘤发生过程中APA调节的潜在机制
()在经历动态APA的基因和在Pancan12肿瘤类型中显著突变的基因之间只有5个基因是共同的。(b条)已知多聚腺苷化因子的基因表达变化热图。每个矩形代表一种肿瘤类型中一个因子的肿瘤和匹配正常组织之间的平均对数2倍变化。如果edgeR的错误发现率小于0.05且平均绝对褶皱变化大于1.5,则认为该因子存在差异。黄色和蓝色方框分别表示显著上调和下调的基因。白盒是非重要基因。(c(c))之间的相关性成本F64每个样本的表达折叠变化和3′UTR缩短事件数。每个点代表7种肿瘤类型的患者样本。X轴是成本F64肿瘤与匹配正常组织的对数倍变化。Y轴是每个样本的缩短事件数。斯皮尔曼相关系数(0.54)和P(P)-值(2.8e-28)显示在顶部。(d日)肿瘤中高表达近端APAs的基因之间的文氏图比较成本F64以及Hela细胞中偏好远端APA的基因成本F64成本F64T. (e(电子))肿瘤中3′UTR缩短的基因成本F64来源于HeLa细胞的iCLIP数据比背景数据(P(P)-值3.3e-21依据t吨-测试)。

类似文章

引用人

工具书类

    1. Elkon R、Ugalde AP、Agami R。选择性切割和多聚腺苷酸化:程度、调节和功能。《自然》杂志评论遗传学。2013;14:496–506.-公共医学
    1. Sandberg R、Neilson JR、Sarma A、Sharp PA、Burge CB。增殖细胞表达的mRNA具有缩短的3′非翻译区和较少的microRNA靶位点。科学。2008;320:1643–1647.-项目管理咨询公司-公共医学
    1. Derti A等人。五种哺乳动物聚腺苷酸化的定量图谱。基因组研究。2012;22:1173–1183.-项目管理咨询公司-公共医学
    1. 田B,胡J,张H,卢茨CS。人类和小鼠基因mRNA多聚腺苷化的大规模分析。核酸研究。2005;33:201–212。-项目管理咨询公司-公共医学
    1. 巴雷奥C、佩拉德L、奥斯本HB。AU-丰富元素和相关因素:有统一的原则吗?核酸研究。2005;33:7138–7150.-项目管理咨询公司-公共医学

出版物类型