×

使用基于评分的方法对RNA-seq数据进行通路分析。 (英语) Zbl 1393.62119号

摘要:已经提出了各种途径/基因集方法,以提供表达与实验条件或临床结果相关的更高层次生物学现象的证据。在这些方法中,已经反复表明,重采样方法比隐式假设基因独立的方法要好得多。然而,很少有方法针对RNA-Seq转录数据的特定特征进行优化,在这些特征中,映射标签产生的离散计数具有不同的库大小,并且具有违反参数假设的潜在离群值或偏态模式。我们描述了对RNA-Seq数据的转换,以提高与结果线性关联的能力,并灵活处理标准化因子。使用这些变换或交替变换,我们将最近开发的零近似应用于二次型统计,用于自足路径测试和竞争路径测试。该方法为RNA-Seq通路测试提供了一个方便的集成平台。我们证明了该方法在没有实际排列的情况下提供了适当的I类错误控制,并且与竞争方法相比,它在许多设置下都很强大。对F344与HIV1Tg大鼠的研究数据以及人类淋巴母细胞系性别差异的通路分析有力地支持了该发现的生物学解释性。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abdo,《基于人群的化学品体外危害和浓度反应评估:1000基因组高通量筛选研究》,《环境健康展望》123页458–(2015)
[2] Akari,《人类免疫缺陷病毒1型辅助蛋白vpu通过抑制抗凋亡因子的核因子kB依赖性表达诱导凋亡》,《实验医学杂志》194第1299页–(2001)·doi:10.1084/jem.194.9.1299
[3] Armini,HIV-1 Vpr对细胞周期调节器的影响,DNA细胞生物学23 pp 249–(2004)·doi:10.1089/104454904773819833
[4] Barry,微阵列数据中测试功能类别的统计框架,《应用统计年鉴》第286页–(2008)·Zbl 1137.62390号 ·doi:10.1214/07-AOAS146
[5] Beasley,基于秩的逆正态变换越来越多地被使用,但它们值得吗,《行为遗传学》39,第580页–(2009)·doi:10.1007/s10519-009-9281-0
[6] 本杰米尼,《控制错误发现率:一种实用而有力的多重测试方法》,《皇家统计学会期刊》B辑57页289页–(1995)·Zbl 0809.62014号
[7] 底部,使用RNA-Seq和微阵列评估C57BL/6J和DBA/2J小鼠纹状体中的基因表达,PLoS One 14(2011)
[8] Epstein,《校正病例对照研究中混杂因素的排列程序,包括罕见变异试验》,AJHG第215页–(2012)·文件编号:10.1016/j.ajhg.2012.06.004
[9] Gatti,FastMap:纯合人群中的快速eQTL定位,生物信息学25 pp 482–(2009)·Zbl 05743761号 ·doi:10.1093/bioinformatics/btn648
[10] Goeman,《根据基因集分析基因表达数据:方法学问题》,生物信息学23页,980–(2007)·doi:10.1093/bioinformatics/btm051
[11] Hanzelmann,GSVA:微阵列和RNA-seq数据的基因集变异分析,BMC生物信息学14(2013)·doi:10.1186/1471-2105-14-7
[12] Jansen,排除人类外周血转录组的差异,BMC Genomics 5(2014)
[13] Kennedy,多元回归随机检验,《统计学模拟与计算通讯》,第25页,第923页–(1996)·Zbl 0875.62172号 ·doi:10.1080/03610919608813350
[14] Lappalainen,转录组和基因组测序揭示了人类的功能变异,《自然》第506511页–(2013)
[15] Law,Voom:《精确权重解锁用于rna-seq读取计数的线性模型分析工具》,《基因组生物学》15 pp R29–(2014)·doi:10.1186/gb-2014-15-2-r29
[16] Li,rna测序数据的归一化、测试和错误发现率估计,生物统计学pp kxr031–(2011)
[17] Li,HIV-1转基因大鼠大脑中基因表达的转录组测序,PLoS ONE 8 pp e59582–(2013)·doi:10.1371/journal.pone.0059582
[18] 罗,《通用基因集/通路分析》,R Bioconductor(2015)
[19] Melas,利用磷蛋白组数据的自适应扰动方法构建大信号通路,分子生物系统8第1571页–(2012)·doi:10.1039/c2mb05482e
[20] 蒙哥马利,《在白人人群中使用第二代测序的转录组遗传学》,《自然》第464页第773页–(2010年)·doi:10.1038/nature08903
[21] Morazavi,通过RNA-Seq绘制和量化哺乳动物转录体,《自然方法》5,第621页–(2008年)·doi:10.1038/nmeth.1226
[22] Nyagoi,《HIV-1 Tat蛋白在宫颈癌发生过程中对细胞周期的影响》,《癌症生物学与治疗》5,第684页–(2006年)·文件编号:10.4161/cbt.5.6.2907
[23] Patrick,使用RNA-Seq数据估计数据特异性组成外显子,BMC生物信息学14 pp 1471–(2013)·doi:10.1186/1471-2105-14-31
[24] Rahbari,甲状腺癌性别差异,《未来肿瘤学》第6卷第1771页–(2010年)·doi:10.2217/fon.10.127
[25] Rapaport,《RNA-seq数据差异基因表达分析方法的综合评估》,《基因组生物学》14(2013)·doi:10.1186/gb-2013-14-9-r95
[26] Robinson,edgeR:数字基因表达数据差异表达分析的生物导体包,生物信息学26 pp 1–(2010)·Zbl 05744430号 ·doi:10.1093/bioinformatics/btp616
[27] Sasidharan,内镜检查患者中幽门螺杆菌感染种族和性别差异的进一步证据,Trans R Soc Trop Med Hyg 102第1226页–(2008)·doi:10.1016/j.trstmh.2008.05.006
[28] Soneson,《RNA-seq数据差异表达分析方法的比较》,BMC生物信息学14(2013)·doi:10.1186/1471-2105-14-91
[29] Supek,REVIGO总结并可视化了基因本体术语的长列表,PLoS ONE 6 pp e21800–(2011)·doi:10.1371/journal.pone.0021800
[30] Tusher,应用于电离辐射反应的微阵列显著性分析,《美国国家科学院院刊》98页5116–(2001)·2014年12月10日 ·doi:10.1073/美国国家统计局091062498
[31] Wright,基因组全关联和连锁确定了11p13和20q13囊性纤维化中肺部疾病严重程度的修饰位点。2,《自然遗传学》43,第539页–(2011年)·doi:10.1038/ng.838
[32] Wu,Camera:解释基因间相关性的竞争性基因集测试,核酸研究40 pp e133–(2012)·doi:10.1093/nar/gks461
[33] Wu,Roast:复杂微阵列实验的旋转基因集测试,生物信息学26页2176–(2010)·doi:10.1093/bioinformatics/btq401
[34] Xiong,Q.Mukherjee,S.Furey,T.2014 GSAASeqSp:RNA-Seq数据gsaa.unc.edu的基因集关联分析工具集
[35] Young,goseq:RNA-seq数据集的基因本体测试,R Bioconductor(2014)
[36] 周,《极端假设检验:高通量数据的快速和稳健关联》,接受,生物统计学(2015)·doi:10.1093/biostatistics/kxv007
[37] 周,一种强大而灵活的RNA序列计数数据分析方法,生物信息学27 pp 2672–(2011)·doi:10.1093/bioinformatics/btr449
[38] 周,经验路径分析,无排列,生物统计学14 pp 573–(2013a)·doi:10.1093/biostatistics/kxt004
[39] 周,时空聚类与二次型排列矩,Stat 2 pp 292–(2013b)·数字对象标识代码:10.1002/sta4.37
[40] Zwiener,《转换rna-seq数据以提高预后基因特征的性能》,《公共科学图书馆·综合》第1页e85150–(2014)·doi:10.1371/journal.pone.0085150
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。