×

基于下一代RNA-seq数据检测差异表达SNV的统计方法。 (英语) Zbl 1366.62215号

小结:在本文中,我们提出了一种新的统计方法——MutRSeq——用于基于RNA-seq数据检测差异表达的单核苷酸变体(SNV)。具体而言,我们专注于非同义突变,并采用分层似然方法对观察到的突变事件以及RNA-seq实验中的读取计数测量进行联合建模。然后,我们引入了一种基于似然比的测试统计,它不仅检测总体表达水平的变化,还检测等位基因特异表达模式的变化。此外,该方法可以联合检测一个基因/通路中的多个突变。仿真研究表明,在一系列不同的设置下,所提出的方法比少数竞争对手获得了更好的功率。最后,我们将此方法应用于乳腺癌数据集,并识别三阴性乳腺癌肿瘤和其他乳腺癌肿瘤亚型之间差异表达的非同义突变基因。

MSC公司:

62页第10页 统计学在生物学和医学科学中的应用;元分析
92D20型 蛋白质序列,DNA序列
62F03型 参数假设检验
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Anders,序列计数数据的差异表达分析,《基因组生物学》11 pp R106–(2010)·doi:10.1186/gb-2010-11-10-r106
[2] 本杰米尼,《控制错误发现率:一种实用而有力的多重测试方法》,《皇家统计学会杂志》,B辑57,第289页–(1995)·Zbl 0809.62014号
[3] Bochar,BRCA1与人类SWI/SNF相关复合体相关:染色质重塑与乳腺癌的联系,Cell 102,第257页–(2000)·doi:10.1016/S0092-8674(00)00030-1
[4] Bilal,《确定YES1激酶作为基底样乳腺癌治疗靶点》,《基因癌症1》第1063页–(2010年)·doi:10.1177/1947601910395583
[5] Bullard,mRNA-Seq实验中归一化和差异表达的统计方法评估,BMC生物信息学11第94页–(2010)·Zbl 05766221号 ·数字对象标识代码:10.1186/1471-2105-11-94
[6] Chepelev,使用RNA-Seq检测人类基因组表达外显子中的单核苷酸变异,核酸研究37 pp e106–(2009)·doi:10.1093/nar/gkp507
[7] Chen,一种包含高斯参数估计缺失数据机制的惩罚EM算法,《生物统计学》70 pp 312–(2014)·Zbl 1419.62321号 ·doi:10.1111/biom.12149
[8] Dillies,《Illumina高通量RNA测序数据分析归一化方法的综合评估》,《生物信息学简报》4,第671页–(2012年)
[9] Dobin,STAR:超快通用RNA-seq对准器,生物信息学29,第15页–(2013)·doi:10.1093/bioinformatics/bts635
[10] Hansen,使用条件分位数归一化消除RNA-seq数据中的技术变异性,生物统计学13第204页–(2011)·doi:10.1093/biostatistics/kxr054
[11] Jensen,STRING 8-630生物体蛋白质及其功能相互作用的全球观点,《核酸研究》37页D412–(2014)·Zbl 05746565号 ·doi:10.1093/nar/gkn760
[12] Kim,检测数量性状罕见变异关联的惩罚回归方法,遗传学前沿5第121页-(2014)·文件编号:10.3389/fgene.2014.00121
[13] Li,序列比对/地图格式和SAMtools,生物信息学25 pp 2078–(2009)·兹比尔05744153 ·doi:10.1093/bioinformatics/btp352
[14] Li,人类转录组中广泛存在的RNA和DNA序列差异,《科学》333第53页–(2011)·doi:10.1212/science.1207018
[15] Leng,EBSeq:RNA-seq实验推理的经验贝叶斯层次模型,生物信息学29 pp 1035–(2013)·doi:10.1093/bioinformatics/btt087
[16] 麦肯纳,《基因组分析工具包:用于分析下一代DNA测序数据的MapReduce框架》,《基因组研究》20页1297–(2010)·doi:10.1101/gr.107524.110
[17] Morazavi,通过RNA-seq绘制和量化哺乳动物转录体,《自然方法》5第621页–(2008年)·doi:10.1038/nmeth.1226
[18] Ozsolak,RNA测序:进展、挑战和机遇,《自然评论遗传学》,第12页,87–(2011)·doi:10.1038/nrg2934
[19] 彭,RNA-Seq数据的综合分析揭示了人类转录组中广泛的RNA编辑,《自然生物技术》30,第253页–(2012)·doi:10.1038/nbt.2122
[20] Pirinen,《从RNA-seq读取数据评估多组织中的等位基因特异性表达》,生物信息学31,第2497页–(2015)·doi:10.1093/bioinformatics/btv074
[21] Robinson,评估标签丰度差异的中等统计检验,生物信息学23页2881–(2007)·doi:10.1093/bioinformatics/btm453
[22] Robinson,RNA-seq数据差异表达分析的标度归一化方法,《基因组生物学》11 pp R25–(2010)·doi:10.1186/gb-2010-11-3-r25
[23] Ramaswami,《准确识别人类Alu和非Alu RNA编辑位点》,《自然方法》9,第579页–(2012年)·doi:10.1038/nmeth.1982
[24] Skelly,一个强大而灵活的统计框架,用于测试RNA-seq数据中等位基因特异性基因表达的假设,Genome Research 21 pp 1728–(2011)·doi:10.1101/gr.119784.110
[25] Soneson,《RNA-seq数据差异表达分析方法的比较》,BMC生物信息学14 pp 91–(2013)·doi:10.1186/1471-2105-14-91
[26] Sun,使用RNA-seq数据进行eQTL定位,《生物科学统计》第5页198–(2013)·doi:10.1007/s12561-012-9068-3
[27] 癌症基因组图谱网络,人类乳腺肿瘤的综合分子肖像,《自然》第490页,第61页–(2012年)·doi:10.1038/nature11412
[28] Ye,上调的WDR26作为一个支架来协调PI3K/AKT途径驱动的乳腺癌细胞生长、迁移和侵袭,Oncotarget(2016)·doi:10.18632/目标7439
[29] 赵,活化T细胞转录组分析中RNA-Seq和微阵列的比较,PLoS ONE 9 pp e78644–(2014)·doi:10.1371/journal.pone.0078644
[30] 邹,用于联合分析F1互惠杂交和自交系RNA-Seq数据的新型统计方法,《遗传学》197 pp 389–(2014)·doi:10.11534/遗传学113.160119
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。