×

使用一系列负二项模型对RNA-Seq数据进行贝叶斯分析。 (英语) Zbl 1407.62414号

摘要:RNA-Seq数据的分析主要集中在三个类别,包括基因表达、相对外显子使用和转录物表达。使用负二项式(NB)模型分别为每个类别提出了方法。然而,在一个特征(如外显子)上的NB分布之后的计数不能保证其他两个特征(例如基因/转录本)的NB分配。本文提出了一类负二项模型,该模型在相干NB模型下集成了基因、外显子和转录分析。该模型很容易将读取分配给抄本的不确定性纳入其中,并大大简化了对相对使用的估计。我们开发了简单的吉布斯采样算法用于后验推理,通过适当的共轭先验利用完全可处理的封闭计算形式。提出的模型在广泛的模拟下进行了研究。最后,我们将模型应用于实际数据集。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aitchison,J.、Barcelo-Vida,C.、Martin-Fernandez,J.A.和Pawlowsky-Glahn,V.(2000)。“对数比分析和成分距离”,《数学地质学》,32:271–275·Zbl 1101.86309号 ·doi:10.1023/A:1007529726302
[2] Anders,S.和Huber,W.(2010年)。“序列计数数据的差异表达分析”,《基因组生物学》,11:R106。
[3] Anders,S.、Reyes,A.和Huber,W.(2012年)。“从RNA-seq数据中检测外显子的差异使用”,《基因组研究》,22:2008-2017年。
[4] Brooks,A.N.、Yang,L.、Duff,M.O.、Hansen,K.D.、Park,J.W.、Dudoit,S.、Brenner,S.E.和Graveley,B.R.(2010)。“果蝇和哺乳动物之间RNA调控图谱的保护”,《基因组研究》,193-202年。
[5] Chen,M.-H.、Shao,Q.和Ibrahim,J.G.(2000)。贝叶斯计算中的蒙特卡罗方法。纽约:斯普林格·Zbl 0949.65005号
[6] Cheung,V.G.、Nayak,R.R.、Wang,I.X.、Elwyn,S.、Cousins,S.M.、Morley,M.和Spielman,R.S.(2010年)。“人类基因表达的多态顺式和反式调节”,《公共科学图书馆·生物学》,8:e1000480。
[7] Di,Y.、Schafer,D.W.和nd J.H.Chang,J.S.C.(2011)。“用于评估RNA-seq差异基因表达的NBP负二项模型”,《遗传学和分子生物学的统计应用》,第10期:第24条·兹比尔1296.92026 ·doi:10.202/1544-6115.1637
[8] Dillies,M.-A.、Rau,A.、Aubert,J.、Hennequet-Anier,C.、Jeanmougin,M.、Servant,N.、Keime,C.、Marot,G.、Castel,D.、Estelle,J.,Guernec,G.,Jagla,B.、Jouneau,L.、Laloé,D.,Gall,C.、Schaéffer,B.、Crom,S.L.、Guedj,M.和Jaffrézic,F.(2013)。“对Illumina高通量RNA测序数据分析归一化方法的综合评估”,《生物信息学简报》,14:671-683。
[9] Gelfand,A.E.和Dey,D.K.(1994年)。“贝叶斯模型选择:渐近和精确计算”,《皇家统计学会杂志》,56:501-514·Zbl 0800.62170号
[10] Hardcastle,T.J.和Kelly,K.A.(2010年)。“baySeq:识别序列计数数据中差异表达的经验贝叶斯方法”,BMC生物信息,11:422。
[11] 易卜拉欣,J.G.、陈,M.H.和辛哈,D.(2001)。贝叶斯生存分析。纽约:斯普林格·Zbl 0978.62091号
[12] Kim,D.、Pertea,G.、Trannell,C.、Pimentel,H.、Kelley,R.和SL,S.L.S.(2013)。“TopHat2:在插入、缺失和基因融合的情况下转录组的精确比对”,《基因组生物学》,14:R36。
[13] Leng,N.、Dawson,J.A.、Thomson,J.A、Ruotti,V.、Rissman,A.I.、Smits,B.M.、Haag,J.D.、Gould,M.N.、Stewart,R.M.和Kendziorski,C.(2013)。《EBSeq:RNA-seq实验中推理的经验贝叶斯层次模型》,生物信息学。
[14] León-Novelo,L.G.、Müller,P.、Arap,W.、Kolonin,M.、Sun,J.、Pasqualini,R.和Do,K.-A.(2013年)。“噬菌体展示数据的半参数贝叶斯推断”,《生物统计学》,69:174-183·Zbl 1270.62146号 ·文件编号:10.1111/j.1541-0420.2012.01817.x
[15] Lewin,A.、Bochkina,N.和Richardson,S.(2007年)。“差异基因表达的完全贝叶斯混合模型:模拟和模型检查”,《遗传学和分子生物学的统计应用》,第6期:第36条·Zbl 1276.92090号 ·doi:10.2202/1544-6115.1314
[16] Love,M.I.、Huber,W.和Anders,S.(2014)。“利用DESeq2对RNA-Seq数据的折叠变化和离散度进行适度估计”,《基因组生物学》,15:550。
[17] Mortazavi,A.、Williams,B.A.、McCue,K.、Schaeffer,L.和Wold,B.(2008)。“通过RNA-Seq绘制和量化哺乳动物转录体”,《自然方法》,5:621-628。
[18] Niu,L.、Huang,W.、Umbach,D.M.和Li,L.(2014)。“IUTA:从RNA-Seq数据中有效检测不同亚型使用的工具”,BMC Genomics,15:862。
[19] Pickrell,J.K.、Marioni,J.C.、Pai,A.A.、Degner,J.F.、Engelhardt,B.E.、Nkadori,E.、Veyrieras,J.B.、Stephens,M.、Gilad,Y.和Pritchard,J.K(2010)。《通过RNA测序了解人类基因表达变异的机制》,《自然》,464:768-772。
[20] Rapaport,F.、Khanin,R.、Liang,Y.、Pirun,M.、Krek,A.、Zumbo,P.、Mason,C.E.、Socci,N.D.和Betel,D.(2013)。“RNA-seq数据差异基因表达分析方法的综合评估”,《基因组生物学》,14:R95。
[21] Robinson,M.D.、McCarthy,D.J.和Smyth,G.K.(2010年)。“edgeR:用于数字基因表达数据差异表达分析的生物导体包”,《生物信息学》,26:139–140。
[22] Salzman,J.、Jiang,H.和Wong,W.H.(2011)。“RNA-Seq数据的统计建模”,《统计科学》,26·Zbl 1219.62173号 ·doi:10.1214/10-STS343
[23] Shi,Y.和Jiang,H.(2013)。“rSeqDiff:使用分层似然比测试从RNA序列数据中检测差异异构体表达。”PLoS ONE,8:e79448。
[24] Soneson,C.和Delorenzi,M.(2013)。“RNA-seq数据差异表达分析方法的比较”,《生物信息学》,14:91。
[25] Storey,J.D.和Tibshirani,R.(2003)。“全基因组研究的统计意义”,《美国国家科学院学报》,100:9440-9445·Zbl 1130.62385号 ·doi:10.1073/pnas.1530509100
[26] Trapnell,C.、Hendrickson,D.G.、Sauvageau,M.、Goff,L.、Rinn,J.L.和Pachter,L.(2013)。“RNA-seq转录解析时基因调控的差异分析”,《自然生物技术》,31:46-53。
[27] Turro,E.、Su,S.-Y.、Goncalves,A.、Coin,L.J.、Richardson,S.和Lewin,A.(2011)。“使用多重定位RNA-seq评估单倍型和亚型特异性表达”,《基因组生物学》12:R13。
[28] van de Wiel,M.A.、Leday,G.、Pardo,L.、Rue,H.、der Vaart,A.W.V.和Wieringen,W.N.V.(2012)。“通过估计多重收缩先验值对RNA序列数据进行贝叶斯分析”,《生物统计学》,14:113-128。
[29] van de Wiel,M.A.、Neerincx,M.、Buffert,T.E.、Sie,D.和Verheul,H.M.(2014)。“ShrinkBayes:一种用于分析复杂研究设计中基于计数的测序数据的通用R包。”生物信息学,15:116。
[30] Watanabe,S.(2010年)。“贝叶斯交叉验证的渐近等价性和奇异学习理论中广泛适用的信息准则”,《机器学习研究杂志》,11:3571-3594·Zbl 1242.62024号
[31] Wu,H.、Wang,C.和Wu,Z.(2013)。“一种新的离散收缩估计器改进了RNA-seq数据中的差异表达检测。”《生物统计学》,14:232-243。
[32] Zhao,L.、Wu,W.、Feng,D.、Jiang,H.和Nguyen,X.L.(2017)。“使用一系列负二项模型对RNA-Seq数据进行贝叶斯分析”的补充材料“贝叶斯研究”。
[33] Zhou,M.和Carin,L.(2012)。“增强并征服负二项过程”,NIPS。
[34] Zhou,M.和Carin,L.(2015)。“负二项式过程计数和混合建模”,IEEE,37:307–320。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。