×

用于推断拷贝数变体及其与基因表达的关联的分层贝叶斯模型。 (英语) Zbl 1454.62315号

摘要:已经成功开发了许多统计模型来分析来自单一来源的高通量数据,但很少有方法可用于集成来自不同来源的数据。在这里,我们将重点放在将基因表达水平与收集到的相同受试者的比较基因组杂交(CGH)阵列测量相结合。我们指定了一个测量误差模型,该模型将基因表达水平与潜在拷贝数状态联系起来,而潜在拷贝数状态又通过隐马尔可夫模型与观察到的替代CGH测量联系起来。我们使用选择先验函数来利用相邻拷贝数状态之间的依赖性,并研究MCMC随机搜索技术用于后验推理。我们的方法产生了一个统一的建模框架,用于同时推断拷贝数变体(CNV)并确定其与mRNA转录物丰度的显著关联。我们展示了模拟数据的性能,并说明了对人类癌症细胞系基因组研究数据的应用。

MSC公司:

第62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Barnes,C.、Plagnol,V.、Fitzgerald,T.、Redon,R.、Marchini,J.、Clayton,D.和Hurles,M.E.(2008)。具有拷贝数变化的病例对照关联检验的稳健统计方法。《自然遗传学》40 1245-1252。
[2] Belfiore,A.、Genua,M.和Malaguarnera,R.(2009年)。PPAR-γ激动剂及其对IGF-I受体信号传导的影响:对癌症的影响。PPAR Research 2009文章ID 830501。
[3] Breheny,P.、Chalise,P.,Batzler,A.、Wang,L.和Fridley,B.L.(2012)。拷贝数变异的遗传关联研究:拷贝数状态的分配是否应该在测试之前?公共科学图书馆ONE 7 e34262。
[4] Broet,P.、Lewin,A.、Richardson,S.、Dalmasso,C.和Magdelenat,H.(2004)。一种基于混合模型的策略,用于在多类响应微阵列实验中选择基因集。生物信息学20 2562-2571。
[5] Brown,P.J.、Vannucci,M.和Fearn,T.(1998)。多元贝叶斯变量选择和预测。J.R.统计社会服务。B统计方法。60 627-641. ·Zbl 0909.62022号 ·doi:10.111/1467-9868.00144
[6] Bussey,K.J.、Chin,K.、Lababidi,S.、Reimers,M.、Reinhold,W.C.、Ku,W.-L.、Gwadry,F.、Kouros-Mehr,A.H.、Fridlyand,J.、Jain,A.、Collins,C.、Nishizuka,S.,Tonon,G.、Roschke,A.、Gehlhaus,K.,Kirsch,I.、Scudiero,D.A.、Gray,J.W.和Weinstein,J.N.(2006)。整合NCI-60细胞系面板中DNA拷贝数、基因表达水平和药物敏感性的数据。分子癌症治疗学5 853-867。
[7] Cardin,N.、Holmes,C.、Donnelly,P.、Wellcome Trust Case Control Consortium和Marchini,J.(2011)。贝叶斯层次混合建模,从目标CNV阵列分配拷贝数。遗传流行病学35 536-548。
[8] Cassese,A.、Guindani,M.、Tadesse,M.G.、Falciani,F.和Vannucci,M.(2014)。补充“用于推断拷贝数变体及其与基因表达的关联的分层贝叶斯模型”·兹比尔1454.62315
[9] Chen,X.,Wang,L.和Ishwaran,H.(2010)。癌症生存预测的基于路径的综合临床基因组模型。统计师。普罗巴伯。莱特。80 1313-1319. ·Zbl 1198.62158号 ·doi:10.1016/j.spl.2010.04.011
[10] Chin,K.,DeVries,S.,Fridlyand,J.,Spellman,P.T.,Roydasgupta,R.,Kuo,W.L.,Lapuk,A.,Neve,R.M.,Qian,Z.,Ryder,T.,Chen,F.,Feiler,H.,Tokuyasu,T.、Kingsley,C.、Dairkee,S.、Meng,Z.、Chew,K.、Pinkel,D.、Jain,A.、Ljung,B.M.、Esserman,L.、Alberson,D.G.、Waldman,F.和Gray,J.W.(2006)。与乳腺癌病理生理相关的基因组和转录异常。癌细胞。10 529-541.
[11] Choi,H.、Qin,Z.S.和Ghosh,D.(2010)。用于DNA拷贝数和基因表达数据联合分析的双层混合模型。J.计算。生物.17 121-137·doi:10.1089/cmb.2009.0019
[12] Colella,S.、Yau,C.、Taylor,J.M.、Mirza,G.、Butler,H.、Clouston,P.、Bassett,A.S.、Seller,A.、Holmes,C.和Ragoussis,J.(2007)。QuantiSNP:一种客观的Bayes hidden-Markov模型,用于检测和准确绘制使用SNP基因分型数据的拷贝数变化。核酸研究35 2013-2025。
[13] Cordell,H.J.(2002)。上位性:它的意思是什么,它不意味着什么,以及在人类身上检测它的统计方法。人类分子遗传学11 2463-2468。
[14] Costa,T.、Guindani,M.、Bassetti,F.、Leisen,F.和Airoldi,E.M.(2013)。具有潜在β增强的广义物种采样先验。可在上获取。2012年8月66日·Zbl 1368.62125号
[15] Dalenc,F.、Drouet,J.、Ader,I.、Delmas,C.、Rochaix,P.、Favre,G.、Cohen-Jonathan,E.和Toulas,C.(2012)。选择性剪接导致COOH-截短核磷蛋白表达增加与HeLa细胞对电离辐射的细胞抵抗有关。国际癌症杂志100 662-668。
[16] Drier,Y.、Sheffer,M.和Domany,E.(2013年)。基于路径的癌症个性化分析。程序。国家。阿卡德。科学。美国110 6388-6393。
[17] Du,L.,Chen,M.,Lucas,J.和Carin,L.(2010)。比较基因组杂交的粘性隐马尔可夫模型。IEEE传输。信号处理。58 5353-5368. ·Zbl 1391.92014年 ·doi:10.1109/TSP.2010.2053033
[18] Fox,E.B.、Sudderth,E.B.,Jordan,M.I.和Willsky,A.S.(2011年)。一种粘性HDP-HMM,可应用于说话人日记。附录申请。统计数字5 1020-1056·Zbl 1232.62077号 ·doi:10.1214/10-AOAS395
[19] George,E.和McCulloch,R.E.(1997年)。贝叶斯变量选择方法。统计师。Sinica中国7 339-373·Zbl 0884.62031号
[20] Geweke,J.(1992)。评估基于抽样的后验矩计算方法的准确性。贝叶斯统计,4(佩尼·斯科拉,1991)169-193。牛津大学出版社,纽约。
[21] Guha,S.、Li,Y.和Neuberg,D.(2008)。阵列CGH数据的贝叶斯隐马尔可夫建模。J.Amer。统计师。协会103 485-497·Zbl 1469.62368号 ·doi:10.1198/0162145000000923
[22] Heidelberger,P.和Welch,P.D.(1981)。仿真中置信区间生成和游程控制的谱方法。通信ACM 24 233-245·数字对象标识代码:10.1145/358598.358630
[23] Jones,B.、Carvalho,C.、Dobra,A.、Hans,C.、Carter,C.和West,M.(2005年)。高维图形模型的随机计算实验。统计师。科学。20 388-400. ·Zbl 1130.62408号 ·doi:10.1214/088342305000000304
[24] Kaczynski,J.、Hansson,G.和Wallerstedt,S.(2009年)。原发性肝癌中Wallersted染色卟啉主要反映一种平行的肝病。《肠胃病研究与实践2009》文章编号402394。
[25] Marioni,J.C.、Thorne,N.P.和Tavare,S.(2006年)。BioHMM:一种用于分割阵列CGH数据的异构隐马尔可夫模型。生物信息学22 1144-1146。
[26] Monni,S.和Tadesse,M.G.(2009年)。关联高维响应和协变量的随机划分方法。贝叶斯分析。4 413-436. ·Zbl 1330.62035号 ·doi:10.1214/09-BA416
[27] Morris,J.S.、Brown,P.J.、Herrick,R.C.、Baggerly,K.A.和Coombes,K.R.(2008)。使用基于小波的功能混合模型对质谱蛋白质组数据进行贝叶斯分析。生物计量学64 479-489667·Zbl 1137.62399号 ·doi:10.1111/j.1541-0420.2007.00895.x
[28] Newton,M.A.、Noueiry,A.、Sarkar,D.和Ahlquist,P.(2004)。用半参数分层混合方法检测差异基因表达。生物统计学5 155-176·Zbl 1096.62124号 ·doi:10.1093/biostatistics/5.2.155
[29] Noor,R.、Mittal,S.和Iqbal,J.(2002)。超氧化物歧化酶的应用及其与人类疾病的相关性。医学科学。莫尼特。8 9.
[30] Ovacik,M.A.、Sukumaran,S.、Almon,R.R.、DuBois,D.C.、Jusko,W.J.和Androulakis,I.P.(2010)。大鼠肝脏的昼夜节律特征:从基因表达到途径。BMC生物信息学11 540。
[31] Picard,F.、Robin,S.、Lebarbier,E.和Daudin,J.-J.(2007年)。用于阵列CGH数据分析的分割/聚类模型。生物统计学63 758-766·Zbl 1146.62047号 ·doi:10.1111/j.1541-0420.2006.00729.x
[32] Raber,P.、Ochoa,A.C.和Rodríguez,P.C.(2012年)。肿瘤中髓源性抑制细胞对L-精氨酸的代谢:T细胞抑制机制和治疗前景。免疫学。投资。41 614-634.
[33] Redon,R.、Ishikawa,S.、Fitch,K.R.、Feuk,L.、Perry,G.H.、Andrews,T.D.、Fiegler,H.、Shapero,M.H.、Carson,A.R.、Chen,W.等人(2006年)。人类基因组拷贝数的全球变异。自然444 444-454。
[34] Richardson,S.、Bottolo,L.和Rosenthal,J.S.(2010年)。高维数据稀疏回归分析的贝叶斯模型。贝叶斯统计9 539-569。
[35] Richardson,S.和Gilks,W.R.(1993)。具有协变量测量误差的流行病学研究的条件独立模型。Stat.Med.12 1703-1722年。
[36] 罗德里格斯(Rodriguez,R.R.R)、杜兰(Duran,R.C.D.)、法尔恰尼(Falciani,F.)、佩尼亚(Peña)、J.G.T.和特雷维诺(Trevino,V.)(2012)。COMPADRE:通过组件分解进行路径活动分析的R和web资源。生物信息学28 2701-2702。
[37] Scott-Boyer,M.P.、Imholte,G.C.、Tayeb,A.、Labbe,A.、Deschepper,C.F.和Gottardo,R.(2012)。多元eQTL映射的集成层次贝叶斯模型。统计应用程序。遗传学。分子生物学。11 1515-1544. ·Zbl 1296.92071号 ·doi:10.1515/1544-6115.1760
[38] Sebat,J.、Lakshmi,B.、Troge,J.和Alexander,J.,Young,J.以及Lundin,P.、Maner,S.、Massa,H.、Walker,M.、Chi,M.等人(2004年)。人类基因组中的大规模拷贝数多态性。科学305 525-528。
[39] Sha,N.、Vannucci,M.、Tadesse,M.G.、Brown,P.J.、Dragoni,I.、Davies,N.,Roberts,T.C.、Contestabile,A.、Salmon,M、Buckley,C.和Falciani,F.(2004)。多项概率模型中的贝叶斯变量选择用于识别疾病阶段的分子特征。生物统计学60 812-828·Zbl 1274.62428号 ·doi:10.1111/j.0006-341X.2004.00233.x
[40] Somwar,H.、Erdjument-Bromage,R.、Larsson,E.、Shum,D.、Lockwood,W.W.、Yang,G.、Sander,C.、Ouerfelli,O.、Tempst,P.J.、Djaballah,H.和Varmus,H.E.(2011年)。超氧化物歧化酶1(SOD1)是肺腺癌细胞系生长抑制剂筛选中确定的一种小分子的靶点。PNAS 108 39。
[41] Stingo,F.C.、Chen,Y.A.、Vannucci,M.、Barrier,M.和Mirkes,P.E.(2010)。一种用于microRNA调控网络推断的贝叶斯图形建模方法。附录申请。统计数据4 2024-2048·Zbl 1220.62142号 ·doi:10.1214/10-AOAS360
[42] Stranger,B.E.,Forrest,M.S.,Dunning,M.,Ingle,C.E.,Beazley,C.,Thorne,N.,Redon,R.,Bird,C.P.,de Grassi,A.,Lee,C.,Tyler-Smith,C.,Carter,N.、Scherer,S.W.,Tavare,S.,Deloukas,P.,Hurles,M.E.和Dermitzakis,E.T.(2007)。核苷酸和拷贝数变异对基因表达表型的相对影响。《科学》315 848-853。
[43] Su,J.、Yoon,B.-J.和Dougherty,E.R.(2009)。基于通路活性概率推断的准确可靠的癌症分类。公共科学图书馆ONE 4 e8161。
[44] 苏比拉纳,I.、迪亚兹·乌里亚特,R.、卢卡斯,G.和冈萨雷斯,J.R.(2011)。CNVassoc:使用R.BMC Med.Genomics 4 47对CNV数据进行关联分析。
[45] Venkatraman,E.S.和Olshen,A.B.(2007年)。一种用于阵列CGH数据分析的快速循环二进制分割算法。生物信息学23 657-663。
[46] Wang,K.,Li,M.,Hadley,D.,Liu,R.,Glessner,J.,Grant,S.F.A.,Hakonarson,H.和Bucan,M.(2007)。PennCNV:设计用于全基因组SNP基因分型数据中高分辨率拷贝数变异检测的集成隐马尔可夫模型。基因组研究17 1665-1674。
[47] Wang,K.,Chen,Z.,Tadesse,M.G.,Glessner,J.,Grant,S.F.A.,Hakonarson,H.,Bucan,M.和Li,M.(2008)。拷贝数变异的遗传模型。核酸研究36 21。
[48] Wu,G.、Guo,Z.、Chatterjee,A.、Huang,X.、Rubin,E.、Wu,F.、Mambo,E.、Chang,X.、Osada,M.、Kim,M.S.、Moon,C.、Califano,J.A.、Ratovitski,E.A.、Gollin,S.M.、Sukumar,S.、Sidransky,D.和Trink,B.(2006年)。糖基磷脂酰肌醇(GPI)转氨酶亚单位磷脂酰肌糖醇聚糖T类和/或GPI锚定附件1的过度表达可诱导肿瘤发生,并有助于人类乳腺癌的侵袭。癌症研究66 9829-9836。
[49] Yang,Y.和Bedford,M.T.(2013)。蛋白质精氨酸甲基转移酶与癌症。《国家癌症评论》13 37-50。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。