×

模拟SNP簇与疾病反应之间的关联。 (英文) Zbl 1338.92004号

Mitra,Riten(编辑)等,生物统计学中的非参数贝叶斯推断。查姆:施普林格(ISBN 978-3-319-19517-9/hbk;978-3-316-19518-6/电子书)。概率与统计科学前沿,115-134(2015)。
小结:本文的目的是讨论SNP基因型数据与疾病之间的关系。对于遗传关联研究,使用多个标记进行的统计分析已被证明比单个标记关联测试更有效、更有生物学意义。由于所考虑的遗传标记的数量通常很大,因此在这里我们对它们进行聚类,然后研究标记组与疾病之间的关联。我们提出了一个两步程序:首先,在归一化广义伽玛过程混合模型下引入贝叶斯非参数聚类估计,这样我们就能够将来自大规模SNP数据的信息与数量少得多的解释变量结合起来。然后,由于引入了遗传评分,我们使用logit模型研究了相关疾病反应与标志物组之间的关联。推断是通过最近在文献中介绍的MCMC截断方法获得的。我们还回顾了贝叶斯非参数聚类模型和算法在这里所采用的混合类的最新进展。最后,将该模型应用于病例对照环境中克罗恩病的全基因组关联研究。
关于整个系列,请参见[Zbl 1327.92007号].

MSC公司:

92B15号机组 普通生物统计学
62H30型 分类和区分;聚类分析(统计方面)
92 C50 医疗应用(通用)

软件:

PReMiuM公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Argiento,R。;古列尔米,A。;Pievatolo,A.,使用非参数分层混合的贝叶斯密度估计和模型选择,计算。统计数据分析。,54, 816-832 (2010) ·Zbl 1464.62019年 ·doi:10.1016/j.csda.2009.11.002
[2] Argiento,R。;Cremaschi,A。;Guglielmi,A.,《使用物种采样高斯混合模型进行聚类分析的基于密度的算法》,J.Compute。图表。统计,23,1126-1142(2014)·doi:10.1080/10618600.2013.856796
[3] Argiento,R.、Bianchini,I.和Guglielmi,A.(2015)。通过先验截断的NGG混合物模型的阻塞吉布斯采样器。统计师。公司。,在线优先·Zbl 1505.62037号
[4] Asimit,J。;Zeggini,E.,复杂性状的罕见变异关联分析方法,年度。修订版Genet。,44, 293-308 (2010) ·doi:10.1146/annurev-genet-102209-163421
[5] Bansal,V.公司。;利比格,O。;Torkamani,A。;Schork,N.J.,《涉及罕见变异的关联研究的统计分析策略》,《自然评论遗传学》。,11, 773-785 (2010) ·数字对象标识代码:10.1038/nrg2867
[6] Barrios,E。;A·李高。;尼托·巴拉哈斯,L.E。;普伦斯特,I.,用归一化随机测量混合模型建模,统计科学。,28, 313-334 (2013) ·Zbl 1331.62120号 ·doi:10.1214/13-STS416
[7] Caron,F.(2012年)。二部图的贝叶斯非参数模型。《神经信息处理系统进展》,第2051-2059页。
[8] Caron,F.和Fox,E.B.(2014年)。稀疏可交换随机图的贝叶斯非参数模型。arXiv预打印arXiv:1401.1137。
[9] 陈,C。;丁,N。;Buntine,W.,《机器学习国际会议(ICML)》(2012年),爱丁堡:英国爱丁堡
[10] Chen,L.S。;Hutter,C.M。;波特,J.D。;刘,Y。;普伦蒂斯,R.L。;彼得斯,美国。;Hsu,L.,通过对GWAS数据的基因集分析的规范化方法对结肠癌病因学的见解,美国遗传学杂志。,86, 860-871 (2010) ·doi:10.1016/j.ajhg.2010.04.014
[11] Cho,J.H.,炎症性肠病的遗传学和免疫发病机制,《国家免疫学评论》。,8, 458-466 (2008) ·doi:10.1038/nri2340
[12] 钟,Y。;邓森,D.,带变量选择的非参数贝叶斯条件分布建模,美国统计协会,104,1646-1660(2009)·Zbl 1205.62039号 ·doi:10.1198/jasa.2009.tm08302
[13] Dahl,D.B.(2006)。通过Dirichlet过程混合模型对表达式数据进行基于模型的聚类。V.M.Do K.-A、Müller P.编辑,基因表达和蛋白质组学的贝叶斯推断,第201-218页。剑桥:剑桥大学出版社。
[14] De Blasi,P。;Favaro,S。;A·李高。;梅纳,R。;普伦斯特,I。;Ruggiero,M.,吉布斯型先验是狄利克雷过程最自然的推广吗?,IEEE传输。模式分析。机器。智力。,37212-229(2014)·doi:10.1109/TPAMI.2013.217
[15] 德鲍斯,R.A。;Geilenkirchen,文学硕士。;van Riet,S。;van Dissel,J.T。;van de Vosse,E.,人类il-12rβ2多态性变体的差异表达和功能,分子免疫学,56,4,380-389(2013)·doi:10.1016/j.molimm.2013.07.002
[16] 杜尔,R.H。;Taylor,K.D。;Brant,S.R。;Rioux,J.D。;Silverberg,M.S。;Daly,M.J。;斯坦哈特,A.H。;亚伯拉罕,C。;Regueiro,M。;Griffiths,A.,一项全基因组关联研究确定IL23R为炎症性肠病基因,《科学》,3141461-1463(2006)·doi:10.1126/science.1135245
[17] Favaro,S。;Teh,Y.W.,规范化随机测量混合模型的MCMC,统计科学。,28, 335-359 (2013) ·Zbl 1331.62138号 ·doi:10.1214/13-STS422
[18] Ferguson,T.S.,《一些非参数问题的贝叶斯分析》,Ann.Statist。,1, 209-230 (1973) ·Zbl 0255.62037号 ·doi:10.1214/aos/1176342360
[19] 弗里奇,A。;Ickstadt,K.,基于后验相似矩阵的改进聚类标准,贝叶斯分析。,4, 367-392 (2009) ·Zbl 1330.62249号 ·doi:10.1214/09-BA414
[20] Glas,J.、Seiderer,J.,Wetzke,M.、Konrad,A.、Török,H.-P.、Schmechel,S.、Tonnechi,L.、Grassl,C.、Dambacher,J.和Pfennig,S.等人(2007年)。rs1004819是德国克罗恩病患者的主要疾病相关il23r变异体:il23r、CARD15和OCTN1/2变异体的联合分析。公共图书馆One,2,e819。
[21] Griffin,J.E.(2014)。贝叶斯非参数模型中推理的自适应截断方法。统计师。公司。,在线优先,1-19。
[22] 格里芬,J.E。;Walker,S.G.,归一化随机测量混合物的后验模拟,计算机杂志。图表。《法律总汇》第20卷第241-259页(2011年)·doi:10.1198/jcgs.2010.08176
[23] 胡,J。;Tzeng,J.-Y.,具有样本异质性的多平台数据的综合基因集分析,生物信息学,301501-1507(2014)·doi:10.1093/bioinformatics/btu060
[24] 黄,H。;Chanda,P。;A.阿隆索。;Bader,J.S。;Arking,D.E.,基于基因的关联测试,《公共科学图书馆·遗传学》,第7期(2011年)·doi:10.1371/journal.pgen.1002177
[25] Ishwaran,H。;James,L.F.,Gibbs《破胶前期取样方法》,J.Amer。统计师。协会,96,161-173(2001)·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[26] Jasra,A。;霍姆斯,C。;Stephens,D.,马尔可夫链蒙特卡罗方法和贝叶斯混合建模中的标签切换问题,统计科学。,20, 50-67 (2005) ·Zbl 1100.62032号 ·doi:10.1214/088342305000000016
[27] 约翰斯通,I.M。;Silverman,B.W.,《干草堆中的针和稻草:可能稀疏序列的经验贝叶斯估计》,《统计年鉴》。,32, 1594-1649 (2004) ·Zbl 1047.62008年 ·数字对象标识代码:10.1214/00905360400000030
[28] Jostins,L。;里普克,S。;威士玛,R.K。;杜尔,R.H。;McGovern,D.P。;Hui,K.Y。;Lee,J.C。;舒姆,L.P。;夏尔马,Y。;Anderson,C.A.,宿主-微生物相互作用形成了炎症性肠病的遗传结构,《自然》,49119-124(2012)·doi:10.1038/nature11582
[29] 刘建伟。;Green,P.J.,基于贝叶斯模型的聚类程序,J.Compute。图表。统计,16526-558(2007)·doi:10.1198/106186007X238855
[30] Lee,我。;布隆,U.M。;Wang,P.I。;Shim,J.E。;Marcotte,E.M.,《通过基于网络的全基因组关联数据提升对候选疾病基因进行优先级排序》,《基因组研究》,21,1109-1121(2011)·doi:10.1101/gr.118992.110
[31] A·李高。;梅纳,R.H。;Prünster,I.,控制贝叶斯非参数混合模型中的强化,J.R.Stat.Soc.,B,69715-740(2007)·兹伯利07555373 ·doi:10.1111/j.1467-9868.2007.00609.x
[32] Liverani,S.、Hastie,D.I.、Azizi,L.、Papathomas,M.和Richardson,S.(2015)。PReMiuM:使用Dirichlet过程的剖面回归混合模型的R包。J.Stat.软件。,即将推出。
[33] Medvedovic,M。;Yeung,K.Y。;Bumgarner,R.E.,基于贝叶斯混合模型的重复微阵列数据聚类,生物信息学,20,1222-1232(2004)·doi:10.1093/bioinformatics/bth068
[34] 莫里托,J。;帕帕托马斯,M。;Jerrett,M。;Richardson,S.,贝叶斯轮廓回归及其在全国儿童健康调查中的应用,生物统计学,11484-498(2010)·Zbl 1437.62560号 ·doi:10.1093/biostatistics/kxq013
[35] Mooney,S.,《单核苷酸多态性功能分析的生物信息学方法和资源》,Brief Bioninform。,6, 44-56 (2005) ·doi:10.1093/bib/6.1.44
[36] Muliere,P。;Tardella,L.,Ferguson-Dirichlet先验函数随机泛函的近似分布,加拿大。J.Stat.,26,283-297(1998)·Zbl 0913.62010号 ·doi:10.2307/3315511
[37] 米勒,P。;F.A.金塔纳。;Rosner,G.A.,协变量回归的产品分割模型,J.Compute。图表。统计,20,260-278(2011)·doi:10.1198/jcgs.2011.09066
[38] Nguyen,L.B。;Diskin,S.J。;卡帕索,M。;王凯。;戴蒙德,文学硕士。;Glessner,J。;Kim,C。;Attiyeh,E.F。;莫斯,Y.P。;Cole,K.,使用基因中心方法进行的表型限制全基因组关联研究确定了三个低风险神经母细胞瘤易感基因座,《公共科学图书馆·遗传学》,7(2011)·doi:10.1371/journal.pgen.1002026
[39] 奥诺吉,A。;努里莫托,M。;Morita,M.,基于狄利克雷过程先验的贝叶斯遗传聚类算法的表征和贝叶斯聚类方法之间的比较,BMC生物信息学,12263-278(2011)·doi:10.1186/1471-2105-12-263
[40] 帕帕托马斯,M。;莫里托,J。;霍加特,C。;哈斯蒂,D。;Richardson,S.,使用贝叶斯变量选择和Dirichlet过程探索来自遗传关联研究的数据:应用于搜索基因×基因模式,Genet。流行病。,36, 663-674 (2012) ·doi:10.1002/gepi.21661
[41] Pitman,J.(1996)。Blackwell MacQueen骨灰盒计划的一些发展。在B.M.Ferguson TS、Shapley LS主编《统计学、概率论和博弈论:纪念大卫·布莱克威尔的论文》中,第245-267页。海沃德:数理统计研究所。
[42] F.A.金塔纳。;Iglesias,P.L.,贝叶斯聚类和产品划分模型,J.R.Stat.Soc.,B,65,557-574(2003)·Zbl 1065.62115号 ·doi:10.1111/1467-9868.00402
[43] 拉马南,V.K。;沈,L。;摩尔,J.H。;Saykin,A.J.,《基因组数据的路径分析:概念、方法和未来发展前景》,《遗传学趋势》。,28, 323-332 (2012) ·doi:10.1016/j.tig.2012.03.004
[44] Reece,J.B。;洛杉矶Urry。;Cain,M.L。;Wasserman,S.A。;Minorsky,P.V。;Jackson,R.,Campbell Biology(2014),波士顿:皮尔逊,波士顿
[45] Regazzini,E。;A·李高。;Prünster,I.,具有独立增量的归一化随机测度均值的分布结果,Ann.Statist。,31, 560-585 (2003) ·Zbl 1068.62034号 ·doi:10.1214/aos/1051027881
[46] 罗德里格斯,A。;邓森,D.B。;Gelfand,A.E.,嵌套Dirichlet过程,美国统计协会,103,1131-1154(2008)·Zbl 1205.62062号 ·doi:10.1198/0162145000000553
[47] Tadesse,M.G。;Sha,N。;Vannucci,M.,高维数据聚类中的贝叶斯变量选择,J.Am.Stat.Assoc.,100602-617(2005)·Zbl 0938.34001号 ·doi:10.1198/0162145000001565
[48] 威康信托病例控制联盟,对14000例七种常见疾病和3000例共同对照的全基因组关联研究,《自然》,447661-678(2007)·doi:10.1038/nature05911
[49] Wakefield,J.,遗传流行病学研究中错误发现概率的贝叶斯测度,美国人类遗传学杂志。,81, 208-227 (2007) ·doi:10.1086/519024
[50] Wakefield,J.,《全基因组关联研究的贝叶斯因子:与p值的比较》,Genet。流行病。,33, 79-86 (2009) ·doi:10.1002/gepi.20359
[51] Wang,C.、Ruggeri,F.、Shoiao,C.和Argiento,R.(2014)。大规模SNP观测的贝叶斯非参数聚类和关联研究。已提交·Zbl 1401.62098号
[52] 魏永川。;Wen,S.H。;陈,P.C。;Wang,C.H。;肖长光,《全基因组关联研究的简单贝叶斯混合模型与混合程序》,《欧洲遗传学杂志》。,18, 8, 942-947 (2010) ·Zbl 1117.62433号 ·doi:10.1038/ejhg.2010.51
[53] Yau,C。;Holmes,C.,用于可变相关性确定聚类的分层贝叶斯非参数混合模型,贝叶斯分析。,6, 329-351 (2011) ·Zbl 1330.62265号 ·doi:10.1214/11-BA612
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。