×

全基因组关联研究中二元表型分析的两阶段贝叶斯方法。 (英语) 兹比尔1441.62390

摘要:测序和基因分型技术的最新进展正在推动全基因组关联研究的数据革命,其特点是统计学中具有挑战性的大(p)小(n)问题。也就是说,考虑到这些进展,许多此类研究现在考虑评估少数受试者的大量基因标记基因型。鉴于数据的维度,对标记的联合分析通常充满了许多挑战,而边际分析是不够的。为了克服这些障碍,本文提出了一种贝叶斯两阶段方法,可用于联合关联遗传标记与二元性状,同时控制混杂。我们的方法的第一阶段使用边缘扫描来识别一组简化的候选标记,然后在第二阶段通过层次模型对其进行联合评估。最终的标记选择是通过一种新的、计算高效的最大后验估计技术来识别稀疏估计器来完成的。我们通过广泛的数值研究评估了该方法的性能,并考虑了涉及结直肠癌的全基因组应用。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abbi,R.、El‐Darzi,E.、Vasilakis,C.和Millard,P.(2008)。根据住院时间对患者进行分组,分析EM算法的停止标准。《2008年第4届国际IEEE会议智能系统会议论文集》,第1卷,第3-9页。IEEE9。
[2] Albert,J.H.和Chib,S.(1993年)。二进制和多光子响应数据的贝叶斯分析。美国统计协会杂志,88,669-679·Zbl 0774.62031号
[3] Armagan,A.、Dunson,D.B.和Lee,J.(2013)。广义双Pareto收缩。《中国统计》,第23期,第119-143页·Zbl 1259.62061号
[4] Baurley,J.W.和Conti,D.V.(2013)。遗传关联研究的可扩展、基于知识的分析框架。BMC生物信息学,14,312。
[5] Bulik‐Sullivan,B.K.,Loh,P.‐R。,Finucane,H.K.、Ripke,S.、Yang,J.,精神基因组学联合会精神分裂症工作组,…Neale,B.M.(2015)。在全基因组关联研究中,LD评分回归将混杂与多基因性区分开来。《自然遗传学》,47291-295。
[6] Candes,E.和Tao,T.(2007年)。Dantzig选择器:当p远大于n时的统计估计。《统计年鉴》,3522313-2351·Zbl 1139.62019号
[7] Dudbridge,F.(2013)。多基因风险评分的功效和预测准确性。《公共科学图书馆·遗传学》,9,e1003348。
[8] Fan,J.,&Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。《美国统计协会杂志》,961348-1360·Zbl 1073.62547号
[9] Friedman,J.、Hastie,T.和Tibshirani,R.(2010)。广义线性模型的坐标下降正则化路径。统计软件杂志,33,1-20。
[10] Jemal,A.、Bray,F.、Center,M.M.、Ferlay,J.、Ward,E.和Forman,D.(2011年)。全球癌症统计。CA:《临床医生癌症杂志》,6169-90。
[11] Koh,K.、Kim,S.‐J.和Boyd,S.(2007年)。大规模l1正则逻辑回归的内点方法。机器学习研究杂志,81519-1555·Zbl 1222.62092号
[12] 刘,T.‐H。,Zheng,F.,Cai,M.-Y。,郭,L.,林,H.‐X。,Chen,J.W.,…Xie,D.(2016)。推测的肿瘤激活剂ARHGEF3通过抑制细胞凋亡促进鼻咽癌细胞的发病。Oncotarget,725836-25848。
[13] Manolio,T.A.、Collins,F.S.、Cox,N.J.、Goldstein,D.B.、Hindorff,L.A.、Hunter,D.J.、…Visscher,P.M.(2009)。寻找复杂疾病的缺失遗传力。《自然》,461747-753。
[14] Neath,A.A.和Cavanaugh,J.E.(2012年)。贝叶斯信息准则:背景、推导和应用。威利跨学科评论:计算统计学,4199-203。
[15] Park,T.和Casella,G.(2008)。贝叶斯套索。美国统计协会杂志,103,681-686·Zbl 1330.62292号
[16] Peters,U.、Bien,S.和Zubair,N.(2015)。结直肠癌的遗传结构。古特,64,1623-1636。
[17] Polson,N.G.、Scott,J.G.和Windle,J.(2013)。使用Pólya Gamma潜变量的逻辑模型的贝叶斯推理。美国统计协会杂志,1081339-1349·Zbl 1283.62055号
[18] Raftery,A.E.(1996)。近似贝叶斯因子和广义线性模型中模型不确定性的解释。生物特征,83,251-266·Zbl 0864.62049号
[19] Shi,Y.、Chen,G.‐B.、。,黄,X.‐X。,Xiao,C.‐X。,王浩浩。,Li,Y.S.,…Guleng,B.(2015)。Dragon(排斥导向分子b,RGMb)是一种促进结直肠癌生长的新基因。Oncotarget,620540-20554。
[20] Tibshirani,R.(1996)。通过套索进行回归收缩和选择。英国皇家统计学会杂志:B辑(方法学),58267-288·Zbl 0850.62538号
[21] Wang,X.、Philip,V.M.、Ananda,G.、White,C.C.、Malhotra,A.、Michalski,P.J.、…Carter,G.W.(2018)。广义线性混合模型的贝叶斯框架确定了晚发性阿尔茨海默病的新候选基因座。遗传学,20951-64。
[22] Wasserman,L.(2000)。贝叶斯模型选择和模型平均。数学心理学杂志,44,92-107·Zbl 0946.62032号
[23] Wu,T.T.、Chen,Y.F.、Hastie,T.、Sobel,E.和Lange,K.(2009)。通过套索惩罚logistic回归进行全基因组关联分析。生物信息学,25714-721。
[24] Yazdani,A.和Dunson,D.B.(2015)。对相关个体进行全基因组关联研究的混合贝叶斯方法。生物信息学,313890-3896。
[25] Zeggini,E.和Ioanidis,J.P.(2009)。全基因组关联研究中的荟萃分析。药物基因组学,191-201年10月。
[26] 邹华(2006)。自适应套索及其oracle属性。美国统计协会杂志,1011418-1429·Zbl 1171.62326号
[27] Zou,H.和Hastie,T.(2005年)。通过弹性网进行规则化和变量选择。英国皇家统计学会杂志:B辑(统计方法),67301-320·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。