×

全基因组关联研究中SNP遗传率的简单一致估计。 (英文) Zbl 1435.62399号

摘要:全基因组关联研究(GWAS)的分析以大量单变量回归为特征,其中一个数量性状在数十万到数百万个单核苷酸多态性(SNP)等位基因计数上回归,一次一个。本文提出了性状SNP遗传力的估计值,这里定义为研究中SNP解释的性状方差的分数。所提出的GWAS遗传率(GWASH)估计量易于计算,具有很高的可解释性,并且随着SNP数量和样本量的增加而保持一致。更重要的是,它可以根据GWAS中通常报告的汇总统计数据进行计算,而不需要访问原始数据。该估计器通过LD矩阵的矩(可从辅助数据集估计),充分考虑了研究中SNP之间的连锁不平衡(LD)或相关性。与文献中其他建议的估计器不同,我们建立了GWASH估计器的理论性质,并获得了精度的分析估计值,允许对SNP遗传力估计进行功率和样本量计算,并为未来方法学的发展奠定了坚实的基础。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62兰特 大数据和数据科学的统计方面
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 1000基因组项目联盟,Auton,A.、Brooks,L.D.、Durbin,R.M.、Garrison,E.P.、Kang,H.M.,Korbel,J.O.、Marchini,J.L.、McCarthy,S.等人(2015)。人类遗传变异的全球参考。自然526 68-74。
[2] Bickel,P.J.和Levina,E.(2008)。大协方差矩阵的正则化估计。Ann.Statist公司。36 199-227. ·Zbl 1132.62040号 ·doi:10.1214/09053607000000758
[3] Bulik-Sullivan,B.K.,Loh,P.R.,Finucane,H.K.,Ripke,S.,Yang,J.,精神基因组学联合会精神分裂症工作组,Patterson,N.,Daly,M.J.,Price,A.L.等人(2015)。在全基因组关联研究中,LD评分回归将混杂与多基因性区分开来。自然遗传学。47 291-295.
[4] Cai,T.T.,Zhang,C.-H.和Zhou,H.H.(2010)。协方差矩阵估计的最佳收敛速度。Ann.Statist公司。38 2118-2144. ·Zbl 1202.62073号 ·doi:10.1214/09-AOS752
[5] Chang,C.C.、Chow,C.C.、Tellier,L.C.、Vattikuti,S.、Purcell,S.M.和Lee,J.J.(2015)。第二代PLINK:迎接更大、更丰富数据集的挑战。Gigascience 4 7。
[6] de Leeuw,C.A.、Mooij,J.M.、Heskes,T.和Posthuma,D.(2015)。MAGMA:GWAS数据的广义基因集分析。公共科学图书馆计算。生物学11 e1004219。
[7] Dicker,L.H.(2014)。高维线性模型中的方差估计。生物特征101 269-284·Zbl 1452.62495号 ·doi:10.1093/biomet/ast065
[8] Falconer,D.S.和Mackay,T.F.C.(1996年)。《数量遗传学导论》,第4版,Longman,Harlow。
[9] Fisher,R.A.(1918年)。孟德尔遗传假设下的亲属关系。事务处理。R.Soc.爱丁堡。52 399-433.
[10] Gazal,S.、Finucane,H.K.、Furlotte,N.A.、Loh,P.-R.、Palamara,P.F.、Liu,X.、Schoech,A.、Bulik-Sullivan,B.、Neale,B.M.等人(2017年)。人类复杂性状的连锁非平衡依赖结构表现出负选择行为。自然遗传学。49 1421.
[11] Hemani,G.、Shakhbazov,K.、Westra,H.-J、Esko,T.、Henders,A.K.、McRae,A.F.、Yang,J.、Gibson,G.、Martin,N.G.等人(2014a)。检测和复制影响人类转录的上位性。自然508 249。
[12] 赫马尼·G、沙赫巴佐夫·K、韦斯特拉·H·J、埃斯科·T、亨德斯·A·K、麦克雷·A·F、杨·J、吉布森·G、马丁·N·G等人(2014b)。明显上位性的另一种解释。自然514 E5。
[13] Hill,W.G.、Goddard,M.E.和Visscher,P.M.(2008)。数据和理论表明,复杂性状的遗传方差主要是加性的。《公共科学图书馆·遗传学》。4 e1000008。
[14] Hofert,M.、Kojadinovic,I.、Maechler,M.和Yan,J.(2014)。copula:与copula的多元相关性。R包版本0.999-9。
[15] Kojadinovic,I.,Jun Yan,J.Y.等人(2010年)。使用copula R包对具有连续边际的多元分布进行建模。J.统计软件。34 1-20.
[16] Li,Y.、Willer,C.、Sanna,S.和Abecasis,G.(2009年)。新的NHGRI-EBI公布的全基因组关联研究目录(GWAS目录)。基因型插补10 387-406。
[17] Locke,A.E.等人(2015)。体重指数的遗传学研究为肥胖生物学提供了新的见解。自然518 197-206。
[18] Lynch,M.和Walsh,B.(1998年)。遗传学与数量性状分析。第1卷。马萨诸塞州西诺-桑德兰。
[19] MacArthur,J.、Bowler,E.、Cerezo,M.、Gil,L.、Hall,P.、Hastings,E.、Junkins,H.、McMahon,A.、Milano,A.等人(2017年)。新的NHGRI-EBI公布的全基因组关联研究目录(GWAS目录)。核酸研究45 D896-D901。
[20] Okbay,A.等人(2016年)。全基因组关联研究确定了74个与教育程度相关的基因座。自然533 539-542。
[21] Pasaniuc,B.和Price,A.L.(2017年)。使用简要关联统计分析复杂性状的遗传。Nat.Rev.基因。18 117-127.
[22] Schork,A.J.、Thompson,W.K.、Pham,P.、Torkamani,A.、Roddey,J.C.、Sullivan,P.F.、Kelsoe,J.R.、O'Donovan,M.C.、Furberg,H.等人(2013)。并非所有SNP都是平等产生的:全基因组关联研究揭示了功能注释SNP之间的一致富集模式。《公共科学图书馆·遗传学》。9 e1003449。
[23] Schwartzman,A.、Schork,A.J、Zablocki,R.和Thompson,W.K(2019年)。对“全基因组关联研究SNP遗传力的简单一致估计”的补充。DOI:10.1214/19-AOAAS1291SUPPA,DOI:10.1214/19-AOAAS1291SUPPB·Zbl 1435.62399号
[24] Sniekers,S.、Stringer,S.,Watanabe,K.、Jansen,P.R.、Coleman,J.R.I.、Krapohl,E.、Taskesen,E.、Hammerschlag,A.R.、Okbay,A.等人(2017年)。对78308名个体的全基因组关联荟萃分析确定了影响人类智力的新基因座和基因。自然遗传学。49 1107-1112.
[25] 西班牙,S.L.和巴雷特,J.C.(2015)。精细绘制复杂性状的策略。嗯,分子遗传学。24年11月11日至19日。
[26] Speed,D.、Cai,N.、Consortium,U.、Johnson,M.R.、Nejentsev,S.和Balding,D.J.(2017年)。复杂人类性状SNP遗传力的重新评估。自然遗传学。49 986-992.
[27] Visscher,P.M.、Wray,N.R.、Zhang,Q.、Sklar,P.、McCarthy,M.I.、Brown,M.A.和Yang,J.(2017)。GWAS发现10年:生物学、功能和翻译。Am.J.Hum.遗传学。101 5-22.
[28] Wood,A.R.、Tuke,M.A.、Nalls,M.A、Hernandez,D.G.、Bandinelli,S.、Singleton,A.B.、Melzer,D.、Ferrucci,L.、Frayling,T.M.等人(2014年)。对明显上位的另一种解释。自然514 E3-E5。
[29] Yang,J.、Benyamin,B.、McEvoy,B.P.、Gordon,S.、Henders,A.K.、Nyholt,D.R.、Madden,P.A.、Heath,A.C.、Martin,N.G.等人(2010年)。常见的单核苷酸多态性解释了人类身高遗传率的很大一部分。自然遗传学。42 565-569.
[30] Yang,J.,Bakshi,A.,Zu,Hemani,G.,Vinkhuyzen,A.A.,Lee,S.H.,Robinson,M.R.,Perry,J.R.,Nolte,I.M.等人(2015年)。用插补变量进行遗传方差估计发现,人类身高和体重指数的缺失遗传力可以忽略不计。自然遗传学。47 1114.
[31] Zhou,X.、Carbonetto,P.和Stephens,M.(2013)。贝叶斯稀疏线性混合模型的多基因建模。《公共科学图书馆·遗传学》。9 e1003264。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。