×

高维稀疏线性混合模型的遗传性估计。 (英语) Zbl 1337.62157号

摘要:受遗传领域应用的启发,我们建议在高维稀疏线性混合模型中估计遗传率。遗传率决定了线性混合模型中不同随机成分之间如何共享方差。我们的方法的主要新颖之处是考虑到随机效应可以是稀疏的,也就是说可能包含空分量,但我们不知道它们的比例或位置。我们考虑的估计器受到了M.皮林等【Ann.Appl.Stat.7,No.1,369–390(2013;Zbl 1454.62377号)],并基于最大似然法。我们还研究了估计量的理论性质,即在温和的假设下,当观察数(n)和随机效应数(n)趋于无穷大时,我们的遗传率估计量是一致的。我们还证明了我们的遗传率估计满足中心极限定理,该定理作为副产品给出了遗传率的置信区间。我们还进行了一些蒙特卡罗实验,以展示我们的估计器的有限样本性能。

MSC公司:

62J05型 线性回归;混合模型
62甲12 多元分析中的估计
2012年12月62日 参数估计量的渐近性质
62层25 参数公差和置信区域
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arias-Castro,E.、Candès,E.J.和Plan,Y.(2011年)。稀疏替代方案下的全球测试:方差分析、多重比较和较高的批评。,《统计年鉴》39 2533-2556·Zbl 1231.62136号 ·doi:10.1214/11-AOS910
[2] Bai,Z.和Silverstein,J.W.(2010)。,《大维随机矩阵的谱分析》,第二版,《统计学中的斯普林格级数》。纽约州施普林格·Zbl 1301.60002号 ·doi:10.1007/978-1-4419-0661-8
[3] Bai,Z.和Zhou,W.(2008)。列中没有独立结构的大样本协方差矩阵。,中国统计局18 425-442·Zbl 1135.62009号
[4] Beinrucker,A.、Dogan,U.和Blanchard,G.(2014)。使用观测值和协变量的子样本扩展稳定性选择·Zbl 1505.62061号
[5] Bonnet,A.、Lévy-Leduc,C.、Gassiat,E.、Toro,R.和Bourgeron,T.(2015)。通过稀疏高维线性混合模型中的变量选择方法提高遗传力。,提交。
[6] Fan,Y.和Li,R.(2012)。混合效应模型中的变量选择。,《统计年鉴》40 2043-2068·Zbl 1257.62077号 ·doi:10.1214/12-AOS1028
[7] Gilmour,A.、Thompson,R.和Cullis,B.(1995年)。平均信息REML:线性混合模型方差参数估计的有效算法。,生物统计学51 1440-1450·Zbl 0875.62314号 ·doi:10.2307/2533274
[8] Golan,D.和Rosset,S.(2011年)。使用随机效应模型在全基因组研究中准确估计遗传率。,生物信息学[ISMB/ECCB]27 317-323。
[9] Guan,Y.和Stephens,M.(2011)。用于全基因组关联研究和其他大规模问题的贝叶斯变量选择回归。,应用统计学年鉴5 1780-1815·Zbl 1229.62145号 ·doi:10.1214/11-AOAS455
[10] Ingster,Y.I.、Tsybakov,A.B.和Verzelen,N.(2010年)。稀疏回归中的检测边界。,电子统计杂志4 1476-1526·Zbl 1329.62314号 ·doi:10.1214/10-EJS589
[11] Kang,H.M.、Zaitlen,N.A.、Wade,C.M.、Kirby,A.、Heckerman,D.、Daly,M.J.和Eskin,E.(2008)。模型生物关联映射中种群结构的有效控制。,遗传学178 1709-1723。
[12] Lynch,M.和Walsh,B.(1998)。,遗传学与数量性状分析。M.桑德兰。
[13] Marchenko,V.A.和Pastur,L.A.(1968年)。一些随机矩阵集的特征值分布。,数学。苏联,第1 457-483页·Zbl 0162.22501号 ·doi:10.1070/SM1967v001n04ABEH001994
[14] Meinshausen,N.和Bühlmann,P.(2010年)。稳定性选择。,英国皇家统计学会杂志:B辑(统计方法)72 417-473·doi:10.1111/j.1467-9868.2010.00740.x
[15] Patterson,H.D.和Thompson,R.(1971)。块大小不相等时块间信息的恢复。,生物特征58 545-554·Zbl 0228.62046号 ·doi:10.1093/biomet/583.545
[16] Pirinen,M.、Donnelly,P.和Spencer,C.C.A.(2013)。大规模数据集上线性混合模型的高效计算及其在遗传研究中的应用。,应用统计学年鉴7 369-390·Zbl 1454.62377号 ·doi:10.1214/12-AOAS586
[17] Searle,S.R.、Casella,G.和McCulloch,C.E.(1992)。,差异组件。概率统计威利级数。新泽西州威利·Zbl 0850.62007号
[18] Serfling,R.(1980)。,数理统计的逼近定理。概率与数理统计中的威利级数。威利,纽约州纽约市·兹伯利0538.62002
[19] 托罗、R.、波琳、J.-B.、胡格特、G.、洛斯、E.、弗劳因、V.、巴纳斯切夫斯基、T.、巴克、G.J.、博克德、A.、比切尔、C.、卡瓦略、F.、康罗德、P.、福斯-比勒、M.、弗洛尔、H.、加里纳、J.、加拉文、H.,戈洛恩、P.,海因茨、A.、伊特曼、B.、劳伦斯、C.、莱马é特、H.;曼恩、K.、内斯、F.,鲍斯、T.,巴布索娃,Z.、里茨chel,M.,Robbins,T.,Smolka,M。,Ströhle,A.、Schumann,G.和Bourgeron,T.(2014)。人类神经解剖多样性的基因组结构。,分子精神病学。
[20] Wei,G.C.G.和Tanner,M.A.(1990年)。EM算法和穷人数据增强算法的蒙特卡罗实现。,美国统计协会杂志85 699-704。
[21] Yang,J.、Benyamin,B.、McEvoy,B.P.、Gordon,S.、Henders,A.K.、Nyholt,D.R.、Madden,P.A.、Heath,A.C.、Martin,N.G.、Montgomery,G.W.、Goddard,M.E.和Visscher,P.M.(2010)。常见的SNP解释了人类身高遗传率的很大一部分。,《自然遗传学》42 565-569。
[22] Yang,J.、Lee,S.H.、Goddard,M.E.和Visscher,P.M.(2011年)。GCTA:全基因组复杂性状分析工具。,美国人类遗传学杂志88 76-82。
[23] Zhou,X.、Carbonetto,P.和Stephens,M.(2013)。贝叶斯稀疏线性混合模型的多基因建模。,《公共科学图书馆·遗传学》9 e1003264。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。