×

具有一般体积的线性混合模型中的主成分。 (英语) Zbl 1475.62107号

摘要:我们研究了多元混合效应线性模型中协方差估计的主成分。我们表明,在高维中,主特征值和特征向量可能会表现出低维设置中不存在的偏差和混叠效应。我们在一个高维渐近框架中导出了主特征值位置和特征向量投影的一阶极限,考虑到随机效应的一般总体谱分布,并从更具限制性的尖峰模型扩展了先前的结果。我们的分析使用自由概率技术,并且我们开发了两个独立的通用工具——GOE和确定性矩阵的强渐近自由性,以及双线性形式预解式的自由确定性等价近似。

MSC公司:

62E20型 统计学中的渐近分布理论
62H20个 关联度量(相关性、典型相关性等)
62H25个 因子分析和主成分;对应分析
62J05型 线性回归;混合模型
60对20 随机矩阵(概率方面)

软件:

GCTA公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bai,Z.和Yao,J.(2012)。广义加标总体模型中的样本特征值。《多元分析杂志》。106 167-177. ·Zbl 1301.62049号 ·doi:10.1016/j.jmva.2011.10.009
[2] Baik,J.、Ben Arous,G.和Péché,S.(2005)。非零复样本协方差矩阵最大特征值的相变。安·普罗巴伯。33 1643-1697. ·Zbl 1086.15022号 ·doi:10.1214/00911790500000233
[3] Baik,J.和Silverstein,J.W.(2006)。尖峰种群模型大样本协方差矩阵的特征值。《多元分析杂志》。97 1382-1408. ·Zbl 1220.15011号 ·doi:10.1016/j.jmva.2005.08.003
[4] Belinschi,S.、Bercovici,H.和Capitaine,M.(2017年)。关于大型独立随机矩阵中多项式的离群特征值。预印本。可从arXiv:1703.08102获取·兹比尔1471.15031
[5] Belinschi,S.T.、Bercovici,H.、Capitaine,M.和Février,M.(2017)。大变形酉不变模型谱中的异常值。安·普罗巴伯。45 3571-3625. ·Zbl 1412.60014号 ·doi:10.1214/16-AOP1144
[6] Belinschi,S.T.和Capitaine,M.(2017年)。独立Wigner矩阵和确定性矩阵中多项式的谱性质。J.功能。分析。273 3901-3963. ·Zbl 1407.46055号 ·doi:10.1016/j.jfa.2017.07.010
[7] Benaych-Georges,F.(2009年)。矩形随机矩阵,相关卷积。可能性。理论相关领域144 471-515. ·Zbl 1171.15022号 ·doi:10.1007/s00440-008-0152-z
[8] Benaych-Georges,F.和Nadakuditi,R.R.(2011)。大型随机矩阵的有限低秩扰动的特征值和特征向量。高级数学。227 494-521. ·Zbl 1226.15023号 ·doi:10.1016/j.aim.2011.02.007
[9] Benaych-Georges,F.和Nadakuditi,R.R.(2012)。大型矩形随机矩阵低秩扰动的奇异值和奇异向量。《多元分析杂志》。111 120-135. ·Zbl 1252.15039号 ·doi:10.1016/j.jmva.2012.04.019
[10] Bhattacharjee,M.和Bose,A.(2016)。高维自方差矩阵的大样本行为。安。统计师。44 598-628. ·Zbl 1343.62053号 ·doi:10.1214/15-OS1378
[11] Bhattacharjee,M.和Bose,A.(2016)。当\[p{n^{-1}}\到0\]时样本方差-方差矩阵的多项式推广。随机矩阵理论应用。5 1650014, 41. ·兹比尔1356.60013 ·doi:10.1142/S2010326316500143
[12] Bhattacharjee,M.和Bose,A.(2017年)。当\[p{n^{-1}}到y\ in(0,infty)\]时样本方差-方差矩阵的矩阵多项式推广。印度J.Pure Appl。数学。48 575-607. ·Zbl 1390.15119号 ·doi:10.1007/s13226-017-0247-2
[13] Bhattacharjee,M.和Bose,A.(2019)。样本自协方差矩阵在\[p/n\到0\]时的联合收敛性及其应用。安。统计师。47 3470-3503. ·Zbl 1435.62316号 ·doi:10.1214/18-AOS1785
[14] Blows,M.W.和McGuigan,K.(2015)。遗传方差在表型空间的分布和对选择的反应。摩尔生态。24 2056-2072.
[15] Bose,A.和Bhattacharjee,M.(2019年)。大协方差和自协方差矩阵.统计学和应用概率专著162.佛罗里达州博卡拉顿CRC出版社。
[16] Burda,Z.、Jurkiewicz,J.和WacŁaw,B.(2005)。相关Wishart矩阵的谱矩。物理学。版本E(3) 71 026111, 11. ·Zbl 06781399号 ·doi:10.1103/PhysRevE.71.026111
[17] Capitaine,M.和Casalis,M.(2004年)。高斯矩阵和Wishart矩阵的广义矩的渐近自由度。贝塔随机矩阵的应用。印第安纳大学数学。J。53 397-431. ·Zbl 1063.46054号 ·doi:10.1512/iumj.2004.53.2325
[18] Capitaine,M.和Donati-Martin,C.(2007年)。Wigner和Wishart矩阵的强渐近自由性。印第安纳大学数学。J。56 767-803. ·Zbl 1162.15013号 ·doi:10.1112/iumj.207.56.2886
[19] Collet,J.M.、McGuigan,K.、Allen,S.L.、Chenoweth,S.F.和Blows,M.W.(2018年)。突变多效性和基因表达功能模块内部和之间稳定选择的强度。遗传学208 1601-1616. ·doi:10.1534/genetics.118.300776
[20] Collins,B.(2003年)。酉群上多项式随机变量的矩和累积量、Itzykson-Zuber积分和自由概率。国际数学。Res.否。17 953-982. ·Zbl 1049.60091号 ·doi:10.1155/S107379280320917X
[21] Collins,B.和niady,P.(2006年)。关于酉群、正交群和辛群上Haar测度的积分。公共数学。物理学。264 773-795中·Zbl 1108.60004号 ·doi:10.1007/s00220-006-1554-3
[22] Dobriban,E.和Liu,S.(2018年)。线性回归中草图绘制的新理论。预印本。可从arXiv:1810.06089获得。
[23] Dykema,K.(1993)。通过扩展矩阵模型研究某些自由乘积因子。J.功能。分析。112 31-60. ·Zbl 0768.46039号 ·doi:10.1006/jfan.1993.1025
[24] Fan,Z.和Johnstone,I.M.(2019年)。高维随机效应模型中方差分量估计量的特征值分布。安。统计师。47 2855-2886. ·Zbl 1431.62066号 ·doi:10.1214/18-AOS1767
[25] Fan,Z.、Johnstone,I.M.和Sun,Y.(2018年)。高维随机效应模型中的尖峰协方差和主成分分析。预印。可从arXiv:1806.09529获取。
[26] Fan,Z.、Sun,Y.和Wang,Z.(2021)。补充“一般散装线性混合模型中的主要成分”https://doi.org/10.1214/20-AOS2010SUPP网站
[27] Fisher,R.A.(1918年)。孟德尔遗传假设下的亲属关系。事务处理。R.Soc.爱丁堡。52 399-433.
[28] Haagerup,U.和ThorbjØrnsen,S.(2005)。随机矩阵的一个新应用:\[\text{Ext}({C_{\text{red}}^{\ast}}({F_2}))\]不是一个群。数学年鉴. (2) 162 711-775. ·Zbl 1103.46032号 ·doi:10.4007/annals.2005.162.711
[29] Hachem,W.、Loubaton,P.和Najim,J.(2007年)。大随机矩阵某些泛函的行列式等价。附录申请。普罗巴伯。17 875-930. ·Zbl 1181.15043号 ·doi:10.1214/105051606000000925
[30] Hiai,F.和Petz,D.(2000年)。随机矩阵几乎处处渐近自由。科学学报。数学. (塞格德) 66 809-834. ·Zbl 0973.15016号
[31] Hine,E.和Blows,M.W.(2006年)。确定遗传方差-方差矩阵的有效维数。遗传学173 1135-1144.
[32] Johnstone,I.M.(2001)。关于主成分分析中最大特征值的分布。安。统计师。29 295-327. ·Zbl 1016.62078号 ·doi:10.1214/aos/1009210544
[33] Johnstone,I.M.和Lu,A.Y.(2009年)。高维主成分分析的一致性和稀疏性。J.Amer。统计师。协会。104 682-693. ·兹比尔1388.62174 ·doi:10.1198/jasa.2009.0121
[34] Johnstone,I.M.和Paul,D.(2018年)。高维PCA:定向。程序。电气与电子工程师协会106 1277-1292. ·doi:10.1109/JPROC.2018.2846730
[35] Jolliffe,I.T.(1986)。主成分分析.统计学中的斯普林格系列纽约州施普林格·doi:10.1007/9781-4757-1904-8
[36] Leek,J.T.和Storey,J.D.(2007)。通过替代变量分析捕获基因表达研究中的异质性。公共科学图书馆-遗传学。3 e161。
[37] Li,G.和Zhu,H.(2013)。遗传研究:全基因组关联研究中的线性混合模型。打开Bioninform。J。7 27-33. ·数字对象标识代码:10.2174/1875036201307010027
[38] Liu,H.、Aue,A.和Paul,D.(2015)。线性时间序列的Marčenko-Pastur定律。安。统计师。43 675-712. ·Zbl 1312.62080号 ·doi:10.1214/14-AOS1294
[39] Lynch,M.和Walsh,B.(1998年)。遗传学与数量性状分析1.西诺尔,马萨诸塞州桑德兰。
[40] Male,C.(2012年)。大型随机和确定性矩阵中多项式的范数。可能性。理论相关领域154 477-532. ·Zbl 1269.15039号 ·doi:10.1007/s00440-011-0375-2
[41] Marcenko,V.A.和Pastur,L.A.(1967年)。一些随机矩阵集的特征值分布。Sb.数学。1 457-483. ·兹比尔0162.22501
[42] Mingo,J.A.和Speicher,R.(2017)。自由概率与随机矩阵.菲尔德研究所专著35.纽约斯普林格·Zbl 1387.60005号 ·doi:10.1007/978-1-4939-6942-5
[43] Nadler,B.(2008)。主成分分析的有限样本近似结果:矩阵摄动方法。安。统计师。36 2791-2817. ·Zbl 1168.62058号 ·doi:10.1214/08-AOS618
[44] Nica,A.、Shlyakhtenko,D.和Speicher,R.(2002)。算子值分布。自由的特征。国际数学。Res.否。29 1509-1538. ·Zbl 1007.46052号 ·doi:10.1155/S107379280201038
[45] Nica,A.和Speicher,R.(2006年)。自由概率组合论讲座.伦敦数学学会讲座笔记系列335.剑桥大学出版社,剑桥·Zbl 1133.60003号 ·doi:10.1017/CBO9780511735127
[46] Patterson,N.、Price,A.L.和Reich,D.(2006年)。种群结构和特征分析。公共科学图书馆-遗传学。2 e190·doi:10.1371/journal.pgen.0020190
[47] Paul,D.(2007年)。大维尖峰协方差模型样本特征结构的渐近性。统计师。西尼卡17 1617-1642年·Zbl 1134.62029号
[48] Paul,D.和Aue,A.(2014)。统计学中的随机矩阵理论:综述。J.统计。计划。推断150 1-29. ·兹比尔1287.62011 ·doi:10.1016/j.jspi.2013.09.005
[49] Rao,C.R.(1972)。线性模型中方差和协方差分量的估计。J.Amer。统计师。协会。67 112-115. ·Zbl 0231.62082号
[50] Schultz,H.(2005)。独立高斯随机矩阵的非交换多项式。真实和辛的情况。可能性。理论相关领域131 261-309. ·Zbl 1085.46045号 ·doi:10.1007/s00440-004-0366-7
[51] Searle,S.R.、Casella,G.和McCulloch,C.E.(2006年)。差异组件.概率统计中的威利级数新泽西州霍博肯威利·Zbl 1108.62064号
[52] Speicher,R.和Vargas,C.(2012年)。自由确定性等价物、矩形随机矩阵模型和算子值自由概率理论。随机矩阵理论应用。1 1150008, 26. ·Zbl 1263.46053号 ·doi:10.1142/S2010326311500080
[53] Stegle,O.、Parts,L.、Piipari,M.、Winn,J.和Durbin,R.(2012)。使用表达残差的概率估计(PEER)来提高基因表达分析的能力和可解释性。《国家协议》。7 500-507. ·doi:10.1038/nprot.2011.457
[54] Tracy,C.A.和Widom,H.(1996年)。关于正交矩阵系综和辛矩阵系综。公共数学。物理学。177 727-754. ·Zbl 0851.60101号
[55] Voiculescu,D.(1991)。随机矩阵和自由积的极限定律。发明。数学。104 201-220. ·Zbl 0736.60007号 ·doi:10.1007/BF01245072文件
[56] Voiculescu,D.(1998年)。随机矩阵的一个增强的渐近自由度结果及其对自由熵的应用。国际数学。Res.否。1 41-63. ·Zbl 0895.60004号 ·doi:10.115/S107379289800004X
[57] Wang,L.,Aue,A.和Paul,D.(2017)。一类中等高维线性时间序列样本自方差矩阵的谱分析。伯努利23 2181-2209. ·Zbl 1388.62272号 ·doi:10.3150/16-BEJ807
[58] Wright,S.(1935)。方差分析和亲属之间关于与最优值的偏差的相关性。《遗传学杂志》。30 243-256.
[59] Yang,J.、Lee,S.H.、Goddard,M.E.和Visscher,P.M.(2011年)。GCTA:全基因组复杂性状分析工具。Am.J.Hum.遗传学。88 76-82.
[60] 张磊(2006)。新加坡国立大学大维随机矩阵谱分析博士论文
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。