×

比较主成分分析中测试最小特征值相等性所需的校正因子和样本量。 (英语) Zbl 1470.62072号

摘要:在主成分分析(PCA)的推理过程中,研究人员面临的主要挑战之一是确定代表样本的正确成分数量。为此,提出了启发式和统计策略。一种统计方法是使用遵循\(\chi^2)极限分布的似然比检验(LRT)来检验协方差或相关矩阵中最小特征值相等的假设。提出了不同的校正因子,以改进统计数据的抽样分布的近似性。我们使用模拟来研究在使用这些不同因素下测试的显著性水平和功效,并分析适当近似所需的样本量。结果表明,对于协方差矩阵,Bartlett提出的因子在低I型误差概率和高功率目标之间提供了最佳平衡。如果使用相关矩阵,建议使用因子\(W^\ast_B\)和\(c\chi^2_d\)。经验上,我们可以观察到,如果分别采用协方差矩阵或相关矩阵,则大多数因素需要变量数量的10倍或20倍的样本大小。

MSC公司:

62H15型 多元分析中的假设检验
62H25个 因子分析和主成分;对应分析
15A42型 包含特征值和特征向量的不等式

软件:

R(右)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arteaga,F.&Ferrer,A.(2010),“如何用所需的相关结构模拟正常数据集”,化学计量学和智能实验室系统101,38-42。
[2] Bartlett,M.(1951年),“标准化对因子分析中χ2近似的影响”,《生物统计学》38(3/4),337-344·Zbl 0045.08701号
[3] Bartlett,M.(1954),“关于各种χ2近似的多重因素的注释”,《皇家统计学会杂志》。B系列(方法学)16(2),296-298·Zbl 0057.35404号
[4] Björklund,M.(2019),“小心你的主要组成部分”,《进化》73(10),2151-2158。
[5] Box,G.E.P.(1949),“一类似然准则的一般分布理论”,《生物特征36》(3/4),第317-346页·Zbl 0035.09101号
[6] Chakraborty,L.、Rus,H.、Henstra,D.、Thistlethwaite,J.&Scott,D.(2020年),“基于地点的社会经济地位指数:在环境正义的背景下衡量粮食危害的社会脆弱性”,《国际减少灾害风险杂志》43。
[7] Ferré,L.(1995),“主成分分析中成分的选择:方法的比较”,计算统计学与数据分析19,669-689·Zbl 0875.62253号
[8] Friedman,S.(1981),“解释相关矩阵的第一个特征值”,教育和心理测量41,11-21。
[9] Fujikoshi,Y.,Yamada,T.,Watanabe,D.&Sugiyama,T.(2007),“高维主成分分析中最小特征值相等的LR统计的渐近分布”,《多元分析杂志》982002-2008年·Zbl 1133.62037号
[10] Jackson,D.(1993),“主成分分析中的停止规则:启发式和统计方法的比较”,美国生态学会74(8),2204-2214。
[11] Jackson,J.E.(1991),《主要部件用户指南》,John Wiley&Sons,Inc·Zbl 0743.62047号
[12] Jolli ffe,I.(2002),主成分分析,第2版,Springer。哥伦比亚国家统计局-应用统计44(2021)43-64·Zbl 1011.62064号
[13] 64爱德华·加尼安·卡德纳斯和胡安·卡洛斯·科雷亚·莫拉莱斯
[14] Knapp,T.R.&Swoyer,V.H.(1967年),“关于Bartlett相关矩阵重要性检验的一些实证结果”,美国教育研究协会4(1),13-17。
[15] Krazanowski,W.J.(1988),《多元分析原理,用户视角》,牛津统计科学·Zbl 0678.62001号
[16] Lawley,D.(1956),“协方差和相关性潜在根的显著性检验”,《生物统计学》43(1/2),128-136·Zbl 0070.37603号
[17] Mardia,K.,Kent,J.和Bibby,J.(1979),《多元分析》,第6版,圣地亚哥学术出版社·Zbl 0432.62029号
[18] Maté,C.G.(2011),“预测组合的多元分析方法。外汇(FX)市场应用”,Revista Colombiana de Estadistica34(2),347-375·Zbl 07578262号
[19] Peres Neto,P.R.,Jackson,D.A.和Somers,K.M.(2005),“有多少主要成分?“确定重新访问的非平凡轴数量的停止规则”,《计算统计与数据分析》49(4),974-997·Zbl 1429.62223号
[20] R核心团队(2019年),R:统计计算的语言和环境,R统计计算基金会,奥地利维也纳。https://www.Rproject.org/
[21] ⑩ahan,C.、Baydur,H.和Demiral,Y.(2018),“哥本哈根心理社会问卷的新版本-3:土耳其验证研究”,《环境与职业健康档案》74(6),297-309。
[22] Schott,J.R.(1988),“测试相关矩阵最小潜在根的相等性”,《生物特征》75(4),794-796·Zbl 0653.62046号
[23] Schott,J.R.(2006),“协方差矩阵最小特征值相等性的高维检验”,《多元分析杂志》97,827-843·Zbl 1086.62072号
[24] Schott,J.R.(2012),“协方差矩阵最小特征值相等性检验的近似方法”,统计学中的通信——理论和方法41,4439-4443·Zbl 1258.62017号
[25] Watanabe,D.、Okada,S.、Fujikoshi,Y.和Sugiyama,T.(2008),“椭圆总体下协方差矩阵最小特征值相等的LR统计的大样本近似”,计算统计与数据分析52,2714-2724·Zbl 1452.62137号
[26] Waternaux,C.(1984),“非正态情况下的主成分:Q根相等性的检验”,《多元分析杂志》14,323-335·Zbl 0538.62042号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。