×

因子分析和主成分分析的排列方法。 (英语) Zbl 1460.62093号

来自作者的摘要:“研究人员通常有测量样本特征(x{ij})的数据集,例如学生的考试成绩。在因子分析和主成分分析中,这些特征被认为受到不可观察因素的影响,例如技能。我们能确定有多少因素影响数据吗?这是一个重要的问题,因为这里的决策对所有下游数据分析都有很大影响。因此,制定了许多方法。并行分析是一种流行的排列方法:它对数据的每个特征进行随机置乱。如果分量的奇异值大于置换数据的奇异值,则选择分量。尽管它得到了广泛的使用,也有经验证据证明其准确性,但目前还没有理论依据。”
本文在信号加噪声模型下分析了该问题。建立了信号分量和噪声分量的充分条件,以确保并行分析的一致性。仿真研究支持了理论结果,并指出了并行分析的有趣特征。特别地,研究了信号强度的影响、离域效应和维数的影响。最后,研究表明,强信号可能会导致微弱信号分量的检测错误。

MSC公司:

62H25个 因子分析和主成分;对应分析
62甲12 多元分析中的估计
60G35型 信号检测和滤波(随机过程方面)
94甲12 信号理论(表征、重建、滤波等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Anderson,T.W.(1958年)。多元统计分析导论。威利统计出版物。威利,纽约;CRC出版社,伦敦。Zentralblatt数学:0083.14601
·Zbl 0083.14601号
[2] Bai,Z.和Ding,X.(2012)。尖峰模型中尖峰特征值的估计。随机矩阵理论应用。1 1150011, 21. Zentralblatt数学:1251.15037
数字对象标识符:doi:10.1142/S2010326311500110
·兹比尔1251.15037 ·doi:10.1142/S2010326311500110
[3] Bai,J.和Ng,S.(2008年)。大维度因素分析。现为汉诺威出版社。
[4] Bai,Z.和Silverstein,J.W.(2010年)。《大维随机矩阵的谱分析》,第二版,《统计学中的斯普林格级数》。纽约州施普林格。天顶广场数学:1301.60002
·Zbl 1301.60002号
[5] Baik,J.、Ben Arous,G.和Péché,S.(2005)。非零复样本协方差矩阵最大特征值的相变。安·普罗巴伯。33 1643-1697. Zentralblatt数学:1086.15022
数字对象标识符:doi:10.1214/00911790500000233
欧几里德项目:Euclid.aop/127395869
·兹比尔1086.15022 ·doi:10.1214/00911790500000233
[6] Bartlett,M.S.(1950)。因子分析中的显著性检验。英国数学杂志。Stat.Psychol公司。3 77-85.
[7] Benaych-Georges,F.和Nadakuditi,R.R.(2012)。大型矩形随机矩阵低秩扰动的奇异值和奇异向量。J.多变量分析。111 120-135. Zentralblatt数学:1252.15039
数字对象标识符:doi:10.1016/j.jmva.2012.04.019
·兹比尔1252.15039 ·doi:10.1016/j.jmva.2012.04.019
[8] Brown,T.A.(2014)。应用研究的验证性因素分析。纽约吉尔福德。
[9] Buja,A.和Eyuboglu,N.(1992年)。关于平行分析的备注。多变量。行为。第27 509-540号决议。
[10] Cattell,R.B.(1966年)。因子数量的筛选测试。多变量。行为。第1 245-276号决议。
[11] Churchill,G.A.Jr.(1979年)。制定更好的营销结构衡量标准的范例。《商标研究杂志》64-73。
[12] Costello,A.B.和Osborne,J.W.(2005)。探索性因子分析的最佳实践:从分析中获得最大收益的四条建议。实际。评估。,Res.评估。10 1-9.
[13] Dobriban,E.、Leeb,W.和Singer,A.(2017年)。线性变换尖峰模型中的最优预测。预印。可从arXiv:1709.03393获取。出现在统计年鉴中。arXiv:1709.03393
Zentralblatt数学:07196548
数字对象标识符:doi:10.1214/19-AOS1819
欧几里德项目:Euclid.aos/1581930144
·Zbl 1441.62158号 ·doi:10.1214/19-AOS1819
[14] Dobriban,E.和Owen,A.B.(2019年)。确定性平行分析:一种改进的因子和主成分选择方法。J.R.统计社会服务。B.统计方法。81 163-183. Zentralblatt数学:1407.62216
数字对象标识符:doi:10.1111/rssb.12301
·Zbl 1407.62216号 ·doi:10.1111/rssb.12301
[15] Dobriban,E.和Wager,S.(2018年)。预测的高维渐近性:岭回归和分类。安。统计师。46 247-279. Zentralblatt数学:1428.62307
数字对象标识符:doi:10.1214/17-AOS1549
欧几里德项目:Euclid.aos/1519268430
·Zbl 1428.62307号 ·doi:10.1214/17-AOS1549
[16] Fabrigar,L.R.、Wegener,D.T.、MacCallum,R.C.和Strahan,E.J.(1999)。评价探索性因素分析在心理学研究中的应用。精神病。方法4272。
[17] Gaskin,C.J.和Happell,B.(2014)。探索性因素分析:对近期证据的回顾,对当前实践的评估,以及对未来使用的建议。国际J.Nurs。螺柱51 511-521。
[18] Gerard,D.和Stephens,M.(2017年)。基于阴性对照消除不必要变异的统一和概括方法。预印。可从arXiv:1705.08393获取。arXiv:1705.08393
[19] Glorfeld,L.W.(1995)。对Horn的平行分析方法的改进,用于选择要保留的正确数量的因素。教育。精神病。测量。55 377-393.
[20] Green,S.B.、Levy,R.、Thompson,M.S.、Lu,M.和Lo,W.-J.(2012)。提出了使用完全随机数据通过并行分析评估因子数量的问题解决方案。教育。精神病。测量。72 357-374.
[21] Hastie,T.、Tibshirani,R.和Friedman,J.(2009年)。《统计学习的要素:数据挖掘、推断和预测》,第二版,《统计学中的斯普林格系列》。纽约州施普林格。天顶广场数学:1273.62005
·Zbl 1273.62005年
[22] Hayton,J.C.、Allen,D.G.和Scarpello,V.(2004)。探索性因子分析中的因子保留决策:平行分析教程。器官。研究方法7 191-205。
[23] 霍恩,J.L.(1965)。因子分析中因子数量的基本原理和测试。《心理测量学》30 179-185。Zentralblatt数学:1367.62186
数字对象标识符:doi:10.1007/BF02289447
·Zbl 1367.62186号 ·doi:10.1007/BF02289447
[24] Johnstone,I.M.(2001)。关于主成分分析中最大特征值的分布。安。统计师。29 295-327. Zentralblatt数学:1016.62078
数字对象标识符:doi:10.1214/aos/1009210544
欧几里德项目:Euclid.aos/109210544
·Zbl 1016.62078号 ·doi:10.1214/aos/1009210544
[25] Jolliffe,I.T.(2002)。主成分分析,第二版,《统计学中的斯普林格系列》。纽约州施普林格。天顶广场数学:1011.62064
·Zbl 1011.62064号
[26] Kaiser,H.F.(1960年)。电子计算机在因子分析中的应用。教育。精神病。测量。20 141-151.
[27] Kritchman,S.和Nadler,B.(2008年)。从有限的噪声数据中确定因子模型中的组件数量。化学。智力。实验室系统。94 19-32.
[28] Leek,J.T.和Storey,J.D.(2007)。通过替代变量分析捕获基因表达研究中的异质性。公共科学图书馆-遗传学。3 e161。
[29] Leek,J.T.和Storey,J.D.(2008)。多重测试依赖性的通用框架。程序。国家。阿卡德。科学。美国105 18718-18723。Zentralblatt数学:1359.62202
数字对象标识符:doi:10.1073/pnas.0808709105
·Zbl 1359.62202号 ·doi:10.1073/pnas.0808709105
[30] Lin,Z.,Yang,C.,Zhu,Y.等人(2016)。同时减少尺寸和调整混杂变化。程序。国家。阿卡德。科学。美国113 14662-14667。Zentralblatt数学:1407.62218
数字对象标识符:doi:10.1073/pnas.1617317113
·兹比尔1407.62218 ·doi:10.1073/pnas.1617317113
[31] Nadakuditi,R.R.(2014)。OptShrink:一种通过数据驱动的最优奇异值收缩来改进低阶信号矩阵去噪的算法。IEEE传输。通知。理论60 3002-3018。Zentralblatt数学:1360.62399
数字对象标识符:doi:10.1109/TIT.2014.2311661
·Zbl 1360.62399号 ·doi:10.1109/TIT.2014.2311661
[32] Nadler,B.(2008)。主成分分析的有限样本近似结果:矩阵摄动方法。安。统计师。36 2791-2817. Zentralblatt数学:1168.62058
数字对象标识符:doi:10.1214/08-AOS618
欧几里德项目:Euclid.aos/1231165185
·Zbl 1168.62058号 ·doi:10.1214/08-AOS618
[33] Onatski,A.(2009)。测试大因子模型中因子数量的假设。《计量经济学》77 1447-1479。Zentralblatt数学:1182.62180
数字对象标识符:doi:10.3982/ECTA6964
·Zbl 1182.62180号 ·doi:10.3982/ECTA6964
[34] Onatski,A.(2012)。具有弱影响因子的大因子模型主成分估计的渐近性。《计量经济学杂志》168 244-258。Zentralblatt数学:06714698
数字对象标识符:doi:10.1016/j.econom.2012.01.034
·Zbl 1443.62497号 ·doi:10.1016/j.jeconom.2012.01.034
[35] Onatski,A.、Moreira,M.J.和Hallin,M.(2013)。高维数据球度检验的渐近幂。安。统计师。41 1204-1231. Zentralblatt数学:1293.62125
数字对象标识符:doi:10.1214/13-AOS1100
欧几里德项目:Euclid.aos/1371150898
·Zbl 1293.62125号 ·doi:10.1214/13-AOS1100
[36] Paul,D.(2007年)。大维尖峰协方差模型样本特征结构的渐近性。统计师。Sinica 17 1617-1642年。Zentralblatt数学:1134.62029
·Zbl 1134.62029号
[37] Paul,D.和Aue,A.(2014)。统计学中的随机矩阵理论:综述。J.统计学家。计划。推论150 1-29。Zentralblatt数学:1287.62011
数字对象标识符:doi:10.1016/j.jspi.2013.09.005
·Zbl 1287.62011年 ·doi:10.1016/j.jspi.2013.09.005
[38] Peres-Neto,P.R.、Jackson,D.A.和Somers,K.M.(2005)。有多少主要成分?重新访问用于确定非平凡轴数量的停止规则。计算。统计师。数据分析。49 974-997. Zentralblatt数学:1429.62223
数字对象标识符:doi:10.1016/j.csda.2004.06.015
·Zbl 1429.62223号 ·doi:10.1016/j.csda.2004.06.015
[39] Quadeer,A.A.、Louie,R.H.、Shekhar,K.、Chakraborty,A.K.、Hsing,I.-M.和McKay,M.R.(2014)。基因型1a丙型肝炎病毒非结构蛋白3患者衍生序列替代的统计连锁分析揭示了免疫原设计的靶点。J.维罗尔。88 7628-7644.
[40] 雷切·G、麦琪斯·D和雷切·M·G·包装“影响因素”。2010
[41] Saccenti,E.和Timmerman,M.E.(2017年)。从随机矩阵理论的角度考虑Horn的并行分析。《心理测量学》82 186-209。Zentralblatt数学:1360.62531
数字对象标识符:doi:10.1007/s11336-016-9515-z
·Zbl 1360.62531号 ·doi:10.1007/s11336-016-9515-z
[42] 斯皮尔曼,C.(1904)。“一般智力”,客观确定和衡量。美国心理学杂志。15 201-292.
[43] Stewart,D.W.(1981)。因子分析在营销研究中的应用与误用。《J.Mark.Res.51-62》。
[44] Thurstone,L.L.(1947)。多因素分析。芝加哥大学出版社,芝加哥。Zentralblatt数学:0029.22203
·Zbl 0029.22203号
[45] Velicer,W.F.(1976年)。从偏相关矩阵中确定分量的数量。《心理测量学》41 321-327。Zentralblatt数学:0336.62041
数字对象标识符:doi:10.1007/BF02293557
·Zbl 0336.62041号 ·doi:10.1007/BF02293557
[46] Vershynin,R.(2012)。介绍随机矩阵的非渐近分析。在压缩传感210-268中。剑桥大学出版社,剑桥。
[47] Yao,J.、Zheng,S.和Bai,Z.(2015)。大样本协方差矩阵与高维数据分析。剑桥统计与概率数学系列39。剑桥大学出版社,纽约。
[48] Zhou,Y.-H.、Marron,J.S.和Wright,F.A.(2018年)。遗传关联的特征值显著性检验。生物计量学74 439-447。Zentralblatt数学:1415.62151
数字对象标识符:doi:10.1111/biom.12767
·Zbl 1415.62151号 ·doi:10.1111/biom.12767
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。