摘要
研究人员通常拥有测量样本特征$x_{ij}$的数据集,例如学生的考试成绩。在因子分析和主成分分析中,这些特征被认为受到不可观察因素的影响,例如技能。我们可以确定有多少组件影响数据吗?这是一个重要的问题,因为这里的决策对所有下游数据分析都有很大影响。因此,制定了许多方法。并行分析是一种流行的置换方法:它随机地对数据的每个特征进行置乱。如果分量的奇异值大于置换数据的奇异值,则选择分量。尽管它得到了广泛的应用,也有经验证据证明其准确性,但目前还没有理论依据。
在本文中,我们证明了并行分析(或置换方法)一致地选择某些高维因子模型中的大分量。然而,当信号过大时,不会选择较小的分量。直觉上,排列保持噪声不变,同时“破坏”低阶信号。这为排列方法提供了理由。我们的工作还揭示了置换方法的缺点,并为改进铺平了道路。
引用
下载引文
埃德加·多布里班(Edgar Dobriban)。
“用于因子分析和主成分分析的置换方法。”
安。统计师。
48
(5)
2824 - 2847,
2020年10月。
https://doi.org/10.1214/19-AOS1907
问询处
收到日期:2018年5月1日;修订日期:2019年9月1日;发布日期:2020年10月
欧几里德项目首次提供:2020年9月19日
数字对象标识符:10.1214/19-AOS1907
学科:
主要用户:62H25个
次要:62甲12
关键词:因子分析,高维渐近,并行分析,PCA公司,置换方法
版权所有©2020数学统计研究所