×

具有测量误差的稀疏主成分分析。 (英语) Zbl 1341.62168号

摘要:传统的主成分分析往往会产生非零载荷,这使得主成分的解释变得困难。这个缺点可以通过过去十年开发的稀疏主成分分析程序来克服。然而,当随机变量或向量受到测量误差的污染时,还没有进行类似的工作。简单地将现有的稀疏主成分分析程序应用于受误差污染的数据可能会导致有偏差的载荷。本文尝试修改现有的稀疏主成分过程以适应测量误差设置。与无误差情况类似,我们证明了潜在变量的稀疏主成分可以表示为基于观测代理的偏校正拉索(弹性网)回归问题,并开发了有效的算法来实现该过程。进行了数值模拟研究,以说明所提出方法的有限样本性能。

MSC公司:

62H25个 因子分析和主成分;对应分析
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 变更,O。;布朗,P。;Botstein,D.,用于全基因组表达数据处理和建模的奇异值分解,Proc。国家。阿卡德。科学。,97, 10101-10106 (2000)
[2] 卡罗尔·R·J。;Ruppert,D。;斯蒂芬斯基,洛杉矶。;Crainiceanu,C.M.,《非线性模型中的测量误差:现代视角》(2006),Chapman和Hall/CRC·Zbl 1119.62063号
[3] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,最小角回归,Ann.Statist。,32, 407-499 (2004) ·Zbl 1091.62054号
[4] Fuller,W.A.,《测量误差模型》(1987),John Wiley and Sons,Inc·Zbl 0800.62413号
[5] Gorsau,R.L.,《因子分析》(1983年),劳伦斯·埃尔鲍姆协会:劳伦斯·埃尔鲍姆协会,新泽西州希尔斯代尔
[6] Hancock,P。;A.伯顿。;Bruce,V.,《面部处理:人类感知和主成分分析》,Mem。认知。,24, 26-40 (1996)
[7] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素:数据挖掘、推断和预测》(2001),Springer Verlag:Springer Verlag纽约·Zbl 0973.62007号
[8] Henry,F.K.,《因子分析中分析旋转的方差最大标准》,《心理测量学》,23,3,187-200(1958)·Zbl 0095.33603号
[9] Jeffers,J.,《主成分应用的两个案例研究》,Appl。《统计》,第16卷,第225-236页(1967年)
[10] 麻省理工学院Jolliffe。;Uddin,M.,基于套索J.Compute的改进主成分技术。图表。统计人员。,12,531-547(2003年)
[11] Tabachnick,B.G。;Fidell,L.S.,《使用多元统计》(2007),Pearson Allyn&Bacon:新泽西州Pearson Alyn&培根上鞍河
[12] Tibshirani,R.,通过套索进行回归收缩和选择,J.R.Stat.Soc.Ser。B、 58、267-288(1996)·Zbl 0850.62538号
[13] Vines,S.,简单主要成分,应用。统计,49,441-451(2000)·Zbl 0965.62052号
[14] 邹,H。;Hastie,T.,通过弹性网的正则化和变量选择,J.R.Stat.Soc.Seri。B、 67301-320(2005)·Zbl 1069.62054号
[16] 邹,H。;哈斯蒂,T。;Tibshirani,R.,稀疏主成分分析,J.Compute。图表。统计人员。,15, 2, 265-286 (2006)
[17] 邹,H。;Trevor,T.,《通过弹性网进行正则化和变量选择》,J.R.Stat.Soc.Ser。B、 67、2、301-320(2005)·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。