×

Cauchy稳健主成分分析在高维数据集中的应用。 (英语) Zbl 1529.62018号

摘要:主成分分析(PCA)是一种用于各种研究和应用领域的标准降维技术。从算法的角度来看,经典的主成分分析可以用多元高斯似然的运算来表示。由于隐含高斯公式,主成分对异常值不具有鲁棒性。在本文中,我们提出了一种改进的公式,该公式基于使用多元柯西似然代替高斯似然,具有增强主成分的效果。我们提出了一种计算这些鲁棒主成分的算法。我们还导出了第一分量的相关影响函数,并检验了其理论性质。在高维数据集上的仿真实验表明,基于柯西似然估计的主成分通常优于或与现有的稳健PCA技术相当。此外,与我们考虑的其他公共域鲁棒PCA方法相比,我们使用的Cauchy PCA算法在非常高维的设置下具有更低的计算成本。

MSC公司:

62-08 统计学相关问题的计算方法
62H25个 因子分析和主成分;对应分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 博尔顿,RJ;Krzanowski,WJ,投影寻踪主成分的表征,《美国统计》,53,2,108-109(1999)
[2] 坎贝尔,NA,多元分析中的稳健程序I:稳健协方差估计,应用。统计,29,3,231-237(1980)·Zbl 0471.62047号 ·doi:10.2307/2346896
[3] 坎迪斯,EJ;李,X。;马云(Ma,Y.)。;Wright,J.,稳健主成分分析?,J.ACM(JACM),58,3,1-37(2011)·Zbl 1327.62369号 ·数字对象标识代码:10.1145/1970392.1970395
[4] 科帕斯,JB,《关于柯西分布可能性的单峰性》,《生物统计学》,62,3,701-704(1975)·Zbl 0321.62037号 ·doi:10.1093/biomet/62.3.701
[5] 克罗克斯,C。;Filzmoser,P。;Oliveira,MR,投影追踪稳健主成分分析算法,化学。智力。实验室系统。,87, 2, 218-225 (2007) ·doi:10.1016/j.chemolab.2007.01.004
[6] 克罗克斯,C。;Filzmoser,P。;Fritz,H.,稳健稀疏主成分分析,技术计量学,55,2,202-214(2013)·文件编号:10.1080/00401706.2012.727746
[7] Filzmoser,P.,Fritz,H.,Kalcher,K.:pcaPP:投影追踪的稳健主成分分析(2018)。R软件包版本1.9-73。https://CRAN.R-project.org/package=pcaPP
[8] Huber,PJ,位置参数的稳健估计,Ann.Math。Stat.,35,1,73-101(1964)·Zbl 0136.39805号 ·doi:10.1214/aoms/1177703732
[9] 休伯特,M。;Verboven,S.,《高维回归变量的稳健PCR方法》,J.Chemom。,17, 438-452 (2003) ·doi:10.1002/cem.783
[10] Lakiotaki,K.,Vorniotakis,N.,Tsagris,M.,Georgakopoulos,G.,Tsamardinos,I.:生物数据组:数据驱动生物学的统一预处理和自动注释数据集的集合。2018年数据库,bay011(2018)
[11] 李国荣;Chen,ZL,鲁棒色散矩阵和主成分的投影寻踪方法:初级理论和蒙特卡罗,J.Am.Stat.Assoc.,80,759-766(1985)·Zbl 0595.62060号 ·doi:10.1080/016214591985.10478181
[12] 马迪亚,肯塔基州;肯特,JT;Bibby,JM,《多元分析》(1979),学术出版社·Zbl 0432.62029号
[13] Maronna,RA,多元位置和散布的稳健M-估计,Ann.Stat.,4,1,51-67(1976)·Zbl 0322.62054号 ·doi:10.1214/aos/1176343347
[14] Ro,K。;邹,C。;王,Z。;Yin,G.,高维数据的离群检测,Biometrika,102,3,589-599(2015)·兹比尔1452.62378 ·doi:10.1093/biomet/asv021
[15] Sykulski,M.:Rpca:RobustPCA:将矩阵分解为低秩稀疏分量(2017)。R包版本0.2.3。https://CRAN.R-project.org/package=rpca
[16] Todorov,V.:rrcovHD:高维数据的稳健多元方法(2016)。R包版本0.2-5。https://CRAN.R-project.org/package=rrcovHD
[17] Tsagris,M.,Fayomi,A.,Pantazis,Y.,Wood,A.T.A.:Cauchypca:使用cauchy分布的稳健主成分分析(2023)。R软件包版本1.1。https://CRAN.R-project.org/package=cauchypca
[18] Vakili,K.:FastHCS:主成分分析的稳健算法(2018)。R包版本0.0.6。https://CRAN.R-project.org/package=FastHCS
[19] 谢,YL;王建华;梁,LX;太阳,XHS;Yu,RQ,投影寻踪稳健主成分分析,J.Chemom。,7, 6, 527-541 (1993) ·doi:10.1002/cem.1180070606
[20] Zhang,L.,Pan,C.:RobRSVD:稳健正则奇异值分解(2013)。R包版本1.0。https://rdrr.io/cran/RobRSVD/
[21] 张,L。;沈,H。;黄,JZ,稳健正则奇异值分解及其在死亡率数据中的应用,Ann.Appl。统计,7,3,1540-1561(2013)·Zbl 1454.62189号 ·doi:10.1214/13-AOAS649
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。