×

模态主成分分析。 (英语) Zbl 1455.62120号

摘要:主成分分析(PCA)是一种广泛使用的数据处理方法,如降维和可视化。众所周知,标准PCA对异常值敏感,已经提出了各种鲁棒PCA方法。研究表明,许多统计方法的稳健性可以通过使用模式估计而不是平均估计来提高,因为模式估计不会受到异常值的显著影响。因此,本研究提出了模态主成分分析(MPCA),这是一种基于模态估计的鲁棒PCA方法。该方法通过估计投影数据点的模式来找到次分量。作为理论贡献,推导了所提出MPCA的概率收敛性、影响函数、有限样本击穿点及其下界。实验结果表明,该方法优于传统方法。

理学硕士:

62H25个 因子分析和主要成分;对应分析
62G35型 非参数稳健性

软件:

ROBPCA公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Absil,P.A.、Mahony,R.和Sepulchre,R.(2007年)。矩阵流形上的优化算法。新泽西州普林斯顿:普林斯顿大学出版社·Zbl 1147.65043号
[2] Bickel,D.R.和Frühwirth,R.(2006)。关于模式的快速稳健估计:与应用的其他稳健估计的比较。计算统计与数据分析,50(12),3500-3530·Zbl 1445.62055号
[3] Botev,Z.I.、Grotowski,J.F.和Kroese,D.P.(2010年)。通过扩散估计核密度。《统计年鉴》,38(5),2916-2957·Zbl 1200.62029号
[4] Brooks,J.P.、Dula,J.H.和Boone,E.L.(2013)。纯l1范数主成分分析。计算统计与数据分析,61,83-98·Zbl 1349.62247号
[5] Cande’s,E.J.、Li,X.、Ma,Y.和Wright,J.(2011)。稳健的主成分分析?美国医学会杂志,58(3)·Zbl 1327.62369号
[6] Chacón,J.E.(2020年)。统计学的模式时代。《国际统计评论》,88(1),122-141,
[7] Cheng,Y.(1995)。均值漂移、模式搜索和聚类。IEEE模式分析和机器智能汇刊,17(8),790-799,
[8] 克里奇利,F.(1985)。主成分分析中的影响。《生物特征》,72(3),627-636·Zbl 0608.62068号
[9] Croux,C.、Filzmoser,P.和Oliveira,M.R.(2007)。投影寻踪稳健主成分分析算法。化学计量学和智能实验室系统,87(2),218-225,
[10] Croux,C.和Ruiz-Gazen,A.(2005年)。主成分的高分解估计量:重温投影追踪法。多元分析杂志,95(1),206-226·Zbl 1065.62040号
[11] Dalenius,T.(1965)。模式:一个被忽略的统计参数。英国皇家统计学会杂志。A系列(通用),128(1),110-117,
[12] 丁春晖、周德华、何晓霞、查华(2006)。R1-PCA:旋转不变L1:稳健子空间分解的范数主成分分析。《第23届机器学习国际会议论文集》(第148卷,第281-288页)。纽约:ACM。
[13] Fukunaga,K.和Hostetler,L.(1975年)。密度函数梯度的估计及其在模式识别中的应用。IEEE信息理论汇刊,21(1),32-40·Zbl 0297.62025号
[14] Hubert,M.、Rousseeuw,P.J.和Branden,K.V.(2005)。ROBPCA:稳健主成分分析的新方法。技术计量学,47(1),64-79,
[15] Jolliffe,I.(2002)。主成分分析。纽约:Springer-Verlag·Zbl 1011.62064号
[16] Kemp,G.C.和Silva,J.S.(2012年)。回归模式。计量经济学杂志,170(1),92-101·Zbl 1443.62100号
[17] Kwak,N.(2008)。基于L1-形式最大化的主成分分析。IEEE模式分析和机器智能汇刊,30(9),1672-1680,
[18] Lee,M.(1989)。模式回归。《计量经济学杂志》,42(3),337-349·Zbl 0692.62092号
[19] Lerman,G.和Maunu,T.(2018年)。鲁棒子空间恢复概述。IEEE会议录,106(8),1380-1410·Zbl 1476.90262号
[20] Lerman,G.、McCoy,M.B.、Tropp,J.A.和Zhang,T.(2015)。通过凸松弛实现线性模型的稳健计算。计算数学基础,15(2),363-410·Zbl 1328.62377号
[21] Li,G.,&Chen,Z.(1985)。稳健色散矩阵和主成分的投影-脉冲法:基本理论和蒙特卡罗。美国统计协会杂志,80(391),759-766·Zbl 0595.62060号
[22] Meyer,C.D.(2000年)。矩阵分析和应用线性代数。费城:SIAM·Zbl 0962.15001号
[23] Miyagawa,S.、Yoshizawa,S和Yokota,H.(2018年)。用于稳健平面拟合的修剪中值PCA。第25届IEEE图像处理国际会议记录(第753-757页)。新泽西州皮斯卡塔韦:IEEE。
[24] Nie,F.、Yuan,J.和Huang,H.(2014)。最优均值稳健主成分分析。第31届机器学习国际会议论文集(1062-1070页)。
[25] Ota,H.、Kato,K.和Hara,S.(2019年)。条件模式估计的分位数回归方法。电子统计杂志,13(2),3120-3160·Zbl 1429.62149号
[26] Parzen,E.(1962年)。关于概率密度函数和模式的估计。《数理统计年鉴》,33(3),1065-1076·Zbl 0116.11302号
[27] Pimentel-Alarcón,D.和Nowak,R.(2017)。随机一致稳健PCA。电子统计杂志,11(2),5232-5253·Zbl 1384.62188号
[28] Rahmani,M.和Atia,G.(2017年)。一致性追求:快速、简单、稳健的子空间恢复。第34届国际机器学习会议记录(第70卷,第2864-2873页)。
[29] Rao,P.(编辑)。(1983). 非参数函数估计。佛罗里达州奥兰多:学术出版社·Zbl 0542.62025号
[30] Sando,K.、Akaho,S.、Murata,N.和Hino,H.(2019年)。模态线性回归的信息几何。信息几何,2(1),43-75·Zbl 1422.62034号
[31] Schmitt,E.&Vakili,K.(2016)。鲁棒PCA的快速HCS算法。统计与计算,26(6),1229-1242·Zbl 1505.62359号
[32] Scrucca,L.(2011)。基于模型的SIR用于降维。计算统计学和数据分析,55(11),3010-3026·兹比尔1218.62037
[33] Sheather,S.J.和Jones,M.C.(1991年)。一种用于核密度估计的可靠的基于数据的带宽选择方法。英国皇家统计学会学报B(方法学),53(3),683-690·Zbl 0800.62219
[34] Shi,X.,Wu,Y.,&Miao,B.(2009)。关于模式核密度估计收敛速度的注记。《统计与概率快报》,79(17),1866-1871·Zbl 1489.62118号
[35] Silverman,B.W.(1981)。使用核密度估计来研究多模态。英国皇家统计学会学报B(方法学),43(1),97-99,
[36] Silverman,B.W.(1986)。统计和数据分析的密度估计。伦敦:查普曼和霍尔·Zbl 0617.62042号
[37] Terrell,G.R.(1990年)。密度估计中的最大平滑原则。美国统计协会杂志,85(410),470-477,
[38] Tsakiris,M.C.和Vidal,R.(2018年)。双重主成分追求。机器学习研究杂志,19(1),684-732·Zbl 1444.62081号
[39] Vieu,P.(1996)。关于密度模式估计的注记。统计与概率快报,26(4),297-307·兹比尔0847.62024
[40] Xu,H.、Caramanis,C.和Mannor,S.(2010年)。污染数据的主成分分析:高维案例。第23届学习理论会议记录(第490-502页)。加利福尼亚州圣马特奥:摩根·考夫曼。
[41] Xu,H.、Caramanis,C.和Mannor,S.(2013)。Outlier-ro-bast PCA:高维度案例。IEEE信息理论汇刊,59(1),546-572·Zbl 1364.62141号
[42] Xu,H.、Caramanis,C.和Sanghavi,S.(2010年)。通过离群点追踪实现鲁棒PCA。J.D.Lafferty、C.K.I.Williams、J.Shawe-Taylor、R.S.Zemel和A.Culotta(编辑),《神经信息处理系统的进展》,23(第2496-2504页)。纽约州红钩市:Curran·Zbl 1365.62228号
[43] Yamasaki,R.和Tanaka,T.(2019年)。模态线性回归的核选择:最优核和IRLS算法。第18届机器学习和应用国际会议论文集。旧金山:摩根考夫曼。
[44] Yang,W.,&Xu,H.(2015)。一个统一的框架,用于离群ROB类PCA算法。第32届机器学习国际会议记录(第484-493页)。旧金山:摩根考夫曼。
[45] Yao,W.和Li,L.(2014)。一种新的回归模型:模态线性回归。斯堪的纳维亚统计杂志,41(3),656-671·Zbl 1309.62119号
[46] Zhang,T.和Lerman,G.(2014)。鲁棒PCA的一种新的M估计。机器学习研究杂志,15(1),749-808·Zbl 1318.62205号
[47] Zhao,J.、Yu,G.和Liu,Y.(2018)。使用角度分解点评估分类的稳健性。《统计年鉴》,46,3362-3389·Zbl 1408.62121号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。