×

鲁棒子空间估计的快速计算。 (英语) Zbl 1507.62023号

摘要:降维通常是高维数据分析中的一个重要步骤。主成分分析是一种流行的技术,用于寻找高维数据的最佳低维近似。然而,经典PCA对非典型数据非常敏感。提出了稳健的方法来估计最接近规则数据的低维子空间。然而,对于高维数据,这些算法的计算成本很高。提出了鲁棒子空间估计的替代算法,这些算法更适合计算高维问题的解。新算法的主要成分有两方面。首先,通过迭代与估计量相对应的一阶解,直接估计子空间的主方向。其次,为了进一步减少计算时间,提出了五个稳健的确定值来初始化算法,而不是使用随机起始值。结果表明,新算法能产生鲁棒解,计算时间大大缩短,特别是对于高维数据。

MSC公司:

62-08 统计问题的计算方法
62H25个 因子分析和主成分;对应分析
62层35 鲁棒性和自适应程序(参数推断)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 安德森,E。;Bai,Z。;比肖夫,C。;布莱克福德,L.S。;德梅尔,J。;Dongarra,J.J。;杜克罗兹,J。;Hammarling,S。;格林鲍姆,A。;麦肯尼,A。;Sorensen,D.,《LAPACK用户指南》(第三版)(1999年),工业和应用数学学会:美国宾夕法尼亚州费城市工业与应用数学学会,网址:http://www.netlib.org/lapack/lug/lapack_lug.html ·Zbl 0934.65030号
[2] Björck,Å.;Golub,G.H.,计算线性子空间之间角度的数值方法,数学。公司。,27、123、579-594(1973),网址:http://www.jstor.org/stable/2005662 ·Zbl 0282.65031号
[3] Boente,G。;Salibian-Barrera,M.,《函数主成分分析的S-估计量》,J.Amer。统计师。协会,110,511,1100-1111(2015),URL:arXiv:http://dx.doi.org/10.1080/01621459.2014.946991 ·Zbl 1373.62290号
[4] 布拉马,P.P。;她,Y。;李,S。;李,J。;Wu,D.,《强化稳健主成分追求》,IEEE Trans。神经网络。学习。系统。,PP,99,1-14(2018)
[5] Campbell,N.A.,多元分析中的稳健过程I:稳健协方差估计,应用。统计,29,231-237(1980)·Zbl 0471.62047号
[6] 坎迪斯,E.J。;李,X。;马云(Ma,Y.)。;Wright,J.,稳健主成分分析?,J.ACM,58,3,11:1-11:37(2011),网址:http://doi.acm.org/10.1145/1970392.1970395 ·兹比尔1327.62369
[7] Chiang,K.-Y.、Hsieh,C.-J.、Dhillon,I.S.,2016年。带副信息的稳健主成分分析,in:国际机器学习会议,ICML。;Chiang,K.-Y.、Hsieh,C.-J.、Dhillon,I.S.,2016年。带副信息的稳健主成分分析,收录于:国际机器学习会议,ICML。
[8] 克罗克斯,C。;菲尔兹莫瑟,P。;皮森,G。;Rousseeuw,P.J.,通过稳健交替回归拟合乘法模型,统计计算。,13, 1, 23-36 (2003)
[9] 克罗克斯,C。;加西亚·埃斯库德罗,洛杉矶。;Gordaliza,A。;鲁维特,C。;Martín,R.S.,基于仿射子空间裁剪的稳健主成分分析,Statist。Sinica,27,3,1437-1459(2017)·Zbl 1371.62054号
[10] 克罗克斯,C。;Haesbroeck,G.,基于协方差或相关矩阵稳健估计的主成分分析:影响函数和效率,Biometrika,87,603-618(2000),URL:http://biomet.oxfordjournals.org/content/87/3/603.short ·Zbl 0956.62047号
[11] 克罗克斯,C。;Ruiz-Gazen,A.,基于投影寻踪的稳健主成分快速算法,(Prat,A.,COMPSTAT:计算统计学论文集,1996年(1996),西班牙巴塞罗那,Physica-Verlag HD:Physica-Verlag HD Heidelberg),211-216·Zbl 0900.62300号
[12] 克罗克斯,C。;Ruiz-Gazen,A.,《主成分的高分解估计量:重访投影寻踪法》,《多元分析杂志》。,95, 206-226 (2005) ·Zbl 1065.62040号
[13] 德夫林,S.J。;Gnanadesikan,R。;Kettering,J.R.,色散矩阵和主成分的稳健估计,J.Amer。统计师。协会,76,374,354-362(1981),网址:http://www.jstor.org/stable/2287836 ·Zbl 0463.62031号
[14] Eddelbuettel,D。;Sanderson,C.,RcppArmadillo:用高性能C++线性代数加速R,计算。统计师。数据分析。,711054-1063(2014),网址:http://dx.doi.org/10.1016/j.csda.2013.02.005 ·Zbl 1471.62055号
[15] Engelen,S。;休伯特,M。;Vanden Branden,K.,《高维稳健PCA三种程序的比较》,奥地利统计局,34,117-126(2005)
[16] 费菲,L。;弗格斯,R。;Perona,P.,《从少数训练示例中学习生成性视觉模型:在101个对象类别上测试的增量贝叶斯方法》,计算。视觉。图像理解。,106, 1, 59-70 (2007)
[17] Gabriel,K.R。;Zamir,S.,用最小二乘法对矩阵进行低阶近似,可选择权重,《技术计量学》,21,4,489-498(1979),网址:http://www.jstor.org/stable/1268288 ·Zbl 0471.62004号
[18] Georghiades,A.S。;Belhumeur,P.N。;Kriegman,D.J.,《从少到多:可变光照和姿势下人脸识别的照明锥模型》,IEEE Trans。模式分析。机器。智力。,23, 6, 643-660 (2001)
[19] 休伯特,M。;Rousseeuw,P.J。;Vanden Branden,K.,《ROBPCA:稳健主成分分析的新方法》,《技术计量学》,47,64-79(2005)
[20] 休伯特,M。;卢梭,P。;Vanpaemel,D。;Verdonck,T.,《多元位置和散布的DetS和DetMM估计量》,计算。统计师。数据分析。,81,64-75(2015),网址:http://www.sciencedirect.com/science/article/pii/S0167947314002175 ·Zbl 1507.62078号
[21] 休伯特,M。;Rousseeuw,P.J。;Verdonck,T.,《稳健定位和散布的确定性算法》,J.Compute。图表。统计人员。,21、618-637(2012),网址:网址:http://www.tandfonline.com/doi/abs/10.1080/10618600.2012.672100#.UdeZC0A-国家货币管理局,http://www.tandfonline.com/doi/abs/101080/10618600.2012.672100
[22] Lee,K.C。;Ho,J。;Kriegman,D.J.,获取可变光照下人脸识别的线性子空间,IEEE Trans。模式分析。机器。智力。,27, 5, 684-698 (2005)
[23] 李·G。;Chen,Z.,稳健分散矩阵和主成分的投影-探索方法:初级理论和蒙特卡罗,J.Amer。统计师。协会,80,759-766(1985),网址:http://www.tandfonline.com/doi/abs/10.1080/01621459.1985.10478181papers3://publication/uuid/E7A6D092-1420-4117-A47C-C6F759DA3121·Zbl 0595.62060号
[24] 刘,L。;霍金斯博士。;Ghosh,S。;Young,S.S.,微阵列数据的稳健奇异值分解分析,Proc。国家。阿卡德。科学。美国,10013167-13172(2003),网址:http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=263735&tool=pmcentrez&rendertype=abstract ·Zbl 1108.62117号
[25] 北卡罗来纳州洛坎托尔。;Marron,J.S。;辛普森,D.G。;的黎波里,北。;Zhang,J.T。;Cohen,K.L.,功能数据的稳健主成分分析,Test,8,1,1-73(1999)·Zbl 0980.62049号
[26] Maronna,R.A.,基于稳健尺度的主成分和正交回归,技术计量学,47,264-273(2005),URL:http://pubs.amstat.org/doi/abs/10.1198/004017005000000166
[27] Maronna,R.A。;马丁·R。;尤海,V.J.,《稳健统计:理论与方法》(2006),威利出版社·邮编1094.62040
[28] 马龙娜,R.A。;梅恩德斯,F。;Yohai,V.J.,稳健非线性主成分,统计计算。,25、2、439-448(2015),网址:http://dx.doi.org/10.1007/s11222-013-9442-0 ·Zbl 1331.62297号
[29] Maronna,R.A。;Zamar,R.H.,高维数据集位置和离散度的稳健估计,技术计量学,44,4,307-317(2002),URL:http://www.jstor.org/stable/1271538
[30] 纳加,R.A。;Antille,G.,鲁棒和非鲁棒主成分分析的稳定性,计算机。统计师。数据分析。,10, 2, 169-174 (1990) ·Zbl 0825.62515号
[31] R核心团队,R:统计计算的语言和环境(2016),R统计计算基金会:R统计计算基础,奥地利维也纳,URL:https://www.R-project.org/
[32] 拉赫曼尼,M。;Atia,G.K.,《一致性追求:快速、简单和稳健的主成分分析》,IEEE Trans。信号处理。,65, 23, 6260-6275 (2017) ·Zbl 1415.94210号
[33] Rousseeuw,P.J。;Croux,C.,《中值绝对偏差的替代方法》,J.Amer。统计师。协会,88,1273-1283(1993),网址:http://www.jstor.org/stable/2291267 ·Zbl 0792.62025号
[34] Rousseeuw,P.J。;Van Driessen,K.,最小协方差行列式估计的快速算法,技术计量学,41,3,212-223(1999)
[35] Salibián-Barrera,M。;Aelst,S.V.公司。;Willems,G.,基于快速稳健引导的多元MM估计的主成分分析,J.Amer。统计师。协会,101,475,1198-1211(2006),URL:arXiv:http://dx.doi.org/10.1198/016214500000096 ·Zbl 1120.62319号
[36] Salibián-Barrera,M。;Yohai,V.J.,S-回归估计的快速算法,J.Compute。图表。统计人员。,15, 414-427 (2006)
[37] Serneels,S。;Verdonck,T.,包含离群值和缺失元素的数据的主成分分析,计算。统计师。数据分析。,52、3、1712-1727(2008),网址:http://www.sciencedirect.com/science/article/pii/S0167947307002241 ·Zbl 1452.62419号
[38] 她,Y。;李,S。;Wu,D.,稳健正交互补主成分分析,J.Amer。统计师。协会,111514763-771(2016)
[39] Stewart,G.W.,《随机正交矩阵的高效生成及其在条件估计中的应用》,SIAM J.Numer。分析。,17, 3, 403-409 (1980) ·Zbl 0443.65027号
[40] Tharrault,Y.,Mourot,G.,Ragot,J.,2008年。使用稳健的主成分分析进行故障检测和隔离。摘自:2008年第16届地中海控制和自动化会议,第59-64页,http://dx.doi.org/10.109/MED.2008.4602224; Tharrault,Y.,Mourot,G.,Ragot,J.,2008年。使用稳健的主成分分析进行故障检测和隔离。载于:2008年第16届地中海控制与自动化会议,第59-64页,http://dx.doi.org/10.109/MED.2008.4602224 ·Zbl 1156.93399号
[41] 托多罗夫,V。;Filzmoser,P.,稳健多元分析的面向对象框架,J.Stat.Softw。,32,3,1-47(2009),网址:http://www.jstatsoft.org/v32/i03/
[42] 瓦尔迪,Y。;Zhang,C.H.,多元l1-中位数和相关数据深度,Proc。国家。阿卡德。科学。,97、4、1423-1426(2000),URL:arXiv:http://www.pnas.org/content/97/4/1423.full.pdf ·Zbl 1054.62067号
[43] Wilcox,R.R.,《稳健主成分:广义方差视角》,Behav。研究方法,40,102-108(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。