×

针对倾斜数据及其离群值映射的稳健PCA。 (英语) Zbl 1453.62116号

摘要:经典主成分分析(PCA)的异常值敏感性促进了稳健技术的发展。如果非外围数据具有近似对称分布,则现有的鲁棒PCA方法(如ROBPCA)效果最佳。当原始变量倾斜时,太多的点往往被标记为离群值。提出了一种稳健的主成分分析方法,该方法也适用于倾斜数据。为了标记离群值,定义了一个新的离群值映射。它的性能通过来自经济、工程和金融的实际数据进行了说明,并通过仿真研究进行了验证。

MSC公司:

62-08 统计学相关问题的计算方法
62H25个 因子分析和主成分;对应分析
62层35 鲁棒性和自适应程序(参数推断)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Barndorff-Nielsen,O.,正态逆高斯分布和随机波动率建模,斯堪的纳维亚统计杂志,24,1-13(1997)·Zbl 0934.62109号
[2] Box,G.E.P.,《方差问题分析中应用的二次型定理:方差不等式在单向分类中的作用》,《数理统计年鉴》,25290-302(1954)·Zbl 0055.37305号
[3] 布莱斯,G。;休伯特,M。;Struyf,A.,《偏度的稳健度量》,《计算与图形统计杂志》,1996-1017年第13期(2004年)
[4] 布莱斯,G。;休伯特,M。;Rousseeuw,P.J.,《独立成分分析的稳健化》,《化学计量学杂志》,第19期,第364-375页(2005年)
[5] Cariboni,J.,2007年。Lévy模型下的信贷衍生品定价。鲁汶大学博士论文。网址:http://hdl.handle.net/1999/853; Cariboni,J.,2007年。Lévy模型下的信贷衍生品定价。鲁汶大学博士论文。网址:http://hdl.handle.net/1999/853
[6] Chiang,L.H。;Colegrove,L.F.,在线多元质量控制的工业实施,计算统计和数据分析,88,143-153(2007)
[7] 克罗克斯,C。;Ruiz-Gazen,A.,《主成分的高分解估计量:重访投影寻踪法》,《多元分析杂志》,95,206-226(2005)·Zbl 1065.62040号
[8] 多诺霍,D.L。;Gasko,M.,基于半空间深度和预测边距的位置估计的分解特性,《统计年鉴》,第20期,1803-1827页(1992年)·Zbl 0776.62031号
[9] Engelen,S。;休伯特,M。;Vanden Branden,K.,《高维稳健PCA三种程序的比较》,《奥地利统计杂志》,34117-126(2005)
[10] Higuchi,I。;Eguchi,S.,具有自适应选择调谐参数的稳健主成分分析,机器学习研究杂志,5453-471(2004)·Zbl 1222.68217号
[11] 休伯特,M。;Engelen,S.,生物科学中的稳健PCA和分类,生物信息学,201728-1736(2004)
[12] 休伯特,M。;Engelen,S.,《主成分分析高分解重采样方法的快速交叉验证》,计算统计与数据分析,51,5013-5024(2007)·Zbl 1162.62374号
[13] 休伯特,M。;Rousseeuw,P.J。;Vanden Branden,K.,《ROBPCA:稳健主成分分析的新方法》,《技术计量学》,47,64-79(2005)
[14] 休伯特,M。;Rousseeuw,P.J。;Verboven,S.,《稳健主成分的快速方法及其在化学计量学、化学计计量学和智能实验室系统中的应用》,60,101-111(2002)
[15] 休伯特,M。;Vanden Branden,K.,偏最小二乘回归的稳健方法,化学计量学杂志,17,537-549(2003)
[16] Hubert,M.,Vandervieren,E.,2007年。倾斜分布的调整箱线图。计算统计学和数据分析,出版中(doi:10.1016/j.csda.2007.11.008;Hubert,M.,Vandervieren,E.,2007。倾斜分布的调整箱线图。计算统计与数据分析,出版中(doi:10.1016/j.csda.2007.11.008·Zbl 1452.62074号
[17] 休伯特,M。;Van der Veeken,S.,偏斜数据的离群检测,化学计量学杂志,22235-246(2008)
[18] 休伯特,M。;Verboven,S.,高维回归变量的稳健PCR方法,化学计量学杂志,17438-452(2003)
[19] Krzanowski,W.J.,《主成分的组间比较》,《美国统计协会杂志》,74703-707(1979)·Zbl 0459.62042号
[20] 北卡罗来纳州洛坎托尔。;Marron,J.S。;辛普森,D.G。;北的黎波里。;Zhang,J.T。;Cohen,K.L.,功能数据的主成分分析,Test,8,1-73(1998)·Zbl 0980.62049号
[21] Maronna,R.,基于稳健尺度的主成分和正交回归,技术计量学,47264-273(2005)
[22] Nomikos,P。;MacGregor,J.F.,《用于监控批处理过程的多元SPC图》,《技术计量学》,37,41-59(1995)·Zbl 0825.62740号
[23] Rousseeuw,P.J.,最小二乘回归,美国统计协会杂志,79871-880(1984)·Zbl 0547.62046号
[24] Rousseeuw,P.J。;Van Driessen,K.,最小协方差行列式估计的快速算法,技术计量学,41,212-223(1999)
[25] Serneels,S。;Verdonck,T.,包含异常值和缺失元素的数据的主成分分析,计算统计学和数据分析,52,3712-1727(2008)·Zbl 1452.62419号
[26] W.A.斯塔尔,1981年。健壮的Schätzungen:无限的最优性和Schátzungen von Kovarianzmatrizen。苏黎世理工大学博士论文;斯塔赫尔,W.A.,1981年。健壮的Schätzungen:无限的最优性和Schátzungen von Kovarianzmatrizen。苏黎世理工学院博士论文
[27] Vanden Branden,K。;Hubert,M.,基于SIMCA方法的高维稳健分类,化学计量学和智能实验室系统,79,10-21(2005)
[28] Verboven,S。;Hubert,M.,LIBRA:稳健分析、化学计量学和智能实验室系统的Matlab库,75,127-136(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。