×

兹马思-数学第一资源

稳健核主成分分析与分类。(英语) Zbl 1284.62370
摘要:核主成分分析(KPCA)将线性主成分分析从实向量空间扩展到任何高维核特征空间。线性PCA对异常值的敏感性是众所周知的,文献中已经提出了各种鲁棒方案。对于KPCA来说,这种健壮的版本受到的关注要少得多。在本文中,我们提出了三种鲁棒PCA算法的核心版本:球形PCA、投影寻踪和ROBPCA。这些稳健的KPCA算法在分类上下文中进行分析,并对KPCA得分进行判别分析。在一个仿真研究中,研究了不同鲁棒KPCA算法的性能,比较了在干净数据和污染数据上的误分类率。构造了一个离群点映射来可视化这类分类问题中的离群值。一个来自蛋白质分类的实例说明了稳健KPCA及其相应的离群值映射的有用性。

理学硕士:
62小时30分 分类和区分;聚类分析(统计方面)
62G35型 非参数鲁棒性
62小时25分 因子分析和主成分分析;对应分析
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Alzate C,Suykens-JAK(2008)使用ε不敏感鲁棒损失函数的核成分分析。IEEE Trans神经网络19:1583–1598
[2] Croux C,Ruiz Gazen A(1996)基于投影寻踪的鲁棒主成分快速算法。In:COMPSTAT:计算统计学论文集,第211-216页·Zbl 0900.62300
[3] Croux C,Ruiz Gazen A(2005)主成分的高分解估计:投影寻踪法的再探讨。多变量分析杂志95:206–226·Zbl 1065.62040
[4] Croux C,Filzmoser P,Oliveira MR(2007)投影寻踪鲁棒主成分分析算法。化学集成实验室系统87:218–225
[5] 崔浩,何X,Ng KW(2003)基于稳健分散的主成分渐近分布。生物计量学90:953–966·Zbl 1436.62222
[6] Debruyne M(2009)支持向量机分类的离群值映射。安应用统计3(4):1566–1580·Zbl 1185.62112
[7] Debruyne M,Hubert M(2009)Stahel-Donoho协方差估计的影响函数。Stat Probab Lett 79:275–282号文件·Zbl 1169.62049
[8] 《检测有影响力的核观察》(2009amDebuyert Van,2009am)。计算统计数据分析(正在出版)。doi:10.1016/j.csda.2009.08.018·Zbl 1284.62046
[9] Debruyne M,Serneels S,Verdonck T(2009b),robusted最小二乘支持向量机分类。化学计量学杂志23(9):479–486
[10] Donoho DL,Gasko M(1992)基于半空间深度和预测外向度的位置估计的分解特性。安统计20:1803-1827·Zbl 0776.62031
[11] Friedman JH,Tukey JW(1974)探索性数据分析的投影寻踪算法。IEEE Trans Comput C-23(9):881–890·中银0284.68079
[12] Huber PJ(1985)投影追踪。安统计13:435-475·Zbl 0595.62059
[13] Hubert M,Engelen S(2004)《稳健PCA与生物科学分类》。生物信息学20:1728–1736
[14] Hubert M,Van Driessen K(2004)快速稳健判别分析。计算统计数据分析45:301–320·Zbl 1429.62247
[15] Hubert M,Rousseeuw PJ,Verboven S(2002)主成分快速稳健方法及其在化学计量学中的应用。化学集成实验室系统60:101–111
[16] Hubert M,Rousseeuw PJ,Vanden Branden K(2005)Robbca:稳健主成分分析的新方法。技术指标47:64–79
[17] 李庚,陈志(1985)稳健色散矩阵与主成分的投影寻踪法:基本理论与蒙特卡罗。美国统计协会杂志80:759–766·Zbl 0595.62060
[18] 刘志中,陈丁,本斯梅尔H(2005)基因表达数据的核主成分分析分类。生物医学生物技术杂志2:155–169
[19] Locantore N,Marron JS,Simpson DG,Tripoli N,Zhang JT,Cohen KL(1999)功能数据的稳健主成分分析。测试8:1–73·Zbl 0980.62049
[20] 吕C-D,张天勇,杜X-Z,李C-P(2004)一种鲁棒核PCA算法。计算机网络5:3084–3087
[21] Marden JI(1999)主成分的一些稳健估计。统计概率表43:349–359·Zbl 0939.62055
[22] Maronna RA(2005)基于稳健尺度的主成分和正交回归。技术指标47:264–273
[23] Maronna RA,Zamar R(2002)《高维数据集的位置和离散度的稳健估计》。技术指标44:307–317
[24] Mika S,Rätsch G,Weston J,Schölkopf B,Müller KR(1999),Fisher核判别分析。在:IEEE信号处理神经网络国际研讨会IX,第41-48页
[25] Nguyen MH,De la Torre F(2009)稳健核主成分分析。Adv神经信息处理系统21:1185–1192
[26] Ohst C(1988)最佳逼近球及其性质。亚琛RWTH大学统计与数学研究所马蒂克文凭
[27] Pollack JD,Li Q,Pearl DK(2005)古生菌、细菌和真核生物磷酸甘油酯激酶蛋白系统发育分析的分类效用:贝叶斯分析的见解。分子系统进化35:420-430
[28] Rousseeuw PJ(1984)最小二乘回归。美国统计学杂志79:871–880·零担0547.62046
[29] Rousseeuw PJ,Croux C(1993)中值绝对偏差的替代方案。美国统计协会杂志88:1273–1283·Zbl 0792.62025
[30] Rousseeuw PJ,Van Driessen K(1999)最小协方差行列式估计的快速算法。技术指标41:212–223
[31] Saigo H,Vert J,Ueda N,Akutsul T(2004)使用字符串对齐核进行蛋白质同源性检测。生物信息学20:1682–1689
[32] Schölkopf B,Smola A(2002)《使用内核学习》。麻省理工学院出版社,剑桥·Zbl 1019.68094
[33] Schölkopf B,Smola A,Müller K-R(1998)非线性成分分析作为核特征值问题。神经计算10:1299–1319
[34] Shawe Taylor J,Cristianini N(2004)模式分析的核方法。剑桥大学出版社·Zbl 0994.68074
[35] Stahel WA(1981)Robuste Schätzungen:无穷大最优与Schätzungen von Kovarianz矩阵。博士论文,ETH Zürich·Zbl 0531.62036
[36] Suykens JAK,Van Gestel T,De Brabanter J,De Moor B,Vandewalle J(2002),最小二乘支持向量机。新加坡世界科学院·Zbl 1017.93004
[37] 高田核PCA(2002)噪声分析。国际人工神经网络会议论文集。计算机科学课堂讲稿,2415卷,739-744页·Zbl 1013.68831
[38] Verboven S,Hubert M(2005)LIBRA:用于稳健分析的MATLAB库。化学实验室系统75:127-136
[39] 杨杰,金哲,杨杰,张德,弗兰基.费休判别法的本质:KPCA+LDA。模式识别37:2097–2100·中银02117452
[40] Yang J,Frangi AF,Yang JY,Zhang D,Jin Z(2005)KPCA-plus-LDA:一个用于特征提取和识别的完整核Fisher判别框架。IEEE Trans-Pattern Anal Mach Intell美国电气与电子工程师协会27:230–244·Zbl 05110640
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。