×

采用最优评分方法进行稳健稀疏多组分类。 (英语) Zbl 1433.68372号

总结:我们提出了一种基于最优评分法的稳健稀疏分类方法。如果变量数量超过观察数量,也适用。首先根据最优评分标准将数据投影到低维子空间中。投影仅包括原始变量的子集(稀疏建模),并且不被异常值扭曲(稳健建模)。在这个低维子空间分类中,通过最小化到群中心的鲁棒马氏距离来进行分类。数据的低维表示对于可视化也很有用。我们详细讨论了所提出方法的算法。仿真研究表明,与非稳健和/或非解析替代方法相比,通过最优评分实现稳健和稀疏分类的特性。给出了三个实际数据应用。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alfons,A。;克罗克斯,C。;Gelper,S.,《用于分析高维大数据集的稀疏最小二乘回归》,Ann Appl Stat,7,1,226-248(2013)·Zbl 1454.62123号 ·doi:10.1214/12-AOAS575
[2] 阿玛尼诺,C。;里尔迪,R。;Lanteri,S。;Modi,G.,托斯卡纳橄榄油的化学计量分析,化学智能实验室系统,5,4,343-354(1989)·doi:10.1016/0169-7439(89)80034-6
[3] Brodinova S、Ortner T、Filzmoser P、Zaharieva M、Breitender C(2015)《监督音频异常值检测的鲁棒PCA评估》。附:第22届国际计算统计会议(COMPSTAT)记录·Zbl 1414.62232号
[4] Clemmensen L,Kuhn M(2012)稀疏LDA:稀疏判别分析。R包版本0.1-6。https://CRAN.R-project.org/package=spareLDA。2015年10月21日访问
[5] 克莱门森,L。;哈斯蒂,T。;维滕,D。;Ersböll,B.,稀疏判别分析,技术计量学,53,4,406-413(2012)·doi:10.1198/TECH.2011.08118
[6] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,《最小角度回归》,《Ann Stat》,第32、2、407-499页(2004年)·Zbl 1091.62054号 ·doi:10.1214/09053604000000067
[7] Hampel,F.,影响曲线及其在稳健估计中的作用,美国国家统计协会,69346383-393(1974)·Zbl 0305.62031号 ·doi:10.1080/01621459.1974.10482962
[8] 汉佩尔,F。;朗切蒂,E。;卢梭,P。;Stahel,W.,《稳健统计:基于影响函数的方法》(1986),霍博肯:威利,霍博肯·Zbl 0593.62027号
[9] 哈斯蒂,T。;Tibshirani,R。;Buja,A.,《通过最佳评分进行灵活判别分析》,美国统计学会杂志,89,428,1255-1270(1994)·Zbl 0812.62067号 ·doi:10.1080/01621459.1994.10476866
[10] 哈斯蒂,T。;Tibshirani,R。;Wainwright,M.,《稀疏性统计学习:套索和概括》(2015),博卡拉顿:CRC出版社,博卡拉通·Zbl 1319.68003号
[11] 霍夫曼,I。;Filzmoser,P。;Serneels,S。;Varmuza,K.,《二进制分类的稀疏和稳健PLS》,《化学杂志》,30,4,153-162(2016)·doi:10.1002/cem.2775
[12] 休伯特,M。;Van Driessen,K.,《快速稳健判别分析》,《计算统计数据分析》,45,2,301-320(2004)·Zbl 1429.62247号 ·doi:10.1016/S0167-9473(02)00299-2
[13] 休伯特,M。;卢梭,P。;Van Aelst,S.,高分解稳健多元方法,《统计科学》,23,1,92-119(2008)·Zbl 1327.62328号 ·doi:10.1214/0883423070000087
[14] 约翰逊,R。;Wichern,D.,应用多元统计分析(2002),《上鞍河:普伦蒂斯·霍尔》,上鞍河
[15] 《统计计算的语言和环境》(2016),维也纳:R统计计算基金会,维也纳
[16] 卢梭,P。;Van Driessen,K.,最小协方差行列式估计的快速算法,技术计量学,41,3,212-223(1999)·doi:10.1080/00401706.1999.10485670
[17] Tibshirani,R.,《通过套索进行回归收缩和选择:回顾》,J R Stat Soc B,73,3,273-282(2011)·Zbl 1411.62212号 ·doi:10.1111/j.1467-9868.2011.00771.x
[18] Todorov V(2016)rrcovHD:高维数据的稳健多元方法。R包版本0.2-4。https://CRAN.R-project.org/package=rrcovHD。2016年2月17日访问
[19] 托多罗夫,V。;Pires,A.,几种稳健线性判别分析方法的比较性能,REVSTAT Stat J,5,1,63-83(2007)·Zbl 1513.62130号
[20] Vanden Branden,K。;Hubert,M.,基于simca方法的高维稳健分类,化学智能实验室系统,79,1,10-21(2005)·doi:10.1016/j.chemolab.2005.03.002
[21] 维滕,D。;Tibshirani,R.,使用fisher线性判别式的惩罚分类,J R Stat Soc Ser B(统计方法论),73,5753-772(2011)·Zbl 1228.62079号 ·doi:10.1111/j.1467-9868.2011.00783.x
[22] 沃尔克,R。;Schwetlick,H.,《迭代加权最小二乘法:算法、收敛分析和数值比较》,SIAM科学统计计算杂志,9,5,907-921(1988)·Zbl 0709.65130号 ·doi:10.1137/0909062
[23] Wu,T。;Lange,K.,套索惩罚回归的坐标下降算法,Ann Appl Stat,2,1,224-244(2008)·Zbl 1137.62045号 ·doi:10.1214/07-AOAS147
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。