×

使用角度分解点评估分类的稳健性。 (英语) Zbl 1408.62121号

分类的可靠性是最先进的机器学习方法的核心。考虑到有离群值和无离群值估计值之间的差异,提出了一种新的全局可靠性度量方法。首先,作者考虑了具有有界和无界损失函数的线性学习,研究了二元分类中角破裂点的理论性质。接下来,考虑了具有有界或无界损失函数的二元核学习(RKHS)的角分解点。在包括乳腺癌诊断数据集在内的两个数据集上,证明了所提出的角破裂准则的有效性。

理学硕士:

62H30型 分类和区分;聚类分析(统计方面)
62层35 鲁棒性和自适应程序(参数推断)
68T05型 人工智能中的学习和自适应系统
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Biggio,B.、Nelson,B.和Laskov,P.(2012年)。针对支持向量机的毒药攻击。第29届国际机器学习会议论文集(J.Langford和J.Pineau,eds.)1807-1814。纽约ACM。
[2] Christmann,A.和Steinwart,I.(2004年)。模式识别凸风险最小化方法的鲁棒性。J.马赫。学习。第5号决议1007–1034·Zbl 1222.68348号
[3] Donoho,D.和Huber,P.J.(1983年)。击穿点的概念。在埃里希·莱曼的《节日》157–184。加利福尼亚州贝尔蒙特市沃兹沃斯·Zbl 0523.62032号
[4] Freund,Y.和Schapire,R.E.(1997)。在线学习的决策理论推广及其在助推中的应用。J.计算。系统科学55 119–139·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504
[5] Genton,M.G.和Lucas,A.(2003)。独立和相关观测的分解点的综合定义。J.R.统计社会服务。B.统计方法65 81–94·Zbl 1063.62038号 ·数字对象标识代码:10.1111/1467-9868.00373
[6] Hable,R.和Christmann,A.(2011年)。关于支持向量机的定性鲁棒性。《多变量分析杂志》102 993–1007·Zbl 1274.62285号 ·doi:10.1016/j.jmva.2011.01.009
[7] Hampel,F.R.(1971)。稳健性的一般定性定义。安。数学。Stat.42 1887–1896年·Zbl 0229.62041号 ·doi:10.1214/aoms/1177693054
[8] Hampel,F.R.(1974年)。影响曲线及其在鲁棒估计中的作用。J.Amer。统计师。协会69 383–393·Zbl 0305.62031号 ·doi:10.1080/016214519974.10482962
[9] Hastie,T.、Tibshirani,R.和Friedman,J.(2009年)。《统计学习的要素:数据挖掘、推断和预测》,第二版,纽约斯普林格出版社·Zbl 1273.62005年
[10] Horst,R.和Thoai,N.V.(1999年)。DC编程:概述。J.优化。理论应用103 1-43·Zbl 1073.90537号 ·doi:10.1023/A:1021765131316
[11] Hubert,M.、Rousseeuw,P.J.和Van Aelst,S.(2008)。高分解稳健多元方法。统计师。科学。92–119. ·Zbl 1327.62328号 ·doi:10.1214/0883423070000087
[12] Kanamori,T.、Fujiwara,S.和Takeda,A.(2014)。鲁棒支持向量机的故障点。预印。可从arXiv:1409.0934获取。
[13] Kimeldorf,G.S.和Wahba,G.(1970年)。随机过程的贝叶斯估计与样条平滑之间的对应。安。数学。统计数字41 495–502·Zbl 0193.45201号 ·doi:10.1214/aoms/1177697089
[14] Krause,N.和Singer,Y.(2004年)。更仔细地利用利润。第二十届国际机器学习会议论文集63。纽约ACM。
[15] Lin,X.、Wahba,G.、Xiang,D.、Gao,F.、Klein,R.和Klein(2000)。具有伯努利观测值和随机GACV的大数据集的平滑样条方差分析模型。统计年鉴28 1570–1600·Zbl 1105.62358号 ·doi:10.1214/aos/1015951996
[16] Liu,Y.和Shen,X.(2006)。多类别\(ψ\)-学习。J.Amer。统计师。协会101 500–509·Zbl 1119.62341号
[17] Mason,L.、Baxter,J.、Bartlett,P.和Frean,M.(2000)。作为梯度下降的推进算法。神经信息处理系统进展12 512–518。麻省理工学院出版社,剑桥。
[18] Ronchetti,E.(1997)。通过影响函数进行稳健推理。J.统计。计划。推论57 59–72·Zbl 0900.62175号 ·doi:10.1016/S0378-3758(96)00036-5
[19] Sakata,S.和White,H.(1995年)。有限样本分解点的另一种定义及其在回归模型估计中的应用。J.Amer。统计师。协会90 1099–1106·兹比尔0851.62024
[20] Schölkopf,B.和Smola,A.J.(2002年)。使用内核学习:支持向量机、正则化、优化及其他。麻省理工学院出版社,马萨诸塞州剑桥。
[21] Scholkopf,B.、Smola,A.J.、Williamson,R.C.和Bartlett,P.L.(2000)。新的支持向量算法。神经计算12 1207–1245。
[22] Shen,X.、Tseng,G.C.、Zhang,X.和Wong,W.H.(2003)。关于(ψ)-学习。J.Amer。统计师。协会98 724–734·兹比尔1052.62095 ·doi:10.1198/0162145000000639
[23] Stromberg,A.J.和Ruppert,D.(1992年)。非线性回归分解。J.Amer。统计师。协会87 991–997·Zbl 0765.62067号 ·doi:10.1080/01621459.1992.10476254
[24] Vapnik,V.N.(1998)。统计学习理论。纽约威利·Zbl 0935.62007号
[25] Wahba,G.(1990年)。观测数据的样条模型59。宾夕法尼亚州费城SIAM·Zbl 0813.62001号
[26] Wu,Y.和刘,Y.(2007)。鲁棒截断铰链损失支持向量机。J.Amer。统计师。协会102 974–983·Zbl 1469.62293号 ·doi:10.1198/0162145000000617
[27] Xu,L.、Crammer,K.和Schuurmans,D.(2006)。基于凸离群消融的鲁棒支持向量机训练。美国人工智能协会6 536–542。
[28] Yu,Y.、Yang,M.、Xu,L.、White,M.和Schuurmans,D.(2010)。松弛裁剪:稳健回归和分类的全局训练方法。神经信息处理系统进展2532–2540。
[29] 赵,J。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。