×

基于距离的定向深度分类器:一项鲁棒性研究。 (英语) Zbl 07793012号

摘要:受污染的训练集会严重影响分类规则的性能。为此,引入了鲁棒监督分类器。在众多方法中,本文主要研究基于深度的分类器,这是一类已被证明具有一些鲁棒性的方法。然而,在定向数据框架内没有对它们进行稳健性研究。在这里,我们评估了它们在一些定向污染方案下的性能。并与定向贝叶斯规则进行了比较。介绍并讨论了不同的定向特定污染场景:污染分布平均值的反方向性和正交性,以及定向平均值偏移异常值模型。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿贝贝,A。;Nudurupati,S.V.,使用稳健判别函数的基于秩的分类,《统计中的通信——模拟和计算》,38,2,199-214(2009)·Zbl 1161.62036号 ·网址:10.1080/03610910802446993
[2] 卡波佐,A。;格雷塞林,F。;Murphy,T.B.,基于修剪和约束的基于模型的分类的稳健方法,数据分析和分类进展,14,22327-54(2020)·Zbl 1474.62215号 ·doi:10.1007/s11634-019-00371-w
[3] 钱德拉,B。;Gupta,M.,在基因表达数据的幼稚贝叶斯分类器中估计概率的稳健方法,专家系统与应用,38,31229-98(2011)·doi:10.1016/j.eswa.2010.06.076
[4] 克罗克斯,C。;Dehon,C.,使用S-估计量的稳健线性判别分析,加拿大统计杂志,29,3,473-93(2001)·Zbl 0987.62044号 ·doi:10.2307/3316042
[5] Debruyne,M.,《支持向量机分类的离群值图》,《应用统计年鉴》,3,4,1566-80(2009)·Zbl 1185.62112号 ·doi:10.1214/09-AOAS256
[6] Demni,H。;巴尔扎诺,S。;波齐奥,G.C。;萨尔瓦多共和国。;Vistocco,D。;Vichi,M.,《数据分析中的统计学习和建模》。分类、数据分析和知识组织研究,深度函数定向监督学习:心电图波形分析应用,79-87(2021),查姆:斯普林格,查姆
[7] Demni,H。;Porzio,G.C.,非旋转对称下的定向DD-分类器(2021)
[8] Demni,H。;Messaoud,A。;Porzio,G.C。;Bauer,N。;伊克斯塔特,K。;吕布克,K。;西班纳克,G。;Trautmann,H。;Vichi,M.,《统计计算应用》。分类、数据分析和知识组织研究,定向数据的余弦深度分布分类器,49-60(2019),Cham:Springer,Cham
[9] 杜塔,S。;Ghosh,A.K.,《利用投影深度进行稳健分类》,《统计数学研究所年鉴》,第64、3、657-76页(2012年)·Zbl 1237.62080号 ·doi:10.1007/s10463-011-0324-y
[10] Figueiredo,A.,von Mises-Fisher分布的判别分析,统计中的通信-模拟和计算,38,9,1991-2003(2009)·Zbl 1182.62136号 ·doi:10.1080/03610910903200281
[11] 弗莱奈,B。;Verleysen,M.,《标签噪声存在下的分类:一项调查》,IEEE神经网络和学习系统汇刊,25,5,845-69(2014)·doi:10.1109/TNNLS.2013.2292894
[12] 霍金斯博士。;McLachlan,G.J.,高分解线性判别分析,美国统计协会杂志,92,437,136-43(1997)·Zbl 0889.62052号 ·doi:10.1080/0162145.1997.10473610
[13] 何,X。;Simpson,D.G.,稳健方向估计,《统计年鉴》,20,1,351-69(1992)·doi:10.1214/aos/1176348526
[14] 霍奇,V。;Austin,J.,《异常值检测方法的调查》,《人工智能评论》,22,2,85-126(2004)·Zbl 1101.68023号 ·doi:10.1023/B:AIRE.000045502.10941.a9
[15] 胡贝尔,P.J。;Ronchetti,E.M.,《稳健统计》(2009),John Wiley and Sons·Zbl 1276.62022号
[16] 休伯特,M。;Van der Veeken,S.,《倾斜数据的稳健分类》,《数据分析和分类进展》,4,4,239-54(2010)·Zbl 1284.62378号 ·doi:10.1007/s11634-010-0066-3
[17] 休伯特,M。;Van Driessen,K.,快速稳健判别分析,计算统计与数据分析,45,2,301-20(2004)·Zbl 1429.62247号 ·doi:10.1016/S0167-9473(02)00299-2
[18] 休伯特,M。;卢梭,P。;Segaert,P.,使用深度和距离的多变量和功能分类,数据分析和分类进展,11,3,445-66(2017)·Zbl 1414.62247号 ·doi:10.1007/s11634-016-0269-3
[19] Joossens,K。;克罗克斯,C。;休伯特,M。;Pison,G。;Struyf,A。;Van Aelst,S.,《最新稳健方法的理论和应用》。工业和技术统计,稳健线性和二次判别分析分类性能的实证比较,131-40(2004),巴塞尔:Birkhäuser,巴塞尔
[20] 加藤,S。;Eguchi,S.,von Mises-Fisher分布位置和浓度参数的稳健估计,统计论文,57,1,205-34(2016)·Zbl 1333.62145号 ·doi:10.1007/s00362-014-0648-9
[21] Ko,D。;Guttorp,P.,定向数据估计值的稳健性,统计年鉴,16,2,609-18(1988)·Zbl 0645.62045号
[22] Kirschstein,T。;Liebscher,S。;潘多尔夫,G。;Porzio,G.C。;Ragozini,G.,关于定向位置估计器的有限样本稳健性,计算统计与数据分析,133,53-75(2019)·Zbl 1507.62091号 ·doi:10.1016/j.csda.2018.08.028
[23] 莱伊,C。;萨巴,C。;Verdebout,T.,定向数据分位数的新概念,《电子统计杂志》,8,1,795-816(2014)·Zbl 1349.62197号 ·doi:10.1214/14-EJS904
[24] 李,J。;Cuesta-Albertos,J.A。;Liu,R.Y.,DD-分类器:基于DD-plot的非参数分类程序,美国统计协会杂志,107,498,737-53(2012)·兹比尔1261.62058 ·doi:10.1080/01621459.2012.688462
[25] Liu,R.Y。;帕雷柳斯,J.M。;Singh,K.,《通过数据深度进行多元分析:描述性统计、图形和推断》(由Liu和Singh讨论和反驳),《统计年鉴》,27,3,783-858(1999)·Zbl 0984.62037号 ·doi:10.1214/aos/1018031260
[26] Liu,R.Y。;Singh,K.,《定向数据排序:圆和球体上的数据深度概念》,《统计年鉴》,第20、3、1468-84页(1992年)·doi:10.1214/aos/1176348779
[27] Lopez-Cruz,P.L。;比尔扎,C。;Larranaga,P.,方向朴素贝叶斯分类器,模式分析与应用,18,22225-46(2015)·Zbl 1428.62283号 ·doi:10.1007/s10044-013-0340-z
[28] Mardia,K.V。;Jupp,P.E.,《方向统计》(2000),John Wiley and Sons·Zbl 0935.62065号
[29] Nakayama,Y.,《用于高维不平衡数据的稳健支持向量机》,《统计中的通信——模拟和计算》,50,5,1524-40(2021)·Zbl 1489.62185号 ·doi:10.1080/03610918.2019.1586922
[30] 潘多尔夫,G。;格雷塞林,F。;Mola,F。;Zenga,M.,CLADAG 2017年短篇论文集,定向数据DD-分类器的稳健性方面(2017),曼托瓦:Universitas Studiorum S.r.l.Casa Editrice,Mantova
[31] 潘多尔夫,G。;D'Ambrosio,A.,定向数据的深度分类,应用专家系统,169,doi:(2021)·doi:10.1016/j.eswa.2020.114433
[32] 潘多尔夫,G。;D'Ambrosio,A。;Porzio,G.C.,《基于深度的循环数据分类注释》,《应用统计分析电子期刊》,第11、2、447-62页(2018年)
[33] 潘多尔夫,G。;潘达维因,D。;Porzio,G.C.,《定向数据的基于距离的深度》,加拿大统计杂志,46,4,593-609(2018)·Zbl 1492.62095号 ·doi:10.1002/cjs.11479
[34] 佩西,A。;García-Portugués,E.,方向统计的最新进展,Test,30,1,1-58(2021)·Zbl 1474.62467号 ·数字对象标识代码:10.1007/s11749-021-00759-x
[35] Tsagris,M。;Alenazi,A.,《球面上判别分析方法的比较》,《统计学中的传播:案例研究、数据分析和应用》,第5、4、467-91页(2019年)
[36] Tukey,J.W.,《数学与数据的描绘》,2523-31(1975)·Zbl 0347.6202号
[37] Small,C.G.,多元和方向分布的中心性度量,加拿大统计杂志,15,1,31-39(1987)·兹比尔062262054 ·doi:10.2307/3314859
[38] O.Vencalek。;Demni,H。;Messaoud,A。;Porzio,G.C.,《关于球面数据的最大深度和最大库分类器的优化》,《数学应用》,65,3,331-42(2020)·Zbl 07217114号 ·doi:10.21136/AM.2020.0331-19
[39] O.Vencalek。;Pokotylo,O.,深度加权贝叶斯分类,计算统计学和数据分析,123,1-12(2018)·Zbl 1469.62154号 ·doi:10.1016/j.csda.2018.01.011
[40] Wilcox,R.,稳健估计和假设检验简介(2013)·Zbl 1362.62003年
[41] 朱,X。;Wu,X.,《类噪声与属性噪声:定量研究》,《人工智能评论》,22,3,177-210(2004)·Zbl 1069.68587号 ·doi:10.1007/s10462-004-0751-8
[42] Zuo,Y。;Serfling,R.,《统计深度函数的一般概念》,《统计年鉴》,28,2,461-82(2000)·Zbl 1106.62334号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。