×

利用投影深度进行稳健分类。 (英语) Zbl 1237.62080号

摘要:本文使用投影深度(PD)对多元数据进行稳健分类。我们考虑两种类型的分类器,即最大深度分类器和改进的基于深度的分类器。后者涉及核密度估计,需要选择相关的平滑尺度。我们考虑了核密度估计的单尺度和多尺度版本,并研究了在适当的正则性条件下所得分类器的大样本特性。分析了一些模拟和真实的数据集,以评估这些分类工具的有限样本性能。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62小时05 多元概率分布的表征与结构理论;连接线
62克07 密度估算
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Breiman L.(1996)装袋预测。机器学习24:123–140·Zbl 0858.68080号
[2] Cator,E.A.,Lopuhaä,H.P.(2011年)。一般多元分布MCD估计的中心极限定理和影响函数。(出现)·Zbl 1239.62068号
[3] Chaudhuri P.、Sengupta D.(1993)《多维符号测试:基于数据云几何的推断》。美国统计协会杂志88:1363-1370·Zbl 0792.62047号 ·doi:10.1080/01621459.1993.10476419
[4] Chen Y.,Dang X.,Peng H.,Bart H.L.Jr(2009)基于核化空间深度函数的离群点检测。IEEE模式分析和机器智能汇刊,31:288–305·doi:10.1109/TPAMI.2008.72
[5] Cover T.M.,Hart P.E.(1967)最近邻模式分类。IEEE信息理论汇刊13:21–27·Zbl 0154.44505号 ·doi:10.1109/TIT.1967.1053964
[6] Croux C.,Dehon C.(2001)使用S-估计量的稳健线性判别分析。加拿大统计杂志29:473–492·Zbl 0987.62044号 ·doi:10.2307/3316042
[7] Fang K.-T.,Kotz S.,Ng K.-W.(1989)对称多元及相关分布。查普曼和霍尔,伦敦
[8] Friedman,J.(1994)。灵活的度量最近邻分类。技术报告LCS 113,美国加利福尼亚州斯坦福大学统计系。http://statistics.stanford.edu/\(\sim)ckirby/techreports/LCS/LCS%20113.pdf。
[9] Ghosh A.K.,Chaudhuri P.(2004)核判别分析中的最优平滑。中国统计局14:457–483·Zbl 1045.62024号
[10] Ghosh A.K.,Chaudhuri P.(2005)关于使用分离曲面的数据深度和分布自由判别分析。。伯努利11:1–27·Zbl 1059.62064号 ·doi:10.3150/bj/1110228239
[11] Ghosh A.K.,Chaudhuri P.(2005)《关于最大深度和相关分类器》。斯堪的纳维亚统计杂志32:328–350·兹比尔1089.62075 ·数字对象标识代码:10.1111/j.1467-9469.2005.00423.x
[12] Ghosh A.K.,Chaudhuri P.,Murthy C.A.(2005)《关于最近邻分类器的可视化和聚合》。IEEE模式分析和机器智能汇刊27:1592–1602·Zbl 05112480号 ·doi:10.1109/TPAMI.2005.204
[13] Ghosh A.K.、Chaudhuri P.、Sengupta D.(2006)《使用核密度估计进行分类:多尺度分析和可视化》。技术计量学48:120–132·doi:10.1198/004017005000000391
[14] He X.,Wang G.(1997)多元数据集深度等值线的收敛性。统计年鉴25:495–504·Zbl 0873.62053号 ·doi:10.1214/aos/1031833661
[15] Hoberg R.(2000)基于数据深度的聚类分析。In:Kiers H.A.L.、Rasson J.P.、Groenen P.J.F.、Schader M.(编辑)数据分析、分类和相关方法。柏林施普林格,第17-22页
[16] Holmes C.,Adams N.(2002)统计模式识别的概率最近邻算法。英国皇家统计学会期刊B辑方法学64:295–306·Zbl 1059.62065号 ·doi:10.1111/1467-9868.00338
[17] Holmes C.,Adams N.(2003)最近邻分类模型中的似然推断。生物特征90:99–112·Zbl 1034.62053号 ·doi:10.1093/biomet/90.1.99
[18] Hubert M.,Van Driessen K.(2004)快速稳健的判别分析。计算统计与数据分析45:301–320·Zbl 1429.62247号 ·doi:10.1016/S0167-9473(02)00299-2
[19] Jornsten R.(2004)基于L1数据深度的聚类和分类。多元分析杂志90:67-89·Zbl 1047.62064号 ·doi:10.1016/j.jmva.2004.02.013
[20] Lagarias J.C.、Reeds J.A.、Wright M.H.和Wright P.E.(1998)低维Nelder-Mead单纯形方法的收敛性。SIAM优化期刊9:112–147·Zbl 1005.90056号 ·doi:10.1137/S1052623496303470
[21] Li,J.、Cuesta-Albertos,J.A.、Liu,R.(2011)。基于DD-plot的非参数分类程序。提交。( http://personalizes.unican.es/cuestaj/publicaciones.html ). ·Zbl 1261.62058号
[22] Liu R.,Singh K.(1993)基于数据深度和多元秩检验的质量指数。美国统计协会杂志88:252–260·Zbl 0772.62031号
[23] Liu R.,Parelius J.,Singh K.(1999)数据深度的多元分析:描述性统计和推断。统计年鉴27:783–858·Zbl 0984.62037号
[24] Maronna R.A.,Yohai V.J.(1995)Stahel-Donoho稳健多元估计的行为。美国统计协会杂志90:330–341·Zbl 0820.62050号 ·doi:10.1080/01621459.1995.10476517
[25] Peterson G.E.,Barney H.L.(1952)元音研究中使用的控制方法。美国声学学会杂志24:175–185·数字对象标识代码:10.1121/1.1906875
[26] Rousseeuw P.J.,Struyf A.(1998)高维计算位置深度和回归深度。统计与计算8:193–203·doi:10.1023/A:1008945009397
[27] Rousseeuw P.J.,Van Driessen K.(1999)最小协方差行列式估计的快速算法。技术计量学41:212–223·doi:10.1080/00401706.1999.10485670
[28] Schapire R.E.、Fruend Y.、Bartlett P.、Lee W.(1998)《提高利润率:投票方法有效性的新解释》。统计年鉴26:1651–1686·Zbl 0929.62069号 ·doi:10.1214操作系统/1024691352
[29] Silverman B.W.(1986)统计和数据分析密度估计。查普曼和霍尔,伦敦·Zbl 0617.62042号
[30] Tukey,J.(1975)。数学和数据的图像化。1975年温哥华国际数学家大会会议记录(第523-531页)·兹伯利0347.62002
[31] Tyler D.E.(1987)多元分散的无分布M估计。统计年鉴。15: 234–251 ·Zbl 0628.62053号 ·doi:10.1214操作系统/1176350263
[32] Vardi,Y.,Zhang,C.H.(2000)。多元L1中值和相关数据深度。美国国家科学院院刊,971423-1426·Zbl 1054.62067号
[33] Wilcox R.R.(2005)鲁棒估计和假设检验导论。伦敦学术出版社·Zbl 1113.62036号
[34] 夏C.,林L.,杨G.(2008)扩展投影数据深度及其在判别中的应用。统计学中的传播:理论与方法37:2276–2290·Zbl 1143.62314号 ·doi:10.1080/03610920801931838
[35] Zuo Y.,Serfling R.(2000)统计深度函数的一般概念。统计年鉴28:461–482·Zbl 1106.62334号 ·doi:10.1214/aos/1016218226
[36] Zuo Y.,Serfling R.(2000)样本统计深度函数等高线的结构特性和收敛结果。统计年鉴28:483–499·Zbl 1105.62343号 ·doi:10.1214/aos/1016218227
[37] Zuo Y.(2003)基于投影的深度函数和相关中位数。统计年鉴31:1460–1490·Zbl 1046.62056号 ·doi:10.1214/aos/1065705115
[38] 左寅(2004)加权Lp深度和Lp中值的稳健性。Allgemeines统计档案88:1–20·Zbl 1083.62116号 ·doi:10.1007/s101820400156
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。