×

基于数据深度的快速非参数分类。 (英语) Zbl 1283.62128号

摘要:开发了一个新的过程,称为(D Dα)过程,用于解决将(D)维对象分类为(q geq 2)类的问题。该过程是非参数的;它使用\(q\)维深度图和一种非常有效的算法在深度空间\([0,1]^{q}\)中进行判别分析。具体来说,深度是类带状深度,算法是(alpha)-过程。如果有两个以上的类别,则执行几个二进制分类,并应用多数规则。
讨论了“局外人”的特殊处理,即深度向量为零的数据。将DD阿尔法分类器应用于模拟数据和实际数据,并将结果与最近提出的类似程序的结果进行了比较。在大多数情况下,新程序的错误率相当,但比其他分类方法(包括支持向量机)快得多。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62G99型 非参数推理
65C60个 统计中的计算问题(MSC2010)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 亚松森A,纽曼D(2007)UCI机器学习库。http://archive.ics.uci.edu/ml/ ·Zbl 1294.62112号
[2] Cascos I(2009)数据深度:多元统计和几何。收录:Kendall W,Molchanov I(eds)《随机几何的新观点》。牛津大学出版社·Zbl 1192.62140号
[3] Christmann A,Rousseeuw PJ(2001)二元回归中的重叠测量。计算统计数据分析37:65-75·Zbl 1051.62065号 ·doi:10.1016/S0167-9473(00)00063-3
[4] Christmann A,Fischer P,Joachims T(2002)各种回归深度方法和支持向量机之间的比较,以近似最小错误分类数。计算统计17:273-287·Zbl 1010.62054号 ·doi:10.1007/s001800200106
[5] Cuesta-Albertos JA,Nieto-Reyes A(2008)随机Tukey深度。计算机统计数据分析52:4979-4988·Zbl 1452.62344号 ·doi:10.1016/j.csda.2008.04.021
[6] Dutta S,Ghosh AK(2011)关于基于Lp深度的分类和p的自适应选择(2011年预印本)
[7] Dutta S,Ghosh AK(2012)《利用投影深度进行稳健分类》。Ann Inst统计数学64:657-676·Zbl 1237.62080号 ·doi:10.1007/s10463-011-0324-y
[8] Dyckerhoff R(2004)满足投影特性的数据深度。AStA 88:163-190·Zbl 1294.62112号 ·doi:10.1007/s101820400167
[9] Dyckerhoff R、Koshevoy G、Mosler K(1996)《带状数据深度:理论与计算》。摘自:Prat A(ed)COMPSTAT 1996计算统计学论文集。海德堡Physica-Verlag,第235-240页·Zbl 0894.62081号
[10] Ghosh AK,Chaudhuri P(2005)关于使用分离曲面的数据深度和分布自由判别分析。伯努利11:1-27·Zbl 1059.62064号 ·doi:10.3150/bj/1110228239
[11] Ghosh AK,Chaudhuri P(2005)关于最大深度和相关分类器。扫描J统计32:327-350·Zbl 1089.62075号 ·数字对象标识代码:10.1111/j.1467-9469.2005.00423.x
[12] Hastie T、Tibshirani R、Friedman JH(2009)《统计学习的要素:数据挖掘、推理和预测》,第2版。纽约州施普林格·Zbl 1273.62005年
[13] Hubert M,van Driessen K(2004)快速稳健的判别分析。计算统计数据分析45:301-320·Zbl 1429.62247号
[14] Jornsten R(2004)基于L1数据深度的聚类和分类。多变量分析杂志90:67-89·Zbl 1047.62064号 ·doi:10.1016/j.jmva.2004.02.013
[15] Koshevoy G,Mosler K(1997),多元分布的带状裁剪。Ann Stat 25:1998-2017年·Zbl 0881.62059号 ·doi:10.1214/aos/1069362382
[16] Lange T,Mozharovskyi P,Barath G(2011)解决模式识别和功能依赖重建任务的两种方法。第十四届应用随机模型和数据分析国际会议,罗马·Zbl 1010.62054号
[17] Li J,Cuesta-Albertos JA,Liu RY(2012)DD-分类器:基于DD-plot的非参数分类程序。美国统计协会J Am Stat Assoc 107:737-753·Zbl 1261.62058号 ·doi:10.1080/01621459.2012.688462
[18] Liu RY(1990)关于基于随机单形的数据深度概念。安统计18:405-414·Zbl 0701.62063号 ·doi:10.1214/aos/1176347507
[19] Liu RY,Parelius J,Singh K(1999)《数据深度的多元分析:描述性统计和推断》。安统计27:783-858·Zbl 0984.62037号
[20] Mahalanobis P(1936)关于统计学中的广义距离。印度国家科学院院刊12:49-55·Zbl 0015.03302号
[21] Mosler K(2002)《多元离散、中心区域和深度:提升带状方法》。纽约州施普林格·兹比尔1027.62033
[22] Mosler K,Hoberg R(2006),带状深度的数据分析和分类。收录:Liu R、Serfling R、Souvaine D(eds)数据深度:稳健多元分析、计算几何和应用,第49-59页·Zbl 1010.62054号
[23] Rousseeuw PJ,Hubert M(1999)回归深度。美国统计协会J Am Stat Assoc 94:388-433·Zbl 1007.62060号 ·doi:10.1080/01621459.1999.10474129
[24] Serfling R(2006)非参数多元推断中的深度函数。收录:Liu R、Serfling R、Souvaine D(eds)数据深度:稳健多元分析、计算几何和应用,第1-16页·Zbl 1452.62344号
[25] Tukey JW(1974)《数学与数据的描绘》。摘自:温哥华国际数学家大会议事录,第523-531页·Zbl 1106.62334号
[26] Vapnik VN(1998)统计学习理论。纽约威利·Zbl 0935.62007号
[27] Vasil’ev VI(1991)模式识别学习(PRL)问题中的约简原则。图案识别图像分析1:1
[28] Vasil’ev VI(2003)揭示规律问题中的归约原理I.Cybern Syst Anal 39:686-694·Zbl 1075.68642号 ·doi:10.1023/B:CASA.0000012089.39260.b3
[29] Vasil’ev VI,Lange T(1998)模式识别学习中的对偶原则(俄语)。Kibernetika i Vyt片岩'elnaya Technika基贝内特卡121:7-16
[30] Zuo YJ,Serfling R(2000)统计深度函数的一般概念。安统计28:461-482·Zbl 1106.62334号 ·doi:10.1214/aos/1016218226
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。