×

关于最大深度分类器:深度分布方法。 (英语) Zbl 1516.62450号

摘要:在本文中,我们考虑了对多元数据进行排序的数据深度的概念,并基于(mathbb{R}^d)中一些深度函数的分布提出了一个分类规则。在适当的条件下,讨论了该分类规则与最优贝叶斯规则的等价性。使用真实数据集研究了所提出的分类方法在低维和高维环境中的性能。此外,与其他使用模拟数据集的基于深度的分类器相比,该方法的性能也得到了验证。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Chan,Y.-B。;Hall,P.,《高维、低样本量设置下分类器的尺度调整》,《生物特征》,96,469-478(2009)·Zbl 1163.62045号
[2] 陈,Y。;Dang,X。;彭,H。;Bart,H.L.,带核空间深度函数的离群点检测,IEEE Trans。模式分析。机器。智力。,31, 288-305 (2009)
[3] Christmann,A。;菲舍尔,P。;Joachims,T.,各种回归深度方法与支持向量机之间的比较,以近似最小错误分类数,计算。统计,17,273-287(2002)·Zbl 1010.62054号
[4] Cuesta-Albertos,J.A。;Nieto-Reyes,A.,功能分类和随机Tukey深度。实际问题,高级智能。软计算-组合软计算。统计师。方法数据分析。,77, 123-130 (2010)
[5] 崔,X。;林,L。;Yang,G.R.,《扩展投影数据深度及其在判别中的应用》,Commun。Stat.-理论方法,3722276-2290(2008)·Zbl 1143.62037号
[6] Donoho,D.L。;Gasko,M.,基于半空间深度和投影边距的位置估计的分解特性,Ann.Statist。,20, 1803-1827 (1992) ·Zbl 0776.62031号
[7] 杜塔,S。;Ghosh,A.K.,《利用投影深度进行稳健分类》,《Ann.Inst.Stat.Math。,64, 657-676 (2012) ·兹比尔1237.62080
[8] Dyckerhoff,R.、Mosler,K.和Koshevoy,G.,分区域数据深度:理论和计算,载于1996年在西班牙巴塞罗那举行的计算统计学第12届研讨会论文集,第235-240页·Zbl 0894.62081号
[9] 范,J。;Fan,Y.,使用特征退火独立规则的高维分类,Ann.Statist。,36, 2605-2637 (2008) ·Zbl 1360.62327号
[10] Fisher,R.A.,《多重测量在分类问题中的应用》,《优生学年鉴》,第7179-188页(1936年)
[11] Ghosh,A.K。;Chaudhuri,P.,《关于最大深度和相关分类器》,Scand。J.统计。,32, 327-350 (2005) ·Zbl 1089.62075号
[12] Gorecki,T.,判别分析中的序列组合,J.Appl。Stat.,42,398-408(2015)·Zbl 1514.62593号
[13] 郭毅。;哈斯蒂,T。;Tibshirani,R.,正则化线性判别分析及其在微阵列中的应用,生物统计学,886-100(2007)·Zbl 1170.62382号
[14] 哈斯蒂,T。;Buja,A。;Tibshirani,R.,《惩罚判别分析》,《Ann.Stat.》,23,73-102(1995)·Zbl 0821.62031号
[15] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.H.,《统计学习的要素:数据挖掘、推断和预测》(2001年),纽约斯普林格出版社·Zbl 0973.62007号
[16] Koshevoy,G。;Mosler,K.,多元分布的带状修剪,Ann.Statist。,25, 1998-2017 (1997) ·Zbl 0881.62059号
[17] Lange,T.、Mosler,K.和Mozharovskyi,P.,(####)——非对称和失败数据的分类,摘自《数据分析、机器学习和知识发现》,M.Spiliopoulou、L.Schmidt-Thieme和R.Janning编辑,Springer,Cham,2014年,第71-78页。
[18] 兰格,T。;莫斯勒,K。;Mozharovskyi,P.,基于数据深度的快速非参数分类,Stat.Pap。,55, 49-69 (2014) ·Zbl 1283.62128号
[19] LeCun,Y。;博图,L。;Y.本吉奥。;Haffner,P.,《基于梯度的学习应用于文档识别》,Proc。IEEE,86,2278-2324(1998)
[20] 李,J。;Cuesta-Albertos,J.A。;Liu,R.Y.,DD-分类器:基于DD-plot的非参数分类程序,J.Amer。统计师。协会,107,737-753(2012)·Zbl 1261.62058号
[21] 刘瑞英,《基于随机单形的数据深度概念》,《统计年鉴》。,18, 405-414 (1990) ·Zbl 0701.62063号
[22] Liu,R.Y。;Parelius,J.M。;Singh,K.,《通过数据深度进行多元分析:描述性统计、图形和推理》,Ann.Statist。,27, 783-858 (1999) ·Zbl 0984.62037号
[23] Liu,R.Y。;Singh,K.,基于多元数据深度和多元秩检验的质量指数,美国统计协会杂志,88,252-260(1993)·Zbl 0772.62031号
[24] Makinde,O.S.,高维数据的秩上分布分类器,提交,2016。
[25] Makinde,O.S.,基于功能深度分布函数的一些分类规则,统计论文·Zbl 1432.62189号 ·doi:10.1007/s00362-016-0841-0
[26] Makinde,O.S.和Chakraborty,B.,《关于基于多元秩分布函数的一些非参数分类器》,载于《现代非参数、稳健和多元方法》,Nordhausen,K.,Taskinen,S.,eds.,Springer,Switzerland,2015年,第249-264页。
[27] Mansouri,K。;Ringsted,T。;巴拉比奥,D。;托德斯基尼,R。;Consonni,V.,化学品现成生物降解性的定量结构-活性关系模型,化学杂志。信息模型。,53, 867-878 (2013)
[28] Mosler,K.,《多元离散、中心区域和深度:提升带状线方法》(2002),Springer:Springer,纽约·Zbl 1027.62033号
[29] Nash,W.J.、Sellers,T.L.、Talbot,S.R.、Cawthorn,A.J.和Ford,W.B.,《塔斯马尼亚州鲍鱼(鲍鱼属)的种群生物学》。塔斯马尼亚州第一产业和渔业部塔鲁纳海洋研究实验室海洋渔业司,北海岸和巴斯海峡群岛的黑唇鲍(H.rubra),技术报告第48号,1994年。
[30] 卢梭,P。;Leroy,A.,《稳健回归和异常检测》(1987),《威利跨科学:威利跨学科》,纽约·兹比尔0711.62030
[31] Sohn,I。;希姆·J。;黄,C。;Kimd,S。;Lee,J.W.,通过监督加权离散核聚类和支持向量机的融合进行转录因子结合位点识别和基因分类,J.Appl。统计,41,573-581(2014)·Zbl 1514.62878号
[32] Stahel,W.A.,协方差估计的分解,研究报告31,Fachgruppe fur Statistik,ETH,苏黎世。1981
[33] Tian,T.S。;詹姆斯,G.M。;Wilcox,R.R.,《分类中降维的多元自适应随机搜索方法》,《应用统计年鉴》,4,340-365(2010)·Zbl 1189.62106号
[34] Tukey,J.,《数学与图像数据》,《1975年国际数学大会论文集》,第2523-531页(1975年)·Zbl 0347.6202号
[35] Vapnik,V.N.,基于经验数据的依赖性估计(1982),Springer:Springer,纽约·Zbl 0499.62005号
[36] Witten,D.M。;Tibshirani,R.,《使用Fisher线性判别法进行惩罚分类》,J.R.Statist。Soc.B,73,753-772(2011年)·Zbl 1228.62079号
[37] Zuo,Y。;Serfling,R.,统计深度函数的一般概念,Ann.Statist。,28, 461-482 (2000) ·Zbl 1106.62334号
[38] Zuo,Y。;Serfling,R.,样本统计深度函数等高线的结构性质和收敛结果,Ann.Statist。,28, 483-499 (2000) ·Zbl 1105.62343号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。