×

一种简单的方法,用于组合估计以提高分类中的总体错误率。 (英语) Zbl 1329.65023号

摘要:为了开发更有效的分类规则,我们提出了一种新的易于实现的程序,用于组合不同的分类器。该方法的工作原理是找到一个新观测值(必须分类)的类条件期望的非参数估计,条件是与单个分类器对应的(J)预测值向量。在这里,我们提出了一种数据分割方法来进行各种类条件期望的估计。结果表明,在相当小的假设条件下,所提出的组合分类器是最优的,因为它的总误分类率渐近小于(或等于)任何一个单独分类器的误分类率。还进行了仿真研究以评估所提方法。此外,为了使数值结果更具挑战性,我们还考虑了高维稳定分布(Cauchy)。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)

软件:

超级学习者
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Adler W、Brenning A、Potapov S、Schmid M、Lausen B(2011)成对数据的集合分类。计算统计数据分析55:1933-1941·Zbl 1328.62578号
[2] Biau G、Fischer A、Guedj B、Malley J(2013)《COBRA:非线性聚合策略》。arXiv:1303.2236v1[math.ST]·Zbl 1334.62005年
[3] Boser B,Guyon I,Vapnik V(1992)最佳边缘分类器的训练算法。摘自:计算学习理论第五届年度研讨会论文集,第5卷,第144-152页·Zbl 0953.62060号
[4] Breiman L(1995)叠加回归。马赫学习24:49-64·Zbl 0849.68104号
[5] Breiman L(1996a)装袋预测值。马赫学习24:123-140·Zbl 0858.68080号
[6] Breiman L(1996b)银行外估计。加州大学伯克利分校统计系技术报告
[7] Breiman L(2001)《随机森林》。马赫学习45:5-32·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[8] De Bock KW,Coussement K,Van den Poel D(2010),基于广义可加模型的集成分类。计算统计数据分析54:1535-1546·Zbl 1284.62368号 ·doi:10.1016/j.csda.2009.12.013
[9] Devroye L,Györfi L,Lugosi G(1996)模式识别的概率理论。纽约州施普林格·Zbl 0853.68150号 ·doi:10.1007/978-1-4612-0711-5
[10] Fauvel M、Chanuscot J、Benediktsson JA(2006)城市遥感图像分类的决策融合。IEEE Trans Geosci遥感44:2828-2838·doi:10.1109/TGRS.2006.876708
[11] Galar M,Fernandez A,Bustince H,Herrera F(2011)多类问题中二进制分类器集成方法概述:一对一和一对所有方案的实验研究。图案识别44:1761-1776·doi:10.1016/j.patcog.2011.01.017
[12] Hastie T,Tibshirani R(1996)高斯混合判别分析。J R Stat Soc B期刊58:155-176·Zbl 0850.62476号
[13] LeBlanc M,Tibshirani R(1996)回归和分类中的组合估计。美国统计协会杂志91:1641-1650·Zbl 0881.62046号
[14] Little R,Rubin D(1987)缺失数据的统计分析。纽约威利·Zbl 0665.62004号
[15] Mojirsheibani M(1997)一致的组合分类规则。统计概率Lett 36:43-47·Zbl 0953.62060号 ·doi:10.1016/S0167-7152(97)00047-3
[16] Mojirsheibani M(1999)基于离散化的分类器组合。美国统计协会杂志94:600-609·Zbl 0997.62048号 ·doi:10.1080/01621459.1999.10474154
[17] van der Laan M,Dudoit S,van der Vaart A(2006)交叉验证自适应ε-网估计器。统计数字24:373-395·Zbl 1111.62003号
[18] van der Laan,M,Polley E,Hubbard A(2007)超级学习者。遗传学和分子生物学中的统计学应用,6,第25条,第23页·兹比尔0849.68104
[19] Wolpert D(1992)叠加概括。神经网络5:241-259·doi:10.1016/S0893-6080(05)80023-1
[20] Xu L,Kryzak A,Suen CY(1992)组合多分类器的方法及其在手写识别中的应用。IEEE Trans-Syst Man Cybern 22:418-435电气与电子工程师协会·数字对象标识代码:10.1109/21.155943
[21] Yang Y(2000)结合不同的自适应回归程序。多变量分析杂志74:135-161·Zbl 0964.62032号 ·doi:10.1006/jmva.1999.1884
[22] Yang Y(2004)《聚合回归程序以提高绩效》。伯努利10:25-47·Zbl 1040.62030 ·doi:10.3150/bj/1077544602
[23] Yiu K,Mak M,Li C(1999)用于模式分类的高斯混合模型和基于概率决策的神经网络:比较研究。神经计算应用程序8:235-245·doi:10.1007/s005210050026
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。