霍尔,彼得;理查德·萨姆沃思 袋装最近邻分类器的性质。 (英语) Zbl 1069.62051号 J.R.Stat.Soc.,塞尔维亚。B、 统计方法。 67,第3期,363-379(2005). 结果表明,如果重采样大小小于实际样本大小的69%(在有重采样的情况下),或者小于样本大小的50%(在无重采样的情形下),则装袋是一种计算密集的方法,它可以渐进地提高最近邻分类器的性能。然而,对于较大的采样分数,常规最近邻分类器及其袋装版本的风险之间没有渐近差异。特别是,两者都没有达到贝叶斯分类器的大样本性能。相反,当采样分数收敛到0,但重采样大小发散到(infty)时,袋装分类器收敛到最优Bayes规则,其风险收敛到后者的风险。当这两个种群具有明确定义的密度时,最容易看到这些结果,但在其他情况下也可能得出这些结果,其中密度仅存在于相对意义上。交叉验证可以有效地用于选择采样分数。用数值计算来说明这些理论性质。 引用于13文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 65C60个 统计中的计算问题(MSC2010) 2015年1月62日 贝叶斯推断 关键词:贝叶斯风险;引导数据库;分类错误;交叉验证;密度;歧视;错误率;标记点过程;泊松过程;预测;后悔;统计学学习;无重置采样;重新放置采样 PDF格式BibTeX公司 XML格式引用 \textit{P.Hall}和\textit{R.Samworth},J.R.Stat.Soc.,Ser。B、 统计方法。67,第3号,363--379(2005;Zbl 1069.62051) 全文: 内政部 参考文献: [1] Bay S.D.,程序。第15届国际会议机器学习第37页–(1998) [2] DOI:10.1016/S1088-467X(99)00018-9·doi:10.1016/S1088-467X(99)00018-9 [3] Bickel P.J.,统计师。罪。第7页第1页–(1997年) [4] DOI:10.1023/A:1018054314350·doi:10.1023/A:1018054314350 [5] L.Breiman(1999)使用自适应装袋法进行借方回归。技术报告547。加州大学伯克利分校统计系·Zbl 1052.68109号 [6] DOI:10.1023/A:1010933404324·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324 [7] DOI:10.1214/aos/1031689014·Zbl 1029.62037号 ·doi:10.1214/aos/1031689014 [8] A.Buja和W.Stuetzle(2000)装袋对方差、偏差和均方误差的影响。手稿。宾夕法尼亚大学,费城。 [9] A.Buja和W.Stuetzle(2000)装袋的平滑效果。手稿。宾夕法尼亚大学,费城。 [10] 封面T.M.,程序。夏威夷国际会议系统科学第413页–(1968年) [11] 内政部:10.1109/TIT.1967.1053964·Zbl 0154.44505号 ·doi:10.1109/TIT.1967.1053964 [12] Daley D.J.,点过程理论导论(1988)·Zbl 0657.60069号 [13] Devroye L.,IEEE传输。Pattn Ana公司。机器。智力。第4页154页–(1982) [14] Devroye L.,模式识别的概率理论(1996)·doi:10.1007/978-1-4612-0711-5 [15] 内政部:10.1198/016214502753479248·Zbl 1073.62576号 ·doi:10.1198/016214502753479248 [16] Efron B.,J.Am.统计师。资产负债表78第316页–(1983年) [17] Efron B.,J.Am.统计师。第92章第548页——(1997年) [18] E.Fix和J.Hodges(1951)判别分析,非参数判别:一致性属性。技术报告4,项目21-49-004。美国空军航空医学院(Randolph Field)。 [19] Francois J.,《基于知识的系统中的信息处理和不确定性管理》,第111页–(2001年) [20] 内政部:10.1006/jcss.1997.1504·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504 [21] J.H.Friedman和P.Hall(2000),关于装袋和非线性估计。手稿。斯坦福大学,斯坦福·Zbl 1104.62047号 [22] DOI:10.1214/aos/1016218222·doi:10.1214/aos/1016218222 [23] Fukunaga K.,IEEE传输。Pattn Ana公司。机器。智力。第9页103–(1987) [24] Guerra-Salcedo C.,程序。遗传与进化计算会议第236页–(1999) [25] 内政部:10.1016/0167-7152(89)90002-3·Zbl 0676.62038号 ·doi:10.1016/0167-7152(89)90002-3 [26] Hand D.J.,《歧视与分类》(1981年)·Zbl 0587.62119号 [27] Ho T.K.,程序。第14届国际会议模式识别,布里斯班,第545页–(1998) [28] 内政部:10.1109/34.709601·doi:10.1009/34.709601 [29] DOI:10.1214/aos/1015362184·Zbl 1012.62066号 ·doi:10.1214/aos/1015362184 [30] 内政部:10.1198/016214501753168271·doi:10.1198/016214501753168271 [31] 内政部:10.1109/5326.661099·doi:10.1109/5326.661099 [32] L.I.Kuncheva、M.Skurichina和R.P.W.Duin(2002)《线性分类器对袋装和增强多样性的实验研究》,245 -258 . [33] Larkey L.S.,程序。第19届A.国际信息检索研究与发展会议第289页–(1996) [34] 内政部:10.1214/aos/1032894460·Zbl 0859.62040号 ·doi:10.1214/aos/1032894460 [35] 奶妈E.,勒克特。注释统计。77 (1992) ·doi:10.1007/978-1-4612-2950-6 [36] Marron J.S.,Ann.统计师。第11页,第1142页–(1983年) [37] DOI:10.1016/0378-3758(89)90039-6·Zbl 0689.62027号 ·doi:10.1016/0378-3758(89)90039-6 [38] Mollineda R.A.,程序。第四届Wrld Multiconf。系统论、控制论和信息学第640页–(2000) [39] 内政部:10.1109/18.335893·Zbl 0820.62060号 ·数字对象标识代码:10.1109/18.335893 [40] DOI:10.1214/aos/1024691352·Zbl 0929.62069号 ·doi:10.1214/aos/1024691352 [41] DOI:10.1016/S0031-3203(97)00110-6·doi:10.1016/S0031-3203(97)00110-6 [42] Skurichina M.,法学博士。注释计算。科学。2364页,第62页–(2002年) [43] DOI:10.1023/A:1008933626919·doi:10.1023/A:1008933626919 [44] Stoller D.S.,J.Am.统计师。第49章第770页——(1954年) [45] 内政部:10.1109/18.796368·Zbl 0962.62026号 ·数字对象标识代码:10.1109/18.796368 [46] Zemke S.,程序。《工程中的人工神经网络》第1067页–(1999) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。