×

袋装最近邻分类器的性质。 (英语) Zbl 1069.62051号

结果表明,如果重采样大小小于实际样本大小的69%(在有重采样的情况下),或者小于样本大小的50%(在无重采样的情形下),则装袋是一种计算密集的方法,它可以渐进地提高最近邻分类器的性能。然而,对于较大的采样分数,常规最近邻分类器及其袋装版本的风险之间没有渐近差异。特别是,两者都没有达到贝叶斯分类器的大样本性能。相反,当采样分数收敛到0,但重采样大小发散到(infty)时,袋装分类器收敛到最优Bayes规则,其风险收敛到后者的风险。当这两个种群具有明确定义的密度时,最容易看到这些结果,但在其他情况下也可能得出这些结果,其中密度仅存在于相对意义上。交叉验证可以有效地用于选择采样分数。用数值计算来说明这些理论性质。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
65C60个 统计中的计算问题(MSC2010)
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bay S.D.,程序。第15届国际会议机器学习第37页–(1998)
[2] DOI:10.1016/S1088-467X(99)00018-9·doi:10.1016/S1088-467X(99)00018-9
[3] Bickel P.J.,统计师。罪。第7页第1页–(1997年)
[4] DOI:10.1023/A:1018054314350·doi:10.1023/A:1018054314350
[5] L.Breiman(1999)使用自适应装袋法进行借方回归。技术报告547。加州大学伯克利分校统计系·Zbl 1052.68109号
[6] DOI:10.1023/A:1010933404324·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[7] DOI:10.1214/aos/1031689014·Zbl 1029.62037号 ·doi:10.1214/aos/1031689014
[8] A.Buja和W.Stuetzle(2000)装袋对方差、偏差和均方误差的影响。手稿。宾夕法尼亚大学,费城。
[9] A.Buja和W.Stuetzle(2000)装袋的平滑效果。手稿。宾夕法尼亚大学,费城。
[10] 封面T.M.,程序。夏威夷国际会议系统科学第413页–(1968年)
[11] 内政部:10.1109/TIT.1967.1053964·Zbl 0154.44505号 ·doi:10.1109/TIT.1967.1053964
[12] Daley D.J.,点过程理论导论(1988)·Zbl 0657.60069号
[13] Devroye L.,IEEE传输。Pattn Ana公司。机器。智力。第4页154页–(1982)
[14] Devroye L.,模式识别的概率理论(1996)·doi:10.1007/978-1-4612-0711-5
[15] 内政部:10.1198/016214502753479248·Zbl 1073.62576号 ·doi:10.1198/016214502753479248
[16] Efron B.,J.Am.统计师。资产负债表78第316页–(1983年)
[17] Efron B.,J.Am.统计师。第92章第548页——(1997年)
[18] E.Fix和J.Hodges(1951)判别分析,非参数判别:一致性属性。技术报告4,项目21-49-004。美国空军航空医学院(Randolph Field)。
[19] Francois J.,《基于知识的系统中的信息处理和不确定性管理》,第111页–(2001年)
[20] 内政部:10.1006/jcss.1997.1504·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504
[21] J.H.Friedman和P.Hall(2000),关于装袋和非线性估计。手稿。斯坦福大学,斯坦福·Zbl 1104.62047号
[22] DOI:10.1214/aos/1016218222·doi:10.1214/aos/1016218222
[23] Fukunaga K.,IEEE传输。Pattn Ana公司。机器。智力。第9页103–(1987)
[24] Guerra-Salcedo C.,程序。遗传与进化计算会议第236页–(1999)
[25] 内政部:10.1016/0167-7152(89)90002-3·Zbl 0676.62038号 ·doi:10.1016/0167-7152(89)90002-3
[26] Hand D.J.,《歧视与分类》(1981年)·Zbl 0587.62119号
[27] Ho T.K.,程序。第14届国际会议模式识别,布里斯班,第545页–(1998)
[28] 内政部:10.1109/34.709601·doi:10.1009/34.709601
[29] DOI:10.1214/aos/1015362184·Zbl 1012.62066号 ·doi:10.1214/aos/1015362184
[30] 内政部:10.1198/016214501753168271·doi:10.1198/016214501753168271
[31] 内政部:10.1109/5326.661099·doi:10.1109/5326.661099
[32] L.I.Kuncheva、M.Skurichina和R.P.W.Duin(2002)《线性分类器对袋装和增强多样性的实验研究》,245 -258 .
[33] Larkey L.S.,程序。第19届A.国际信息检索研究与发展会议第289页–(1996)
[34] 内政部:10.1214/aos/1032894460·Zbl 0859.62040号 ·doi:10.1214/aos/1032894460
[35] 奶妈E.,勒克特。注释统计。77 (1992) ·doi:10.1007/978-1-4612-2950-6
[36] Marron J.S.,Ann.统计师。第11页,第1142页–(1983年)
[37] DOI:10.1016/0378-3758(89)90039-6·Zbl 0689.62027号 ·doi:10.1016/0378-3758(89)90039-6
[38] Mollineda R.A.,程序。第四届Wrld Multiconf。系统论、控制论和信息学第640页–(2000)
[39] 内政部:10.1109/18.335893·Zbl 0820.62060号 ·数字对象标识代码:10.1109/18.335893
[40] DOI:10.1214/aos/1024691352·Zbl 0929.62069号 ·doi:10.1214/aos/1024691352
[41] DOI:10.1016/S0031-3203(97)00110-6·doi:10.1016/S0031-3203(97)00110-6
[42] Skurichina M.,法学博士。注释计算。科学。2364页,第62页–(2002年)
[43] DOI:10.1023/A:1008933626919·doi:10.1023/A:1008933626919
[44] Stoller D.S.,J.Am.统计师。第49章第770页——(1954年)
[45] 内政部:10.1109/18.796368·Zbl 0962.62026号 ·数字对象标识代码:10.1109/18.796368
[46] Zemke S.,程序。《工程中的人工神经网络》第1067页–(1999)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。