×

统计模式识别的概率最近邻方法。 (英语) Zbl 1059.62065号

摘要:最近邻算法是统计模式识别中最常用的方法之一。这些模型概念简单,实证研究表明,它们的性能与其他技术相比具有很强的竞争力。然而,缺乏选择邻里(k)大小的正式框架是有问题的。此外,该方法只能通过报告预测点附近类的相对频率来进行离散预测。
我们为(k)-最近邻法提出了一个概率框架,该框架在很大程度上克服了这些困难。通过(k)上的先验分布以及邻域之间的交互强度来调节不确定性。这些先验分布通过适当的概率预测传播不确定性,这些概率预测对(0,1)具有持续支持。该方法不假设预测变量的分布。该方法也是全自动的,无需用户设置参数,并且在许多基准数据集上证明了其高度准确。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
2015年1月62日 贝叶斯推断
62G99型 非参数推理
68吨10 模式识别、语音识别

软件:

UCI-毫升
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Besag,关于条件和内在自回归,Biometrika 82 pp 733–(1995)·Zbl 0899.62123号
[2] 贝萨格,贝叶斯图像恢复及其在空间统计中的两个应用,Ann.Inst.Math。统计师。第43页第1页–(1991年)·Zbl 0760.62029号 ·doi:10.1007/BF00116466
[3] Blake,C.L.Merz,C.J.1998 UCI机器学习数据库库。加州大学欧文分校信息与计算机科学系。(可从网址:http://www.ics.uci.edu/mlearn/MLRepository.html)
[4] Dasarathy,最近邻(NN)规范:NN模式分类技术(1991)
[5] Dawid,贝叶斯统计4第109页–(1992)
[6] Devroye,模式识别的概率理论(1996)·doi:10.1007/978-1-4612-0711-5
[7] Diggle,空间点过程的统计分析(1983年)
[8] Enas,平滑参数的选择和k近邻分类的效率,计算。数学。适用。第12页第235页–(1986年)·Zbl 0606.62060号 ·doi:10.1016/0898-1221(86)90076-3
[9] Fix,E.Hodges,J.L.1951判别分析-非参数判别:一致性属性项目21-49-004,报告4 261 279
[10] 弗里德曼,《关于偏见、方差、0/1损失和维度诅咒》,《数据挖掘知识》。发现。第1页第55页–(1997年)·doi:10.1023/A:1009778005914
[11] Fukunaga,k近邻密度估计的优化,IEEE Trans。通知。理论19第320页–(1973)·Zbl 0276.62039号 ·doi:10.1109/TIT.1973.1055003
[12] 杰拉德·D·J·1969竞争商:一种新的衡量竞争对林木个体影响的方法研究公报20
[13] Gilks,遵循动态贝叶斯模型的移动目标-蒙特卡罗推断,J.R.Statist。Soc.63第127页–(2001年)·Zbl 0976.62021号 ·doi:10.1111/1467-9868.00280
[14] 马尔可夫链蒙特卡罗实践(1996)·Zbl 0832.00018号
[15] Hand,《消费信贷评分中的统计分类方法:综述》,J.R.Statist。Soc.160第523页–(1997年)·doi:10.1111/j.1467-985X.1997.00078.x
[16] Holmes,C.C.Adams,N.M.2001近邻分类模型中的似然推断技术报告
[17] 麦克拉克伦,判别分析和统计模式识别(1992)·Zbl 1108.62317号 ·doi:10.1002/0471725293
[18] Michie,《机器学习、神经和统计分类》(1994年)·Zbl 0827.68094号
[19] Ripley,神经网络和相关分类方法(讨论),J.R.Statist。Soc.56第409页–(1994年)·Zbl 0815.62037号
[20] 模式识别和神经网络(1996)·Zbl 0853.62046号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。