×

\(k\)NN分类器子集的集合。 (英语) Zbl 1416.62338号

摘要:组合多分类器(称为集成方法)可以显著提高学习算法的预测性能,特别是在数据集中存在非信息特征的情况下。我们提出了一个用于两步分类任务的(k)NN分类器子集集合ES(k)NN。首先,我们使用样本外准确度,根据分类器的个体性能选择分类器。然后从最佳模型开始,依次组合选定的分类器,并在验证数据集上评估其集体性能。我们使用基准数据集及其原始特征和一些添加的非信息特征来评估我们的方法。将结果与常用的k神经网络、bagged神经网络、random神经网络、多特征子集方法、随机森林和支持向量机进行了比较。我们在基准分类问题和模拟数据集上的实验比较表明,该集成比通常的(k)NN及其集成具有更好的分类性能,并且性能与随机森林和支持向量机相当。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bache K,Lichman M(2013)UCI机器学习库。http://archive.ics.uci.edu/ml。访问日期:2014年10月3日
[2] Barandela,R。;瓦尔多维诺斯,RM;Sánchez,JS,分类器集合的新应用,模式分析应用,6245-256,(2013)
[3] 鲍尔,E。;Kohavi,R.,《投票分类算法的实证比较:打包、增强和变体》,《马赫学习》,36,105-139,(1999)
[4] Bay S(1998)通过多个特征子集组合最近邻分类器。摘自:《第十五届机器学习国际会议论文集》,第3卷。摩根考夫曼出版公司,第37-45页
[5] Breiman,L.,《装袋预测》,《马赫学习》,24,123-140,(1996)·Zbl 0858.68080号
[6] Breiman L(1996b)银行外估计。技术代表。http://citeseerx.ist.psu.edu。访问日期:2014年10月3日
[7] Cannings T,Samworth R(2015)《随机投影集合分类》。arXiv:1504.04595v1.pdf。2015年10月3日访问·Zbl 1373.62301号
[8] 盖,T。;Hart,P.,最近邻模式分类,IEEE Trans-Inf理论,13,21-27,(1967)·Zbl 0154.44505号
[9] Domeniconi C,Yan B(2004)最近邻居合奏。摘自:IEEE第17届模式识别国际会议论文集(ICPR 2004),第1卷,第228-231页
[10] Grabowski S(2002)对多个k-nn分类器进行投票。收录于:无线电工程、电信和计算机科学现代问题国际会议论文集IEEE,第223-225页
[11] Gul A、Perperoglou A、Khan Z、Mahmoud O、Adler W、Miftahuddin M、Lausen B(2015)R包:ESKNN:用于分类和类成员概率估计的K近邻分类器子集集合。http://cran.r-project.org/web/packages/ESKNN/index.html。访问日期:2015年9月30日
[12] Guvenir HA,Akkus A(1997)基于特征投影的加权k最近邻分类。http://www.cs.bilkent.edu.tr/tech-reports/1997/BU-CEIS-9719.pdf。2014年10月3日访问
[13] 霍尔,P。;Samworth,R.,袋装最近邻分类器的特性,J R Stat Soc Ser B(统计方法),67,363-379,(2005)·Zbl 1069.62051号
[14] Hernández-Orallo,J。;弗拉奇,P。;Ferri,C.,《绩效指标的统一观点:将阈值选择转化为预期分类损失》,J Mach Learn Res,13,2813-2869,(2012)·Zbl 1436.62260号
[15] Hothorn,T。;Lausen,B.,《激光扫描图像的打包树分类器:基于数据和模拟的策略》,Artif Intell Med,27,65-79,(2003)
[16] Hothorn,T。;Lausen,B.,《双重分类:通过自举聚合组合分类器》,《模式识别》,第36期,第1303-1309页,(2003年)·Zbl 1028.68144号
[17] Hothorn,T。;Lausen,B.,通过装袋树捆绑分类器,计算统计数据分析,49,1068-1078,(2005)·兹比尔1429.62246
[18] Hothorn,T。;劳森,B。;A.本纳。;Radespiel-Trĺoger,M.,《打包存活树木》,《统计医学》,第23期,第77-91页,(2004年)
[19] 卡拉佐格鲁,A。;Smola,A。;霍尼克,K。;Zeileis,A.,《R中内核方法的内核-S4包》,J Stat Softw,11,1-20,(2004)
[20] Khoshgoftaar,T。;Hulse,J。;Napolitano,A.,《将增压和装袋技术与噪声和不平衡数据进行比较》,IEEE Trans-Syst Man Cybern Part A Syst Hum,41,552-568,(2011)
[21] Kruppa,J。;刘,Y。;迪纳,HC;霍尔斯特,T。;魏玛,C。;科尼,IR;Ziegler,A.,《使用机器学习方法进行二分和多类别结果的概率估计:应用》,Biom J,56,564-583,(2014)·Zbl 1441.62405号
[22] Lausser,L.公司。;穆塞尔,C。;Melkozerov,A。;Kestler,HA,《识别预测中心以压缩k近邻分类器的训练集》,计算统计,29,81-95,(2014)·Zbl 1306.65085号
[23] Leisch F,Dimitriadou E(2010)mlbench:机器学习基准问题。R包版本2.1-1
[24] 李,S。;EJ哈纳;Adgeroh,D.,Random knn feature selection——一种快速稳定的随机森林替代品,BMC Bioninform,12,450,(2011)
[25] 刘,Z。;X.赵。;左,MJ;Xu,H.,行星齿轮箱故障级别诊断的特征选择,Adv Data Anal Classif,8,377-401,(2014)·Zbl 1414.93126号
[26] 麦克林(R.Maclin)。;Opitz,D.,《流行的合奏方法:一项实证研究》,J Artif Res,1169-189,(2011)·兹比尔0924.68159
[27] O.马哈茂德。;哈里森,A。;Perperoglou,A。;居尔,A。;Z.Khan。;梅托迪耶夫,MV;Lausen,B.,基于比例重叠分数的功能基因组学实验中分类的特征选择方法,BMC Bioninform,15,274,(2014)
[28] 米斯,D。;AJ怀纳;Buja,A.,《增强分类树和类概率/分位数估计》,J Mach Learn Res,8,409-439,(2007)·Zbl 1222.68261号
[29] P.梅尔维尔。;沙阿,N。;米哈尔科娃,L。;穆尼,R。;Roli,F.(编辑);基特勒,J.(编辑);Windeatt,T.(编辑),缺失数据和噪声数据的信号群实验,293-302,(2004),海德堡
[30] Meyer D、Dimitriadou E、Hornik K、Weingessel A、Leisch F(2012)e1071:概率理论小组统计部的杂项职能(原名:e1071),TU Wien。R包版本1.6-1
[31] 穆塞尔,C。;Lausser,L。;HA Kestler;Lausen,B.(编辑);Krolak-Schwerdt,S.(编辑);Böhmer,M.(编辑),分类和数据集分析的代表性原型集集合,329-339,(2015),海德堡
[32] Nettleton,DF;Orriols-Puig,A。;Fornells,A.,《不同类型噪声对监督学习技术精度影响的研究》,Artif Intell Rev,33,275-306,(2010)
[33] Peters A,Hothorn T(2012),《改进的预测》。http://CRAN.R-project.org/package=ipred。R包版本0.9-1
[34] R核心团队(2013)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。网址:http://www.R-project.org/
[35] Samworth,RJ,最优加权最近邻分类器,Ann Stat,40,2733-2763,(2012)·Zbl 1373.62317号
[36] 斯泰尔伯格,EW;维克斯,AJ;库克,NR;Gerds,T。;戈恩,M。;Obuchowski,N。;Pencina,MJ;Kattan,MW,《评估预测模型的性能:一些传统和新措施的框架》,《流行病学》,21,128-138,(2010)
[37] 周,ZH;Yu,Y.,将装袋适应最近邻分类器,计算机科学技术杂志,20,48-54,(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。