×

融合优势点树和线性判别法进行快速特征分类。 (英语) Zbl 1364.62158号

摘要:本文描述了一种分类策略,它可以被视为最邻近分类的一种更一般的形式。它融合了最近邻,线性鉴别Vantage-Point公司树,生成高效的索引数据结构和分类算法。在学习阶段,我们定义了一组复杂度较低的不相交子空间,这些子空间可以用线性判别法分离,最终得到一组局部工作的简单(弱)分类器。在分类中,最接近查询的质心决定了所考虑的分类器集,哪些响应是加权的。该算法在该领域广泛使用的数据集中进行了实验验证,获得了与最先进的分类技术相当的错误率。最后,对于广泛的应用,所提出的解决方案具有一组有趣的特性:1)它是确定性的;2) 它在时间上对学习集的大小进行近似对数的分类,在计算成本方面远比最近邻分类有效;3)保持了简单模型的泛化能力。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] ALPAYDIN,E.(1999),“用于比较监督分类学习算法的组合5×2 cv F-检验”,神经计算,11(8),1885-1892·数字对象标识代码:10.1162/08997669900016007
[2] BANFIELD,R.、HALL,L.、BOWYER,K.和KEGELMEYER,W.(2007),“决策树集成创建技术的比较”,IEEE模式分析和机器智能学报,29(1),173-180·doi:10.1109/TPAMI.2007.250609
[3] BAUER,E.和KOHAVI,R.(1999),“投票分类算法的实证比较:打包、提升和变体”,机器学习,36(1-2),105-139·doi:10.1023/A:1007515423169
[4] BOCK,K.,COUSEMENT,K.和POEL,D.(2010),“基于广义加性模型的集合分类”,计算统计学和数据分析,541535-1546·Zbl 1284.62368号 ·doi:10.1016/j.csda.2009.12.013
[5] BREIMAN,L.(1996),“打包预测”,机器学习,24(2),123-140·Zbl 0858.68080号
[6] BREIMAN,L.(2001),“随机森林”,机器学习,45(1),5-32·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[7] BRYLL,R.,GUTIERREZ-OSUNA,R.和QUEK,F.(2003),“属性打包:使用随机特征子集提高分类器集合的准确性”,模式识别,36(6),291-1302·Zbl 1033.68092号 ·doi:10.1016/S0031-3203(02)00121-8
[8] CAI,D.、HE,X.和HAN,J.(2008),“线性时间中的线性判别分析训练”,《2008年IEEE第24届数据工程国际会议论文集》,第209-217页。
[9] CANUTO,A.、ABREU,M.、OLIVEIRA,L.、XAVIER JR.,J.和SANTOS,A.(2007),“研究合奏成员的选择对合奏的基于选择和基于融合的方法的准确性和多样性的影响”,《模式识别快报》,28(4),472-486。
[10] CECI,M.、APPICE,A.和MALERBA,D.(2003),“比较具有回归和分裂节点的模型树的简化方法”,载于《第十四届智能系统方法学国际研讨会论文集》,《人工智能讲义》第2871卷,第49-56页·Zbl 1070.68532号
[11] CORTES,C.和VAPNIK,V.(1995),“支持向量网络”,机器学习,20,1-25·Zbl 0831.68098号
[12] COVER,T.和HART,P.(1967),“最近邻模式分类”,IEEE信息理论汇刊,13(1),21-27·Zbl 0154.44505号 ·doi:10.1109/TIT.1967.1053964
[13] DEMSAR,J.(2006),“多数据集分类器的统计比较”,《机器学习研究杂志》,7,1-30·Zbl 1222.68184号
[14] DIETTERICH,T.(2000),“构建决策树集合的三种方法的实验比较:打包、提升和随机化”,机器学习,49(2),139-157·doi:10.1023/A:1007607513941
[15] DOMINGOS,P.(1996),“统一基于实例和基于规则的归纳法”,机器学习,24,141-168。
[16] DUDA,R.、HART,P.和STORK,D.(2000),《模式分类》(第二版),Wiley Interscience,ISBN 0-471-05669-3·Zbl 0968.68140号
[17] FRANK,E.、HALL,M.和PFAHRINGER,B.(2003),“局部加权朴素贝叶斯”,《第19届人工智能不确定性会议论文集》,圣马特奥,第249-256页。
[18] FREUND,Y.和SCHAPIRE,R.(1995),“在线学习的决策理论推广和促进应用”,《第二届欧洲计算学习理论会议论文集》,第23-37页。
[19] HO,T.K.(1995),“随机决策森林”,《第三届文件分析和识别国际会议论文集》,第278-282页。
[20] HO,T.K.(1998),“构建决策森林的随机子空间方法”,IEEE模式分析和机器智能汇刊,20(8),832-844。
[21] HOTHORN,T.和LAUSEN,B.(2005),“通过装袋树构建分类器”,计算统计和数据分析,49,1068-1078·Zbl 1429.62246号 ·doi:10.1016/j.csda.2004.06.019
[22] JIRINA,M.和JIRINA JR.,M.(2013),“基于最近邻分类器中奇异指数的利用”,分类杂志,30(1),3-29·Zbl 1360.68681号
[23] JOHNSON,R.和WICHERN,D.(1988),应用多元统计分析(第二版),新泽西州恩格尔伍德克利夫斯:普伦蒂斯·霍尔公司·Zbl 0663.62061号
[24] KLEINBERG,E.M.(1990),“随机歧视”,《数学和人工智能年鉴》,1207-239·Zbl 0870.68071号 ·doi:10.1007/BF01531079
[25] KUMAR,A.(2008),“组合模式分类器:方法和算法”,IEEE工业电子学报,55(1),348-363·doi:10.1109/TIE.1930.896476
[26] KUNCHEVA,L.(2004),《组合模式分类器:方法和算法》,新泽西州霍博肯:John Wiley&Sons出版社·Zbl 1066.68114号 ·数字对象标识代码:10.1002/0471660264
[27] KUNCHEVA,L.和RODRÍGUEZ,J.(2007),“分类器与随机线性Oracle的集成”,IEEE知识与数据工程汇刊,19(4),500-508·doi:10.1109/TKDE.2007.1016
[28] LU,J.和TAN,Y-P.(2011),《分类的最近特征空间分析》,IEEE信号处理快报,18(1),55-58。
[29] MOLLER,M.(1993),“用于快速监督学习的缩放共轭梯度算法”,神经网络,6,525-533·doi:10.1016/S0893-6080(05)80056-5
[30] OJALA,T.、PIETIKAINEN,M.和HARWOOD,D.(1996),“基于特征分布分类的纹理度量的比较研究”,模式识别,29,51-59·doi:10.1016/0031-3203(95)00067-4
[31] GARCíA-PEDRAJAS,N.(2009),“通过加权实例选择构建分类器集合”,IEEE神经网络汇刊,20(2),258-277·doi:10.1109/TNN.2008.2005496
[32] SCHAPIRE,R.(1990),“弱可学习性的力量”,机器学习,5(2),197-227。
[33] SEIFFERT,C.、KHOSHGOFTAR,T.、HULSE,J.和NAPOLITANO,A.(2008),“RUSBoost:当训练数据倾斜时提高分类性能”,载于《第19届国际模式识别会议论文集》,第1-4页。
[34] STALLKAMP,J.、SCHLIPSING,M.、SALMEN,J.和IGEL,C.(2012),“人与计算机:交通标志识别的基准机器学习算法”,神经网络,32,323-332·doi:10.1016/j.neunet.2012.02.016
[35] TING,K.M.、WELLS,J.R.、TAN,S.C.、TENG,S.W.和WEBB,G.I.(2011),“特征子空间聚合:稳定和不稳定学习者的集合”,机器学习,82,375-397·doi:10.1007/s10994-010-5224-5
[36] VIOLA,P.A.和JONES,M.J.(2004),“鲁棒实时人脸检测”,《国际计算机视觉杂志》,57(2),137-154·doi:10.1023/B:VISI.0000013087.49260.fb
[37] YAN,R.和TEŠI ch,J.(2007),“多标签分类的模型共享子空间提升”,载于第13届ACM SIGKDD国际知识发现和数据挖掘会议论文集,第834-843页·Zbl 1284.62368号
[38] YIANILOS,P.(1993),“广义度量空间中最近邻搜索的数据结构和算法”,摘自第四届ACM-SIAMS离散算法年会论文集,工业和应用数学学会,第311-321页·Zbl 0801.68037号
[39] YU,G.、ZHANG,G.,YU,Z.、DOMENICONI,C.、YOUC,J.和HANA,G.(2012),“子空间中的半监督集成分类”,应用软计算,121511-1522。
[40] ZAMAN,M.和HIROSE,H.(2013),“DF-SVM:通过支持向量机在人工扩大的特征空间上构建的决策森林”,《人工智能评论》,第40期,第467-494页·doi:10.1007/s10462-011-9291-1
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。