×

异构数据的改进支持向量机算法。 (英语) Zbl 1374.68415号

摘要:支持向量机(SVM)是一种常用的分类学习算法。经典的SVM有效地管理了由数值属性定义的分类任务。然而,数值属性和标称属性都被用于实际任务中,经典SVM没有充分考虑它们之间的差异。名义属性通常在编码后被视为数字属性。这可能会降低学习算法的性能。在本研究中,我们提出了一种用于异构数据学习的新型SVM算法,称为异构SVM(HSVM)。该算法学习映射,通过最小化估计泛化误差将标称属性嵌入到实际空间中,而不是直接编码。进行了大量实验,得到了一些有趣的结果。实验表明,HSVM提高了标称数据和异构数据的分类性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Vapnik,V.,《统计学习理论的本质》(1999),施普林格出版社:德国柏林施普林格·Zbl 0928.68093号
[2] 牛,X.-X。;Suen,C.Y.,一种用于识别手写数字的新型混合cnn-svm分类器,模式识别。,45, 4, 1318-1325 (2012)
[3] 刘,C.-L。;Nakashima,K。;Sako,H。;Fujisawa,H.,手写数字识别最新技术的基准测试,模式识别。,362271-2285(2003年)·Zbl 1054.68124号
[5] Warren Liao,T.,时间序列数据聚类调查,模式识别。,38, 11, 1857-1874 (2005) ·Zbl 1077.68803号
[6] 塔皮亚,E。;布拉西奥,P。;Angelone,L.,稀疏和稳定的基因选择与共识svm-rfe,模式识别。莱特。,33, 2, 164-172 (2012)
[7] Ruiz,R。;里克尔梅,J.C。;Aguilar-Ruiz,J.S.,癌症分类微阵列数据中基于包装物的增量基因选择,模式识别。,39, 12, 2383-2392 (2006)
[8] 程,J。;王凯,用联合支持向量机进行图像检索的主动学习,模式识别。,40, 1, 330-334 (2007) ·Zbl 1103.68501号
[9] 刘,Y。;张,D。;Lu,G。;马伟英,基于内容的高层次语义图像检索综述,模式识别。,40, 1, 262-282 (2007) ·Zbl 1103.68503号
[10] Kachouri,R。;杰马尔,K。;Maaref,H.,异构图像数据库中的多模型分类方法,模式识别。,43, 12, 4077-4088 (2010) ·Zbl 1207.68289号
[12] 昆兰,J.R.,C4。5:《机器学习计划》,第1卷(1993),摩根·考夫曼:美国马萨诸塞州摩根·考夫曼
[13] 布雷曼,L。;弗里德曼,J。;斯通,C.J。;Olshen,R.A.,《分类和回归树》(1984),查普曼和霍尔/CRC:查普曼&霍尔/CRC英国伦敦·Zbl 0541.62042号
[15] 斯坦菲尔,C。;Waltz,D.,《迈向基于记忆的推理》,Commun。ACM,29,12,1213-1228(1986)
[16] 威尔逊,D.R。;Martinez,T.R.,《改进的异质距离函数》,J.Artif。智力。决议,6,1-34(1997)·Zbl 0894.68118号
[17] 菲克斯,E。;Hodges,J.L.,歧视分析。非参数判别一致性属性,《国际统计年鉴》,第238-247页(1989年)·Zbl 0715.62080号
[18] Tan,P.-N.,《数据挖掘导论》(2007),培生教育:印度培生教育
[19] 程,V。;李,C.-H。;郭敬通(Kwok,J.T.)。;李春光,标称数据的异类学习,模式识别。,37, 7, 1471-1477 (2004)
[20] 沙佩尔,O。;Vapnik,V。;O.布斯克。;Mukherjee,S.,《为支持向量机选择多个参数》,马赫。学习。,46, 1, 131-159 (2002) ·Zbl 0998.68101号
[21] Burges,C.J.,模式识别支持向量机教程,Data Min.Knowl。迪斯科。,2, 2, 121-167 (1998)
[23] Tsang,I.W。;郭敬通(Kwok,J.T.)。;Cheung,P.-M.,核心向量机在超大数据集上的快速svm训练,J.Mach。学习。第6、1、363号决议(2006年)·Zbl 1222.68320号
[24] 巴罗斯共和国。;Basgalupp,M.P。;de Carvalho,A。;Freitas,A.A.,《决策树归纳进化算法综述》,IEEE Trans。系统。人类网络。C部分:申请。修订版,42、3、291-312(2012)
[25] 吴,X。;库马尔,V。;Ross Quinlan,J。;Ghosh,J。;杨琼。;Motoda,H。;McLachlan,G.J。;Ng,A。;刘,B。;Yu,P.S.,《数据挖掘中的十大算法》,Knowl。信息系统。,14, 1, 1-37 (2008)
[26] 贾马,J。;Braddil,P.,级联泛化,马赫。学习。,41, 3, 315-343 (2000) ·Zbl 0966.68180号
[30] 北卡罗来纳州克里斯蒂亚尼尼。;Shawe-Taylor,J.,《支持向量机和其他基于内核的学习方法简介》(2000),剑桥大学出版社:剑桥大学出版社,英国剑桥
[32] 里夫金,R。;Klautau,A.,为一对所有分类辩护,J.Mach。学习。第5101-141号决议(2004年)·Zbl 1222.68287号
[33] 李,S。;Tan,M.,使用混合clpso-bfgs算法调整svm参数,神经计算,73,102089-96(2010)
[35] Bergstra,J。;Bengio,Y.,超参数优化的随机搜索,J.Mach。学习。研究,13,281-305(2012)·Zbl 1283.68282号
[37] 霍尔,M。;E.弗兰克。;霍姆斯,G。;普法林格,B。;鲁特曼,P。;Witten,I.H.,《weka数据挖掘软件:更新》,ACM SIGKDD Explor。纽斯利特。,11, 1, 10-18 (2009)
[38] 大卫·G。;Averbuch,A.,数值和标称数据的光谱分类光谱聚类,模式识别。,45, 1, 416-433 (2012) ·Zbl 1225.68171号
[39] Demšar,J.,多数据集上分类器的统计比较,J.Mach。学习。研究,7,1-30(2006)·Zbl 1222.68184号
[40] He,H。;Garcia,E.A.,从不平衡数据中学习,IEEE Trans。知识。数据工程,21,9,1263-1284(2009)
[41] 王,B.X。;Japkowicz,N.,《为不平衡数据集提升支持向量机》,Knowl。信息系统。,25, 1, 1-20 (2010)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。