×

一种新的基于特征空间划分的集成方法用于高维数据分类。 (英语) Zbl 1395.62171号

摘要:集成数据挖掘方法,也称为分类器组合,常用于提高分类性能。各种分类器组合方法,如套袋、增强和随机森林已经被设计出来,并且在过去受到了相当大的关注。然而,数据维度与日俱增。这种趋势带来了各种挑战,因为这些方法不适合直接应用于高维数据集。在本文中,我们提出了一种用于高维数据分类的集成方法,每个分类器由一组不同的特征构成,这些特征由冗余特征的划分决定。在我们的方法中,考虑特征的冗余性来划分原始特征空间。然后,利用支持向量机对生成的每个特征子集进行训练,并通过多数投票对每个分类器的结果进行组合。通过与其他集成技术的比较,验证了该方法的效率和有效性,结果表明该方法优于其他方法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)

软件:

AR面;CMU项目
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 赵,H。;辛哈,A.P。;Ge,W.,特征构造对分类性能的影响:银行破产预测的实证研究,专家系统与应用,36,2,2633-2644,(2009)·doi:10.1016/j.eswa.2008.01.053
[2] Pradhan,B.,利用GIS、计算机和地球科学对滑坡易感性制图中决策树、支持向量机和神经模糊模型的预测能力进行比较研究,51,350-365,(2013)·doi:10.1016/j.cageo.2012.08.023
[3] Ciresan,D.C。;美国迈尔。;Masci,J。;Schmidhuber,J.,用于交通标志分类的多列深度神经网络,神经网络,30,333-338,(2012)
[4] Jin,C.H。;Pok,G。;华盛顿州帕克市。;Ryu,K.H.,改进的基于模式序列的电力负荷预测方法,IEEJ电子电气工程学报,9,6,670-674,(2014)·doi:10.1002/tee.22024
[5] 齐,Z。;田,Y。;Shi,Y.,用于模式分类的稳健双支持向量机,模式识别,46,1,305-316,(2013)·Zbl 1248.68441号 ·doi:10.1016/j.patcog.2012.06.019
[6] 拉赫曼,A。;Verma,B.,使用非均匀分层聚类和遗传算法生成集成分类器,基于知识的系统,43,30-42,(2013)·doi:10.1016/j.knosys.2013.01.002
[7] Breiman,L.,打包预测,机器学习,24,2,123-140,(1996)·Zbl 0858.68080号
[8] 弗伦德,Y。;Schapire,R.E.,《新增压算法的实验》,机器学习国际会议
[9] Cho,S.B。;Won,H.-H.,使用具有多个重要基因亚群的神经网络集合进行癌症分类,应用智能,26,3244-250,(2007)·Zbl 1190.92013年 ·doi:10.1007/s10489-006-0020-4
[10] Tumer,K。;Ghosh,J.,《Classier组合:分析结果和影响》,《全国人工智能会议论文集》
[11] Tumer,K。;Oza,N.C.,《改进泛化的经估计输入系综》,《国际神经网络联合会议论文集》(IJCNN’99)
[12] 布莱尔·R。;古铁雷斯·奥苏纳,R。;Quek,F.,属性打包:使用随机特征子集提高分类器集合的准确性,模式识别,36,6,1291-1302,(2003)·Zbl 1033.68092号 ·doi:10.1016/s0031-3203(02)00121-8
[13] Rokach,L.,基于遗传算法的分类问题特征集划分,模式识别,41,5,1676-1700,(2008)·Zbl 1140.68476号 ·doi:10.1016/j.patcog.2007.10.013
[14] Rokach,L.,基于集成的分类器,《人工智能评论》,33,1-2,1-39,(2010)·doi:10.1007/s10462-009-9124-7
[15] Breiman,L.,《随机森林》,机器学习,45,1,5-32,(2001)·Zbl 1007.68152号 ·doi:10.1023/a:1010933404324
[16] 安,H。;Moon,H。;法扎里,M.J。;Lim,北。;Chen,J.J。;Kodell,R.L.,高维数据随机分区的集合分类,计算统计与数据分析,51,12,6166-6179,(2007)·Zbl 1203.62115号 ·doi:10.1016/j.csda.2006.12.043
[17] Ming Ting,K。;威尔斯,J.R。;川潭,S。;魏腾,S。;Webb,G.I.,特征子空间聚合:稳定和不稳定学习者的集合,机器学习,82,375-397,(2011)·doi:10.1007/s10994-010-5224-5
[18] 德博克,K.W。;Poel,D.V.D.,《基于旋转的集成分类器用于客户流失预测的实证评估》,《应用专家系统》,38,10,12293-12301,(2011)·doi:10.1016/j.eswa.2011.04.007
[19] Yang,Y。;马,Z。;Hauptmann,A.G。;Sebe,N.,通过在多个任务之间共享信息进行多媒体分析的特征选择,IEEE多媒体事务,15,3,661-669,(2013)·doi:10.1109/tmm.2012.2237023
[20] 盖亚斯,I.A。;Smith,L.S.,大维域中的特征子集选择,模式识别,43,1,5-13,(2010)·Zbl 1192.68574号 ·doi:10.1016/j.patcog.2009.06.009
[21] Yu,L。;Liu,H.,《高维数据的特征选择:基于快速相关性的滤波解决方案》,第12届机器学习国际会议论文集
[22] Piao,Y。;皮亚奥,M。;帕克,K。;Ryu,K.H.,利用基因表达数据进行癌症分类的基于集合相关的基因选择算法,生物信息学,28,24,3306-3315,(2012)·doi:10.1093/bioinformatics/bts602
[23] Akay,M.F.,支持向量机与乳腺癌诊断特征选择相结合,应用专家系统,36,2,3240-3247,(2009)·doi:10.1016/j.eswa.2008.01.009
[24] Hanson,S.J。;Halchenko,Y.O.,使用全脑支持向量机进行目标识别的脑阅读:没有“人脸”识别区域,神经计算,20,2,486-503,(2008)·Zbl 1131.92013年 ·doi:10.1162/neco.2007.09-06-340
[25] Zaghloul,W。;李,S.M。;Trimi,S.,文本分类:神经网络与支持向量机,工业管理与数据系统,109,5,708-717,(2009)·doi:10.1108/02635570910957669
[26] 张,L。;廖,B。;李,D。;朱伟,利用支持向量机预测凋亡蛋白亚细胞定位的新表示,理论生物学杂志,259,2,361-365,(2009)·Zbl 1402.92163号 ·doi:10.1016/j.jtbi.2009.03.025
[27] 马丁内斯。;Benavente,R.,AR面部数据库,CVC技术报告,24,(1998)
[28] 萨马利亚,F.S。;Harter,A.C.,人脸识别随机模型的参数化,第二届IEEE计算机视觉应用研讨会论文集
[29] 西姆·T。;贝克,S。;Bsat,M.,《人脸的cmu姿势、照明和表情(饼图)数据库》,cmu-RI-TR-01-02,(2001),卡内基梅隆大学机器人研究所
[30] Hond,D.博士。;Spacek,L.,《面部处理的独特描述》,第八届英国机器视觉会议论文集(BMVC’97)
[31] 阿姆斯特朗,S.A。;斯汤顿,J.E。;Silverman,L.B。;彼得斯,R。;Den Boer,M.L。;Minden,医学博士。;Sallan,S.E。;兰德,E.S。;Golub,T.R。;Korsmeyer,S.J.,MLL易位指定了一个独特的基因表达谱,用于区分独特的白血病,《自然遗传学》,30,1,41-47,(2002)·数字对象标识代码:10.1038/ng765
[32] 辛格,D。;Febbo,P.G。;Ross,K。;Jackson,D.G。;马诺拉,J。;拉德,C。;Tamayo,P。;Renshaw,A.A。;阿米科公司。;里奇,J.P。;兰德,E.S。;Loda,M。;坎托夫,P.W。;Golub,T.R。;Sellers,W.R.,基因表达与前列腺癌临床行为的相关性,《癌细胞》,1,2203-209,(2002)·doi:10.1016/s1535-6108(02)00030-2
[33] Hsu,H.-H。;谢长伟。;Lu,M.-D.,通过组合过滤器和包装器的混合特征选择,专家系统与应用,38,7,8144-8150,(2011)·doi:10.1016/j.eswa.2010.12.156
[34] Piao,M。;Shon,H.S。;Lee,J.Y。;Ryu,K.H.,负荷预测中基于子空间投影法的聚类分析,IEEE电力系统交易,29,6,2628-2635,(2014)·doi:10.1109/tpwrs.2014.2309697
[35] 巴希尔,M.E.A。;Lee,D.G。;李,M。;Bae,J.-W。;肖恩,H.S。;Cho,M.C。;Ryu,K.H.,远程心脏临床护理信息系统的触发学习和ECG参数定制,IEEE生物医学信息技术汇刊,16,4,561-571,(2012)·doi:10.1109/titb.2012.2188812
[36] Lee,Y。;Jung,Y.J。;Nam,K.W。;Nittel,S。;比尔德,K。;Ryu,K.H.,使用分层斜坡网格的地球传感器数据表示,传感器,12,12117074-17093,(2012)·doi:10.3390/s121217074
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。