×

通过可变邻域搜索进行机器学习中的特征选择。 (英语) Zbl 1528.68349号

摘要:通过特征选择可以提高机器学习方法的泛化能力。本文提出了一种新的启发式机器学习特征选择框架。该框架基于可变邻域搜索(VNS)启发式。该框架是通用的,可以应用于任何现有的监督机器学习方法。本文说明了该框架的实现,该框架封装了传统的回归和分类问题。实际数据集的数值实验表明了该框架的适用性。

理学硕士:

68T05年 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Github仓库,https://github.com/ramhiser网站
[2] Mld\(\alpha\)t\(\alfa\)存储库,https://www.mldata.io
[3] UCI机器学习库,http://archive.ics.uci.edu/ml
[4] Alba,E.,Garcia-Nieto,J.,Jourdan,L.,Talbi,E.G.:使用pso/svm和ga/svm混合算法进行癌症分类中的基因选择。2007年IEEE大会演变。计算。第284-290页。IEEE(2007)
[5] Almualim,H.,Dietterich,T.G.:学习有许多不相关的特征。输入:AAAI。第91卷,第547-552页(1991年)·Zbl 0942.68657号
[6] 阿龙,美国。;北巴尔凯。;诺特曼,D。;Gish,K。;伊巴拉,S。;麦克,D。;Levine,A.,通过寡核苷酸阵列探测的肿瘤和正常结肠组织的聚类分析揭示的基因表达的广泛模式,Proc。国家。阿卡德。科学。,96, 12, 6745-6750 (1999) ·doi:10.1073/pnas.96.12.6745
[7] Battiti,R.,《在监督神经网络学习中使用互信息选择特征》,IEEE Trans。神经网络。,5, 4, 537-550 (1994) ·doi:10.1109/72.2982224
[8] Bishop,C.M.:模式识别和机器学习。斯普林格(2006)·Zbl 1107.68072号
[9] 坎达内多,LM;费尔德海姆,V。;Deramaix,D.,《低能耗房屋中电器能源使用的数据驱动预测模型》,《能源建筑》。,140, 81-97 (2017) ·doi:10.1016/j.enbuild.2017.01.083
[10] 克里斯滕森,不列颠哥伦比亚省;EA豪斯曼;CJ马西特;郑S。;伦施,MR;Wiemels,JL;尼尔森,HH;卡拉加斯,MR;JF帕德伯里;布埃诺,R。;Sugarbaker,DJ;是的,RF;Wiencke,JK;Kelsey,KT,老龄化和环境暴露改变组织特异性DNA甲基化,取决于CpG岛环境,《公共科学图书馆·遗传学》。,5、8、e1000602(2009)·doi:10.1371/journal.pgen.1000602
[11] Chuang,LY;Chang,HW;涂,CJ;Yang,CH,使用基因表达数据进行特征选择的改进二进制粒子群算法,计算。生物化学。,32, 1, 29-38 (2008) ·Zbl 1142.92319号 ·doi:10.1016/j.compbiochem.2007.09.005
[12] 俄亥俄州科尔顿。;达马斯,S。;Santamaría,J.,通过chc进化算法进行基于特征的图像配准,图像视觉。计算。,24, 5, 525-533 (2006) ·doi:10.1016/j.imavis.2006.02.002
[13] 宾夕法尼亚州埃斯特韦斯;Tesmer,M。;加利福尼亚州佩雷斯;Zurada,JM,规范化互信息特征选择,IEEE Trans。神经网络。,20, 2, 189-201 (2009) ·doi:10.1109/TNN.2008.2005601
[14] Fleuret,F.,带条件互信息的快速二进制特征选择,J.Mach。学习。第5号决议,1531-1555(2004)·Zbl 1222.68200号
[15] 加西亚·托雷斯,M。;Gómez-Vela,F。;梅利安·巴蒂斯塔,B。;Moreno-Vega,JM,《通过特征分组进行高维特征选择:可变邻域搜索方法》,《信息科学》。,326, 102-118 (2016) ·doi:10.1016/j.ins.2015.07.041
[16] 盖恩,I。;Elisseeff,A.,《变量和特征选择简介》,J.Mach。学习。第3号决议,1157-1182(2003年)·Zbl 1102.68556号
[17] 盖恩,I。;李,J。;Mader,T。;宾夕法尼亚州普莱彻;施耐德,G。;Uhr,M.,竞争基准方法为nips 2003特征选择基准,Pattern Recogn设定了新标准。莱特。,28, 12, 1438-1444 (2007) ·doi:10.1016/j.patrec.2007.02.014
[18] 盖恩,I。;韦斯顿,J。;巴恩希尔,S。;Vapnik,V.,使用支持向量机进行癌症分类的基因选择,马赫。学习。,46, 1-3, 389-422 (2002) ·Zbl 0998.68111号 ·doi:10.1023/A:1012487302797
[19] Hamidieh,K.,预测超导体临界温度的数据驱动统计模型,计算。马特。科学。,154, 346-354 (2018) ·doi:10.1016/j.commatsci.2018.07.052
[20] Hansen,P.,Mladenović,N.:可变邻域搜索简介。摘自:《元神经科学》,第433-458页。斯普林格(1999)·Zbl 0985.90095号
[21] Hansen,P。;Mladenović,N.,《可变邻域搜索:原理和应用》,欧洲期刊Oper。决议,130,3,449-467(2001)·Zbl 0981.90063号 ·doi:10.1016/S0377-2217(00)00100-4
[22] Hansen,P.,Mladenović,N.:可变邻域搜索。摘自:《元启发式手册》,第145-184页。斯普林格(2003)·Zbl 1102.90371号
[23] 黄,CL;Wang,CJ,基于遗传算法的支持向量机特征选择和参数优化,专家系统。申请。,31, 2, 231-240 (2006) ·doi:10.1016/j.eswa.2005.09.024
[24] 库沙巴,RN;Al-Ani,A。;Al-Jumaily,A.,《使用差异进化和统计修复机制的特征子集选择》,专家系统。申请。,38, 9, 11515-11526 (2011) ·doi:10.1016/j.eswa.2011.03.028
[25] Kohavi,R。;John,GH,特征子集选择包装器,Artif。智力。,97, 1-2, 273-324 (1997) ·Zbl 0904.68143号 ·doi:10.1016/S0004-3702(97)00043-X
[26] 北卡罗来纳州夸克。;Choi,CH,基于parzen窗口的互信息输入特征选择,IEEE Trans。模式分析。机器。智力。,24, 12, 1667-1671 (2002) ·doi:10.1109/TPAMI.2002.1114861
[27] Lal,T.N.,Chapelle,O.,Weston,J.,Elisseeff,A.:嵌入式方法。摘自:特征提取,第137-165页。斯普林格(2006)
[28] Langley,P.等人:机器学习中相关特征的选择。摘自:AAAI秋季相关性研讨会论文集。第184卷,第245-271页(1994年)·Zbl 0904.68142号
[29] Little,马萨诸塞州;体育系麦克沙里;罗伯茨,SJ;科斯特洛,DA;莫罗兹,IM,《利用非线性递归和分形缩放特性进行语音障碍检测》,《生物识别》。Eng.Online,6,1,23(2007年)·doi:10.1186/1475-925X-6-23
[30] Mangasarian,O.L.,Wolberg,W.H.:通过线性规划进行癌症诊断。威斯康星大学麦迪逊分校计算机科学系,技术代表(1990)
[31] Marinaki,M。;Marinakis,Y.,特征选择问题的克隆选择算法与迭代局部搜索和可变邻域搜索的混合,模因计算。,181-201年7月3日(2015年)·doi:10.1007/s12293-015-0161-2
[32] Mladenović,N。;Hansen,P.,可变邻域搜索,计算。运营商。第24、11、1097-1100号决议(1997年)·Zbl 0889.90119号·doi:10.1016/S0305-0548(97)00031-2
[33] 宾夕法尼亚州蒙德拉;Rajapakse,JC,Svm-rfe,基因选择用mrmr过滤器,IEEE Trans。纳米生物学。,9, 1, 31-37 (2009) ·doi:10.1109/TNB.2009.2035284
[34] Narendra,PM;Fukunaga,K.,特征子集选择的分支定界算法,IEEE Trans。计算。,26, 9, 917-922 (1977) ·Zbl 0363.68059号·doi:10.1109/TC.1977.1674939
[35] New York Vapnik,V.,《统计学习理论》。威利(1998)·Zbl 0935.62007号
[36] Nie,F.,Xiang,S.,Jia,Y.,Zhang,C.,Yan,S.:特征选择的迹比准则。输入:AAAI。第2卷,第671-676页(2008年)
[37] 哦,是的;Lee,JS;Moon,BR,特征选择的混合遗传算法,IEEE Trans。模式分析。机器。智力。,26, 11, 1424-1437 (2004) ·doi:10.1109/TPAMI.2004.105
[38] Ortigosa,I.、Lopez,R.、Garcia,J.:帆船剩余阻力预测的神经网络方法。收录:海洋工程国际会议论文集。2007年,第250页(2007年)
[39] 拉马纳,英属维尔京群岛;巴布,MSP;Venkateswalu,N.,《美国和印度肝脏患者的关键对比研究:探索性分析》,《国际计算机杂志》。科学。问题(IJCSI),9,3,506(2012)
[40] Richard,O.D.,Peter,E.H.,David,G.S.等人:模式分类。《威利国际科学》第373-378页(2001年)·Zbl 0968.68140号
[41] 罗布尼克-Šikonja,M。;Kononenko,I.,《起伏和相关的理论和实证分析》,马赫。学习。,53, 1-2, 23-69 (2003) ·Zbl 1076.68065号 ·doi:10.1023/A:1025667309714
[42] 希普,马萨诸塞州;罗斯,KN;Tamayo,P。;翁,美联社;JL库托克;阿奎尔,RCT;加森贝克,M。;安吉洛,M。;Reich,M。;平库斯,GS;Ray,TS公司;马萨诸塞州科瓦尔;最后,KW;诺顿,A。;助教李斯特;梅西洛夫,J。;DS纽伯格;兰德,ES;阿斯特,JC;Golub,TR,通过基因表达谱和监督机器学习预测弥漫性大B细胞淋巴瘤预后,《自然医学》,8,1,68-74(2002)·doi:10.1038/nm0102-68
[43] Tsanas,A。;Little,马萨诸塞州;体育系麦克沙里;LO Ramig,《通过无创言语测试准确远程监测帕金森病进展》,IEEE Trans。生物识别。工程,57,4,884-893(2009)·doi:10.1109/TBME.2009.2036000
[44] Tsanas,A。;Xifara,A.,《使用统计机器学习工具对住宅建筑的能源性能进行准确定量估算》,《能源建筑》。,49, 560-567 (2012) ·doi:10.1016/j.enbuild.2012.03.003
[45] Tu,C.J.,Chuang,L.Y.,Chang,J.Y.,Yang,C.H.,et al.:使用pso-svm进行特征选择。国际期刊计算。科学。(2007)
[46] Vapnik,VN,统计学习理论综述,IEEE Trans。神经网络。,10, 5, 988-999 (1999) ·doi:10.1109/72.788640
[47] 维加拉,JR;Estévez,PA,基于互信息的特征选择方法综述,神经计算。申请。,175-186年1月24日(2014年)·doi:10.1007/s00521-013-1368-0
[48] 山姆·维埃拉(SM Vieira);门多萨,LF;GJ Farinha;Sousa,JM,使用支持向量机进行特征选择的改进二进制粒子群算法应用于脓毒症患者的死亡率预测,应用。软计算。,13, 8, 3494-3504 (2013) ·doi:10.1016/j.asoc.2013.03.021
[49] Weston,J.、Mukherjee,S.、Chapelle,O.、Pontil,M.、Poggio,T.、Vapnik,V.:支持向量机的特征选择。In:高级神经信息程序。系统。。第668-674页(2001年)
[50] 薛,B。;张,M。;Browne,WN,《分类中特征选择的粒子群优化:多目标方法》,IEEE Trans。赛伯恩。,43, 6, 1656-1671 (2012) ·doi:10.1109/TSMCB.2012.2227469
[51] 薛,B。;张,M。;Browne,WN,《分类中特征选择的粒子群优化:新型初始化和更新机制》,应用。软计算。,18, 261-276 (2014) ·doi:10.1016/j.asoc.2013.09.018
[52] 薛,B。;张,M。;布朗,WN;Yao,X.,《特征选择的进化计算方法调查》,IEEE Trans。进化。计算。,20, 4, 606-626 (2015) ·doi:10.1109/TEVC2015.2504420
[53] Yang,J.,Honavar,V.:使用遗传算法进行特征子集选择。摘自:特征提取、构造和选择,第117-136页。斯普林格(1998)
[54] Yeh,IC,使用人工神经网络的高性能混凝土强度建模,Cem。混凝土。第28、12、1797-1808号决议(1998年)·doi:10.1016/S0008-8846(98)00165-3
[55] 扎姆斯,G。;Ajlouni,N。;Ajlouni,N。;Ajlouni,北。;Holland,J。;西山。;Goldberg,D.,《搜索、优化和机器学习中的遗传算法》,Inf.Technol。J.,3,1,301-302(1981)
[56] 邹,H。;Hastie,T.,通过弹性网的正则化和变量选择,J.Rroyal Stat.Soc.Seri。B(Stat.Methodol.),67,2,301-320(2005)·Zbl 1069.62054号 ·文件编号:10.1111/j.1467-9868.2005.005.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。