×

基于信息理论特征排序的快速多标签特征选择。 (英语) Zbl 1394.68296号

摘要:多标签特征选择包括从多标签数据集中选择重要特征。这可以通过根据功能的重要性对其进行排名,然后选择排名靠前的功能来实现。已经提出了许多多标签特征选择方法来寻找能够提高多标签学习精度的特征子集。相比之下,计算效率高的多标签特征选择方法尚未得到广泛研究。在本研究中,我们提出了一种基于信息理论特征排序的快速多标签特征选择方法。实验结果表明,对于大型多标签数据集,该方法生成特征子集的速度明显快于其他几种多标签特征选择方法。

MSC公司:

68T05型 人工智能中的学习和自适应系统
94甲17 信息的度量,熵
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] R.Agrawal,A.Gupta,Y.Prabhu,M.Varma,《数百万标签的多标签学习:为网页推荐广告商标语》,载于:《第22届万维网国际会议论文集》,巴西里约热内卢,2013年,第13-24页。
[2] Bennasar,M。;Setchi,R。;Hicks,Y.,特征交互最大化,模式识别。莱特。,34, 1630-1635, (2013)
[3] 布特尔,M。;罗,J。;沈,X。;Brown,C.,学习多标签场景分类,模式识别。,37, 1757-1771, (2004)
[4] W.Chen、J.Yan、B.Zhang、Z.Chen和Q.Yang,文本分类中多标签特征选择的文档转换,收录于:第七届IEEE数据挖掘国际会议论文集,美国奥马哈,2007年,第451-456页。
[5] 盖,T。;托马斯·J。;Wiley,J.,《信息理论的要素》,第6卷,(1991),Wiley在线图书馆Wiley-Interscience,纽约·兹比尔0762.94001
[6] K.Dembczyñski,W.Waegeman,W.Cheng,E.Hüllermier,多标签分类中性能指标的后悔分析:汉明和子集零损失的情况,收录于:《计算机科学讲义》,第6321卷(2010)280-295。
[7] S.Diplaris,G.Tsoumakas,P.Mitkas,I.Vlahavas,蛋白质分类与多种算法,Lect。票据计算。科学。3746(2005)448-456。
[8] 道奎尔,G。;Verleysen,M.,Mutual information based feature selection for multilabel classification,神经计算,122,148-155,(2013)
[9] P.Duygulu,K.Barnard,J.F.de Freitas,D.A.Forsyth,《作为机器翻译的对象识别:学习固定图像词汇的词汇》,载于:《第七届欧洲计算机视觉会议论文集》,斯普林格,哥本哈根,丹麦,2002年,第97-112页·Zbl 1039.68623号
[10] Q.Gu,Z.Li,J.Han,相关多标签特征选择,摘自:《第20届ACM信息与知识管理国际会议论文集》,英国格拉斯哥,2011年,第1087-1096页。
[11] D.Hsu,S.Kakade,J.Langford,T.Zhang,通过压缩传感进行多标签预测,载于:《第24届神经信息处理系统年会论文集》,加拿大温哥华,2009年,第772-780页。
[12] A.Jakulin,机器学习中的属性交互(博士论文),Universia v Ljubljani,2003年。
[13] S.Ji,L.Tang,S.Yu,J.Ye,提取共享子空间用于多标签分类,载于:第14届ACM SIGKDD国际知识发现和数据挖掘会议论文集,美国拉斯维加斯,2008年,第381-389页。
[14] I.Katakis,G.Tsoumakas,I.Vlahavas,《自动标签建议的多标签文本分类》,载于:《第18届欧洲机器学习会议论文集和第11届数据库知识发现原则与实践》,比利时安特卫普,2008年,第1-9页。
[15] D.Kong,C.Ding,H.Huang,H.Zhao,用于图像注释的多标签ReliefF和F-statistic特征选择,收录于:第25届IEEE计算机视觉和模式识别会议论文集,美国普罗维登斯,2012年,第2352-2359页。
[16] 孔,X。;Yu,P.,Gmlca图分类多标签特征选择框架,Knowl。信息系统。,31, 281-305, (2012)
[17] G.Lastra,O.Luaces,J.R.Quevedo,A.Bahamonde,多标签分类任务的图形特征选择,载于:计算机科学讲义,第7014卷(2011)246-257。
[18] Lee,J。;Kim,D.W.,使用多元互信息进行多标签分类的特征选择,模式识别。莱特。,34, 349-357, (2013)
[19] 刘易斯,D。;杨,Y。;Rose,T。;Li,F.,Rcv1a文本分类研究的新基准集合,J.Mach。学习。研究,5361-397,(2004)
[20] Madjarov,G。;科切夫,D。;Gjorgjevikj,D。;Díeroski,S.,《多标签学习方法的广泛实验比较》,模式识别。,45, 3084-3104, (2012)
[21] 聂,F。;黄,H。;蔡,X。;Ding,C.,通过联合\(l_{2,1}\算子名称{-}\算子名称{范数}\)最小化的有效和鲁棒特征选择,高级神经网络信息过程。系统。,23, 1813-1821, (2010)
[22] 哦,我。;Lee,J。;Moon,B.,用于特征选择的混合遗传算法,IEEE Trans。模式分析。机器。智力。,26, 1424-1437, (2004)
[23] B.Qian,I.Davidson,《多标签分类的半监督降维》,载于《第24届AAAI人工智能会议论文集》,美国亚特兰大,2010年,第569-574页。
[24] 里德·J。;普法林格,B。;霍姆斯,G。;Frank,E.,多标签分类分类器链,马赫。学习。,85, 333-359, (2011)
[25] 夏皮雷,R。;Singer,Y.,Boostextera boosting-based system for text categorification,马赫。学习。,39, 135-168, (2000) ·Zbl 0951.68561号
[26] Sebastiani,F.,自动文本分类中的机器学习,ACM Comput。调查。,34, 1-47, (2002)
[27] Shannon,C.,通信数学理论,ACM SIGMOBILE移动计算。Commun公司。第5版,第3-55页,(2001年)
[28] 宋,L。;Smola,A。;格雷顿,A。;贝多·J。;Borgwardt,K.,《通过依赖最大化进行特征选择》,J.Mach。学习。决议,第13号,第1393-1434页,(2012年)·Zbl 1303.68110号
[29] 斯波拉,N。;Cherman,E.A。;莫纳德,M.C。;Lee,H.D.,《使用问题转换方法的多标签特征选择方法的比较》,Electron。注释Theor。计算。科学。,292135-151(2013)
[30] A.N.Srivastava,B.Zane-Ulman,《发现复杂空间系统文本报告中反复出现的异常现象》,载于《IEEE航空航天会议论文集》,美国大天空,2005年,第3853-3862页。
[31] K.Trohidis,G.Tsoumakas,G.Kalliris,I.Vlahavas,《音乐到情感的多标签分类》,收录于:《第九届国际音乐信息检索会议论文集》,美国费城,2008年,第325-330页。
[32] G.Tsoumakas,I.Katakis,I.Vlahavas,《具有大量标签的域中的有效和高效多标签分类》,载于《第18届欧洲机器学习会议论文集》和《第11届数据库知识发现原则与实践》,比利时安特卫普,2008年,第30-44页。
[33] Tsoumakas,G。;Katakis,I。;Vlahavas,I.,多标签分类的随机k标签集,IEEE Trans。知识。数据工程,231079-1089,(2011)
[34] Tsoumakas,G。;Spyromitros-Xioufis,E。;维尔切克,J。;Vlahavas,I.,Mulana多标签学习Java库,J.Mach。学习。第12号决议,2411-2414,(2011)·Zbl 1280.68207号
[35] 张,M。;佩纳,J。;Robles,V.,多标签朴素贝叶斯分类的特征选择,信息科学。,179, 3218-3229, (2009) ·Zbl 1193.68219号
[36] M.Zhang、K.Zhang,《利用标签依赖进行多标签学习》,载于《第16届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,美国华盛顿,2010年,第999-1008页。
[37] 张,M。;Zhou,Z.,ML-knna多标签学习的惰性学习方法,模式识别。,40, 2038-2048, (2007) ·Zbl 1111.68629号
[38] 张,M。;周,Z.,多标签学习算法综述,IEEE Trans。知识。数据工程,26,1819-1837,(2013)
[39] Zhang,Y。;周,Z.,通过依赖最大化减少多标签维数,ACM Trans。知识。光盘。数据,4,(2010),第14条
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。