×

基于模糊联合互信息最大化的特征选择。 (英语) Zbl 1472.94036号

摘要:如今,真实世界的应用程序处理大量数据,尤其是高维特征空间。这些数据集对分类系统来说是一个重大挑战。不幸的是,现有的大多数功能都是不相关或冗余的,从而使这些系统效率低下且不准确。出于这个原因,已经引入了许多基于信息论的特征选择(FS)方法来提高分类性能。然而,现有的方法在处理连续特征、估计冗余关系和考虑外部类信息等方面存在一定的局限性。为了克服这些局限性,本文提出了一种新的FS方法,称为模糊联合互信息最大化(FJMIM)。通过与九种传统和最新的特征选择方法进行实验比较,验证了我们提出的方法的有效性。基于13个基准数据集,实验结果证实了我们提出的方法在分类性能和特征选择稳定性方面有很大的改进。

MSC公司:

94甲15 信息论(总论)
94甲16 数据分析和大数据的信息方面

软件:

UCI-毫升
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 五十、 一种新的基于归一化互信息的特征选择方法。智力。,37, 100-120, 2012 ·doi:10.1007/s10489-011-0315-y
[2] J、 综述了基于互信息的特征选择方法,神经计算。申请。,24, 175-186, 2014 ·doi:10.1007/s00521-013-1368-0
[3] I.K.Fodor,降维技术综述,劳伦斯·利弗莫尔国家实验室,加利福尼亚州(美国),2002年。
[4] H、 特征空间理论——数据挖掘的数学基础,知识。基于系统。,14, 253-257, 2001 ·doi:10.1016/S0950-7051(01)00103-4
[5] R、 一种基于类区域分析的特征选择新方法,IEEE Trans。系统。人类网络。系统。,27, 196-207, 1997 ·doi:10.1009/3477.558798
[6] Y、 生物信息学中的特征选择技术综述,生物信息学,232507-25172007·doi:10.1093/bioinformatics/btm344
[7] 一、 变量和特征选择简介,J.Mach。学习。决议,31157-11822003·Zbl 1102.68556号
[8] M、 使用联合互信息最大化进行特征选择,专家系统。申请。,42, 8520-8532, 2015 ·doi:10.1016/j.eswa.2015.07.007
[9] Q、 基于模糊粗糙技术的信息保持混合数据约简,模式识别。莱特。,27, 414-423, 2006 ·doi:10.1016/j.parec.2005.09.004
[10] C.Lazar,J.Taminuo,S.Meganck,D.Steenhoff,A.Coletta,C.Molter等,基因表达微阵列分析中特征选择过滤技术的调查,IEEE/ACM传输。计算。生物信息学。, 9 (2012), 1106-1119.
[11] G、 关于特征选择方法的综述,Comput。选举人。工程,40,16-28,2014·doi:10.1016/j.compleceng.2013.11.024
[12] O、 基于代表性样本的模糊互信息特征选择,国际软件创新,6,58-722018·doi:10.4018/IJSI.2018010105
[13] D、 基于推理相关性的特征选择,智能。数据分析。,15, 375-398, 2011 ·doi:10.3233/IDA-2010-0473
[14] R、 相互信息:检测和评估变量之间的相关性,生物信息学,18,S231-S240,2002·doi:10.1093/bioinformatics/18.suppl_2.S231
[15] J、 通过最大化独立分类信息进行特征选择,IEEE Trans。知识。数据工程,29828-8412017·doi:10.1109/TKDE.2017.2650906
[16] F、 基于互信息的前向特征选择方法的理论基础,神经计算,32567-892019·doi:10.1016/j.neucom.2018.09.077
[17] D、 基于模糊互信息的最小冗余和最大相关异构特征选择,国际计算杂志。智力。系统。,4, 619-633, 2011 ·doi:10.1080/18756891.2011.9727817
[18] J、 粗糙集理论中测量不确定性和模糊性的新方法。,31, 331-342, 2002 ·Zbl 1010.94004号 ·doi:10.1080/030810702100013635
[19] Z、 模糊关系信息系统的不确定性测量,IEEE Trans。模糊系统。,27, 2338-2352, 2019
[20] C、 一般模糊关系的不确定性度量,模糊集系统。,360, 82-96, 2019 ·Zbl 1423.68516号 ·doi:10.1016/j.fs.2018.07.006
[21] Y、 构建相似度量的一些新方法,模糊集系统。,234, 46-60, 2014 ·Zbl 1315.03096号 ·doi:10.1016/j.fss.2013.03.008
[22] G、 信息论特征选择的新视角,Artif。智力。统计,49-562009
[23] D.D.Lewis,文本分类中的特征选择和特征提取,《言语与自然语言:1992年在纽约哈里曼举行的研讨会论文集》,23-26。
[24] R、 在监督神经网络学习中使用互信息选择特征,IEEE Trans。神经网络。学习。系统。,5, 537-550, 1994 ·doi:10.1109/72.298224
[25] H、 基于最大相关性、最大相关性和最小冗余度的互信息标准的特征选择,IEEE Trans。模式分析。机器。智力。,27, 1226-1238, 2005 ·doi:10.1109/TPAMI.2005.159
[26] H、 基于联合互信息的特征选择。国际公务员制度委员会交响乐团。高级集成电路。数据分析。,22-25, 1999
[27] F、 带条件互信息的快速二进制特征选择,J.Mach。学习。2004年第51531-1555号决议·Zbl 1222.68200号
[28] P.E.Meyer、G.Bontempi、,变量互补在肿瘤分类特征选择中的应用《进化计算应用研讨会》,施普林格,柏林,海德堡,2006年,第91-102页。
[29] A、 一种基于互信息的强大特征选择方法,Int.J.Compute。科学。网络安全。,8, 116, 2008
[30] P、 规范化互信息特征选择,IEEE Trans。神经网络,20189-2012009·doi:10.1109/TNN.2008.2005601
[31] N、 Mifs-nd:一种基于互信息的特征选择方法,专家系统。申请。,41, 6371-6385, 2014 ·doi:10.1016/j.eswa.2014.04.019
[32] G、 基于互信息的信息特征集选择方法,模式识别。,46, 3315-3327, 2013 ·doi:10.1016/j.patcog.2013.04.021
[33] J、 连续和混合模式数据归纳学习的类相关离散化,IEEE Trans。模式分析。机器。智力。,1995年6月17日至65日·数字对象标识代码:10.1109/34.391407
[34] Q、 用模糊粗糙集选择信息特征及其在复杂系统监控中的应用,模式识别。,37, 1351-1363, 2004 ·Zbl 1070.68600号 ·doi:10.1016/j.patcog.2003.10.16
[35] J、 模糊粗糙集不确定性测度的互补信息熵及其应用,软计算。,19, 1997-2010, 2015 ·Zbl 1359.68277号 ·doi:10.1007/s00500-014-1387-5
[36] H、 一种基于模糊熵的特征选择的高效模糊分类器,IEEE Trans。系统。人类网络。系统。,31, 426-432, 2001 ·doi:10.1109/3477.931536
[37] I、 二次编程特征选择,J.Mach。学习。2010年第11491-1516号决议·Zbl 1242.68245号
[38] K、 特征选择问题:传统方法和新算法,Aaai,2129-1341992
[39] K、 使用收缩估计器进行有效的特征选择,马赫数。学习。,108, 1261-1286, 2019 ·Zbl 1472.68156号 ·doi:10.1007/s10994-019-05795-1
[40] 十、 基于特征集等价和互信息增益最大化的输入特征选择方法,IEEE Access,7151525-1515382019·doi:10.1109/ACCESS.2019.2948095
[41] P、 考虑加权相关性的特征选择,应用。智力。,1-11
[42] S、 离散化技术综述:监督学习中的分类和实证分析,IEEE Trans。知识。数据工程,25734-7502012
[43] A、 分类评估方法,应用。计算。通知。,2020
[44] M.Allahayari、S.Pouriyeh、M.Assefi、S.Safaei、E.D.Trippe、J.B.Gutierrez等人,《文本挖掘的简要调查:分类、聚类和提取技术》,预印本,arXiv:1707.02919。
[45] R、 精度估计和模型选择的交叉验证和引导研究,Ijcai,14,1137-11451995
[46] S.Nogueira、G.Brown、,测量特征选择的稳定性,关于数据库中的机器学习和知识发现的欧洲联合会议,Springer,Cham,2016442-457。
[47] 蔡永生、杨宇春、钟国富、黄光裕、,基于互信息和模糊互信息的特征选择策略比较,2013年IEEE模糊系统国际会议(FUZZ-IEEE),IEEE,2013,1-6。
[48] 五十、 特征选择的稳定性指数,人工智能和应用,421-4272007
[49] D.Dua,C.Graff,UCI机器学习库,2017年。可从以下位置获得:http://archive.ics.uci.edu/ml。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。