×

用于分类中变量选择的条件互信息的时间有效估计。 (英语) Zbl 1506.62178号

摘要:提出了一种基于熵的相关测度计算算法。该算法允许对实际数据中的可变子集进行穷尽式探索。通过使用来自不同领域的8个数据集和模拟数据与其他三种基于熵的变量选择方法进行比较,证明了该方法的时间效率。该方法适用于数值数量有限的离散数据,适用于医疗诊断支持、DNA序列分析、心理测量学和其他领域。

MSC公司:

62-08 统计问题的计算方法
62页第10页 统计学在生物学和医学中的应用;元分析
68T05型 人工智能中的学习和自适应系统

软件:

R(右);4.5条
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akadi,A.E。;Ouardighi,A.E。;Aboutajdine,D.,一种基于互信息的强大特征选择方法,国际计算杂志。科学。Netw公司。安全。,8, 116-121, (2008)
[2] Alvarez-Esteban,P。;del Barrio,E。;库斯塔·阿尔贝托斯,J。;Matrana,C.,在几个样本中搜索常见的池模式,Comput。统计师。数据分析。,67, 1-14, (2013) ·2013年1月1471.6日
[3] 贝恩,M。;Muggleton,S.,《学习最优国际象棋策略》(Furukawa,K.;Michie,D.;Muggletton,S.《机器智能》,第13卷,(1995),牛津大学出版社,美国纽约州纽约市),291-309
[4] Battiti,R.,《在监督神经网络学习中使用互信息选择特征》,IEEE Trans。神经网络。,5, 537-550, (1994)
[5] 盖,T.M。;Thomas,J.A.,《信息理论的要素》,(1991年),美国纽约州纽约市威利国际科学研究所·Zbl 0762.94001号
[6] de Leeuw,J.,通过迭代奇异值分解对二进制数据进行主成分分析,计算。统计师。数据分析。,50, 1, 21-39, (2006) ·Zbl 1429.62218号
[7] Duch,W.、Adamczak,R.、Grabczewski,K.、Ishikawa,M.、Ueda,H.,1997年。使用约束反向传播网络提取清晰的逻辑规则两种新方法的比较。摘自:欧洲人工神经网络研讨会论文集。比利时布鲁日,第16-18页。
[8] Estevez,宾夕法尼亚州。;Tesmer,M。;佩雷斯,C.A。;Zurada,J.M.,标准化互信息特征选择,IEEE Trans。神经网络。,20, 189-201, (2009)
[9] 宾夕法尼亚州法拉利。;Barbiero,A.,模拟有序数据,多元行为。研究,47,4,566-589,(2012)
[10] Fleuret,F.,带条件互信息的快速二进制特征选择,J.Mach。学习。第5号决议,1531-1555,(2004)·Zbl 1222.68200号
[11] Güvenir,H.A。;Demiröz,G。;Ilter,N.,《使用投票特征间隔学习红斑鳞状病变的鉴别诊断》,Artif。智力。医学,13,3,147-165,(1998)
[12] 盖恩,I。;Gunn,S。;Nikravesh,M。;Zadeh,L.A.,(特征提取:基础与应用,模糊性与软计算研究,(2006),Springer-Verlag New York,Inc.Secaucus,NJ,USA)
[13] 黄,J。;蔡,Y。;Xu,X.,基于互信息的特征选择包装器的混合遗传算法,模式识别。莱特。,28, 1825-1844, (2007)
[14] Iannario,M.,关于序数数据的混合模型的可识别性,Metron,68,187-94,(2010)·Zbl 1301.62017年
[15] 雅库林,A。;Bratko,I.,《测试属性交互的重要性》,(第21届机器学习国际会议论文集,ICML,(2004),ACM出版社),409-416
[16] 荣格,C.-S。;Seo,H。;Kang,H.-G.,多维模式分类中所选特征的冗余信息估计,模式识别。莱特。,32、4、590-596(2011),网址:http://dx.doi.org/10.1016/j.patrec.2010.11.023
[17] Kolenikov,S.,Angeles,G.,2004年。主成分分析中离散数据的使用:理论、模拟和对社会经济指数的应用。
[18] 洛杉矶库根。;Cios,K.J。;Tadeusiewicz,R。;奥吉拉,M。;Goodenday,L.S.,自动心脏SPECT诊断的知识发现方法,Artif。智力。医学,23,2,149-169,(2001)
[19] Kwak,北卡罗来纳州。;Choi,C.-H.,基于parzen窗口的互信息输入特征选择,IEEE Trans。模式分析。机器。智力。,24, 12, 1667-1671, (2002)
[20] 刘,H。;Sun,J。;刘,L。;张浩,动态互信息特征选择,模式识别。,42, 1330-1339, (2009) ·Zbl 1183.68540号
[21] 曼宁,C.D。;Raghavan,P。;Schütze,H.,《信息检索导论》,(2008),剑桥大学出版社·Zbl 1160.68008号
[22] Merrill,D。;Grimshaw,A.S.,《高性能和可扩展基数排序:为GPU计算实现动态并行的案例研究,并行处理》。莱特。,21, 2, 245-272, (2011)
[23] Nijenhuis,A。;Will,H.S.,《组合算法:用于计算机和硬计算器》,(1978),学术出版社,美国佛罗里达州奥兰多·Zbl 0476.68047号
[24] 马里兰州诺德维尔。;毛巾,G.G。;Shavlik,J.W.,《训练基于知识的神经网络以识别DNA序列中的基因》,(《1990年神经信息处理系统进展会议论文集》,第3卷,NIPS-3,(1990),摩根考夫曼出版社,美国加利福尼亚州旧金山),530-536
[25] 彭,H。;长,F。;Ding,C.H.Q.,基于互信息的特征选择:MAX依赖性、MAX相关性和MIN冗余性的标准,IEEE Trans。模式分析。机器。智力。,27, 8, 1226-1238, (2005)
[26] Quinlan,J.R.,C4.5:机器学习程序,(1993),Morgan Kaufmann Publishers Inc.,美国加利福尼亚州旧金山
[27] R: 《统计计算的语言和环境》(2012),奥地利维也纳统计计算R基金会,网址:http://www.R-project.org网站/
[28] R: 统计计算语言和环境,(2009年),奥地利维也纳R统计计算基金会,网址:网址:http://www.R-project.org
[29] Reif,J.H.,《并行算法的综合》,35-60,(1993),Morgan Kaufmann Publishers Inc.San Francisco,CA,USA,(章节前缀和及其应用)
[30] Schlimmer,J.C.,1987年。通过表征调整获得概念。加州大学欧文分校博士论文,aAI8724747。
[31] 索托卡,J.M。;Pla,F.,使用基于条件互信息的距离进行聚类的监督特征选择,模式识别。,43,62068-2081,(2010),网址:http://dx.doi.org/10.1016/j.patcog.2009.12.013 ·Zbl 1191.68514号
[32] Tan,M.,Eshelman,L.J.,1988年。使用加权网络表示噪声域中的分类知识。在:司法协助第121-134页。
[33] Torkkola,K.,非参数互信息最大化特征提取,J.Mach。学习。第3号决议,1415-1438,(2003)·兹比尔1102.68638
[34] 奇皮里斯,A。;瓦拉科斯,I。;Kugiumtzis,D.,特征选择中条件互信息的最近邻估计,专家系统。申请。,39,1612697-12708,(2012),网址:http://dx.doi.org/10.1016/j.eswa.2012.05.014
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。