佩德罗·拉托雷·卡莫纳;何塞·马丁内斯·索托卡;普拉·菲利贝托 基于回归任务信息度量的过滤器类型变量选择。 (英语) Zbl 1306.62177号 熵 14,第2期,323-343(2012). 摘要:本文提出了一种用于回归问题的有监督变量选择方法。该方法采用基于信息度量的分层聚类策略来选择变量。该技术可以应用于单输出回归数据集,并且可以扩展到多输出数据集。对于单输出数据集,将该方法与其他三种变量选择方法进行比较,以对四个数据集进行回归。在多输出情况下,将其与其他最先进的方法进行比较,并使用两个回归数据集进行测试。为了分析和比较所提方法的性能,使用了两种不同的优值(对于单输出和多输出情况)。 MSC公司: 62J99型 线性推断、回归 62小时30分 分类和区分;聚类分析(统计方面) 62B10型 信息论主题的统计学方面 94甲17 信息的度量,熵 关键词:变量选择;条件互信息 软件:信息技术计划 PDF格式BibTeX公司 XML格式引用 \textit{P.Latorre Carmona}等人,熵14,No.2,323--343(2012;Zbl 1306.62177) 全文: DOI程序 参考文献: [1] DOI:10.1016/S1088-467X(97)00008-5·doi:10.1016/S1088-467X(97)00008-5 [2] Verleysen,利用互信息进行特征选择的进展,基于相似性的聚类。5400/2009第52页–(2009)·doi:10.1007/978-3-642-01805-34 [4] DOI:10.1016/j.infsof.2010.05.009·doi:10.1016/j.infsof.2010.05.009 [6] Fan,使用降维近似条件密度函数,Acta Math。申请。罪。第25页第445页–(2009年)·Zbl 1176.62030号 ·doi:10.1007/s10255-008-8815-1 [7] DOI:10.1016/j.化学实验室.2005.06.010·doi:10.1016/j.chemolab.2005.06.010 [8] 内政部:10.1109/34.824819·doi:10.1009/34.824819 [9] Pudil,使用非单调准则函数进行特征选择的浮动搜索方法,模式识别。第2页279页–(1994年) [10] DOI:10.1023/A:10077379606734·doi:10.1023/A:1007379606734 [11] DOI:10.1016/j.patcog.2009.12.013·Zbl 1191.68514号 ·doi:10.1016/j.patcog.2009.12.013 [13] DOI:10.1109/TIT.2010.2080891·Zbl 1366.94187号 ·doi:10.1109/TIT.2010.2080891 [14] 封面,信息理论要素(1991) [15] 内政部:10.1109/TPAMI.2005.159·doi:10.1109/TPAMI.2005.159 [16] 内政部:10.1109/72.977291·数字对象标识代码:10.1109/72.977291 [17] 内政部:10.1080/01621459.1963.10500845·doi:10.1080/01621459.1963.10500845 [18] 杨,信息理论第一课程(2002年) [20] 内政部:10.1093/biomet/83.1.189·Zbl 0865.62026号 ·doi:10.1093/biomet/83.1.189 [21] Hyndman,估算和可视化条件密度,J.Compute。图表。第5章第315页–(1996年) [22] 内政部:10.1016/j.csda.2010.01.11·Zbl 1284.65006号 ·doi:10.1016/j.csda.2010.01.11 [23] DOI:10.1214/aoms/1177728190·Zbl 0073.14602号 ·doi:10.1214/aoms/1177728190 [24] Nocedal,数值优化(2006) [25] DOI:10.1093/ietisy/e90-d.7.1038·doi:10.1093/ietisy/e90-d.7.1038 [27] 数字对象标识码:10.1111/j.1467-9868.2005.0050.x·兹比尔1069.62054 ·文件编号:10.1111/j.1467-9868.2005.005.x [29] Obozinski,多分类问题的联合协变量选择和联合子空间选择,统计计算。第20页,第231页–(2010年)·数字对象标识代码:10.1007/s11222-008-9111-x [30] 莫雷诺,SEN2FLEX数据采集报告(2005) [31] DELVE数据存储多伦多http://www.cs.toronto.edu/delve/ ·Zbl 0928.68092号 [32] 哈里森,《Hedonic价格与清洁空气需求》,J.Environ。经济。管理。第81页第5页–(1978年)·Zbl 0375.90023号 ·doi:10.1016/0095-0696(78)90006-2 [33] UCI机器学习回购网址://archive.ics.uci.edu/ml/ [34] Drucker,支持向量回归机,神经信息处理系统,第155页–(1997) [35] DOI:10.1109/TSP.2004.831028·Zbl 1369.94273号 ·doi:10.1109/TSP.2004.831028 [36] 内政部:10.1109/TPAMI.2002.1114861·doi:10.1109/TPAMI.2002.1114861 [37] DOI:10.1016/j.ins.2009.12.010·doi:10.1016/j.ins.2009.12.010 [38] 约翰逊,应用多元统计分析(2007) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。