×

一种具有部分信息共享的分布式特征选择方案。 (英语) Zbl 1442.68192号

摘要:本文介绍了一种新的基于垂直数据分区和分布式搜索结构的特征选择和分类方法。这些特征被划分为子集,每个子集都与执行本地搜索的专用处理器相关联。当所有局部选择过程完成后,每个处理器与所有其他处理器共享其局部选择模型的特征,并重复局部搜索直到收敛。由于垂直分区和分布式选择方案,该方法能够处理相对较大规模的示例。由于本地处理器并行地在更小的搜索空间上执行选择任务,因此该过程是高效的。该方法的另一个重要特点是倾向于生成简单的模型结构,这通常有利于分类器的可解释性和鲁棒性。对提出的方法进行了评估,并将其与文献中针对几个基准数据集提出的其他著名特征选择和分类方法进行了比较。所得结果证明了该方法在分类精度和计算时间方面的有效性。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
68宽15 分布式算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Banerjee,M.和Chakravarty,S.(2011年)。使用虚拟维度选择分布式数据的隐私保护特征。《第20届ACM信息和知识管理国际会议论文集》(第2281-2284页)。
[2] Ben-David,A.,《使用Cohen加权kappa比较分类精度》,《应用专家系统》,34,2,825-832(2008)·doi:10.1016/j.eswa.2006年10月22日
[3] Bolón-Canedo,V.、Sánchez-Maroño,n.和Alonso-Betanzos,A.(2015b)。一种基于复杂性度量的分布式特征选择方法。在人工神经网络国际工作会议上(第15-128页)。西班牙:马洛卡棕榈岛。
[4] Bolón-Canedo,V.、Sánchez-Marono,n.和Cerviño-Rabuñal,J.(2014)。从垂直分区数据中进行并行特征选择。在ESANN中
[5] 波隆-卡内多,V。;Sánchez-Maroño,N。;Alonso Betanzos,A.,分布式特征选择:微阵列数据分类的应用,应用软计算,30136-150(2015)·doi:10.1016/j.asoc.2015.01.035
[6] 布兰科维奇,A。;Falsone,A。;Prandini,M。;Piroddi,L.,基于模型总体随机提取的特征选择和分类算法,IEEE控制论汇刊,48,4,1151-1162(2018)·doi:10.1109/TCYB.2017.2682418
[7] 卡诺,A。;Zafra,A。;Ventura,S.,标准和不平衡数据的加权数据引力分类,IEEE控制论汇刊,43,6,1672-1687(2013)·doi:10.1109/TSMCB.2012.2227470
[8] Chandrashekar,G。;Sahin,F.,《特征选择方法的调查》,计算机与电气工程,40,1,16-28(2014)·doi:10.1016/j.compleceng.2013.11.024
[9] 楚,C。;SK Kim;Lin,YA;Yu,Y。;Bradski,G。;Ng、AY;Olukotun,K.,多核机器学习的地图还原,神经信息处理系统的进展,19,281(2007)
[10] 德索萨,JT;马特温,S。;Japkowicz,N.,并行特征选择,算法,45,3343-456(2006)·Zbl 1097.68612号 ·doi:10.1007/s00453-006-1220-3
[11] 迪奥·R。;沈庆,《和声搜索的特征选择》,IEEE系统、人与控制论汇刊,B部分:控制论,42,6,1509-1523(2012)·doi:10.1109/TSMCB.2012.2193613
[12] 费里,F。;普迪尔,P。;哈蒂夫,M。;Kittler,J.,《大规模特征选择技术的比较研究》,《实践中的模式识别》,IV,403-413(1994)
[13] Guillén,A.、Sorjamaa,A.、Miche,Y.、Lendasse,A.和Rojas,I.(2009年)。隐写问题的高效并行特征选择。《生物灵感系统:计算智能和环境智能》(第1224-1231页)。
[14] Guyon,I.和Elisseeff,A.(2006年)。特征提取简介。在I.Guyon、M.Nikravesh、S.Gunn和L.A.Zadeh(编辑)的《特征提取》中。模糊性和软计算研究,(第207卷)。柏林,海德堡:施普林格。10.1007/978-3-540-35488-81. ·Zbl 1102.68556号
[15] Inza,I。;拉腊尼亚加,P。;埃克塞贝里亚,R。;Sierra,B.,《基于贝叶斯网络优化的特征子集选择》,人工智能,123,1,157-184(2000)·Zbl 0952.68118号 ·doi:10.1016/S0004-3702(00)00052-7
[16] 卡比尔,MM;沙贾汗,M。;Murase,K.,用于特征选择的新型混合蚁群优化算法,应用专家系统,39,3,3747-3763(2012)·doi:10.1016/j.eswa.2011.09.073
[17] Kira,K.和Rendell,L.A.(1992年)。一种实用的特征选择方法。第九届机器学习国际研讨会论文集(第249-256页)。
[18] Kononenko,I.(1994年)。评估属性:地形分析和延伸。在关于机器学习的欧洲会议上(第171-182页)。斯普林格。
[19] 林,SW;Chen,SC,PSOLDA:用于提高线性判别分析分类准确率的粒子群优化方法,应用软计算,9,3,1008-1015(2009)·doi:10.1016/j.asoc.2009.01.01
[20] Liu,H.和Motoda,H.(2012)。知识发现和数据挖掘的特征选择(第454卷)。施普林格科技与商业媒体·Zbl 0908.68127号
[21] 洛佩兹,FG;MG托雷斯;巴蒂斯塔,BM;佩雷斯,JAM;Moreno-Vega,JM,通过并行分散搜索解决特征子集选择问题,《欧洲运筹学杂志》,169,2477-489(2006)·Zbl 1079.90174号 ·doi:10.1016/j.ejor.2004.08.010
[22] Morán-Fernández,L.、Bolón-Canedo,V.和Alonso-Betanzos,A.(2015)。一种按特征划分分布式特征选择的高效方法。西班牙人工智能协会会议(第245-254页)。斯普林格。
[23] Newman,D.、Hettich,S.、Blake,C.和Merz,C.(1998年)。机器学习数据库的UCI存储库。2016年6月28日检索自网址:http://www.ics.uci.edu/mlearn/MLRepository.html。
[24] 皮罗迪,L。;Spinelli,W.,基于仿真误差最小化的多项式NARX模型识别算法,国际控制杂志,76,17,1767-1781(2003)·Zbl 1041.93019号 ·doi:10.1080/00207170310001635419
[25] Prasad,B.R.、Bendale,UK和Agarwal,S.(2016)。对高维数据使用垂直分区的分布式特征选择。在计算、通信和信息学进展国际会议(ICACCI)上(第807-813页)。电气与电子工程师协会
[26] Pudil,P.、Ferri,F.、Novovicova,J.和Kittler,J.(1994)。非单调准则函数特征选择的浮动搜索方法。在:第12届模式识别国际会议(第2卷,第279-283页)。
[27] MG史密斯;Bull,L.,用遗传算法进行特征构建和选择的遗传编程,遗传编程和进化机器,6,3,265-281(2005)·doi:10.1007/s10710-005-2988-7
[28] Sorjama,A。;Hao,J。;Reyhani,N。;纪毅。;Lendasse,A.,《时间序列长期预测方法》,神经计算,70,16,2861-2869(2007)·doi:10.1016/j.neucom.2006.06.015
[29] Sreeja,N。;Sankar,A.,使用基于蚁群优化的特征选择的基于模式匹配的分类,应用软计算,31,91-102(2015)·doi:10.1016/j.asoc.2015.02.036
[30] 薛,B。;张,M。;Browne,WN,《分类中特征选择的粒子群优化:多目标方法》,IEEE控制论汇刊,43,6,1656-1671(2013)·doi:10.1109/TSMCB.2012.2227469
[31] 薛,B。;张,M。;Browne,WN,《分类中特征选择的粒子群优化:新的初始化和更新机制》,应用软计算,18,261-276(2014)·doi:10.1016/j.asoc.2013.09.018
[32] Yang,J.和Honavar,V.(1998年)。使用遗传算法进行特征子集选择。特征提取、构造和选择(第117-136页)。马萨诸塞州波士顿:斯普林格。
[33] 赵,Z。;张,R。;考克斯,J。;杜林,D。;Sarle,W.,《大规模并行特征选择:基于方差保持的方法》,机器学习,92,1195-220(2013)·Zbl 1273.68310号 ·doi:10.1007/s10994-013-5373-4
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。