×

基于启发式的粗糙集特征选择方法。 (英语) Zbl 1490.68231号

摘要:本文提出了拟议的研究方法,致力于应用贪婪启发式来收集可用特征的信息。发现的知识以生成的决策规则的形式表示,用于支持特征选择和约简过程,以便用经典粗糙集方法归纳决策规则。通过几种方法对离散化的输入数据集进行观测。实验结果表明,通过该方法消除相关性较小的属性,可以推断出基数较小的规则集,同时保持满意分类所需的规则质量。

MSC公司:

68层37 人工智能背景下的不确定性推理
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)

软件:

导轨R;第4.5条
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Pawlak,Z.,《粗糙集与智能数据分析》,信息科学。,147, 1-12 (2002) ·Zbl 1018.68082号
[2] Pawlak,Z。;Skowron,A.,《粗糙集的基础》,《信息科学》。,177, 1, 3-27 (2007) ·Zbl 1142.68549号
[3] 安,A。;Cercone,N.,《规则质量度量提高了规则归纳的准确性:一种实验方法》,(Ra-shi,Z.W.;Ohsuga,S.,《智能系统基础》,智能系统基础,ISMIS 2000。智能系统基础。智能系统基础,ISMIS 2000,计算机科学讲义,卷1932(2000),Springer),119-129·Zbl 0983.68770号
[4] 劳贝尔,L。;西科拉,M。;Michalak,M.,《规则质量衡量分类、回归和生存规则归纳中的设置——一种实证方法》,Fundam。通知。,149, 419-449 (2016)
[5] Nguyen,H.S.,《近似布尔推理:数据挖掘中的基础和应用》,(Peters,J.F.;Skowron,A.,《粗糙集交易》V.《粗糙集的交易》V,计算机科学讲义,第4100卷(2006),Springer),334-506·Zbl 1136.68497号
[6] Pawlak,Z。;Skowron,A.,《粗糙集与布尔推理》,《信息科学》。,177, 1, 41-73 (2007) ·Zbl 1142.68551号
[7] 阿明,T。;奇卡洛夫,I。;莫什科夫,M。;Zielosko,B.,优化近似决策规则的动态规划方法,《信息科学》。,119, 403-418 (2013) ·Zbl 1293.68265号
[8] 阿明,T。;奇卡洛夫,I。;莫什科夫,M。;Zielosko,B.,决策规则长度和覆盖范围之间的关系,Fundam。通知。,129, 1-2, 1-13 (2014) ·Zbl 1285.68141号
[9] Zielosko,B.,《动态规划方法在关联规则相对于覆盖和长度的优化中的应用》,Fundam。通知。,148, 1-2, 87-105 (2016) ·Zbl 1373.68408号
[10] Błaszczynski,J。;Słowiáski,R。;Szeląg,M.,可变一致性粗糙集方法的序列覆盖规则归纳算法,信息科学。,181, 5, 987-1002 (2011)
[11] 克拉克·P。;Niblett,T.,《CN2归纳算法》,马赫数。学习。,3, 4, 261-283 (1989)
[12] 西科拉,M。;劳贝尔,L。;Gudy she Guider,A.,分类、回归和生存设置中的指导性分离和冲突规则学习,Knowl-基于系统。,173, 1-14 (2019)
[13] 昆兰,J.R.,C4.5:机器学习课程(1993),摩根考夫曼出版社。
[14] 阿扎德,M。;Zielosko,B。;莫什科夫,M。;Chikalov,I.,具有多值决策比较研究的表的决策规则、树和测试,(Watada,J.;Jain,L.C.;Howlett,R.J.;Mukai,N。;Asakura,K.,《第17届基于知识和智能信息与工程系统国际会议论文集》。第17届基于知识和智能信息与工程系统国际会议论文集,KES 2013。第17届基于知识的智能信息与工程系统国际会议论文集。第17届基于知识和智能信息与工程系统国际会议论文集,KES 2013,Procedia Computer Science,vol.22(2013),Elsevier),87-94
[15] Ang,J.等人。;Tan,K。;Mamun,A.,用于规则提取的进化模因算法,专家系统。申请。,37, 2, 1302-1315 (2010)
[16] D·勒·扎克。;Wróblewski,J.,用于搜索近似熵约简的基于顺序的遗传算法,(Wang,G.;Liu,Q.;Yao,Y.;Skowron,A.,《粗糙集、模糊集、数据挖掘和粒度计算》,粗糙集,模糊集,数据挖掘和颗粒计算,RSFDGrC 2003。粗糙集、模糊集、数据挖掘和粒度计算。粗糙集、模糊集、数据挖掘和粒度计算,RSFDGrC 2003,计算机科学讲义,第2639卷(2003),Springer),308-311·Zbl 1026.68654号
[17] 莫什科夫,M.J。;Piliszczuk,M。;Zielosko,B.,《关于部分约简和不可约部分决策规则的构造》,Fundam。通知。,75, 1-4, 357-374 (2007) ·Zbl 1108.68116号
[18] 斯坦奇克,美国。;Zielosko,B。;Żabiáski,K.,《贪婪启发式在特征表征和选择中的应用:柱状图领域的案例研究》,(Nguyen,H.;Ha,Q.;Li,T.;Przybyla-Kasperek,M.,《粗糙集》,IJCRS 2018。粗糙集。粗糙集,IJCRS 2018,计算机科学讲义,第11103卷(2018),施普林格:施普林格奎恩,越南),350-362
[19] (Guyon,I.;Gunn,S.;Nikravesh,M.;Zadeh,L.,《特征提取:基础和应用》,《模糊性和软计算研究》,第207卷(2006),Physica-Verlag,Springer)·Zbl 1114.68059号
[20] 盖恩,I。;Elisseeff,A.,《变量和特征选择简介》,J.Mach。学习。第3号决议,1157-1182(2003年)·Zbl 1102.68556号
[21] (Argamon,S.;Burns,K.;Dubnov,S.,《风格的结构:理解方式和意义的算法方法》(The Structure of Style:Algorithmic Approachs to Understanding Manner and Meanine,2010),施普林格出版社:施普林格-柏林出版社)
[22] Stamatatos,E.,《现代作者归属方法调查》,《美国社会科学杂志》。技术。,60, 3, 538-556 (2009)
[23] Dougherty,J。;Kohavi,R。;Sahami,M.,连续特征的监督和非监督离散化,(机器学习论文集1995:第12届机器学习国际会议论文集(1995),Elsevier),194-202
[24] 刘,H。;Motoda,H.,《特征选择、数据挖掘和知识发现的计算方法》(2007),查普曼和霍尔/CRC·Zbl 1130.62118号
[25] Janusz,A。;Ślȩzak,D.,属性聚类和选择的粗糙集方法,应用。Artif公司。智力。,28, 3, 220-242 (2014)
[26] Jensen,R。;Shen,Q.,《计算智能和特征选择:粗糙和模糊方法》,IEEE计算智能新闻系列(2008),Wiley-IEEE出版社
[27] 斯坦奇克,U.,《组合包装器选择方法中特征特征的排名》,神经计算。申请。,26, 2, 329-344 (2015)
[28] Kohavi,R。;John,G.,特征子集选择包装器,Artif。智力。,97, 1, 273-324 (1997) ·Zbl 0904.68143号
[29] Staáczyk,U.,《嵌入式粗糙方法中的属性权重》(Gruca,A.;Czachórski,T.;Kozielski,S.,《人机交互》第3卷)。人机交互3,智能和软计算进展,第242卷(2013年),施普林格-弗拉格:德国柏林施普林格),475-483
[30] 斯坦奇克,U。《基于属性排名的决策规则选择》,J.Intell。模糊系统。,29, 2, 899-915 (2015)
[31] 贾,X。;Shang,L。;周,B。;Yao,Y.,粗糙集理论中的广义属性约简,Knowl-基于系统。,91204-218(2016)
[32] 格里戈罗夫斯基,M。;Ślȩzak,D.,《弹性特征选择:r-C-约简的计算基础》,《信息科学》。,499, 25-44 (2019) ·兹比尔1451.68224
[33] Ge,H。;李,L。;Xu,Y。;Yang,C.,不一致决策表的快速通用约简算法,国际期刊近似原因。,82, 56-80 (2017) ·兹比尔1404.68162
[34] 梁,J。;Wang,F。;Dang,C。;钱,Y.,一种具有多粒度视图的高效粗糙特征选择算法,Int.J.近似推理。,53, 6, 912-926 (2012)
[35] 拉扎,M.S。;Qamar,U.,《通过避免正区域使用基于粗糙集的直接相关性计算进行特征选择》,《国际期刊近似原因》。,92, 175-197 (2018) ·Zbl 1423.68512号
[36] Yang,Y。;Chen博士。;Wang,H。;Tsang,E。;Zhang,D.,从样本到达的动态数据中进行基于模糊粗糙集的增量属性约简,模糊集系统。,31266-86(2017),主题:模糊粗糙集·Zbl 1368.68301号
[37] Yang,Y。;Chen博士。;Wang,H.,基于主动样本选择的粗糙集属性约简增量算法,IEEE Trans。模糊系统。,25, 4, 825-838 (2017)
[38] 梁,J。;Wang,F。;Dang,C。;Qian,Y.,应用粗糙集技术进行特征选择的组增量方法,IEEE Trans。知识。数据工程,26,2,294-308(2014)
[39] 刘,Y。;郑,L。;秀,Y。;尹,H。;赵,S。;王,X。;陈,H。;Li,C.,基于区分矩阵的融合决策表增量特征选择,国际期刊近似推理。,118, 1-26 (2020) ·Zbl 1468.68237号
[40] Yao,Y.,《三向粒度计算、粗糙集和形式概念分析》,《国际期刊近似推理》。,116, 106-125 (2020) ·Zbl 1468.68246号
[41] Wan,Q。;李,J。;Wei,L。;Qian,T.,最佳颗粒水平选择:颗粒描述准确性观点,国际期刊近似原因。,116, 85-105 (2020) ·Zbl 1468.68243号
[42] Jing,Y。;李·T。;黄,J。;张勇,一种基于知识粒度的属性泛化增量式属性约简方法,国际期刊近似推理。,76, 80-95 (2016) ·Zbl 1385.68047号
[43] Ferone,A.,基于特征粒化诱导的粗糙集合成的特征选择,国际期刊近似推理。,101, 276-292 (2018) ·兹比尔1448.68415
[44] 王,C。;Shi,Y。;范,X。;Shao,M.,基于k-最近邻域粗糙集的属性约简,国际期刊近似推理。,106, 18-31 (2019) ·Zbl 1456.68190号
[45] 帕切科,F。;塞拉达,M。;桑切斯,R。;Cabrera,D。;Li,C。;de Oliveira,J.V.,旋转机械故障严重程度分类中使用粗糙集理论进行特征选择的属性聚类,专家系统。申请。,71, 69-86 (2017)
[46] 王,X。;杨,J。;滕,X。;夏,W。;Jensen,R.,基于粗糙集和粒子群优化的特征选择,模式识别。莱特。,28, 4, 459-471 (2007)
[47] Jensen,R。;Shen,Q.,用蚁群优化发现粗糙集约简,(2003年英国计算智能研讨会论文集(2003)),15-22
[48] 陈,Y。;朱,Q。;Xu,H.,用鱼群算法寻找粗糙集约简,Knowl-基于系统。,81, 22-29 (2015)
[49] 巴赞,J。;Szczuka,M.,粗糙集探索系统,(Peters,J.F.;Skowron,A.,《粗糙集汇刊III》,《粗糙集汇刊III》,《计算机科学讲义》,第3400卷(2005年),施普林格:施普林格-柏林,海德堡),37-56·Zbl 1116.68599号
[50] 巴赞,J。;Nguyen,H。;Nguyen,S。;Synak,P。;Wróblewski,J.,分类问题中的粗糙集算法,(Polkowski,L.;Tsumoto,S。;Lin,T.,《粗糙集方法与应用:信息系统中知识发现的新发展》。粗糙集方法和应用:信息系统中知识发现的新发展,模糊性和软计算研究,第56卷(2000年),《物理学:海德堡物理学》,49-88·Zbl 0992.68197号
[51] Bonates,T。;Hammer,P.L。;Kogan,A.,数据集中的最大模式,离散应用。数学。,156, 6, 846-861 (2008) ·Zbl 1140.68457号
[52] Nguyen,H.S。;Ślȩzak,D.,近似约简和关联规则-对应和复杂性结果,(RSFDGrC’99:第七届粗糙集、数据挖掘和粒度软件计算新方向国际研讨会论文集·Zbl 0954.68129号
[53] Feige,U.,近似集合覆盖的阈值,J.ACM,45,634-652(1998),ACM,纽约·Zbl 1065.68573号
[54] 莫什科夫,M。;Zielosko,B.,组合机器学习-粗糙集方法,计算智能研究,第360卷(2011年),Springer·Zbl 1246.68010号
[55] 乙醇胺,F。;阿明,T。;莫什科夫,M。;Zielosko,B。;Żabiáski,K.,关联规则优化启发式比较,Fundam。通知。,166, 1, 1-14 (2019) ·Zbl 1414.68102号
[56] 乔克斯,M。;Witten,D.,《作者归属机器学习方法的比较研究》,Lit。语言学家。计算。,25, 2, 215-223 (2010)
[57] 科佩尔,M。;施勒,J。;Argamon,S.,《作者归属中的计算方法》,J.Am.Soc.Inf.Sci。技术。,60, 1, 9-26 (2009)
[58] Eder,M.,尺寸重要吗?作者归属,小样本,大问题,挖掘。人文奖学金。,30, 167-182 (2015)
[59] Baron,G.,《作者归属域分类器评估的交叉验证和测试集方法比较》(Czachórski,T.;Gelenbe,E.;Grochla,K。;Lent,R.,第31届计算机与信息科学国际研讨会论文集。第31届计算机和信息科学国际研讨会论文集,《计算机和信息学中的通信》,第659卷(2016),施普林格:施普林格-克拉科夫),81-89
[60] 加西亚,S。;卢恩戈,J。;Saez,J。;洛佩兹,V。;Herrera,F.,《离散化技术调查:监督学习中的分类法和实证分析》,IEEE Trans。知识。数据工程,25,4,734-750(2013)
[61] 法耶兹,美国。;Irani,K.,用于分类学习的连续值属性的多间隔离散化,(第13届国际人工智能联合会议论文集,第2卷(1993),Morgan Kaufmann出版社),1022-1027
[62] Kononenko,I.,《关于估计多值属性的偏见》,(《第14届国际人工智能联合会议论文集》,《第14次国际人工智能联席会议论文集,1995年国际人工智能学会论文集》第2卷(1995年),摩根考夫曼出版社),1034-1040
[63] Rissanen,J.,《用最短数据描述建模》,Automatica,14,5,465-471(1978)·Zbl 0418.93079号
[64] Witten,I。;E.弗兰克。;Hall,M.,《数据挖掘》。《实用机器学习工具和技术》(2011),摩根·考夫曼
[65] Lindgren,T.,《规则冲突解决方法》(Boulicaut,J.;Esposito,F.;Giannotti,F.);Pedreschi,D.,《机器学习:ECML 2004》。机器学习:ECML 2004,计算机科学讲义,第3201卷(2004),施普林格:施普林格柏林,海德堡),262-273·Zbl 1132.68572号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。