×

不一致性引导的稳健属性约简。 (英语) Zbl 07786191号

摘要:属性约简(AR)在减少不相关和冗余的域属性,同时维护保留属性的底层语义方面发挥着重要作用。本文基于地球移动器距离(EMD),从最小化约简的可分辨性与整个原始属性集之间的不一致性的角度,提出了一种鲁棒的AR算法。由于不一致性度量器对噪声信息的敏感性,还提出了一种通过检测全局类分布的异常局部类分布来进行实例去噪的策略。通过系统的实验研究证明,采用这种AR预处理过程,发现约简的稳健性显著提高。实验结果表明,从属性约简的大小和使用约简属性的分类结果来看,该方法所获得的约简总体上优于应用流行的、最先进的AR技术所获得的结果。

MSC公司:

68层37 人工智能背景下的不确定性推理
68T05型 人工智能中的学习和自适应系统
62J99型 线性推断、回归
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Alcalá-Fdez,J。;费尔南德斯,A。;Luengo,J。;德拉克,J。;加西亚,S。;桑切斯,L。;Herrera,F.,Keel数据挖掘软件工具:数据集存储库,算法和实验分析框架的集成,J.多值逻辑软计算,17(2011)
[2] Y.Bengio,Y.Grandvalet,估计K倍交叉验证方差的偏差,摘自:《复杂数据问题的统计建模与分析》,Springer,2005年,第75-95页。
[3] C.Blake,C.Merz,UCI机器学习数据库库,1998年。加州大学欧文分校信息与计算机科学学院。
[4] Boongoen,T。;尚,C。;Iam-On,N。;Shen,Q.,将数据可靠性度量扩展到软子空间聚类的滤波方法,IEEE Trans。系统、人、网络、。,B部分(控制论),411705-1714(2011)
[5] 陈,Y。;刘凯。;宋,J。;Fujita,H。;Yang,X.先生。;Qian,Y.,属性约简的属性组,Inf.Sci。,535, 64-80 (2020) ·Zbl 1459.68204号
[6] 戴J。;胡,H。;Wu,W。;钱,Y。;Huang,D.,模糊粗糙集中基于最大可分辨对的属性约简方法,IEEE Trans。模糊系统。,26, 2174-2187 (2018)
[7] 戴J。;胡,Q。;胡,H。;黄,D.,用粗糙集方法进行属性约简的邻域不一致对选择,IEEE Trans。模糊系统。,26, 937-950 (2018)
[8] Das,A.K。;达斯,S。;Ghosh,A.,使用双目标遗传算法进行集成特征选择,Knowl-基于系统。,123, 116-127 (2017)
[9] Dash,M。;Liu,H.,特征选择中基于一致性的搜索,Artif。智力。,151, 155-176 (2003) ·Zbl 1082.68791号
[10] 迪奥·R。;Chao,F。;彭,T。;斯诺克,N。;Shen,Q.,受特征选择启发的分类器集成约简,IEEE Trans。赛博。,44, 1259-1268 (2014)
[11] W.Fu、R.Olson、Nathan、G.Jena、PGijsbers、T.Augspurger、J.Romano、P.Saha、S.Shah、S.Raschka、sohnam、DanKoretsky、kadarakos、Jaimecclin、bartdp1、G.Bradway、J.Ortiz、J.J.Smit、J.H.Menke、M.Ficek、A.Varik、A.Chaves、J.Myatt、Ted、A.G.Badaracco、C.Kastner、C.Jerónimo、Hristo、M.Rocklin、R.Carnevale、Epistasislab/tpot:v0.11.5,2020网址:https://doi.org/10.5281/zenodo.3872281。doi:10.5281/zenodo.3872281。
[12] 哈德拉尼,A。;Guennoun,K。;萨尔丹,R。;Wahbi,M.,《模糊粗糙集:基于自动噪声样本检测的增强知识表示模型的调查与建议》,《认知系统研究》,64,37-56(2020)
[13] 江,Z。;刘凯。;Yang,X.先生。;Yu,H。;Fujita,H。;Qian,Y.,基于监督邻域的属性约简加速器,国际期刊近似推理,119122-150(2020)·Zbl 1434.68573号
[14] Lee,W。;Jun,C.H。;Lee,J.S.,通过支持向量机进行实例分类,以调整adaboost中的权重,用于不平衡数据分类,Inf.Sci。,381, 92-103 (2017)
[15] Lim,H。;Kim,D.W.,基于成对依赖的无监督特征选择,模式识别。,111,第107663条pp.(2021)
[16] López,J。;马尔多纳多,S。;Carrasco,M.,通过dc编程实现稳健特征选择和svm分类的双重正则化方法,Inf.Sci。,429, 377-389 (2018) ·Zbl 1436.68310号
[17] Mafarja,M。;Mirjalili,S.,包装器特征选择的鲸鱼优化方法,应用。软计算,62,441-453(2018)
[18] Mirzaei,A。;Mohsenzadeh,Y。;Sheikhzadeh,H.,变分相关样本特征机:嵌入式特征选择的完全贝叶斯方法,神经计算,241181-190(2017)
[19] Pawlak,Z.,《粗糙集》,《国际计算杂志》。通知。科学。,11341-356(1982年)·Zbl 0501.68053号
[20] 邱,X。;张,L。;Nagaratnam Suganthan,P。;Amaratunga,G.A.,《通过最小二乘估计进行时间序列预测的斜向随机森林集合》,《信息科学》。,420, 249-262 (2017)
[21] 曲,Y。;尚,C。;新墨西哥州帕塔兰。;Wu,W。;沈庆,多功能近邻分类,软。计算。,22, 2717-2730 (2018) ·Zbl 1398.68454号
[22] 曲,Y。;尚,C。;沈(音)。;新墨西哥州帕塔兰。;Wu,W.,基于核的模糊粗糙最近邻分类在乳腺癌风险分析中的应用,国际模糊系统杂志。,17, 471-483 (2015)
[23] 曲,Y。;沈(音)。;新墨西哥州帕塔兰。;尚,C。;Wu,W.,基于模糊相似性的最近邻分类作为模糊粗糙相似性的替代方法,《国际近似推理》,54,184-195(2013)·Zbl 1266.68161号
[24] 曲,Y。;岳,G。;尚,C。;Yang,L。;Zwiggelar,R。;Shen,Q.,多标签模糊粗糙特征选择支持的多标准乳房X光检查风险分析,Artif。智力。医学,100,1-14(2019)
[25] Rubner,Y。;托马西,C。;Guibas,L.J.,《推土机距离作为图像检索的度量标准》,国际计算机杂志。愿景,4099-121(2000)·Zbl 1012.68705号
[26] 尚,C。;Shen,Q.,《利用特征选择辅助基因表达数据分类:比较研究》,国际计算机杂志。智力。Res.,1,68-76(2005年)
[27] Shannon,C.E.,《通信数学理论》,《贝尔系统技术杂志》,第27期,第379-423页(1948年)·Zbl 1154.94303号
[28] L.Sun,J.Xu,X.Cao,基于新条件熵的粗糙集理论决策表约简方法,载于:2009年智能系统与应用国际研讨会,第1-4页。
[29] 苏,M。;Tao,L。;朱,B。;苗,X。;Liang,Z。;丁,Y。;张,X。;张涛,单参数决策理论粗糙集,信息科学。,539, 49-80 (2020) ·Zbl 1474.68365号
[30] 蔡家富。;Chen,Y.C.,特征选择和数据离散化的最佳组合:一项实证研究,信息科学。,505, 282-293 (2019)
[31] Urbanowicz,R.J。;米克尔,M。;西拉卡瓦。;奥尔森,R.S。;Moore,J.H.,《基于浮雕的特征选择:简介和评论》,J.Biomed。通知。,85, 189-203 (2018)
[32] Wang,C.Y。;Wan,L.,基于模糊(协同)蕴涵的粒度可变精度模糊粗糙集的新结果,模糊集系统。(2020)
[33] 夏,S。;张,Z。;李伟(Li,W.)。;王,G。;吉姆·E。;Chen,Z.,Gbnrs:一种新的用于分类中快速自适应属性约简的粗糙集算法,IEEE Trans。知识。数据工程(2020),1-1
[34] 杨,J。;王,G。;张琦,模糊等价关系多粒度空间中的知识距离测度,信息科学。,448-449, 18-35 (2018) ·Zbl 1440.68305号
[35] 杨,J。;王,G。;张,Q。;Wang,H.,模糊概念的多粒度粗近似的知识距离度量,IEEE Trans。模糊系统。,28, 706-717 (2020)
[36] Yang,Y。;Loog,M.,《逻辑回归主动学习的基准和比较》,模式识别。,83, 401-415 (2018)
[37] Zhang,T.,《利用贪婪最小二乘回归进行特征选择的一致性》,J.Mach。学习研究,10,555-568(2009)·兹比尔1235.62096
[38] W.Zheng,F.Y.Wang,C.Gou,利用wasserstein距离进行非参数差分特征选择,收录于:2020 IEEE第32届人工智能工具国际会议,第982-988页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。