×

基于噪声和相关性分析的模糊粗糙特征选择。 (英语) Zbl 07806104号

摘要:特征选择受到了广泛关注,重点是删除冗余或不相关的特征,以改进后续的机器学习任务。模糊粗糙集由于其管理不确定性的能力,被广泛用于特征选择。基于模糊相关性的方法是模糊粗糙集模型领域中的一个有效分支。然而,当噪声对象经常出现时,模糊依赖函数对噪声数据不具有鲁棒性。此外,随着数据集大小的增加,由于潜在的不必要的计算工作,评估度量的计算复杂性也趋于增加。因此,为了同时解决这两个研究问题,我们建议(f)乌齐第页c(c)相关-b条基于特征选择的算法,表示为FRCB。引入邻域半径约束和粒度条件旨在通过将对象划分为核心-边界-外部结构来解释和减轻噪声数据的影响。通过考虑核心对内部类中其他对象的代表性和吸引力,以及对外部类中其他目标的影响,提出了一种更稳健的混合模糊关系和基于相关性的模糊粗糙依赖。为了最小化处理开销和时间复杂性,通过相关性分析识别冗余特征,包括在进行下一次迭代之前进行评估、排序和分组。实验使用了11个数据集。对噪声曲线和原始数据曲线的分析表明,所提出的基于相关性的模糊粗糙依赖性比其他基准测试方法更具鲁棒性。此外,分类和运行时间比较的结果表明,与基线方法相比,本研究提出的FRCB算法表现出优越的性能。

MSC公司:

68倍 计算机科学
94-XX年 信息与通信理论、电路
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Yang,X.先生。;陈,H。;Li,T.等人。;Luo,C.,一种用于特征选择的噪声感知模糊粗糙集方法。知道-基于系统。(2022)
[2] Sheeja,T.K。;Kuriakose,A.S.,一种使用模糊粗糙集的新型特征选择方法。计算。印度,111-116(2018)
[3] 张,X。;梅,C。;陈,D。;Yang,Y.,一种使用典型实例的基于模糊粗糙集的特征选择方法。知识-基于系统。,216-229 (2018)
[4] 安,S。;胡,Q。;Wang,C.,基于概率粒度距离的模糊粗糙集模型。申请。软计算。(2021)
[5] 王,C。;钱,Y。;丁·W。;Feng,X.,基于模糊粗糙最小分类误差准则的特征选择。IEEE Trans Fuzzy系统,1(2021)
[6] 赵,H。;王,P。;胡,Q。;Zhu,P.,基于模糊粗糙集的大规模层次分类特征选择。IEEE Trans Fuzzy系统,1891-1903(2019)
[7] Lin,Y。;李毅。;王,C。;Chen,J.,模糊粗糙集多标签学习的属性约简。知识-基于系统。,51-61 (2018)
[8] 王,C。;齐,Y。;邵,M。;胡,Q。;陈,D。;Qian,Y.,模糊粗糙集特征选择的拟合模型。IEEE Trans Fuzzy系统,741-753(2017)
[9] 袁,Z。;陈,H。;Li,T.等人。;于,Z。;Sang,B。;Luo,C.,基于模糊粗糙集的混合数据无监督属性约简。信息科学。,67-87 (2021) ·Zbl 1528.68352号
[10] 邓,Z。;曹毅。;卢,Q。;Choi,K.S。;Wang,S.,单调关系约束的Takagi-Sugeno-Kang模糊系统。信息科学。,243-257 (2022) ·Zbl 07790817号
[11] 王,C。;邵,M。;何,Q。;钱,Y。;Qi,Y.,基于模糊邻域粗糙集的特征子集选择。知识-基于系统。,173-179 (2016)
[12] 钱,Y。;王,Q。;程,H。;梁,J。;Dang,C.,Fuzzy-rough特性选择加速器。模糊集。系统。,61-78 (2015) ·Zbl 1335.68271号
[13] Jensen,R。;Shen,Q.,Fuzzy-rough数据简化与蚁群优化。模糊集合。系统。,5-20(2005年)·Zbl 1071.68553号
[14] 北卡罗来纳州麦克·帕塔兰。;Jensen,R.,基于无监督模糊粗糙集的维度约简。信息科学。,106-121 (2013) ·Zbl 1293.68233号
[15] 戴J。;陈,J。;刘,Y。;Hu,H.,通过标签对称不确定性相关学习和特征冗余评估进行新的多标签特征选择。知识-基于系统。(2020)
[16] 戴J。;Tian,H.,集值数据的模糊粗糙集模型。模糊集。系统。,54-68 (2013) ·Zbl 1284.68536号
[17] 赵,S。;陈,H。;李,C。;翟先生。;Du,X.,RFRR:鲁棒模糊粗糙约简。IEEE传输。模糊系统。,825-841 (2013)
[18] 何,Q。;吴,C。;陈,D。;Zhao,S.,基于模糊粗糙集的模糊决策信息系统属性约简。知识-基于系统。,689-696 (2011)
[19] Sun,L。;李,M。;丁·W。;张,E。;Mu,X。;Xu,J.,AFNFS:针对不平衡数据的自适应模糊邻域特征选择和自适应合成过采样。信息科学。,724-744 (2022)
[20] 邓,Z。;Li,T.等人。;Deng博士。;刘凯。;张,P。;Zhang,S.,使用基于对偶相似性的邻域模糊熵进行标签分布学习的特征选择。信息科学:国际期刊(2022)
[21] Ma,X.A。;Ju,C.,模糊信息——通过相关性、冗余性和互补性标准进行理论特征选择。信息科学:国际期刊。(2022)
[22] Chouchoulas,A。;Shen,Q.,用于文本分类的粗糙集辅助关键字约简。申请。Artif公司。智力。,843-873 (2001)
[23] Polkowski,L。;津本,S。;Lin,T.Y.,《粗糙集方法与应用:信息系统中知识发现的新发展》。物理(2012)
[24] 胡,Q。;安,S。;Yu,D.,用于鲁棒特征评估和选择的软模糊粗糙集。信息科学。,4384-4400(2010年)
[25] Jensen,R。;Shen,Q.,模糊粗糙属性约简及其在web分类中的应用。模糊集。系统。,469-485 (2004) ·Zbl 1069.68609号
[26] D'eer,L。;Verbist,N。;科内利斯,C。;Godo,L.,《基于隐含联合和容错模糊粗糙集的综合研究:定义、属性和鲁棒性分析》。模糊集。系统。,1-38 (2015) ·Zbl 1373.03116号
[27] 安,S。;胡,Q。;佩德里茨,W。;朱,P。;Tsang,E.C.C.,数据分布感知模糊粗糙集模型及其在稳健分类中的应用。IEEE Trans Cybern,1-13(2015)
[28] 安,S。;胡,Q。;Yu,D。;Liu,J.,基于软极小包围球的鲁棒模糊粗糙集。基金。通知。,189-202 (2012) ·Zbl 1248.68486号
[29] 戴J。;刘,Y。;Chen,J.,基于自适应加权核密度估计的最大独立比和最小冗余比的特征选择。信息科学。(2021) ·Zbl 1526.94012号
[30] 曲,Y。;徐,Z。;尚,C。;Ge,X。;邓,A。;Shen,Q.,不一致性指导稳健属性约简。信息科学。,69-91 (2021) ·Zbl 07786191号
[31] 科内利斯,C。;Jensen,R.,模糊粗糙特征选择的一种容错方法,1598-1605
[32] 赵,S。;曾荫权(Tsang,E.C.)。;Chen,D.,模糊变精度粗糙集模型。IEEE传输。模糊系统。,451-467 (2009)
[33] 李毅。;Wu,S。;Lin,Y。;Liu,J.,基于不同类别比率模糊粗糙集的鲁棒特征选择。知道-基于系统。,74-86 (2017)
[34] Jensen,R。;Shen,Q.,《语义保持维度约简:粗糙和模糊粗糙方法》。IEEE Trans Knowl Data Eng,1457-1471(2004)
[35] Jy,A。;Jz,A。;Wd,B。;Hfcd,E.,带有模糊邻域算子的新型模糊粗糙集模型。信息科学。,266-297 (2021) ·Zbl 1475.68386号
[36] 王,C。;黄,Y。;丁·W。;Cao,Z.,模糊粗糙自我信息测度的属性约简。信息科学。,68-86 (2021) ·Zbl 1474.68367号
[37] Li博士。;张,H。;Li,T.等人。;Bouras,A。;Yu,X。;Wang,T.,使用模糊c-均值和模糊量化粗糙集的混合缺失值插补算法。IEEE传输。模糊系统。,1396-1408 (2021)
[38] 胡,Q。;Yu,D。;谢,Z。;Liu,J.,模糊概率近似空间及其信息测度。IEEE传输。模糊系统。,191-201 (2006)
[39] 曲,Y。;沈(音)。;新墨西哥州帕塔兰。;尚,C。;Wu,W.,基于模糊相似性的最近邻分类作为其模糊粗糙相似性的替代方法。Int.J.大致原因。,184-195 (2013) ·Zbl 1266.68161号
[40] J.也是。;阿卜杜拉(A.R.Abdullah)。;Mohd,S.a.N.,一种新的联合进化二进制粒子群优化算法,具有用于特征选择的多重惯性权重策略。信息学,21(2019)
[41] Jensen,R。;Mac,P.N.,基于最近邻的模糊粗糙特征选择,35-46
[42] Fleuret,F.,带条件互信息的快速二进制特征选择。J.马赫。学习。研究(2004)·Zbl 1222.68200号
[43] 塞奇迪斯,K。;帕潘杰卢,K。;诺盖拉,S。;韦瑟尔,J。;Brown,G.,关于存在特征相关性时特征选择的稳定性,327-342
[44] J.Kennedy,R.C.Eberhart,粒子群算法的离散二进制版本。1997年IEEE系统、人和控制论国际会议,1997年第5卷,第4104-8页,第5卷。10.1109/ICSMC.1997.637339。
[45] 黄,C.-L。;Wang,C.-J.,支持向量机的基于遗传算法的特征选择和参数优化。专家系统。申请。,231-240 (2006)
[46] Rashedi,E。;Nezamabadi-Pour,H。;Saryazdi,S.,BGSA:二进制引力搜索算法。自然计算。,727-745 (2010) ·Zbl 1211.68140号
[47] J.也是。;阿卜杜拉(A.R.Abdullah)。;Mohd Saad,N。;Mohd Ali,N。;Tee,W.,一种新的竞争性二元灰狼优化器,用于解决肌电信号分类中的特征选择问题。计算机,58(2018)
[48] Jensen,R。;Mac,P.N.,《走向可扩展的模糊粗糙特征选择》。信息科学。,1-15 (2015) ·Zbl 1390.68534号
[49] 苗,X。;高,Y。;陈,G。;郑,B。;Cui,H.,处理不完全k最近邻搜索。IEEE传输。模糊系统。(2016)
[50] 斯佩塞,J.L。;米勒,M.E。;图泽,J。;Ip,E.,分类预测建模随机森林变量选择方法的比较。专家系统。申请。,93-101 (2019)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。