×

伪拉贝尔邻域粗糙集:度量和属性约简。 (英语) Zbl 1452.68236号

摘要:构建邻域关系半径的大小对邻域粗糙集的结果和相应的度量有很大影响。很小的半径通常不会给我们带来任何结果,因为任何两个不同的样本都是相互分离的,尽管这两个样本具有相同的标签。如果半径正在增大,那么具有不同标签的样本可能会落入同一个邻域中,这是一个严重的风险。显然,基于半径的邻域关系没有考虑样本的标签,这将导致不满意的判别。为了填补这一空白,在粗糙集理论中系统地研究了伪拉贝尔策略。首先,提出了伪拉贝尔邻域关系。这种关系不仅可以通过距离来区分样本,还可以通过样本的伪标签来区分样本。因此,可以重新定义邻域粗糙集和一些相应的度量。其次,探讨了基于重新定义度量的属性约简。还设计了启发式算法来计算约简。最后,在UCI数据集上的实验结果告诉我们,我们的伪标签策略优于传统的邻域方法。这主要是因为前者可以显著降低不确定性,提高分类精度。Wilcoxon符号秩检验结果还表明,邻域方法和伪拉贝尔邻域方法与粗糙集理论中的度量和属性约简的观点有很大的不同。

MSC公司:

68层37 人工智能背景下的不确定性推理
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Chen,D.G。;Yang,Y.Y.,基于经典和模糊粗糙集模型组合的异构数据属性约简,IEEE Trans。模糊系统。,22, 1325-1334 (2014)
[2] Chen,H.M。;李,T.R。;蔡,Y。;罗,C。;Fujita,H.,基于优势的邻域粗糙集中的并行属性约简,信息科学。,373, 351-368 (2016) ·Zbl 1429.68280号
[3] Chen,Y.H。;Yao,Y.Y.,基于粒度计算的多视图智能数据分析,(2006 IEEE国际粒度计算会议论文集。2006 IEEE粒度计算国际会议论文集,亚特兰大(2006)),281-286
[4] Dai,J.H。;高S.C。;Zheng,G.J.,由相似关系生成的多个邻域确定的广义粗糙集模型,软计算。,22, 2081-2094 (2018) ·兹比尔1398.68534
[5] Denoeux,T.等人。;Sriboonchitta,S。;Kanjanatarakul,O.,《大差异数据的证据聚类》,Knowl-基于系统。,106179-195(2016)
[6] Dai,J.H。;Wang,W.T。;田海伟。;Liu,L.,基于不完备决策系统新条件熵的属性选择,Knowl-基于系统。,39, 207-213 (2013)
[7] Dai,J.H。;徐,Q。;Wang,W.T。;田海伟,不完备决策系统的条件熵及其在数据挖掘中的应用,国际遗传系统杂志。,41, 713-728 (2012) ·Zbl 1277.68265号
[8] Demšar,J.,多数据集上分类器的统计比较,J.Mach。学习。研究,7,1-30(2006)·Zbl 1222.68184号
[9] Ge,H。;Li,L.S。;Xu,Y。;Yang,C.J.,不一致决策表的快速通用约简算法,国际期刊近似原因。,82, 56-80 (2017) ·Zbl 1404.68162号
[10] 胡庆华。;Liu,J.F。;Yu,D.R.,基于粒化和近似的混合特征选择,Knowl-基于系统。,21294-304(2008年)
[11] 胡庆华。;佩德里茨,W。;Yu,D.R。;Lang,J.,基于邻域决策误差最小化选择离散和连续特征,IEEE Trans。系统。人类网络。,B部分,40,137-150(2010)
[12] 胡庆华。;Yu,D.R。;Liu,J.F。;吴春霞,基于邻域粗糙集的异质特征子集选择,信息科学。,178, 3577-3594 (2008) ·Zbl 1154.68466号
[13] 胡庆华。;Yu,D.R。;谢振新,邻里分类器,专家系统。申请。,34, 866-876 (2008)
[14] 胡庆华。;Yu,D.R。;谢振新。;Liu,J.F.,模糊概率近似空间及其信息测度,IEEE Trans。模糊系统。,16, 549-551 (2006)
[15] 胡庆华。;张,L。;Chen,D.G。;佩德里茨,W。;Yu,D.R.,基于高斯核的模糊粗糙集:模型,不确定性度量和应用,国际期刊近似推理。,51, 453-471 (2010) ·Zbl 1205.68424号
[16] 胡庆华。;张立杰。;周Y.C。;Pedrycz,W.,用多核模糊粗糙集进行大尺度多模态属性约简,IEEE Trans。模糊系统。,26, 226-238 (2018)
[17] 贾海杰。;丁,S.F。;Heng,M。;邢伟强,基于信息熵的邻域属性约简谱聚类,计算机学报。,9, 1316-1324 (2014)
[18] 贾晓云。;Shang,L。;周,B。;姚义勇,粗糙集理论中的广义属性约简,Knowl-基于系统。,91, 204-218 (2016)
[19] Jing,Y.G。;李,T.R。;罗,C。;Horn,S.J。;Wang,G.Y。;Yu,Z.,基于知识粒度的属性约简增量方法,Knowl-基于系统。,104, 24-38 (2016)
[20] Jing,Y.G。;李,T.R。;黄J.F。;张义勇,一种基于知识粒度的属性泛化增量式属性约简方法,国际期刊近似推理。,76, 80-95 (2016) ·Zbl 1385.68047号
[21] Ju,H.R。;李海霞。;杨晓波(Yang,X.B.)。;周,X.Z。;Huang,B.,《成本敏感粗糙集:多粒度方法》,Knowl-基于系统。,123, 137-153 (2017)
[22] Li,W.W。;黄志强。;贾晓云。;蔡晓云,基于邻域的决策理论粗糙集模型,国际期刊近似推理。,69, 1-17 (2016) ·Zbl 1344.68238号
[23] 李建中。;杨晓波(Yang,X.B.)。;宋,X.N。;Li,J.H。;王,P.X。;Yu,D.J.,《邻域属性约简:一种多准则方法》,国际期刊Mach。学习。赛博。(2017)
[24] Liang,J.Y。;Wang,F。;Dang,C.Y。;钱,Y.H.,一种具有多粒度视图的高效粗糙特征选择算法,Int.J.近似推理。,53, 912-926 (2012)
[25] 林,G.P。;Liang,J.Y。;Qian,Y.H.,多粒度近似空间的不确定性测度,国际期刊《不确定性》。模糊知道-基于系统。,23, 443-457 (2015) ·Zbl 1323.68501号
[26] 林永杰。;胡,Q.H。;Liu,J.H。;Chen,J.K。;Duan,J.,基于邻域互信息的多标签特征选择,应用。软计算。,38244-256(2016)
[27] Lin,Y.J。;Li,J.J。;林,P.R。;林,G.P。;Chen,J.K.,通过邻域多粒度融合进行特征选择,Knowl-基于系统。,67, 162-168 (2014)
[28] 刘,D。;Liang,D.C.,《粗糙集理论的增量学习研究:现状与未来》,《国际粗糙集》,《数据分析》。,1, 99-112 (2014)
[29] 刘晓明。;赵博士。;Zhou,J.T。;高,W。;Sun,H.F.,通过基于图形的贝叶斯标签传播进行图像插值,IEEE Trans。图像处理。,23, 1084-1096 (2014) ·Zbl 1374.94229号
[30] 刘,Y。;Huang,W.L。;蒋永乐(Jiang,Y.L.)。;曾志勇,邻域粗糙集模型的快速属性约简算法,信息科学。,271, 65-81 (2014) ·Zbl 1341.68273号
[31] 最小值,F。;Liu,F.L。;Wen,L.Y。;Zhang,Z.H.,通过kNN的三部分成本敏感主动学习,软计算。,10, 1-16 (2017)
[32] Ma,J.M。;Yao,Y.Y.,多粒度模糊近似空间中的粗糙集近似,Fundam。通知。,142, 145-160 (2015) ·Zbl 1346.68201号
[33] 钱,J。;Dang,C.Y。;Yue,X.D。;Zhang,N.,动态粒度下连续三方决策的属性约简,国际期刊近似推理。,85, 196-216 (2017) ·兹伯利1419.68175
[34] Qian,Y.H。;Liang,X.Y。;林,G.P。;郭,Q。;Liang,J.Y.,局部多粒度决策理论粗糙集,Int.J.近似推理。,82, 119-137 (2017) ·Zbl 1404.68172号
[35] Qian,Y.H。;Liang,X.Y。;王,Q。;梁建勇。;刘,B。;斯科沃伦,A。;Yao,Y.Y。;Ma,J.M。;Dang,C.Y.,局部粗糙集:大数据中粗糙数据分析的解决方案,国际期刊近似推理。,97, 38-63 (2018) ·兹比尔1445.68223
[36] Qian,Y.H。;Liang,J.Y。;佩德里茨,W。;Dang,C.Y.,粗糙集框架中不完全数据属性约简的高效加速器,模式识别。,44, 1658-1670 (2011) ·Zbl 1218.68152号
[37] Qian,Y.H。;Liang,J.Y。;佩德里茨,W。;Dang,C.Y.,《正近似:粗糙集理论中属性约简的加速器》,Artif。整数。,174, 597-618 (2010) ·Zbl 1205.68310号
[38] 她,Y.H。;姚永勇,多粒度空间中的粗糙集模型,信息科学。,327, 40-56 (2016) ·Zbl 1390.68685号
[39] Shu,W.H。;Qian,W.B.,粗糙集理论中动态不完备决策系统属性约简的增量方法,数据知识。工程,100116-132(2015)
[40] 苏斯马加,R。;Słowiáski,R.,基于类间和类内信息的粗糙集约简和构造的生成,模糊集系统。,274124-142(2015年)·Zbl 1373.68405号
[41] Tang,J.L。;胡,X。;高海杰。;Li,H.,无监督特征选择的判别分析,(2014年SIAM国际数据挖掘会议论文集。2014年SIAM国际数据挖掘大会论文集,宾夕法尼亚州费城(2014)),938-946
[42] Tang,J.L。;Liu,H.,链接社交媒体数据的无监督特征选择,(第18届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第18届AC M SIGKDD国际知识发现与数据挖掘会议文献集,北京(2012)),904-912
[43] 王,M。;最小值,F。;张振华。;Wu,Y.X.,通过密度聚类进行主动学习,专家系统。申请。,85, 305-317 (2017)
[44] Wang,C.Z。;胡庆华。;Wang,X.Z。;Chen,D.G。;Qian,Y.H。;Dong,Z.,基于邻域判别指数的特征选择,IEEE Trans。神经网络。学习。系统。,29, 2986-2999 (2018)
[45] Wang,C.Z。;邵,M.W。;何,Q。;Qian,Y.H。;Qi,Y.L.,基于模糊邻域粗糙集的特征子集选择,Knowl-基于系统。,111, 173-179 (2016)
[46] Wang,F。;Liang,J.Y。;Qian,Y.H.,《属性约简:维度增量策略》,Knowl-基于系统。,39, 95-108 (2013)
[47] 魏伟(Wei,W.)。;Wang,J.H。;Liang,J.Y。;米,X。;Dang,C.Y.,基于属性约简的压缩决策表,Knowl-基于系统。,86, 261-277 (2015)
[48] Wilson,D.R。;Martinez,T.R.,《改进的异质距离函数》,J.Artif。智力。决议,6,1-34(1997)·Zbl 0894.68118号
[49] Wu,K。;Yap,K.H.,《基于内容的图像检索的模糊支持向量机:伪标签支持向量机框架》,IEEE Compute。智力。Mag.,1,10-16(2006)
[50] 谢晓杰。;Qin,X.L.,动态不完备决策系统的一种新的增量属性约简方法,国际期刊近似推理。,93, 443-462 (2018) ·Zbl 1452.68235号
[51] 徐世平。;王,P.X。;Li,J.H。;杨晓波(Yang,X.B.)。;Chen,X.J.,《属性约简:一种集成策略》,(2017年国际粗糙集联合会议,2017年国际粗集联合会议),奥尔斯廷(2017),362-375
[52] 徐世平。;杨晓波(Yang,X.B.)。;宋,X.N。;Yu,H.L.,通过降低最近邻错误率预测蛋白质结构类,(2015年机器学习和控制论国际会议论文集,2015年广州国际机器学习与控制论会议论文集(2015)),7-13
[53] 徐世平。;杨晓波(Yang,X.B.)。;曾荫权,E.C.C。;Mantey,E.A.,《邻里协作分类器》(2016年机器学习和控制论国际会议论文集,2016年济州岛机器学习与控制论国际大会论文集(2016)),470-476
[54] 徐世平。;杨晓波(Yang,X.B.)。;Yu,H.L。;Yu,D.J。;Yang,J.Y。;Tsang,E.C.C.,带标签特定特征约简的多标签学习,Knowl-基于系统。,104, 52-61 (2016)
[55] 杨晓波(Yang,X.B.)。;陈振华。;窦,H.L。;张,M。;Yang,J.Y.,基于邻域系统的粗糙集:模型和属性约简,国际不确定性杂志。模糊知道-基于系统。,20, 399-419 (2012) ·Zbl 1251.68252号
[56] Yue,X.D。;陈永福。;Miao,D.Q。;钱,J.,稳健分类的三部分邻域覆盖约简,国际期刊近似推理。,83, 371-384 (2017) ·Zbl 1404.68125号
[57] 杨晓波(Yang,X.B.)。;齐,Y。;Yu,H.L。;宋,X.N。;Yang,J.Y.,随着颗粒结构的增加更新多颗粒粗糙近似,Knowl-基于系统。,64, 59-69 (2014)
[58] 杨晓波(Yang,X.B.)。;Qi,Y.S。;宋,X.N。;杨建勇,测试成本敏感性多粒度粗糙集:模型和最小成本选择,信息科学。,250, 184-199 (2013) ·Zbl 1320.68197号
[59] 杨晓波(Yang,X.B.)。;徐世平。;Dou,H.L。;宋,X.N。;Yu,H.L。;Yang,J.Y.,《多粒度粗糙集:基于多集的策略》,国际计算机杂志。智力。系统。,10, 277-292 (2017)
[60] 杨晓波(Yang,X.B.)。;Yao,Y.Y.,用于属性约简的信号群选择器,应用。软计算。,70, 1-11 (2018)
[61] Yu,D.J。;胡,J。;吴晓伟。;Shen,H.B。;陈,J。;唐,Z.M。;杨,J。;Yang,J.Y.,《学习复杂空间中的蛋白质多视图特征》,《氨基酸》,441365-1379(2013)
[62] Yue,X.D。;曹立波。;Miao,D.Q。;Chen,Y.F。;Xu,B.,用于交通瓶颈分析的多视图属性约简模型,Knowl-基于系统。,86, 1-10 (2015)
[63] Zeng,A.P。;李,T.R。;刘,D。;Zhang,J.B。;陈海明,混合信息系统增量特征选择的模糊粗糙集方法,模糊集系统。,258, 39-60 (2015) ·Zbl 1335.68274号
[64] 曾伟荣。;陈晓伟。;Cheng,H.,非平衡多标签学习的伪标签,(《2014年数据科学和高级分析国际会议论文集》,2014年国际数据科学和先进分析会议论文集,上海(2014)),25-31
[65] Zhang,J.B。;李,T.R。;阮,D。;Liu,D.,动态数据挖掘的邻域粗糙集,Int.J.Intell。系统。,27, 317-342 (2012)
[66] 张,X。;梅,C.L。;Chen,D.G。;Li,J.H.,混合数据中的特征选择:一种使用新的基于模糊粗糙集的信息熵的方法,模式识别。,56, 1-15 (2016) ·Zbl 1412.68198号
[67] 赵,H。;最小值,F。;朱伟,基于邻域粗糙集的测试敏感属性约简,(《2011 IEEE粒度计算国际会议论文集》,2011 IEEE国际粒度计算会议论文集,高雄(2011)),802-806
[68] 郑东东。;朱丽英,基于邻域系统的粗糙集不确定性测度,知识-基于系统。,86, 57-65 (2015)
[69] 朱,P。;Wen,Q.Y.,与粗糙集近似相关的信息论度量,信息科学。,212, 33-43 (2012) ·Zbl 1250.68263号
[70] 朱,P.F。;Zhu,W.C。;胡庆华。;张春秋。;Zuo,W.M.,基于子空间聚类的无监督特征选择,模式识别。,66, 364-374 (2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。