×

从可辨性的角度进行有效的属性约简。 (英语) Zbl 1390.68556号

摘要:属性约简是模式识别、机器学习和数据挖掘中的重要预处理步骤。粗糙集理论作为一种有效的属性约简方法,提供了一种有用的形式化方法。它保留了原始数据集的识别能力;因此,属性约简在粗糙集理论中得到了广泛的研究。然而,现有属性约简算法的效率低下限制了粗糙集的应用。本文首先分析了现有属性约简算法的局限性。然后,基于可区分性,提出了一种新的属性质量度量方法,称为相对可区分度。理论分析表明,该方法可以找到相对可有可无的属性,并在属性选择过程中去除相对可有可无的属性和冗余对象后保持不变。该属性可用于减少搜索空间,加快属性约简的启发式过程。因此,从区分的角度提出了一种新的属性约简算法。此外,还导出了代数视图、信息视图和区分视图的约简定义之间的关系。发现不一致决策表中粗糙集理论的这些观点之间存在一些非等价关系。在UCI数据集上进行了一组数值实验。实验结果表明,该算法是有效的,适用于大规模数据集的情况。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
68层37 人工智能背景下的不确定性推理

软件:

FSMRDE公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 胡,Q。;佩德里茨,W。;Yu,D。;Lang,J.,基于邻域决策误差最小化选择离散和连续特征,IEEE系统。人类网络。B网络。,40137-150(2010年)
[2] Pedrycz,W.,《颗粒计算:智能系统的分析和设计》(2013),CRC出版社/弗朗西斯·泰勒:CRC出版社/Fran西斯·泰勒-博卡拉顿
[3] 孟,Z。;Shi,Z.,不一致不完备决策系统中基于扩展粗糙集的属性约简,信息科学。,20444-69(2012年)
[4] Pawlak,Z.,《粗糙集:关于数据推理的理论方面》(Rough Sets:Theory Aspects of Reasoning About Data)(1991年),Kluwer Academic Publisher:Kluwer-Academical Publisher London·Zbl 0758.68054号
[5] 胡,Q。;刘杰。;Yu,D.,基于粒度和近似的混合特征选择,基于知识的系统。,21, 294-304 (2008)
[6] 钱,Y。;梁,J。;佩德里茨,W。;Dang,C.Y.,粗糙集框架中不完全数据属性约简的高效加速器,模式识别。,44, 1658-1670 (2011) ·Zbl 1218.68152号
[7] Swiniarski,R。;Skowron,A.,特征选择和识别中的粗糙集方法,模式识别。莱特。,24, 833-849 (2003) ·Zbl 1053.68093号
[8] 新墨西哥州帕塔兰。;沈琦,探索容差粗糙集的边界区域用于特征选择,模式识别。,42, 655-667 (2009) ·Zbl 1162.68625号
[9] 邓,T。;杨,C。;Wang,X.,从特征选择导出的简化,模式识别。莱特。,33, 1638-1646 (2012)
[10] Pawlak,Z。;Skowron,A.,《粗糙集的基础》,《信息科学》。,177, 3-27 (2007) ·Zbl 1142.68549号
[11] Jensen,R。;Shen,Q.,《语义保持维度约简:粗糙和模糊粗糙方法》,IEEE Trans。知识。数据工程,16,1457-1471(2004)
[12] 钱,J。;Miao,D.Q。;张振华。;李伟,基于不可分辨和可分辨关系的属性约简混合方法,国际期刊近似推理。,52, 212-230 (2011) ·Zbl 1214.68297号
[13] Liang,J.Y。;米·J·R。;魏伟(Wei,W.)。;Wang,F.,基于对象和属性视角的属性约简加速器,基于知识的系统。,44, 90-100 (2013)
[14] Chen,D.G。;张,L。;Zhao,S.Y。;胡庆华。;朱,P.F.,用模糊粗糙集求约简的新算法,IEEE Trans。模糊系统。,20, 385-389 (2012)
[15] Yao,Y.Y。;赵勇,用于构造属性约简的区分矩阵简化,信息科学。,179, 867-882 (2009) ·兹比尔1162.68704
[16] Yang,T。;李,Q。;周斌,《相关家族:覆盖信息系统属性约简的新方法》,信息科学。,228, 175-191 (2013) ·兹比尔1293.68263
[17] 王,G。;Hu,J.,利用覆盖近似空间的扩展进行属性约简,Fund。通知。,115219-232(2012年)·Zbl 1248.68494号
[18] 曾荫权,E.C.C。;Chen,D.G。;Yeung,D.S。;Wang,X.Z。;Lee,J.W.T.,使用模糊粗糙集进行属性约简,IEEE Trans。模糊系统。,16, 1130-1141 (2008)
[19] 斯科伦,A。;Rauszer,C.,《信息系统中的可辨矩阵和函数》,《智能决策支持:粗糙集理论应用和进展手册》,331-362(1992),Kluwer:Kluwer-Dordrecht,荷兰·Zbl 0820.68001号
[20] Miao,D.Q。;Zhao,Y。;Yao,Y.Y。;李海霞。;Xu,F.F.,Pawlak粗糙集模型一致和不一致决策表的相对约简,信息科学。,179, 4140-4150 (2009) ·Zbl 1183.68608号
[21] 朗·G。;李,Q。;Guo,L.,用新的属性依赖函数简化不完备信息系统的区分矩阵,Knowl。信息系统。,37, 611-638 (2013)
[22] Chen,D.G。;Zhao,S.Y。;张,L。;Yang,Y.P。;Zhang,X.,粗糙集属性约简的样本对选择,IEEE Trans。知识。数据工程,242080-2093(2012)
[23] 胡晓东。;Lin,T.Y。;Han,J.C.,基于数据库系统的新粗糙集模型,基金。通知。,59, 135-152 (2004) ·Zbl 1098.68127号
[24] 江,F。;隋,Y。;周磊,基于相对决策熵的特征选择方法,模式识别。,48, 2151-2163 (2015) ·Zbl 1374.68391号
[25] 李,M。;尚,C。;Feng,S。;Fan,J.,《不一致决策表中的快速属性约简》,《信息科学》。,254, 155-180 (2014) ·Zbl 1337.68254号
[26] 李,M。;尚,C.X。;Feng,S.Z。;Fan,J.P.,《不一致决策表中的快速属性约简》,《信息科学》。,254, 155-180 (2014) ·Zbl 1337.68254号
[27] 胡庆华。;谢振新。;Yu,D.R.,基于新型模糊粗糙模型和信息粒化的混合属性约简,模式识别。,40, 3509-3521 (2007) ·Zbl 1129.68073号
[28] 乔丘拉斯,A。;Shen,Q.,用于文本分类的粗糙集辅助关键字约简,应用。Artif公司。智力。,15, 843-873 (2001)
[29] Jensen,R。;Shen,Q.,模糊粗糙属性约简及其在网络分类中的应用,模糊集系统。,141, 469-485 (2004) ·Zbl 1069.68609号
[30] Prasad,P.S.V.S.S。;Rao,C.R.,IQuickReduct:对快速约简算法的改进,(《第十二届粗糙集、模糊集、数据挖掘和粒度计算国际会议论文集》,第十二届粗集、模糊集合、数据挖掘与粒度计算国际会议论文集,印度德里(2009)),152-159
[31] Yamaguchi,D.,考虑数据效率的属性依赖函数,Int.J.近似原因。,51, 89-98 (2009)
[32] 王,G。;Yu,H。;杨丹,基于条件信息熵的决策表约简,中国。J.计算。,25, 759-766 (2002)
[33] Wang,G.Y。;赵,J。;An,J.J。;Wu,Y.,代数观点和信息观点在属性约简中的比较研究,Fund。通知。,68, 289-301 (2005) ·Zbl 1098.68134号
[34] Komorowski,J。;Pawlak,Z。;Polkowski,L。;斯考伦,L.,《粗糙集:教程》(Pal,S.K.;Skowron,a.,《粗糙模糊杂交:决策的新趋势》(1999),施普林格:施普林格新加坡),3-98
[35] 钱,J。;吕,P。;岳,X。;刘,C。;Jing,Z.,使用MapReduce的大数据层次属性约简算法,基于知识的系统。,73, 18-31 (2015)
[36] Qian,Y.H。;Liang,J.Y。;佩德里茨,W。;Dang,C.Y.,《正近似:粗糙集理论中属性约简的加速器》,Artif。智力。,174, 597-618 (2010) ·Zbl 1205.68310号
[37] Susmaga,R.,属性约简中的约简和构造,Fund。通知。,61, 159-181 (2004) ·Zbl 1083.68123号
[38] Zhao,Y。;姚明,Y。;罗凤,基于可分辨性和不可分辨性的数据分析,信息科学。,177, 4959-4976 (2007) ·Zbl 1129.68071号
[39] Teng,S.H。;张,D。;崔,L.,粗糙集的一种新的不确定性度量,(IEEE机器人与仿生国际会议论文集。IEEE机器人和仿生国际大会论文集,桂林,中国(2009)),1189-1193
[40] Teng,S.H。;吴建伟。;Sun,J.X.,一种有效的属性约简算法,(IEEE高级计算机控制国际会议论文集。IEEE高级计算控制国际会议文献集,沈阳,中国(2010)),471-475
[41] 钱,Y。;Liang,J.,粗糙集理论中的组合熵和组合粒化,Int.J.不确定性模糊知识系统。,179-193年(2008年)·Zbl 1154.68520号
[42] 张伟新。;邱,G.F。;Wu,W.Z.,粗糙集理论中属性约简的一般方法,科学。中国信息科学。,50, 188-197 (2007) ·兹比尔1118.68669
[43] 徐志勇。;刘振鹏。;Yang,B.R。;Song,W.,一种复杂度最大的快速属性约简算法{O(|C||U|),O(|C2||U/C|)},Chin。J.计算。,29, 391-399 (2006)
[44] 王国勇,粗糙集的代数观与信息观的关系,Proc。SPIE,5098,103-113(2003)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。