×

FRPS:一种模糊粗糙原型选择方法。 (英语) Zbl 1323.68445号

摘要:(k)最近邻(k)NN)方法是一种广泛使用的分类方法,已被证明是非常有效的。通过原型选择(PS)可以提高(k)NN的准确性,也就是说,我们为(k)NN提供了一个简化但增强的数据集,以从中选择其邻居。我们使用模糊粗糙集理论来表示实例的质量,并使用包装器方法来确定要修剪的实例。我们将此方法称为模糊粗糙原型选择(FRPS),并评估其在各种数据集上的有效性。将FRPS与最先进的PS方法进行比较,证实我们的方法在准确性方面表现得非常好。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)

软件:

JStatCom公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 盖,T。;Hart,P.,最近邻模式分类,IEEE信息理论汇刊,13,1,21-27(1967)·兹比尔0154.44505
[2] 杜达,R.O。;哈特,体育。;Stork,D.G.,模式分类(2001),威利·Zbl 0968.68140号
[3] 法雷尔,M.E。;Passamante,A。;Hediger,T.,《噪声数据局部吸引子维数的最近邻估计与关联维数的比较》,《物理评论a(原子、分子和光学物理)》,41,12,6591-6595(1990)
[4] Duin,R.P.W。;Paclík,P.,基于差异的分类器原型选择,模式识别,39,189-208(2006)·Zbl 1080.68646号
[6] Pawlak,Z.,《粗糙集》,《国际计算机信息科学杂志》,11,341-356(1982)·Zbl 0501.68053号
[8] 德刚,C。;W.昌中。;清华,H.,用覆盖粗糙集对一致和不一致覆盖决策系统进行属性约简的新方法,信息科学,177,17,3500-3518(2007)·Zbl 1122.68131号
[9] 杨,X。;杨,J。;吴,C。;Yu,D.,基于优势的粗糙集方法与不完备有序信息系统中的知识约简,信息科学,178,41219-1234(2008)·Zbl 1134.68057号
[10] Zhao,Y。;姚,Y。;Luo,F.,基于可分辨性和不可分辨性的数据分析,信息科学,177,22,4959-4976(2007)·Zbl 1129.68071号
[11] Chouchoulas,A。;沈强,基于粗糙集的文本分类关键词约简,应用人工智能,15,9,843-873(2001)
[12] Swiniarski,R.W。;Skowron,A.,特征选择和识别中的粗糙集方法,模式识别字母,24,6,833-849(2003)·Zbl 1053.68093号
[13] 最小值,F。;Zhu,W.,带误差范围和测试成本的数据属性约简,信息科学,211,48-67(2012)·Zbl 1250.68227号
[14] 孟,Z。;Shi,Z.,不一致不完备决策系统中基于扩展粗糙集的属性约简,信息科学,204,44-69(2012)
[15] 梁,J。;Wang,F。;Dang,C。;Qian,Y.,一种具有多粒度视图的高效粗糙特征选择算法,国际近似推理杂志,53,6,867-926(2012)
[16] 田博士。;曾军,X。;Keane,J.,模式分类中粗糙集特征选择的核心生成近似最小熵离散化,国际近似推理杂志,52,6,659-914(2011)
[17] Dubois,D。;Prade,H.,粗糙模糊集和模糊粗糙集,国际通用系统杂志,191-209(1990)·Zbl 0715.04006号
[18] 科内利斯,C。;Jensen,R。;Hurtado,G。;Slezak,D.,《模糊决策约简的属性选择》,信息科学,180,2,209-224(2010)·Zbl 1183.68604号
[21] 胡,Q。;谢,X。;Yu,D.,基于新型模糊粗糙模型和信息粒化的混合属性约简,模式识别,40,12,3509-3521(2007)·Zbl 1129.68073号
[22] 詹森,R。;Shen,Q.,模糊粗糙属性约简及其在网络分类中的应用,模糊集与系统,141,36469-485(2004)·Zbl 1069.68609号
[23] Jensen,R。;沈庆,模糊粗糙集辅助属性选择,IEEE模糊系统汇刊,15,1,73-89(2007)
[24] Jensen,R。;Shen,Q.,模糊粗糙特征选择的新方法,IEEE模糊系统汇刊,17,4,824-838(2009)
[25] Tsang,E。;陈,D。;杨,D。;王,X。;Lee,J.,使用模糊粗糙集进行属性约简,IEEE模糊系统事务,16,5,1130-1141(2008)
[26] 赵,S。;Tsang,E.,关于模糊粗糙集属性约简中的模糊近似算子,信息科学,178,16,3163-3176(2007)·Zbl 1154.68532号
[27] 陈,D。;张,L。;赵,S。;胡,Q。;Zhu,P.,用模糊粗糙集求约简的新算法,IEEE模糊系统学报,20,2385-389(2012)
[28] 陈,D。;胡,Q。;Yang,Y.,基于高斯核模糊粗糙集的参数化属性约简,信息科学,181,23,5169-5179(2011)·Zbl 1239.68059号
[30] Yager,R.R.,关于多准则决策中的有序加权平均聚合算子,IEEE系统、人与控制论汇刊,18183-190(1988)·Zbl 0637.90057号
[31] 南卡罗来纳州加西亚。;德拉克,J。;卡诺,J。;Herrera,F.,最近邻分类分类和实证研究的原型选择,IEEE模式分析和机器智能汇刊,34,3,417-435(2012)
[32] Wilson,D.L.,使用编辑数据的最近邻规则的渐近性质,IEEE系统、人与控制论汇刊,2,3,408-421(1972)·Zbl 0276.62060号
[33] 服部,K。;Takahashi,M.,模式分类问题中新编辑的k-最近邻规则,模式识别,32521-528(2000)
[34] Tomek,I.,用编辑过的最近邻规则进行的实验,IEEE系统、人与控制论汇刊,6,6,448-452(1976)·Zbl 0332.68081号
[35] 桑切斯,J.S。;平面图,F。;Ferri,F.J.,通过邻近图选择最近邻规则的原型,模式识别字母,18507-513(1997)
[36] Brodley,C.E.,分类器构造的递归自动偏倚选择,机器学习,20,63-94(1995)
[37] Hart,P.E.,《压缩最近邻规则》,IEEE信息理论汇刊,18515-516(1968)
[38] Gates,G.,《简化最近邻规则》,IEEE信息理论汇刊,18,3,431-433(1972)
[39] Angiulli,F.,《大数据集分类的快速最近邻凝聚》,IEEE知识与数据工程汇刊,19,11,1450-1464(2007)
[40] Devi,V.S。;Murty,M.N.,《增量原型集构建技术》,模式识别,35,2,505-513(2002)·Zbl 0997.68113号
[41] 里克尔梅,J。;阿吉拉尔·鲁伊斯,J。;阿吉拉尔·鲁伊斯,J.S。;Toro,M.,用有序投影寻找代表性模式,模式识别,36,4,1009-1018(2003)
[42] Barandela,R。;费里·F·J。;Sanchez,J.S.,最近邻分类的决策边界保持原型选择,国际模式识别与人工智能杂志,19787-806(2005)
[44] Kuncheva,L.I。;Jain,L.C.,最近邻分类器同时编辑和特征选择,模式识别快报,201149-1156(1999)
[45] Kuncheva,L.I.,用遗传算法编辑k近邻规则,模式识别字母,16,8,809-814(1995)
[47] 南卡罗来纳州加西亚。;卡诺,J.R。;Herrera,F.,进化原型选择的模因算法放大方法,模式识别,412693-2709(2008)·Zbl 1149.68411号
[48] 卡诺,J.R。;Herrera,F。;Lozano,M.,使用进化算法作为KDDan实验研究中数据简化的实例选择,IEEE进化计算汇刊,7,6,561-575(2003)
[49] Marchiori,E.,Hit-miss networks with application to instance selection,Journal of Machine Learning Research,997-1017(2008年)·Zbl 1225.68201号
[50] Wilson,D.R。;Martinez,T.R.,基于实例学习算法的简化技术,机器学习,38,257-286(2000)·Zbl 0954.68126号
[51] Marchiori,E.,大裕度实例选择的类条件最近邻,IEEE模式分析和机器智能学报,32,364-370(2010)
[54] 布赖顿,H。;Mellish,C.,基于实例学习算法的实例选择进展,数据挖掘和知识发现,6,2,153-172(2002)·Zbl 1027.68673号
[55] Zadeh,L.A.,模糊集,信息与控制,8,3,338-353(1965)·Zbl 0139.24606号
[57] Sun,B。;龚,Z。;Chen,D.,区间值模糊信息系统的模糊粗糙集理论,信息科学,178,132794-2815(2008)·Zbl 1149.68434号
[58] 王,X。;Tsang,X。;赵,D。;陈,D。;Yean,D.,基于粗糙集技术从模糊样本中学习模糊规则,信息科学,177,20,4493-4514(2007)·Zbl 1129.68069号
[60] Keller,J.M。;格雷,M.R。;Givens,J.R.,《模糊k近邻算法》,IEEE系统、人与控制论汇刊,15580-585(1985)
[61] Radzikowska,A。;Kerre,E.,《模糊粗糙集的比较研究》,《模糊集与系统》,126137-156(2002)·Zbl 1004.03043号
[62] 费尔南德斯,J.A。;Luengo,J。;Derrac,J.等人。;南卡罗来纳州加西亚。;桑切斯,L。;Herrera,F.,Keel数据挖掘软件工具数据集存储库,算法与实验分析框架的集成,多值逻辑与软计算杂志,17,2-3,255-287(2011)
[63] Cohen,J.,标称量表的一致系数,教育和心理测量,20,37-46(1960)
[64] Demsar,J.,多数据集上分类器的统计比较,机器学习研究杂志,7,1-30(2006)·Zbl 1222.68184号
[65] Wilcoxon,F.,《通过排名方法进行个体比较》,《生物计量学公报》,第6期,第80-83页(1945年)
[66] 德拉克,J。;南卡罗来纳州加西亚。;莫利纳,D。;Herrera,F.,《关于使用非参数统计测试作为比较进化和群体智能算法的方法的实用教程》,swarm and evolutionary Computation,1,1,3-18(2011)
[67] 南卡罗来纳州加西亚。;Fernandez,J.A。;Luengo,J。;Herrera,F.,《计算智能和数据挖掘实验设计中多重比较的高级非参数检验》,《信息科学》,180,10,2044-2064(2010)
[68] 南卡罗来纳州加西亚。;费尔南德斯,A。;Luengo,J。;Herrera,F.,基于遗传的机器学习准确性和可解释性的统计技术和性能度量研究,软计算,13959-977(2009)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。