×

连续值离散化的稳定性:粗糙集理论的应用。 (英语) Zbl 1075.68088号

概要:连续值离散化(CVD)是将一组连续值划分为有限数量的区间(类别)的过程。本文介绍了与合成CVD相关的一些稳定性措施。稳定性度量是根据使用Parzen窗口方法找到的单个“划分”区间的一系列估计概率分布构建的。通过这些测量,可以比较CVD替代方法有效划分连续值的能力。粗糙集理论(RST)对这些度量的进一步利用进行了阐述。RST是一种生成规则集的现代方法,能够基于相关特征集(约简)将对象分类为类别。为了避免由连续值特征直接导致的低质量规则(来自RST分析),可以使用CVD方法来减少相关粒度,并允许更高的规则质量。引入的稳定性概念使得能够进一步引入新的度量方法,特别是RST中的约简和规则集稳定性。

MSC公司:

68层37 人工智能背景下的不确定性推理

关键词:

稳定性措施
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾伯哈德,S。;库曼斯,D。;De Vel,O.,RDA分类性能的改进,化学计量学杂志,799-115(1993)
[2] 安,A。;北掸邦。;Chan,C。;Cercone,N。;Ziarko,W.,《发现需水量预测规则:增强的粗糙集方法》,工程应用与人工智能,9,6,645-653(1996)
[3] Bazan,J.G.,《从决策表中提取规律的动态和非动态粗糙集方法的比较》,(Polkowski,L.;Skowron,A.,《知识发现中的粗糙集1:方法论和应用》(1998年),《物理-验证:物理-验证纽约》,451-482
[4] Berka,P。;Bruha,I.,各种离散化程序的经验比较,国际模式识别和人工智能杂志,12,7,1017-1032(1998)
[5] M.Beynon,《β的研究》;M.Beynon,《(β)的研究》
[6] Beynon,M.,《可变精度粗糙集模型中的约简:进一步研究》,《欧洲运筹学杂志》,134592-605(2002)·Zbl 0984.90018号
[7] 贝农,M。;咖喱,B。;Morgan,P.,使用粗糙集理论的分类和规则归纳,专家系统,17,3,136-148(2000)·Zbl 0989.68616号
[8] Beynon,M.J。;Peel,M.J.,变精度粗糙集理论和数据离散化:在企业故障预测中的应用,OMEGA,29561-576(2001)
[9] Breiman,L.,《统计建模:两种文化》,《统计科学》,第16期,199-231页(2001年)·Zbl 1059.62505号
[10] 布朗,C。;Duntsch,L。;Gediga,G.,IRIS reviewed:判别和增强粗糙集数据分析的比较,(Polkowski,L.;Skowron,a.,《知识发现中的粗糙集2:应用、案例研究和软件系统》(1998),Physica-Verlag:Physica-Verlag New York),345-368
[11] Chmielewski,M。;Grzymala-Busse,L.,作为机器学习预处理的连续属性的全局离散化,国际近似推理杂志,15,319-331(1996)·Zbl 0949.68560号
[12] 迪米特拉斯,A.I。;斯洛文斯基,R。;苏斯马加,R。;Zopounidis,C.,《使用粗糙集的商业失败》,《欧洲运筹学杂志》,114263-280(1999)·Zbl 0963.91023号
[13] Dougherty,J。;Kohavi,R。;Sahami,M.,连续特征的监督和非监督离散化,(机器学习:第十二届国际会议论文集(1995),考夫曼:考夫曼-塔霍市,旧金山),194-202
[14] 杜达,R.O。;Hart,P.E.,《模式分类和场景分析》(1973年),威利出版社:威利纽约·Zbl 0277.68056号
[15] 邓奇,I。;Gediga,G.,粗糙集依赖分析的统计评估,国际人机研究杂志,46589-604(1997)
[16] 法耶兹,美国。;Irani,K.,用于分类学习的连续值属性的多间隔离散化,(第十三届国际人工智能联合会议论文集(1993),考夫曼:考夫曼-查贝里,法国),1022-1027
[17] Fischer,R.A.,《分类问题中多重测量的使用》,《年度优生学》,第7期,第179-188页(1936年)
[18] 福里纳,M。;里尔迪,R。;阿玛尼诺,C。;Lanteri,S.,PARVUS:数据探索、分类和关联的可扩展程序包(1988),Elsevier:Elsevier Amsterdam
[19] Grzymala-Busse,J.,LERS-A基于粗糙集的示例学习系统,(Slowinski,R.,《智能决策支持:粗糙集理论应用与进展手册》(1992),Kluwer学术出版社:Kluwer-学术出版社Dordrecht),3-18·Zbl 0820.68001号
[20] Grzymala-Busse,J.W。;Stefanowski,J.,规则归纳的三种离散化方法,国际智能系统杂志,16,29-38(2001)·Zbl 0969.68145号
[21] 赫宾,M。;阀盖,N。;Vautrot,P.,基于概率密度函数估计和影响区骨架的聚类方法,图像处理应用,模式识别快报,17,1141-1150(1996)
[22] 凯恩,G。;Richardson,F。;米德,N.,《等级转换与公司破产预测》,《当代会计研究》,第15、2、145-166页(1998年)
[23] Kerber,R.,ChiMerge:数字属性的离散化,(第九届国际人工智能会议论文集(1992年),人工智能出版社/麻省理工学院出版社),123-128
[24] 科奇科达吉,W.W。;奥洛夫斯基,M。;Marek,V.W.,《关于粗糙集理论的神话》,《ACM通讯》,第41期,第102-103页(1998年)
[25] Kraaijveld,M.A.,在训练和测试数据之间具有改进的鲁棒性偏差的Parzen分类器,模式识别字母,172679-689(1996)
[26] 克鲁辛斯卡,E。;巴比克,A。;斯洛文斯基,R。;Stefanowski,J.,公共医疗数据集上粗糙集方法和概率数据分析技术的比较,(系统理论、知识工程和问题解决,第11卷(1992年),Kluwer学术出版社:Kluwer-学术出版社Dordrecht),251-265·Zbl 0820.68001号
[27] 莫拉琴斯基,I.R。;Sudnik-Ojcikowska,B。;《华沙市中心植物区系描述的粗糙集》,佛罗里达州,253-260(1996)
[28] H.S.Nguyen,粗糙集方法的离散化问题,收录于:L.Polkowski,A.Skowron(编辑),《计算中的粗糙集和当前趋势》,RSCTC’98第一届国际会议论文集,波兰华沙,1998年,第545-552页;H.S.Nguyen,粗糙集方法的离散化问题,收录于:L.Polkowski,A.Skowron(编辑),《计算中的粗糙集和当前趋势》,RSCTC’98第一届国际会议论文集,波兰华沙,1998年,第545-552页
[29] Nguyen,H.S。;Nguyen,S.H.,数据挖掘中的离散化方法,(Polkowski,L.;Skowron,A.,《知识发现中的粗糙集1:方法论和应用》(1998),Physica-Verlag:Physica-Verlag New York),451-482·Zbl 0940.68139号
[30] Parzen,E.,关于概率密度函数模式的估计,《数理统计年鉴》,331065-1076(1962)·Zbl 0116.11302号
[31] Pawlak,Z.,《粗糙集》,《国际信息与计算机科学杂志》,11,5,341-356(1982)·Zbl 0501.68053号
[32] Pawlak,Z.,《粗糙集——关于数据推理的理论方面》(Rough Sets-Theory Aspects of Reasoning About Data)(1991年),Kluwer Academic Publishers:Kluwer-Academical Publishers London·Zbl 0758.68054号
[33] Silverman,B.W.,《统计和数据分析的密度估计》(1986),查普曼和霍尔:查普曼和霍尔伦敦·Zbl 0617.62042号
[34] 斯科伦,A。;Rauszer,C.,《信息系统中的可辨矩阵和函数》,(Slowinski,R.,《智能决策支持-粗糙集理论的应用和进展手册》(1992),Kluwer学术出版社:Kluwer-学术出版社Dordrecht),331-362·Zbl 0820.68001号
[35] 斯洛文斯基,R。;Zopounidis,C。;Dimitras,A.I.,用粗糙集方法预测希腊的公司收购,《欧洲运筹学杂志》,100,1-15(1997)·Zbl 0953.90538号
[36] J.Stefanowski,在发现强决策规则时处理连续属性,收录于:L.Polkowski,A.Skowron(编辑),《计算中的粗糙集和当前趋势》,1998年第一届国际会议论文集,波兰华沙,第394-401页;J.Stefanowski,在发现强决策规则时处理连续属性,收录于:L.Polkowski,A.Skowron(编辑),《计算中的粗糙集和当前趋势》,1998年第一届国际会议论文集,波兰华沙,第394-401页
[37] L.Sun,W.Gao,基于相容粗糙集和遗传算法的连续属性离散化,收录于:N.Zhong,A.Skowron,S.Ohsuga(编辑),《粗糙集、数据挖掘和粒度软件计算的新方向》,第七届国际研讨会论文集,RSFDGrC’99,日本山口,1999年,第188-192页;L.Sun,W.Gao,基于相容粗糙集和遗传算法的连续属性离散化,收录于:N.Zhong,A.Skowron,S.Ohsuga(编辑),《粗糙集、数据挖掘和粒度软件计算的新方向》,第七届国际研讨会论文集,RSFDGrC’99,日本山口市,1999年,第188-192页
[38] 汤普森,J.R。;Tapia,R.A.,《非参数函数估计、建模和仿真》(1990年),工业和应用数学学会:费城工业与应用数学学会·Zbl 0709.62038号
[39] Vapnik,V.N.,《统计学习理论》(1998),威利出版社:威利纽约·Zbl 0934.62009号
[40] Wakulicz-Deja,A。;Paszek,P.,应用粗糙集方法诊断进展性脑病,国际医学信息学杂志,46,119-127(1997)
[41] Ziarko,W.,可变精度粗糙集模型,《计算机与系统科学杂志》,46,39-59(1993)·Zbl 0764.68162号
[42] Ziarko,W.,可变精度粗糙集框架下的不确定性信息分析,计算与决策科学基础,18,381-396(1993)·兹比尔0806.68029
[43] W.Ziarko,Y.Yao(编辑),《粗糙集与当前计算趋势》,第二届国际会议论文集,2000年,加拿大班夫;W.Ziarko,Y.Yao(编辑),《粗糙集与当前计算趋势》,第二届国际会议论文集,2000年,加拿大班夫
[44] 齐格德,D.A。;拉巴塞达,S。;Rakotomala,S.,FUSINTER:连续属性离散化方法,国际不确定性、模糊性和基于知识的系统杂志,6307-326(1998)·Zbl 1087.68629号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。