×

连续属性的全局离散化作为机器学习的预处理。 (英语) Zbl 0949.68560号

摘要:现实生活数据通常在数据库中以实数表示。另一方面,大多数归纳学习方法需要少量的属性值。因此,有必要将具有连续属性的输入数据集转换为具有离散属性的输入信息集。限制为单个连续属性的离散化方法将被称为局部方法,同时转换所有连续属性的方法将被称作全局方法。本文提出了一种将局部离散化方法转化为全局离散化方法的方法。提出了一种基于聚类分析的全局离散化方法,并与三种已知的局部方法进行了实验比较。实验包括对十个真实数据集的十倍交叉验证和遗漏方法。

MSC公司:

68T05型 人工智能中的学习和自适应系统

关键词:

归纳学习方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 布雷曼,L。;弗里德曼,J.H。;Olshen,R.A。;Stone,C.J.,《分类和回归树》(1984),沃兹沃斯和布鲁克斯:加利福尼亚州沃兹沃思和布鲁克斯蒙特里·Zbl 0541.62042号
[2] Catlett,J.,《关于将连续属性转变为有序离散属性》(Kodratoff,Y.,《机器学习-EWSL-91》,《欧洲学习工作会议论文集》,波尔图,《机器教学-EWSL-91-欧洲学习工作会论文集》(葡萄牙波尔图,1991年3月)。机器学习—EWSL-91,《欧洲学习工作会议论文集》,波尔图,。机器学习—EWSL-91,《欧洲学习工作会议论文集》,葡萄牙波尔图,1991年3月,《人工智能讲义》(1991),斯普林格·弗拉格出版社:柏林斯普林格尔·弗拉格),164-178·Zbl 0788.68006号
[3] Chan,C.-C。;巴图尔,C。;Srinivasasasn,A.,动态系统基于规则模型中量化区间的确定,(《IEEE系统、人和控制论会议论文集》,《IEEE系统、人和控制论会议论文集》,弗吉尼亚州夏洛茨维尔(13-n-16 O),1719-1723
[4] Chan,C.-C。;Grzymala-Busse,J.W.,《关于属性冗余和学习程序ID3、PRISM和LEM2》(TR-91-14(1991),堪萨斯大学计算机科学系),20
[5] Chiu,D.K.Y。;Wong,A.K.C。;Cheung,B.,《通过分层最大熵离散化和合成进行信息发现》(Piatetsky-Shapiro,G.;Frawley,W.J.,《数据库中的知识发现》(1991),麻省理工学院出版社:麻省理学出版社剑桥),125-140
[6] Everitt,B.,《聚类分析》(1980),海曼教育图书:伦敦海曼教育书籍·Zbl 0507.62060号
[7] 法耶兹,U.M。;Irani,K.B.,《决策树生成中连续值属性的处理》,马赫。学习,887-102(1992)·Zbl 0767.68084号
[8] Grzymala Busse,J.W.,LERS——一个基于粗糙集的例子学习系统,(Slowinski,R.,《粗糙集理论的应用和进展智能决策支持手册》(1992),Kluwer Academic:Kluwer Academic Norwell,Mass),3-18·Zbl 0820.68001号
[9] Hamburg,M.,《决策统计分析》(1983年),Harcourt Brace Jovanovich:Harcourt-Brace Jovarovich纽约
[10] Lenarcik,A。;Piasta,Z.,《连续条件属性下设计算法生成的概率方法》,(《第一届粗糙集国际研讨会论文集:现状与展望》,波兰波兹南基克尔茨,第一届国际粗糙集研讨会论文集(20-n-22 S)·Zbl 0794.62035号
[11] Pao,Y.-H。;Bozma,Y.-H.,用于归纳学习的数字传感器数据量化,(Kowalik,J.S.,《专家系统中的符号和数值计算耦合》(1986),爱思唯尔科学:爱思唯尔科学阿姆斯特丹),69-81
[12] Pawlak,Z.,《粗糙集》,国际出版社。J.计算。并告知。科学。,11, 341-356 (1982) ·Zbl 0501.68053号
[13] Quinlan,J.R.,C4.5:机器学习程序(1993),Morgan Kaufmann:加州Morgan Koufmann-San Mateo
[14] Weiss,S.M。;Kulikowski,C.A.,《学习的计算机系统:来自统计、神经网络、机器学习和专家系统的分类和预测方法》(1990年),Morgan Kaufmann:Morgan Koufmann San Mateo,加利福尼亚州
[15] Wong,A.K.C。;Chiu,D.K.Y.,从不完全混合模式数据合成统计知识,IEEE Trans。模式分析。和马赫数。智力。,9, 796-805 (1987)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。