×

通过贝叶斯网络分类器将分类变量转换为数值变量,用于二进制分类。 (英语) Zbl 1464.62116号

摘要:许多模式分类算法,如支持向量机(SVM)、多层感知器(MLP)和K-最近邻(KNN),都要求数据由纯数值变量组成。然而,许多现实世界的数据都由分类变量和数值变量组成。本文提出了一种将分类变量和数值变量的混合数据转换为纯数值变量数据的有效方法,用于二元分类。由于该方法基于贝叶斯网络分类器(BNC)的学习理论,因此计算效率高,对噪声和数据丢失具有鲁棒性。此外,该方法有望提取足够的信息来估计最小错误率(MER)分类器。在人工数据集和真实世界数据集上进行模拟,以证明当每个分类变量中的值的数量很大并且BNC准确地对数据建模时,所建议的方法的竞争力。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bishop,C.M.,《模式识别的神经网络》(1995),牛津大学出版社
[2] Burges,C.J.C.,模式识别、数据挖掘和知识发现支持向量机教程,121-167(1998)
[4] 沙佩尔,O。;哈夫纳,P。;Vapnik,V.N.,基于直方图的图像分类支持向量机,IEEE神经网络汇刊,10,5,1055-1064(1999)
[5] 北卡罗来纳州克里斯蒂亚尼尼。;Shawe Taylor,J.,《支持向量机导论》(2000),剑桥大学出版社
[6] Dietterich,T.G.,《比较监督分类学习算法的近似统计检验》,《神经Compuation》,第10期,1895-1923(1998)
[7] 杜达,R.O。;Hart,体育。;斯托克·D·G,《模式分类》(2001),约翰·威利父子公司:约翰·威立父子公司纽约·Zbl 0968.68140号
[8] 弗里德曼,N。;盖革,D。;Goldszmidt,M.,贝叶斯网络分类器,机器学习,29,131-163(1997)·Zbl 0892.68077号
[9] Gärtner,T.,结构化数据内核调查,SIGKDD探索通讯,5,1,49-58(2003)
[11] Haykin,S.,《神经网络:综合基金会》(1999年),Prentice Hall·Zbl 0934.68076号
[14] Jaakkola,T.S。;Haussler,D.,《利用区分分类器中的生成模型》,(M.J.,Kearns;S.A.,Solla;D.A.,Cohn,《神经信息处理系统的进展》,第11卷(1999),麻省理工学院出版社),487-493
[16] 约翰逊,N.L。;科茨,S。;Balakrishnan,N.,《离散多元分布》(1997),John Wiley&Sons:John Willey&Sons New York·Zbl 0868.62048号
[17] Lam,W。;Bacchus,F.,《学习贝叶斯信念网络:基于MDL原理的方法》,计算智能,10269-294(1992)
[19] Lodhi,H。;桑德斯,C。;肖-泰勒,J。;北卡罗来纳州克里斯蒂亚尼尼。;Watkins,C.,使用字符串内核进行文本分类,《机器学习研究杂志》,2419-444(2002)·Zbl 1013.68176号
[23] O Colot,C。;Olivier,P.C。;El-Matouat,A.,《概率定律中的信息标准和突变》(Signal Processing VII:Théorie and Applications,1994),1855-1858
[24] 帕夫利迪斯,P。;韦斯顿,J。;蔡,J。;Noble,W.S.,从多种数据类型学习基因功能分类,计算生物学杂志,9,2,401-411(2002)
[25] Pearl,J.,《智能系统中的概率推理:合理推理网络》(1988),摩根·考夫曼
[26] Schölkopf,B。;Smola,A.J.,《用内核学习》(2002),麻省理工学院出版社
[27] 肖-泰勒,J。;Cristianini,N.,《模式分析的核心方法》(2004),剑桥大学出版社
[28] Tsuda,K。;Kin,T。;Asai,K.,生物序列的边缘化核,生物信息学,18,1,268-275(2002)
[29] Vapnik,V.,《统计学习理论的本质》(1995),Springer-Verlag:Springer-Verlag纽约·Zbl 0833.62008号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。