×

成对分类的新变体。 (英语) Zbl 1176.90380号

摘要:成对分类是一种通过将多类问题转换为一系列二进制问题来处理多类问题的技术,每对类一个二进制问题。通常,(K=2)类分类规则比(K>2)类更容易学习,只有一个决策边界需要注意。本文提出了一种通过耦合二进制分类器生成的概率估计来获得多类分类问题的类成员概率估计的新方法。使用的分类器包括线性贝叶斯正规分类器、基于Parzen密度的分类器、朴素贝叶斯分类器、二叉决策树分类器和随机神经网络分类器。在一些实际数据集上检验了新的成对分类器的准确性。分类错误通过10倍交叉验证技术的分层版本进行估计,即将训练示例划分为10个大小相等的块,其类分布与原始集相似。对每个数据集重复验证技术10次。

MSC公司:

90B90型 运筹学中的案例研究
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Allwein,E.L。;夏皮雷,R.E。;Singer,Y.,《将多类简化为二进制:边缘分类器的统一方法》,《机器学习研究杂志》,1113-141(2000)·Zbl 1013.68175号
[2] Błaszczynski,J。;Greco,S。;Słowiáski,R.,《多标准分类——基于支配权的决策规则应用的新方案》,《欧洲运筹学杂志》,1811030-1044(2007)·Zbl 1121.90073号
[3] Dietterich,T.G。;Bakiri,G.,通过纠错输出代码解决多类学习问题,人工智能研究杂志,263-286(1995)·Zbl 0900.68358号
[4] Friedman,M.,《使用秩来避免方差分析中隐含的正态假设》,《美国统计协会杂志》,32,675-701(1937)
[5] 弗里德曼,M.,A更正。使用秩来避免方差分析中隐含的正态假设,《美国统计协会杂志》,34,109(1939)
[6] 弗里德曼,M.,《M排名问题重要性的替代测试比较》,《数理统计年鉴》,第1186-92页(1940年)
[7] 弗里德曼,J.H.,1996年。多光子分类的另一种方法。斯坦福大学技术报告。;弗里德曼,J.H.,1996年。多光子分类的另一种方法。斯坦福大学技术报告。
[8] Hastie,T.,Tibshirani,R.,1996年。按成对耦合分类。斯坦福大学和多伦多大学技术报告。;Hastie,T.,Tibshirani,R.,1996年。按成对耦合分类。斯坦福大学和多伦多大学技术报告·Zbl 0932.62071号
[9] 哈斯蒂,T。;Tibshirani,R.,《两两耦合分类》,《统计年鉴》,26451-471(1998)·Zbl 0932.62071号
[10] 霍兰德,M。;Wolfe,D.A.,非参数统计方法(1973),Wiley·Zbl 0277.62030号
[11] 伊曼·R·L。;Davenport,J.M.,《弗里德曼统计临界区域的近似》,《统计学理论与方法通讯》,A9,571-595(1980)·Zbl 0451.62061号
[12] Jassem,W.,《波兰语语音平衡和频率加权词表》,《语音和语言技术》,171-99(1997)
[13] Jelonek,J.、Stefanowski,J.,1998年。用(n^2)解决多类学习问题的实验;Jelonek,J.、Stefanowski,J.,1998年。用(n^2)解决多类学习问题的实验
[14] 约翰逊·R·A。;Wichern,D.W.,《应用多元统计分析》(1982),普伦蒂斯·霍尔公司:普伦蒂斯霍尔公司,新泽西州恩格尔伍德克利夫斯·Zbl 0499.62002号
[15] 卡隆斯基,M.,1973年。关于多元正态总体的簇和伪簇的定义。摘自:《国际统计学会第三十九届会议记录》,奥地利维也纳,第523-528页。;Karoński,M.,1973年。关于多元正态总体的簇和伪簇的定义。摘自:《国际统计学会第三十九届会议记录》,奥地利维也纳,第523-528页。
[16] Kruskal,J.B.,关于图的最短生成子树和旅行推销员问题,美国数学学会学报,748-50(1956)·Zbl 0070.18404号
[17] Merz,C.J.,Murphy,P.M.,1998年。机器学习数据库的UCI存储库。机器可读数据存储库<网址:http://www.ics.uci.edu//mlearn//mlrepository.html>;Merz,C.J.,Murphy,P.M.,1998年。机器学习数据库的UCI存储库。机器可读数据存储库<网址:http://www.ics.uci.edu//mlearn//mlrepository.html>
[18] Mojirsheibani,M.,一些组合分类器的比较研究,统计中的通信-模拟和计算,31,2,245-260(2002)·Zbl 1081.62537号
[19] Moreira,M.,Mayoraz,E.,1997年。关于将多光子分解为二分法。摘自:《第十四届机器学习国际会议论文集》,田纳西州纳什维尔,第219-226页。;Moreira,M.,Mayoraz,E.,1997年。关于将多光子分解为二分法。摘自:《第十四届机器学习国际会议论文集》,田纳西州纳什维尔,第219-226页。
[20] Moreira,M.,Mayoraz,E.,1998年。改进的带修正分类器的两两耦合分类。载:《第十届欧洲机器学习会议论文集》(ECML-98),德国开姆尼茨,第160-171页。;Moreira,M.,Mayoraz,E.,1998年。改进的带修正分类器的两两耦合分类。摘自:《第十届欧洲机器学习会议论文集》(ECML-98),德国Chemnitz,第160-171页。
[21] Nemenyi,P.B.,1963年。无分布多重比较,博士论文。普林斯顿大学。;Nemenyi,P.B.,1963年。无分布多重比较,博士论文。普林斯顿大学。
[22] O.O.Oladunni。;Trafalis,T.B.,《基于规则的两两多分类知识机器和应用》,《欧洲运筹学杂志》,195924-941(2009)·Zbl 1180.90221号
[23] Olafsson,S。;李,X。;Wu,S.,运筹学和数据挖掘,《欧洲运筹学杂志》,1871429-1448(2008)·Zbl 1137.90776号
[24] 价格,D。;Knerr,S。;Personnaz,L。;Dreyfus,G.,具有概率输出的成对神经网络分类器,(神经信息处理系统进展7(NIPS-94)(1995),麻省理工学院出版社),1109-1116
[25] Prim,R.C.,《最短连接网络和一些推广》,贝尔系统技术期刊,361389-1401(1957)
[26] 范德海登,F。;Duin,R.P.W。;de Ridder,D。;税务,D.M.J.,分类。分类、参数估计和状态估计:使用Matlab的工程方法(2004),Wiley·Zbl 1079.62129号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。