×

核心:针对多类分类问题的有监督和无监督训练方法的融合。 (英语) Zbl 1428.68252号

摘要:本文详细描述了一个层次分类器(HC)模型。原始分类问题被分解为几个子问题,并为每个子问题构建弱分类器。子问题由来自整个输出类集合的子集的示例组成。对于这个分类框架来说,生成的子问题必须重叠,即一些单独的类可能属于多个子问题。这种方法可以降低总体风险。为子问题构建的单个分类器很弱,即其准确度仅略高于随机分类器的准确度。本文推广了多类模型的弱性概念。它比目前提出的方法更直观。在所描述的HC模型中,在训练单个节点后,使用聚类算法将其问题分解为多个子问题。它负责选择分类相似的类。本文的主要研究范围是寻找最合适的聚类方法。对一些算法进行了定义和比较。最后,我们将整个HC与其他机器学习方法进行了比较。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bishop C(2006)模式识别和机器学习。柏林施普林格·Zbl 1107.68072号
[2] Byun,H。;Lee,Sw,《支持向量机模式识别应用调查》,《国际J模式识别Artif Intell》,17,3,459-486(2003)·doi:10.1142/S021801403002460
[3] 周,Yy;Shapiro,Lg,一种分层多分类器学习算法,模式分析应用,6150-168(2003)·doi:10.1007/s10044-002-0187-1
[4] Christiani N,Shawe-Taylor J(2000)支持向量机和其他基于核的学习方法。剑桥大学出版社
[5] Ciampi,A。;Lechevallier,Y。;利马,Mc;Marcos,Ag,基于似然比统计的不同亚群的层次聚类:聚类海量数据集的应用,Pattern Anal Appl,11,199-220(2008)·doi:10.1007/s10044-007-0088-4
[6] Dara,R。;卡梅尔,M。;Wanas,N.,《多分类器系统中的数据依赖性》,《模式识别》,421260-1273(2009)·Zbl 1183.68526号 ·doi:10.1016/j.patcog.2008.11.035
[7] Day,W。;Edelsbrunner,H.,凝聚层次聚类方法的高效算法,J Classif,1,1,7-24(1984)·Zbl 0563.62034号 ·doi:10.1007/BF01890115
[8] Dietterich,T。;Bakiri,G.,《通过纠错输出代码解决多类学习问题》,J Artif Intell Res,2263-286(1995)·兹比尔0900.68358
[9] 艾布尔,G。;Pfeiffer,Kp,弱分类器的多类增强,J Mach Learn,6189-210(2005)·兹比尔1222.68188
[10] 弗伦德,Y。;Schapire,Re,《在线学习的决策理论推广及其在助推中的应用》,《计算系统科学杂志》,55,119-139(1997)·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504
[11] Fritzke B(1995)一个成长的神经气体网络学习拓扑。收录:Tesauro G、Touretzky DS、Leen TK(eds)《神经信息处理系统进展》,第7卷。麻省理工学院出版社,剑桥,第625-632页
[12] Fritzke B(1997)可以遵循非平稳分布的自组织网络。摘自:Gerstner W、Germond A、Hasler M、Nicoud JD(eds)人工神经网络国际会议。LNCS,第1327卷。纽约州施普林格,第613-618页
[13] Hastie T、Tibshirani R、Friedman J(2001)《统计学习的要素》。施普林格,纽约·Zbl 0973.62007号
[14] Haykin S(2009)《神经网络:综合基础》。新泽西州普伦蒂斯·霍尔·Zbl 0828.68103号
[15] Jolliffe IT(2002)《主成分分析》,第2版。施普林格,纽约·Zbl 1011.62064号
[16] Kearns M,Valiant L(1989)学习布尔公式和有限自动机的密码限制。摘自:第21届ACM计算理论年会论文集。纽约ACM出版社,第434-444页·Zbl 0807.68073号
[17] 库马尔,S。;Ghosh,J。;Crawford,M.,用于高光谱数据分析的多分类器层次融合,模式分析应用,5,210-220(2005)·Zbl 1024.68094号 ·doi:10.1007/s100440200019
[18] Newman DJ、Hettich S、Blake CL(1998)UCI机器学习数据库库。http://www.ics.uci.edu/mlearn/MLRepository.html
[19] Podolak,It,具有重叠类组的层次分类器,Expert Syst Appl,34,1,673-682(2008)·doi:10.1016/j.eswa.2006.10.007
[20] Podolak IT,Bartocha K(2009),具有不断增长的神经气体聚类的层次分类器。收录:Kolehmainen M,Toivanen P,Beliczynski B(eds)自适应和自然计算算法。LNCS,第5495卷。纽约州施普林格,第283-292页
[21] Podolak IT,Roman A(2009)分类理论中的弱点新概念。收录:Kurzynski M,Wozniak M(编辑)计算机识别系统,第3卷。《智能和软计算的进展》,第57期。纽约州施普林格,第239-245页
[22] Podolak IT,Roman A(2010)层次分类器的理论基础和实际结果。计算智能(已提交)
[23] Rokach,L.,分类任务的分解方法:元分解框架,模式分析应用,9257-271(2006)·doi:10.1007/s10044-006-0041-y
[24] Schapire,Re,《弱可学习性的力量》,《马赫学习》,第5期,第197-227页(1990年)
[25] 夏皮雷,Re;Singer,Y.,《使用可信度预测改进增压算法》,《马赫数学习》,37,3,297-336(1999)·Zbl 0945.68194号 ·doi:10.1023/A:1007614523901
[26] Setiono,R.,使用交叉验证构建前馈神经网络,神经计算,132865-2877(2001)·Zbl 0986.68874号 ·doi:10.1162/089976601317098565
[27] Tresp V(2001)委员会机器。收录:神经网络信号处理手册。博卡拉顿CRC出版社
[28] Xi D,Podolak IT,Lee SW(2002)人脸成分提取和支持向量机人脸识别。收录:第五届IEEE自动人脸和手势识别国际会议论文集。IEEE计算机学会,第76-81页
[29] Zwitter M,Sokolic M(1988)主要肿瘤数据集,来自卢布尔雅那肿瘤研究所大学医学中心的医学数据
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。