×

基于路径评估的层次化多标签分类。 (英语) Zbl 1346.68163号

摘要:多标签分类为每个实例分配多个标签;当标签按预定义结构排序时,该任务称为层次多标签分类(HMC)。HMC有全球和本地方法。全局方法将问题作为一个整体来处理,但往往会在大数据集上爆发。局部方法将问题划分为局部子问题,但通常不利用层次结构的信息。本文针对标签不一定到达叶节点的树结构和直接非循环图(DAG)结构提出HMC问题。训练每个父节点的局部分类器,将父节点的预测作为附加属性,以包括类之间的关系。在分类阶段,对出现概率低的分支进行剪枝,进行非强制叶节点预测。我们的方法从层次结构的根开始评估每个可能的路径,同时考虑预测值和节点的级别;选择得分最高的路径(DAG中的路径)。我们用20个具有树和DAG结构层次结构的数据集和许多最先进的方法测试了我们的方法。事实证明,我们的方法在处理深层和填充层次结构时获得了优异的结果。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿什伯恩,M。;鲍尔,C.A。;Blake,J.A.,《基因本体论:生物学统一的工具》,《自然遗传学》。,25, 25-29 (2000)
[2] Bi,W。;Kwok,J.T.,树和DAG结构层次的多标签分类,(第28届机器学习国际会议(ICML-11)(2011)),17-24
[4] Blockeel,H。;Bruynooghe,M.,分层多分类,(ACM SIGKDD 2002多关系数据挖掘研讨会(MRDM 2002)(2002)),21-35
[5] Blockeel,H。;Schietgat,L。;斯特鲁伊夫,J。;季洛斯基,S。;Clare,A.,《分层多标签分类的决策树:功能基因组学中的一个案例研究》(2006),Springer:Springer Berlin,Heidelberg
[6] Cheng,W。;Hüllermier,E。;Dembczynski,K.J.,通过概率分类器链进行贝叶斯最优多标签分类,(第27届机器学习国际会议(ICML-10)(2010)),279-286
[7] 克莱尔,A。;King,R.D.,预测酿酒酵母中的基因功能,生物信息学,ii42-ii49(2003)
[8] 科斯塔,E.P。;Lorena,A.C。;卡瓦略,A.C.P.L.F。;Freitas,A.A.,《分级分类器性能评估方法综述》,(机器学习评估方法II:AAAI-2007研讨会论文(2007)),1-6
[9] 科斯塔,E.P。;Lorena,A.C。;卡瓦略,A.C.P.L.F。;Freitas,A.A。;Holden,N.,《用决策树比较蛋白质等级分类的几种方法》(《生物信息学和计算生物学进展》(2007),Springer),126-137
[10] 迪米特洛夫斯基,I。;科切夫,D。;Loskovska,S。;Díeroski,S.,《使用树集合进行分层多标签分类的视觉概念检测和图像注释》,(识别信号、语音、图像和视频中的模式(2010),Springer),152-161
[11] 李飞飞;弗格斯,R。;Perona,P.,《从少数训练示例中学习生成性视觉模型:在101个对象类别上测试的增量贝叶斯方法》,计算。视觉。图像理解。,106, 1, 59-70 (2007)
[12] Godbole,S。;Sarawagi,S.,《多标签分类的判别方法》,(《知识发现和数据挖掘进展》(2004),施普林格出版社),22-30
[14] 科勒,D。;Sahami,M.,用很少的单词对文档进行分层分类(1997),斯坦福信息实验室
[16] 拉米雷斯,M。;Sucar,L.E。;Morales,E.F.,树和有向非循环图层次的多标签分类,(概率图形模型(2014)),409-425·Zbl 06386477号
[17] 里德·J。;普法林格,B。;福尔摩斯,G。;Frank,E.,多标签分类分类器链,马赫。学习。,254-269 (2011)
[18] Read,Jesse,可伸缩多标签分类(2010),怀卡托大学,博士论文
[19] 鲁普,A。;Zollner,A。;梅尔,D。;阿尔伯曼,K。;哈尼,J。;莫克雷兹,M。;特科,I。;吉尔德纳,美国。;曼豪普特,G。;Münsterkötter,M。;Mewes,H.W.,The FunCat,全基因组蛋白质系统分类的功能注释方案,核酸研究,32,18,5539-5545(2004)
[20] 西拉,C.N。;Freitas,A.A.,《跨不同应用程序域的分层分类调查》,Data Min.Knowl。发现。,22、31-72(2010年4月)
[21] Sucar,L.E。;比尔扎,C。;莫拉莱斯,E.F。;埃尔南德斯·莱尔,P。;萨拉戈萨,J.H。;Larrañaga,P.,基于贝叶斯网络的链分类器的多标签分类,模式识别。莱特。,41, 14-22 (2014)
[22] Tsoumakas,G。;Katakis,I.,《多标签分类:概述》,《国际数据仓库》。Min.,31-13(2007),ISSN 15483924
[23] Valentini,G.,《真路径规则层次集成》,多分类器系统,第5519卷,232-241(2009),Springer
[24] 瓦伦蒂尼,G。;Cesa-Bianchi,N.,HCGene:支持基因层次分类的软件工具,生物信息学,24,5,729-731(2008)
[25] 瓦伦蒂尼,G。;Re,M.,加权真路径规则:用于基因功能预测的多标签层次算法,(欧洲机器学习会议和数据库中知识发现的原理与实践:第一届从多标签数据学习国际研讨会(2009)),132-145
[26] Vedaldi,A。;Fulkerson,B.,《VLFeat:一个开放的便携式计算机视觉算法库》(2008)
[27] 文斯,C。;斯特鲁伊夫,J。;Schietgat,L。;Džeroski,S。;Blockeel,H.,分层多标签分类的决策树,马赫。学习。,73, 2, 185-214 (2008) ·Zbl 1470.62098号
[28] 萨拉戈萨,J.H。;Sucar,L.E。;莫拉莱斯,E.F。;比尔扎,C。;Larra,P.,用于多维分类的贝叶斯链分类器,(第二十届国际人工智能联合会议,IJCAI 11(2011))
[29] 张,M.L。;周振华,多标签学习算法综述,IEEE Trans。知识。数据工程,26,8,1819-1837(2014)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。