×

通过最优路径森林进行多标签半监督分类。 (英文) Zbl 1441.68202号

摘要:多标签分类包括为给定数据集中的每个样本分配一个或多个类。然而,与所有可能的标签组合数量相比,多标签分类器的项目通常仅限于少量监督样本。该场景支持半监督学习方法,该方法可以通过向训练集中添加非监督样本来应对缺少监督样本的情况。最近,我们提出了一种基于最佳连接性用于单标签分类。在这项工作中,我们将其扩展到多标签分类,并获得了可观的效果。在单标签数据转换后,该方法通过假设来自同一类的样本通过相邻样本序列比来自不同类的样本更紧密地连接,将标签从监督样本传播到非监督样本,与原始方法一样。考虑到该过程在特征空间的高密度区域更可靠,一个额外的步骤从概率密度函数的最大值重传标签,以纠正前一步骤中可能出现的标签错误。最后,反转数据转换以获得每个样本的多个标签。与最先进的方法相比,新方法在多个数据集上进行了实验验证。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)

软件:

ML-KNN公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 阿莫林,W.P。;法尔考,A.X。;Carvalho,M.H.,使用最佳路径森林的半监督模式分类,第27届SIBGRAPI图形、模式和图像会议论文集,111-118(2014)
[2] 阿莫林,W.P。;法尔考,A.X。;Papa,J.P。;Carvalho,M.H.,通过最佳连接改进半监督学习,模式识别。,60,C,72-85(2016)
[3] 阿莫林,W.P。;皮斯托里,H。;佩雷拉,M.C。;Jacinto,M.A.C.,《属性约简在皮革缺陷分类中的应用》,第23届SIBGRAPI图形、图案和图像会议论文集,353-359(2010)
[4] http://dl.acm.org/citation.cfm?id=1248547.1248632。 ·Zbl 1222.68144号
[5] N.Bridle,X.Zhu,p-Voltages:高维数据半监督学习的拉普拉斯正则化,2013,网址:http://pages.cs.wisc.edu/jerryzhu/pub/bridle_zhu_mlg.pdf。
[6] Cappabianco,F.A.M。;法尔考,A.X。;Yasuda,C.L。;Udupa,J.K.,通过最优路径森林聚类进行脑组织MR-图像分割,计算。视觉。图像下划线。,116, 10, 1047-1059 (2012)
[7] Chang,H。;Yeung,D.Y.,稳健的基于路径的光谱聚类,模式识别。,41, 1, 191-203 (2008) ·Zbl 1122.68525号
[8] Chang,X。;聂,F。;Yang,Y。;Huang,H.,《半监督多标签特征选择的凸公式》,《第二十届AAAI人工智能会议论文集》,AAAI’14,1171-1177(2014),美国AAAI出版社
[9] Chang,X。;Yang,Y.,通过挖掘多任务之间的相关性进行半监督特征分析,CoRR(2015)
[10] 克莱尔,A。;King,R.D.,《多标签表型数据中的知识发现》,(Raedt,L.D.;Siebes,A.,《数据挖掘和知识发现原理》(PKDD)。数据挖掘和知识发现原理(PKDD),《计算机科学讲义》,第2168卷(2001年),斯普林格出版社,42-53·兹比尔1009.68730
[11] http://dl.acm.org/citation.cfm?id=1248547.1248609。 ·Zbl 1222.68173号
[12] 科尔曼,T.H。;斯坦因,C。;Rivest,R.L。;Leiserson,C.E.,算法导论(2001),麦格劳-希尔高等教育·Zbl 1047.68161号
[13] 科斯塔,K.A.P。;佩雷拉,洛杉矶。;中村,R.Y.M。;佩雷拉,C.R。;Papa,J.P。;Falcáo,A.X.,《加速最优路径森林聚类的自然启发方法及其在计算机网络入侵检测中的应用》,《信息科学》。,294, 10, 95-108 (2015) ·兹比尔1360.62323
[14] http://www.jmlr.org/papers/volume7/demsar06a/demsar106a.pdf。 ·Zbl 1222.68184号
[15] 法尔考,A.X。;斯托尔菲,J。;de Alencar Lotufo,R.,《图像森林变换:理论、算法和应用》,IEEE Trans。模式分析。机器。智力。,26, 1, 19-29 (2004)
[16] 弗里德曼,M.,《M排名问题重要性的替代测试比较》,《数学年鉴》。统计,11,1,86-92(1940)
[17] http://proceedings.mlr.press/v5/goldberg09a/goldberg 09a.pdf。
[18] 碘缺乏症,A。;特法斯,A。;Pitas,I.,用于多视图半监督动作识别的正则化极端学习机,神经计算,145250-262(2014)
[19] http://dl.acm.org/citation.cfm?id=645528.657646。
[20] Kang,F。;金·R。;Sukthankar,R.,相关标签传播与多标签学习应用,2006 IEEE计算机学会计算机视觉和模式识别会议(CVPR'06),第2卷,1719-1726(2006)
[21] Lomsadze,A。;Ter-Hovhannisyan,V。;切尔诺夫,Y.O。;Borodovsky,M.,通过自训练算法在新型真核生物基因组中进行基因识别,核酸研究,33,20,6494-6506(2005)
[22] Madjarov,G。;科切夫,D。;Gjorgjevikj,D。;Deroski,S.,《多标签学习方法的广泛实验比较》,模式识别。,45, 9, 3084-3104 (2012)
[23] McClosky,D。;查尼亚克,E。;Johnson,M.,《有效的句法分析自学训练》,《计算语言学协会北美分会人类语言技术会议主要会议记录》,HLT-NAACL’06,152-159(2006),计算语言学协会:计算语言学协会,美国宾夕法尼亚州斯特鲁兹堡
[24] Papa,J.P。;Falcáo,A.X.,最优路径森林分类器的新变体,视觉计算进展,第LNCS 5358卷,935-944(2008),Springer
[25] 爸爸,J.P。;法尔考,A.X。;阿尔伯克基,V.H.C。;Tavares,J.M.R.S.,大型数据集的高效监督最优路径森林分类,模式识别。,45, 1, 512-520 (2012)
[26] 爸爸,J.P。;法尔考,A.X。;铃木,C.T.N.,《基于最优路径森林的监督模式分类》,国际成像系统杂志。技术。,19, 2, 120-131 (2009)
[27] Papa,J.P。;费尔南德斯,S.E.N。;Falcáo,A.X.,基于k-连接性的Optimum-path森林:理论和应用,模式识别。莱特。,87, 117-126 (2017)
[28] 佩雷拉,L.A.M。;Papa,J.P。;阿尔梅达,J。;托雷斯,R.d.S。;Amorim,W.P.,《视频内容分类的基于多重标签的最优路径森林》,第26届SIBGRAPI图形、模式和图像会议论文集,334-340(2013)
[29] 罗查,L.M。;Cappabianco,F.A.M。;Falcáo,A.X.,《数据聚类作为图像分析应用中的最优路径森林问题》,国际成像系统杂志。技术。,19, 2, 50-68 (2009)
[30] 罗森博格,C。;Hebert,M。;Schneiderman,H.,对象检测模型的半监督自训练,计算机视觉应用程序,2005年。2005年WACV/MOTIONS。IEEE第七次研讨会,第1卷,29-36(2005)
[31] 吴琼。;Tan,M。;宋,H。;陈,J。;Ng,M.K.,ML-FOREST:多标签分类的多标签树集成方法,IEEE Trans。知识。数据工程,28,10,2665-2680(2016)
[32] 张,M.L。;Zhou,Z.H.,多标签神经网络及其在功能基因组学和文本分类中的应用,IEEE Trans。知识。数据工程,18,10,1338-1351(2006)
[33] 张,M.L。;Zhou,Z.H.,ML-KNN:多标签学习的懒惰学习方法,模式识别。,40, 7, 2038-2048 (2007) ·Zbl 1111.68629号
[34] 张,M.L。;周振华,多标签学习算法综述,IEEE Trans。知识。数据工程,26,1819-1837(2014)
[35] Zhang,Y。;Yeung,D.Y.,使用鲁棒路径相似性的半监督鉴别分析,2008年IEEE计算机视觉和模式识别会议,1-8(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。