×

一种用于图像分类和视频动作识别的语义树方法。 (英语) Zbl 1404.68131号

摘要:多任务学习(MTL)方法考虑同时学习一个问题和其他相关问题。MTL的主要挑战是如何选择性地筛选共享信息。每个任务的信息必须与其他任务相关,但当在两个不相关的任务之间共享信息时,会降低两个任务的性能。确保相关问题与主要任务相关是MTL中最重要的一点。本文将设计一种新的算法,通过使用每个任务中特征的语义空间来计算任务之间的关系程度,然后构建语义树以获得更好的学习性能。我们在该算法下提出了一种MTL方法,取得了良好的实验性能。我们对图像分类和视频动作识别进行了实验,并与最先进的MTL方法进行了比较。我们的方法在四个公共数据集中表现良好。

MSC公司:

68吨10 模式识别、语音识别
62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
68T45型 机器视觉和场景理解

软件:

Vlfeat公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Kumar,A.和Daume,H.III,《多任务学习中的学习任务分组和重叠》。第29届国际会议机器学习,第2卷(Omnipress,苏格兰爱丁堡,2012),第1383-1390页。
[2] Vedaldi,A.和Fulkerson,B.,Vlfeat:一个开放和可移植的计算机视觉算法库,发表在Proc。《国际多媒体会议》(ACM,意大利费伦泽,2010),第1469-1472页。
[3] Andreas,A.、Theodoros,E.和Massimiliano,P.,Convex多任务特征学习,马赫。学习。73(3)(2008)243-272·Zbl 1470.68073号
[4] Agarwal,A.、Gerber,S.和Daume,H.,《使用流形正则化学习多任务》,收录于Proc。神经信息处理系统23和24年度会议进展(Curran Associates Inc.,美国纽约州,2010年)。
[5] Lowe,D.G.,从局部尺度不变特征识别物体,收录于Proc。IEEE Int.Conf.Computer Vision,第2卷(IEEE,希腊科基拉,1999年),第1150-1157页。
[6] Perronnin,F.,Liu,Y.,Sánchez,J.和Poirier,H.,使用压缩fisher向量进行大尺度图像检索,收录于Proc。IEEE Conf.计算机视觉和模式识别(CVPR)(IEEE,美国加利福尼亚州旧金山,2010),第3384-3391页。
[7] Guo,W.和Chen,G.,基于时空特征的多任务学习的人类行为识别,《信息科学》320(2015)418-428。
[8] He,J.和Lawrence,R.,《多任务多视图学习的基于图形的框架》,收录于Proc。第28届国际会议机器学习(ICML-11)(爱思唯尔,华盛顿州贝尔维尤,美国,2011年),第25-32页。
[9] Ivan,L.,《关于时空兴趣点》,《国际计算杂志》。见64(2005)107-123。
[10] 李,L.-J.和李,F.-F.,什么,在哪里,谁?在Proc中,通过场景和对象识别对事件进行分类。IEEE Int.Conf.Computer Vision(IEEE,巴西里约热内卢,2007),第1-8页。
[11] Chen,J.、Zhou,J.和Ye,J.,《将低阶结构和组解析结构结合起来以实现稳健的多任务学习》,收录于Proc。ACM SIGKDD Int.Conf.Knowledge Discovery and Data Mining(ACM,美国加利福尼亚州圣地亚哥,2011),第42-50页。
[12] Zhou,J.、Chen,J.和Ye,J.,《通过交替结构优化进行聚类多任务学习》。《神经信息处理系统24和25年度会议进展》(Curran Associates Inc.,西班牙格拉纳达,2011年),第702-710页。
[13] 周,J.,刘,J.、纳拉扬,V.A.和叶,J.《通过融合稀疏群套索模拟疾病进展》,发表于《Proc。ACM SIGKDD Int.Conf.Knowledge Discovery and Data Mining(ACM,中国北京,2012),第1095-1103页。
[14] Liu,J.、Luo,J.和Shah,M.,《从野外视频中识别真实动作》,摘自《Proc。IEEE Computer Society Conf.计算机视觉和模式识别研讨会(IEEE,佛罗里达州迈阿密,美国,2009),第1996-2003页。
[15] Mairal,J.,Bach,F.,Ponce,J.和Sapiro,G.,稀疏编码的在线词典学习,Proc。第26届年度国际会议机器学习(ACM,加拿大魁北克省蒙特利尔,2009年),第689-696页·Zbl 1242.62087号
[16] Yu,K.,Tresp,V.和Schwaighofer,A.,从多个任务中学习高斯过程,ICML 2005 Proc。第22届国际计算机学习会议(ACM,德国波恩,2005),第1017-1024页。
[17] Liu,A.A.、Xu,N.、Su,Y.T.、Lin,H.、Hao,T.和Yang,Z.X.,通过正则化多任务学习进行单/多视角人类行为识别,神经计算151(2015)544-553。
[18] Dollar,P.、Rabaud,V.、Cottrell,G.和Belongie,S.,稀疏时空特征的行为识别,Proc。第二届IEEE国际研讨会,跟踪和监视的视觉监视和性能评估(IEEE,中国北京,2005),第65-72页。
[19] Gu,Q.和Zhou,J.,学习用于多任务聚类和转导转移分类的共享子空间,见Proc。IEEE国际会议数据挖掘(IEEE,佛罗里达州迈阿密,美国,2009),第159-168页。
[20] Lazebnik,S.、Schmid,C.和Ponce,J.,《超越特征袋:用于识别自然场景类别的空间金字塔匹配》,收录于Proc。IEEE计算机学会会议,计算机视觉和模式识别(CVPR)(IEEE,美国纽约,2006),第2169-2178页。
[21] 唐义勇,陶义明,林永明,基于分形行为的特征提取新方法,模式识别。35(5)(2002)1071-1081·Zbl 0997.68117号
[22] 唐义勇,涂立泰,刘杰,李世伟,基于多特征和多级分类的手写体离线识别,IEEE Trans。模式分析。机器。《情报》20(5)(1998)556-561。
[23] Tang,Y.Y.,Yang,L.和Liu,J.,用小波变换表征dirac结构边,IEEE Trans。系统。曼赛本。B Cybern.30(1)(2000)93-109。
[24] Tang,Y.Y.和You,X.,基于新小波函数的带状形状骨架化,IEEE Trans。模式分析。机器。《情报》25(9)(2003)1118-1133。
[25] Evgeniou,T.和Pontil,M.,《规则化多任务学习》,KDD 2004 Proc。第十届ACM SIGKDD国际知识发现和数据挖掘会议(ACM,西雅图,华盛顿州,美国,2004),第109-117页。
[26] 田,J.,张,T.,秦,A.,尚,Z.和唐,Y.Y.,学习用于聚类的分布保持语义子空间,IEEE Trans。图像处理。26(12)(2017)5950-5965。
[27] Schickel-Zuber,V.和Faltings,B.,《使用层次聚类学习推荐系统中使用的概念》,Proc。ACM SIGKDD Int.Conf.Knowledge Discovery and Data Mining(美国加利福尼亚州圣何塞市ACM,2007),第599-608页。
[28] Song,X.、Nie,L.、Zhang,L.,Liu,M.和Chua,T.-S.,通过结构约束多源多任务学习进行兴趣推理,收录于Proc。IJCAI国际人工智能联合会议(AAAI,阿根廷布宜诺斯艾利斯,2015),第2371-2377页。
[29] Zhang,T.,Fang,B.,Tang,Y.Y.,He,G.和Wen,J.,用于人脸识别的保拓扑非负矩阵因式分解,IEEE Trans。图像处理.17(4)(2008)574-584。
[30] Zhang,T.,Fang,B.,Tang,Y.Y.,Shang,Z.和Xu,B.,广义判别分析:矩阵指数方法,IEEE Trans。系统。人类网络。B Cybern.40(1)(2010)186。
[31] Zhang,T.,Fang,B.,Yuan,Y.,Tang,Y.Y.,Shang,Z.,Li,D.和Lang,F.,可变光照下人脸识别的多尺度面部结构表征,模式识别。42(2)(2009)251-258·Zbl 1162.68644号
[32] Zhang,T.,Tang,Y.Y.,Shang,Z.和Liu,X.,使用梯度面在不同光照下进行人脸识别,IEEE Trans。图像处理.18(11)(2009)2599·Zbl 1371.94457号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。