文件Zbl 1404.68131-zbMATH Open

一种用于图像分类和视频动作识别的语义树方法。（英语） Zbl 1404.68131号

国际小波多分辨率。信息处理。 16，第2号，文章ID 1840008，第16页（2018）.

摘要：多任务学习（MTL）方法考虑同时学习一个问题和其他相关问题。MTL的主要挑战是如何选择性地筛选共享信息。每个任务的信息必须与其他任务相关，但当在两个不相关的任务之间共享信息时，会降低两个任务的性能。确保相关问题与主要任务相关是MTL中最重要的一点。本文将设计一种新的算法，通过使用每个任务中特征的语义空间来计算任务之间的关系程度，然后构建语义树以获得更好的学习性能。我们在该算法下提出了一种MTL方法，取得了良好的实验性能。我们对图像分类和视频动作识别进行了实验，并与最先进的MTL方法进行了比较。我们的方法在四个公共数据集中表现良好。

MSC公司：

68吨10	模式识别、语音识别
62H30型	分类和区分；聚类分析（统计方面）
68T05型	人工智能中的学习和自适应系统
68T45型	机器视觉和场景理解

关键词：

多任务学习;语义关系;图像分类;视频动作识别

软件：

Vlfeat公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Kumar，A.和Daume，H.III，《多任务学习中的学习任务分组和重叠》。第29届国际会议机器学习，第2卷（Omnipress，苏格兰爱丁堡，2012），第1383-1390页。
[2]	Vedaldi，A.和Fulkerson，B.，Vlfeat：一个开放和可移植的计算机视觉算法库，发表在Proc。《国际多媒体会议》（ACM，意大利费伦泽，2010），第1469-1472页。
[3]	Andreas，A.、Theodoros，E.和Massimiliano，P.，Convex多任务特征学习，马赫。学习。73（3）（2008）243-272·Zbl 1470.68073号
[4]	Agarwal，A.、Gerber，S.和Daume，H.，《使用流形正则化学习多任务》，收录于Proc。神经信息处理系统23和24年度会议进展（Curran Associates Inc.，美国纽约州，2010年）。
[5]	Lowe，D.G.，从局部尺度不变特征识别物体，收录于Proc。IEEE Int.Conf.Computer Vision，第2卷（IEEE，希腊科基拉，1999年），第1150-1157页。
[6]	Perronnin，F.，Liu，Y.，Sánchez，J.和Poirier，H.，使用压缩fisher向量进行大尺度图像检索，收录于Proc。IEEE Conf.计算机视觉和模式识别（CVPR）（IEEE，美国加利福尼亚州旧金山，2010），第3384-3391页。
[7]	Guo，W.和Chen，G.，基于时空特征的多任务学习的人类行为识别，《信息科学》320（2015）418-428。
[8]	He，J.和Lawrence，R.，《多任务多视图学习的基于图形的框架》，收录于Proc。第28届国际会议机器学习（ICML-11）（爱思唯尔，华盛顿州贝尔维尤，美国，2011年），第25-32页。
[9]	Ivan，L.，《关于时空兴趣点》，《国际计算杂志》。见64（2005）107-123。
[10]	李，L.-J.和李，F.-F.，什么，在哪里，谁？在Proc中，通过场景和对象识别对事件进行分类。IEEE Int.Conf.Computer Vision（IEEE，巴西里约热内卢，2007），第1-8页。
[11]	Chen，J.、Zhou，J.和Ye，J.，《将低阶结构和组解析结构结合起来以实现稳健的多任务学习》，收录于Proc。ACM SIGKDD Int.Conf.Knowledge Discovery and Data Mining（ACM，美国加利福尼亚州圣地亚哥，2011），第42-50页。
[12]	Zhou，J.、Chen，J.和Ye，J.，《通过交替结构优化进行聚类多任务学习》。《神经信息处理系统24和25年度会议进展》（Curran Associates Inc.，西班牙格拉纳达，2011年），第702-710页。
[13]	周，J.，刘，J.、纳拉扬，V.A.和叶，J.《通过融合稀疏群套索模拟疾病进展》，发表于《Proc。ACM SIGKDD Int.Conf.Knowledge Discovery and Data Mining（ACM，中国北京，2012），第1095-1103页。
[14]	Liu，J.、Luo，J.和Shah，M.，《从野外视频中识别真实动作》，摘自《Proc。IEEE Computer Society Conf.计算机视觉和模式识别研讨会（IEEE，佛罗里达州迈阿密，美国，2009），第1996-2003页。
[15]	Mairal，J.，Bach，F.，Ponce，J.和Sapiro，G.，稀疏编码的在线词典学习，Proc。第26届年度国际会议机器学习（ACM，加拿大魁北克省蒙特利尔，2009年），第689-696页·Zbl 1242.62087号
[16]	Yu，K.，Tresp，V.和Schwaighofer，A.，从多个任务中学习高斯过程，ICML 2005 Proc。第22届国际计算机学习会议（ACM，德国波恩，2005），第1017-1024页。
[17]	Liu，A.A.、Xu，N.、Su，Y.T.、Lin，H.、Hao，T.和Yang，Z.X.，通过正则化多任务学习进行单/多视角人类行为识别，神经计算151（2015）544-553。
[18]	Dollar，P.、Rabaud，V.、Cottrell，G.和Belongie，S.，稀疏时空特征的行为识别，Proc。第二届IEEE国际研讨会，跟踪和监视的视觉监视和性能评估（IEEE，中国北京，2005），第65-72页。
[19]	Gu，Q.和Zhou，J.，学习用于多任务聚类和转导转移分类的共享子空间，见Proc。IEEE国际会议数据挖掘（IEEE，佛罗里达州迈阿密，美国，2009），第159-168页。
[20]	Lazebnik，S.、Schmid，C.和Ponce，J.，《超越特征袋：用于识别自然场景类别的空间金字塔匹配》，收录于Proc。IEEE计算机学会会议，计算机视觉和模式识别（CVPR）（IEEE，美国纽约，2006），第2169-2178页。
[21]	唐义勇，陶义明，林永明，基于分形行为的特征提取新方法，模式识别。35（5）（2002）1071-1081·Zbl 0997.68117号
[22]	唐义勇，涂立泰，刘杰，李世伟，基于多特征和多级分类的手写体离线识别，IEEE Trans。模式分析。机器。《情报》20（5）（1998）556-561。
[23]	Tang，Y.Y.，Yang，L.和Liu，J.，用小波变换表征dirac结构边，IEEE Trans。系统。曼赛本。B Cybern.30（1）（2000）93-109。
[24]	Tang，Y.Y.和You，X.，基于新小波函数的带状形状骨架化，IEEE Trans。模式分析。机器。《情报》25（9）（2003）1118-1133。
[25]	Evgeniou，T.和Pontil，M.，《规则化多任务学习》，KDD 2004 Proc。第十届ACM SIGKDD国际知识发现和数据挖掘会议（ACM，西雅图，华盛顿州，美国，2004），第109-117页。
[26]	田，J.，张，T.，秦，A.，尚，Z.和唐，Y.Y.，学习用于聚类的分布保持语义子空间，IEEE Trans。图像处理。26（12）（2017）5950-5965。
[27]	Schickel-Zuber，V.和Faltings，B.，《使用层次聚类学习推荐系统中使用的概念》，Proc。ACM SIGKDD Int.Conf.Knowledge Discovery and Data Mining（美国加利福尼亚州圣何塞市ACM，2007），第599-608页。
[28]	Song，X.、Nie，L.、Zhang，L.，Liu，M.和Chua，T.-S.，通过结构约束多源多任务学习进行兴趣推理，收录于Proc。IJCAI国际人工智能联合会议（AAAI，阿根廷布宜诺斯艾利斯，2015），第2371-2377页。
[29]	Zhang，T.，Fang，B.，Tang，Y.Y.，He，G.和Wen，J.，用于人脸识别的保拓扑非负矩阵因式分解，IEEE Trans。图像处理.17（4）（2008）574-584。
[30]	Zhang，T.，Fang，B.，Tang，Y.Y.，Shang，Z.和Xu，B.，广义判别分析：矩阵指数方法，IEEE Trans。系统。人类网络。B Cybern.40（1）（2010）186。
[31]	Zhang，T.，Fang，B.，Yuan，Y.，Tang，Y.Y.，Shang，Z.，Li，D.和Lang，F.，可变光照下人脸识别的多尺度面部结构表征，模式识别。42（2）（2009）251-258·Zbl 1162.68644号
[32]	Zhang，T.，Tang，Y.Y.，Shang，Z.和Liu，X.，使用梯度面在不同光照下进行人脸识别，IEEE Trans。图像处理.18（11）（2009）2599·Zbl 1371.94457号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

一种用于图像分类和视频动作识别的语义树方法。（英语） Zbl 1404.68131号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

一种用于图像分类和视频动作识别的语义树方法。 （英语） Zbl 1404.68131号

MSC公司：

关键词：

软件：

参考文献：

一种用于图像分类和视频动作识别的语义树方法。（英语） Zbl 1404.68131号