×

基于核的多视图联合稀疏编码用于图像标注。 (英语) Zbl 1426.94035号

摘要:由于视觉特征和语义概念之间的语义鸿沟,图像自动标注问题仍然是一个具有挑战性的任务。为了减少这种差距,本文提出了一种基于核的多视图联合稀疏编码(KMVJSC)图像标注框架。在KMVJSC中,不同的视觉特征和标签信息被视为不同的视图,并被映射到一个隐式核空间,在该核空间中,原始的非线性可分数据变得线性可分。然后,将所有视图集成到一个多视图联合稀疏编码框架中,以自适应地找到一组最优稀疏表示和判别字典,从而有效地利用不同视图的互补信息。将K-奇异值分解(KSVD)和加速近端梯度(APG)算法扩展到核多视点框架,提出了一种优化算法提出了贪婪标签转移算法。在三个数据集上的对比实验表明,与其他相关方法相比,该方法具有竞争力。

MSC公司:

94A08型 信息与通信理论中的图像处理(压缩、重建等)
62华氏35 多元分析中的图像分析

软件:

标签属性
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 张,D。;伊斯兰,M.M。;吕刚,自动图像标注技术综述,模式识别,45,1,346-362,(2012)·doi:10.1016/j.patcog.2011.05.013
[2] 李,X。;乌里奇奥,T。;Ballan,L。;贝尔蒂尼,M。;斯诺克,C.G.M。;Del Bimbo,A.,Socializing the semantic gap:an compative survey on image tag assignment,refinement,and retrieval,美国计算机学会计算调查,49,1,article 14,(2016)·doi:10.1145/2906152
[3] 卡内罗,G。;Chan,A.B。;莫雷诺,P.J。;Vasconcelos,N.,图像注释和检索语义类的监督学习,IEEE模式分析和机器智能学报,29,3,394-410,(2007)·doi:10.1109/TPAMI.2007.61
[4] Verma,Y。;Jawahar,C.V.,探索SVM在存在混淆标签的情况下用于图像注释,第24届英国机器视觉会议论文集
[5] 张,M.-L。;Wu,L.,LIFT:具有标签特定功能的多标签学习,IEEE模式分析和机器智能汇刊,37,1,107-120,(2015)·doi:10.1109/tpami.2014.2339815
[6] Yakhnenko,O。;Honavar,V.,使用分层dirichlet过程模型注释图像和图像对象,第九届多媒体数据挖掘国际研讨会论文集
[7] Putthividhya,D。;阿提亚斯,H.T。;Nagarajan,S.S.,用于图像注释的主题回归多模式潜在Dirichlet分配,IEEE计算机学会计算机视觉和模式识别会议论文集(CVPR’10),IEEE·doi:10.1109/cvpr.2010.5540000
[8] Makadia,A。;巴甫洛维奇,V。;Kumar,S.,《图像注释的新基线》,第十届欧洲计算机视觉会议论文集
[9] Guillaumin,M。;Mensink,T。;Verbeek,J。;Schmid,C.,TagProp:图像自动标注最近邻模型中的判别度量学习,IEEE第12届计算机视觉国际会议论文集(ICCV'09),IEEE·doi:10.1109/iccv.2009.5459266
[10] Verma,Y。;Jawahar,C.V.,通过传播来自语义邻域的标签进行图像注释,国际计算机视觉杂志,121,1126-148,(2017)·Zbl 1441.68262号 ·doi:10.1007/s11263-016-0927-0
[11] 李,X。;斯诺克,C.G.M。;Worring,M.,通过邻居投票学习社交标签相关性,IEEE多媒体交易,11,7,1310-1322,(2009)·doi:10.1109/TMM.2009.2030598
[12] 陈,Z。;曹,J。;夏,T。;Song,Y。;Zhang,Y。;Li,J.,网络视频重新标记,多媒体工具和应用,55,1,53-82,(2011)·doi:10.1007/s11042-010-0604-1
[13] 王,C。;Yan,S。;张,L。;Zhang,H.-J.,用于自动图像注释的多标签稀疏编码,IEEE第22届计算机视觉和模式识别国际会议论文集(CVPR'09),IEEE·doi:10.10109/cvprw.2009.5206866
[14] 高,S。;恰·L·T。;Tsang,I.W.-H。;Ren,Z.,通过高效多层组稀疏编码实现并行单标签图像分类和注释,IEEE多媒体汇刊,16,3,762-771,(2014)·doi:10.1109/TMM.2014.2299516
[15] 曹,X。;张,H。;郭,X。;刘,S。;Meng,D.,SLED:多标签图像注释的语义标签嵌入词典表示,IEEE图像处理学报,24,9,2746-2759,(2015)·Zbl 1408.94069号 ·doi:10.1109/tip.2015.2428055
[16] 卢,Z。;Han,P。;Wang,L。;Wen,J.-R.,图像应用中视觉内容的语义稀疏记录,IEEE图像处理汇刊,24,1,176-188,(2015)·Zbl 1408.94456号 ·doi:10.1109/TIP.2014.2375641
[17] Jing,X.-Y。;Wu,F。;李,Z。;胡,R。;Zhang,D.,用于图像注释的多标签字典学习,IEEE Transactions on image Processing,25,6,2712-2725,(2016)·Zbl 1408.94290号 ·doi:10.1109/TIP.2016.2549459
[18] 莫兰,S。;Lavrenko,V.,图像注释的稀疏核学习,第四届ACM多媒体检索国际会议论文集(ICMR’14),ACM·doi:10.1145/2578726.2578734
[19] 卡拉耶,M.M。;Idrees,H。;Shah,M.,NMF-KNN:使用加权多视图非负矩阵分解的图像注释,第27届IEEE计算机视觉和模式识别会议论文集(CVPR’14),IEEE·doi:10.1109/cvpr.2014.31
[20] 刘伟。;陶,D。;Cheng,J。;Tang,Y.,用于图像注释的多视图Hessian区分稀疏编码,计算机视觉和图像理解,118,50-60,(2014)·doi:10.1016/j.cviu.2013.03.007
[21] 袁,X.-T。;刘,X。;Yan,S.,多任务联合稀疏表示的视觉分类,IEEE图像处理汇刊,21,10,4349-4360,(2012)·Zbl 1381.62217号 ·doi:10.1109/TIP.2012.2205006
[22] 杨,J。;Yu,K。;龚,Y。;Huang,T.,使用稀疏编码进行线性空间金字塔匹配以进行图像分类,IEEE第22届计算机视觉和模式识别国际会议论文集(CVPR'09),IEEE·doi:10.1109/cvprw.2009.5206757
[23] 高,S。;Tsang,I.W。;Chia,L.-T.,带核的稀疏表示,IEEE图像处理汇刊,22,2,423-434,(2013)·兹比尔1373.94126 ·doi:10.1109/TIP.2012.2215620
[24] Nguyen,H.V。;帕特尔,V.M。;新墨西哥州纳斯拉巴迪。;Chellappa,R.,《内核词典学习》,IEEE声学、语音和信号处理国际会议论文集(ICASSP’12),IEEE·doi:10.10109/icsps.2012.6288305
[25] Bezdek,J.C。;Hathaway,R.J.,交替优化的收敛性,神经、并行和科学计算,11,4,351-368,(2003)·Zbl 1063.90051号
[26] 陈,X。;潘·W。;郭敬通(Kwok,J.T.)。;Carbonell,J.G.,多任务稀疏学习问题的加速梯度法,IEEE第五届数据挖掘国际会议论文集
[27] 袁,X.-T。;Yan,S.C.,多任务联合稀疏表示的视觉分类,IEEE第23届计算机视觉和模式识别国际会议论文集(CVPR’10),IEEE·doi:10.1109/cvpr.2010.5539967
[28] Duygulu,P。;巴纳德,K。;弗雷塔斯,J.F.G。;Forsyth,D.A.,《作为机器翻译的对象识别:学习固定图像词汇的词汇》,第七届欧洲计算机视觉会议论文集·Zbl 1039.68623号
[29] 张,S。;黄,J。;李,H。;Metaxas,D.N.,使用组稀疏性的自动图像注释和检索,IEEE系统、人与控制论汇刊B部分:控制论,42,3,838-849,(2012)·doi:10.1109/tsmcb.2011.2179533
[30] Grubinger,M。;克劳夫,P。;米勒,H。;Deselaers,T.,《IAPR TC-12基准:视觉信息系统的新评估资源》,《语言资源与评估国际会议论文集》
[31] Huiskes,M.J。;Lew,M.S.,《MIR Flickr检索评估》,《ACM多媒体信息检索国际会议论文集》
[32] Verbeek,J。;Guillaumin,M。;Mensink,T。;Schmid,C.,MIRFlicker集合上带tagprop的图像注释,第11届ACM多媒体信息检索国际会议论文集
[33] 布鲁尼,V。;Vitulano,D.,基于人类感知的基于内核的对象跟踪改进,IEEE系统、人与控制论事务:系统,44,11,1474-1485,(2014)·doi:10.1109/TSMC.2014.2331217
[34] Wu,F。;王,Z。;张,Z。;杨,Y。;罗,J。;朱伟。;Zhuang,Y.,用于多标签图像注释的弱半监督深度学习,IEEE大数据汇刊,1,3109-122,(2015)·doi:10.1109/tbdata.2015.2497270
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。