文件Zbl 1426.94035-zbMATH Open

基于核的多视图联合稀疏编码用于图像标注。（英语） Zbl 1426.94035号

数学。问题。工程师。 2017年，文章ID 6727105，11 p.（2017）.

摘要：由于视觉特征和语义概念之间的语义鸿沟，图像自动标注问题仍然是一个具有挑战性的任务。为了减少这种差距，本文提出了一种基于核的多视图联合稀疏编码（KMVJSC）图像标注框架。在KMVJSC中，不同的视觉特征和标签信息被视为不同的视图，并被映射到一个隐式核空间，在该核空间中，原始的非线性可分数据变得线性可分。然后，将所有视图集成到一个多视图联合稀疏编码框架中，以自适应地找到一组最优稀疏表示和判别字典，从而有效地利用不同视图的互补信息。将K-奇异值分解（KSVD）和加速近端梯度（APG）算法扩展到核多视点框架，提出了一种优化算法提出了贪婪标签转移算法。在三个数据集上的对比实验表明，与其他相关方法相比，该方法具有竞争力。

MSC公司：

94A08型	信息与通信理论中的图像处理（压缩、重建等）
62华氏35	多元分析中的图像分析

软件：

标签属性

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	张，D。；伊斯兰，M.M。；吕刚，自动图像标注技术综述，模式识别，45，1，346-362，（2012）·doi:10.1016/j.patcog.2011.05.013
[2]	李，X。；乌里奇奥，T。；Ballan，L。；贝尔蒂尼，M。；斯诺克，C.G.M。；Del Bimbo，A.，Socializing the semantic gap:an compative survey on image tag assignment，refinement，and retrieval，美国计算机学会计算调查，49，1，article 14，（2016）·doi:10.1145/2906152
[3]	卡内罗，G。；Chan，A.B。；莫雷诺，P.J。；Vasconcelos，N.，图像注释和检索语义类的监督学习，IEEE模式分析和机器智能学报，29，3，394-410，（2007）·doi:10.1109/TPAMI.2007.61
[4]	Verma，Y。；Jawahar，C.V.，探索SVM在存在混淆标签的情况下用于图像注释，第24届英国机器视觉会议论文集
[5]	张，M.-L。；Wu，L.，LIFT:具有标签特定功能的多标签学习，IEEE模式分析和机器智能汇刊，37，1，107-120，（2015）·doi:10.1109/tpami.2014.2339815
[6]	Yakhnenko，O。；Honavar，V.，使用分层dirichlet过程模型注释图像和图像对象，第九届多媒体数据挖掘国际研讨会论文集
[7]	Putthividhya，D。；阿提亚斯，H.T。；Nagarajan，S.S.，用于图像注释的主题回归多模式潜在Dirichlet分配，IEEE计算机学会计算机视觉和模式识别会议论文集（CVPR’10），IEEE·doi:10.1109/cvpr.2010.5540000
[8]	Makadia，A。；巴甫洛维奇，V。；Kumar，S.，《图像注释的新基线》，第十届欧洲计算机视觉会议论文集
[9]	Guillaumin，M。；Mensink，T。；Verbeek，J。；Schmid，C.，TagProp:图像自动标注最近邻模型中的判别度量学习，IEEE第12届计算机视觉国际会议论文集（ICCV'09），IEEE·doi:10.1109/iccv.2009.5459266
[10]	Verma，Y。；Jawahar，C.V.，通过传播来自语义邻域的标签进行图像注释，国际计算机视觉杂志，121，1126-148，（2017）·Zbl 1441.68262号 ·doi:10.1007/s11263-016-0927-0
[11]	李，X。；斯诺克，C.G.M。；Worring，M.，通过邻居投票学习社交标签相关性，IEEE多媒体交易，11，7，1310-1322，（2009）·doi:10.1109/TMM.2009.2030598
[12]	陈，Z。；曹，J。；夏，T。；Song，Y。；Zhang，Y。；Li，J.，网络视频重新标记，多媒体工具和应用，55，1，53-82，（2011）·doi:10.1007/s11042-010-0604-1
[13]	王，C。；Yan，S。；张，L。；Zhang，H.-J.，用于自动图像注释的多标签稀疏编码，IEEE第22届计算机视觉和模式识别国际会议论文集（CVPR'09），IEEE·doi:10.10109/cvprw.2009.5206866
[14]	高，S。；恰·L·T。；Tsang，I.W.-H。；Ren，Z.，通过高效多层组稀疏编码实现并行单标签图像分类和注释，IEEE多媒体汇刊，16，3，762-771，（2014）·doi:10.1109/TMM.2014.2299516
[15]	曹，X。；张，H。；郭，X。；刘，S。；Meng，D.，SLED：多标签图像注释的语义标签嵌入词典表示，IEEE图像处理学报，24，9，2746-2759，（2015）·Zbl 1408.94069号 ·doi:10.1109/tip.2015.2428055
[16]	卢，Z。；Han，P。；Wang，L。；Wen，J.-R.，图像应用中视觉内容的语义稀疏记录，IEEE图像处理汇刊，24，1，176-188，（2015）·Zbl 1408.94456号 ·doi:10.1109/TIP.2014.2375641
[17]	Jing，X.-Y。；Wu，F。；李，Z。；胡，R。；Zhang，D.，用于图像注释的多标签字典学习，IEEE Transactions on image Processing，25，6，2712-2725，（2016）·Zbl 1408.94290号 ·doi:10.1109/TIP.2016.2549459
[18]	莫兰，S。；Lavrenko，V.，图像注释的稀疏核学习，第四届ACM多媒体检索国际会议论文集（ICMR’14），ACM·doi:10.1145/2578726.2578734
[19]	卡拉耶，M.M。；Idrees，H。；Shah，M.，NMF-KNN:使用加权多视图非负矩阵分解的图像注释，第27届IEEE计算机视觉和模式识别会议论文集（CVPR’14），IEEE·doi:10.1109/cvpr.2014.31
[20]	刘伟。；陶，D。；Cheng，J。；Tang，Y.，用于图像注释的多视图Hessian区分稀疏编码，计算机视觉和图像理解，118，50-60，（2014）·doi:10.1016/j.cviu.2013.03.007
[21]	袁，X.-T。；刘，X。；Yan，S.，多任务联合稀疏表示的视觉分类，IEEE图像处理汇刊，21，10，4349-4360，（2012）·Zbl 1381.62217号 ·doi:10.1109/TIP.2012.2205006
[22]	杨，J。；Yu，K。；龚，Y。；Huang，T.，使用稀疏编码进行线性空间金字塔匹配以进行图像分类，IEEE第22届计算机视觉和模式识别国际会议论文集（CVPR'09），IEEE·doi:10.1109/cvprw.2009.5206757
[23]	高，S。；Tsang，I.W。；Chia，L.-T.，带核的稀疏表示，IEEE图像处理汇刊，22，2，423-434，（2013）·兹比尔1373.94126 ·doi:10.1109/TIP.2012.2215620
[24]	Nguyen，H.V。；帕特尔，V.M。；新墨西哥州纳斯拉巴迪。；Chellappa，R.，《内核词典学习》，IEEE声学、语音和信号处理国际会议论文集（ICASSP’12），IEEE·doi:10.10109/icsps.2012.6288305
[25]	Bezdek，J.C。；Hathaway，R.J.，交替优化的收敛性，神经、并行和科学计算，11，4，351-368，（2003）·Zbl 1063.90051号
[26]	陈，X。；潘·W。；郭敬通（Kwok，J.T.）。；Carbonell，J.G.，多任务稀疏学习问题的加速梯度法，IEEE第五届数据挖掘国际会议论文集
[27]	袁，X.-T。；Yan，S.C.，多任务联合稀疏表示的视觉分类，IEEE第23届计算机视觉和模式识别国际会议论文集（CVPR’10），IEEE·doi:10.1109/cvpr.2010.5539967
[28]	Duygulu，P。；巴纳德，K。；弗雷塔斯，J.F.G。；Forsyth，D.A.，《作为机器翻译的对象识别：学习固定图像词汇的词汇》，第七届欧洲计算机视觉会议论文集·Zbl 1039.68623号
[29]	张，S。；黄，J。；李，H。；Metaxas，D.N.，使用组稀疏性的自动图像注释和检索，IEEE系统、人与控制论汇刊B部分：控制论，42，3，838-849，（2012）·doi:10.1109/tsmcb.2011.2179533
[30]	Grubinger，M。；克劳夫，P。；米勒，H。；Deselaers，T.，《IAPR TC-12基准：视觉信息系统的新评估资源》，《语言资源与评估国际会议论文集》
[31]	Huiskes，M.J。；Lew，M.S.，《MIR Flickr检索评估》，《ACM多媒体信息检索国际会议论文集》
[32]	Verbeek，J。；Guillaumin，M。；Mensink，T。；Schmid，C.，MIRFlicker集合上带tagprop的图像注释，第11届ACM多媒体信息检索国际会议论文集
[33]	布鲁尼，V。；Vitulano，D.，基于人类感知的基于内核的对象跟踪改进，IEEE系统、人与控制论事务：系统，44，11，1474-1485，（2014）·doi:10.1109/TSMC.2014.2331217
[34]	Wu，F。；王，Z。；张，Z。；杨，Y。；罗，J。；朱伟。；Zhuang，Y.，用于多标签图像注释的弱半监督深度学习，IEEE大数据汇刊，1，3109-122，（2015）·doi:10.1109/tbdata.2015.2497270

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

基于核的多视图联合稀疏编码用于图像标注。（英语） Zbl 1426.94035号

MSC公司：

软件：

参考文献：

示例

领域

操作员

基于核的多视图联合稀疏编码用于图像标注。 （英语） Zbl 1426.94035号

MSC公司：

软件：

参考文献：

基于核的多视图联合稀疏编码用于图像标注。（英语） Zbl 1426.94035号