×

通过最优预测子空间学习实现多视图表示和图像标注的联合。 (英语) Zbl 1440.68318号

摘要:图像表示和注释是图像搜索等实际应用中的两个关键任务。现有的方法试图学习有效的表示或直接使用多视图低级视觉特征预测标签,这些特征通常包含冗余信息。然而,这两项任务密切相关,相互作用。合适的图像表示可以产生更好的图像标注结果,从而有效地指导图像表示学习。本文提出通过最优预测子空间学习联合进行多视图表示和图像标注,使这两项任务相互促进。具体来说,在子空间学习中,利用图像的视觉结构和语义信息,使学习的子空间更具区分性和紧凑性。对于标签预测,采用支持向量机(SVM)获得更好的标签预测结果。然后,为了同时学习图像表示、标签预测和投影函数,将这三个子问题合并为一个统一的优化目标函数,并推导出一种替代优化算法来求解。在四个图像数据集上的实验结果表明,我们的方法优于其他图像标注方法。

MSC公司:

68单位10 图像处理的计算方法
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿加瓦尔,S。;布兰森,K。;Belongie,S.,《图形的高阶学习》,机器学习国际会议,17-24(2006)
[2] Amiri,S.H。;Jamzad,M.,用于可缩放图像注释的超图高效多模式融合,模式识别。,48, 7, 2241-2253 (2015) ·Zbl 1374.68606号
[3] Belhumeur,P.N。;赫斯帕尼亚,J.P。;Kriegman,D.J.,《特征脸与渔夫脸:使用特定类别线性投影的识别》,IEEE Trans。模式分析。机器。智力。,19, 7, 711-720 (1997)
[4] 贝尔金,M。;Niyogi,P.,嵌入和聚类的拉普拉斯特征映射和光谱技术,神经信息处理系统(NIPS)进展,第14卷,585-591(2001)
[5] 贝尔金,M。;Niyogi,P。;Sindhwani,V.,《流形正则化:从标记和未标记示例学习的几何框架》,J.Mach。学习。第7号决议,2399-2434(2006)·Zbl 1222.68144号
[6] D.P.Bertsekas,非线性规划(1999)。;D.P.Bertsekas,非线性规划(1999)·Zbl 1015.90077号
[7] 蔡,X。;聂,F。;蔡,W。;Huang,H.,通过多模式半监督学习模型进行异构图像特征集成,IEEE计算机视觉国际会议(ICCV),1737-1744(2013)
[8] 曹,X。;张,C。;Fu,H。;刘,S。;Zhang,H.,多样性诱导的多视图子空间聚类,IEEE计算机视觉和模式识别会议,586-594(2015)
[9] 曹,X。;张,H。;郭,X。;刘,S。;Meng,D.,SLED:多标签图像注释的语义标签嵌入词典表示,IEEE Trans。图像处理。,24, 9, 2746-2759 (2015) ·Zbl 1408.94069号
[10] 陈,M。;郑,A。;Weinberger,K.,《快速图像标记》,国际机器学习会议,1274-1282(2013)
[11] Cheng,J。;冷,C。;李,P。;王,M。;Lu,H.,用于可扩展相似性搜索的半监督多图哈希,计算。视觉图像理解。,124, 1, 12-21 (2014)
[12] Chua,T.-S。;Tang,J。;R·洪。;李,H。;罗,Z。;Zheng,Y.,Nus-wide:新加坡国立大学的真实网络图像数据库,ACM国际图像和视频检索会议,48(2009)
[13] Duygulu,P。;巴纳德,K。;de Freitas,J.F。;Forsyth,D.A.,《作为机器翻译的对象识别:学习固定图像词汇的词汇》,欧洲计算机视觉会议,97-112(2002)·Zbl 1039.68623号
[14] Elhamifar,E。;Vidal,R.,《稀疏子空间聚类:算法、理论和应用》,IEEE Trans。模式分析。机器。智力。,352765-2781(2013年)
[15] 冯,Z。;Feng,S。;金·R。;Jain,A.K.,《通过噪声矩阵恢复完成图像标签》,欧洲计算机视觉会议,424-438(2014)
[16] 冯,Z。;金·R。;Jain,A.K.,《利用高效稳健的核度量学习进行大尺度图像标注》,IEEE计算机视觉国际会议,1609-1616(2013)
[17] 高,L。;宋,J。;聂,F。;Yan,Y。;塞贝,N。;Shen,H.T.,用于图像和视频注释的具有部分标签和多个特征的最优图学习,IEEE计算机视觉和模式识别会议,4371-4379(2015)
[18] Y.Gong,Y.Jia,T.Leung,A.Toshev,S.Ioffe,多标签图像注释的深度卷积排名,arXiv:1312.4894;龚瑜、贾瑜、梁振英、托舍夫、艾夫,多标签图像标注的深度卷积排序,arXiv:1312.4894
[19] Grubinger,M。;克劳夫,P。;穆勒,H。;Deselaers,T.,《iapr tc12基准:视觉信息系统的新评估资源》,OntoImage国际研讨会,13-23(2006)
[20] 桂,J。;陶,D。;孙,Z。;罗,Y。;你,X。;Tang,Y.Y.,用于图像分类的具有视图一致性的组稀疏多视图补丁对齐框架,IEEE Trans。图像处理。,23, 7, 3126-3137 (2014) ·Zbl 1374.94128号
[21] Guillaumin,M。;Mensink,T。;Verbeek,J。;Schmid,C.,Tagprop:图像自动标注的最近邻模型中的判别度量学习,计算机视觉国际会议,309-316(2009)
[22] R·洪。;王,M。;高,Y。;陶,D。;李,X。;Wu,X.,基于区分特征映射和选择的多位置学习图像标注,IEEE Trans。网络。,44, 5, 669-680 (2014)
[23] 景,X。;Wu,F。;Li,Z。;胡,R。;张,D.,用于图像注释的多标签词典学习,IEEE Trans。图像处理。,25, 6, 2712-2725 (2016) ·Zbl 1408.94290号
[24] Kalayeh,M.M。;Idrees,H。;Shah,M.,Nmf-knn:使用加权多视图非负矩阵分解的图像注释,IEEE计算机视觉和模式识别会议(CVPR),184-191(2014),IEEE
[25] Kim,J。;蒙特罗,R。;Park,H.,非负矩阵分解中的群稀疏性。,SIAM国际数据挖掘会议(SDM),851-862(2012)
[26] Lee,D.D。;Seung,H.S.,非负矩阵分解算法,神经信息处理系统进展,556-562(2001)
[27] Lin,Y.Y。;Liu,T.L。;Fuh,C.S.,用于降维的多核学习,IEEE Trans。模式分析。机器。智力。,33, 6, 1147-1160 (2011)
[28] 林,Z。;丁·G。;胡,M。;Wang,J。;Ye,X.,通过图像特定和标记特定线性稀疏重建完成图像标记,IEEE计算机视觉和模式识别会议(CVPR),1618-1625(2013)
[29] 刘,M。;罗,Y。;陶,D。;徐,C。;Wen,Y.,多标签图像分类矩阵补全中的低秩多视图学习,AAAI人工智能会议(2015)
[30] 刘伟。;He,J。;Chang,S.F.,可扩展半监督学习的大图构造,机器学习国际会议,679-686(2010)
[31] 刘伟。;陶,D。;Cheng,J。;Tang,Y.,用于图像注释的多视点黑森判别稀疏编码,计算。视觉图像理解。,118, 50-60 (2014)
[32] Long,B.长。;菲利普,S.Y。;Zhang,Z.M.,多视角无监督学习的一般模型,SIAM国际数据挖掘会议(SDM),822-833(2008)
[33] Makadia,A。;巴甫洛维奇,V。;Kumar,S.,《图像注释的新基准》,欧洲计算机视觉会议,316-329(2008)
[34] Platt,J.,使用序列最小优化快速训练支持向量机,高级内核方法支持向量学习。,3 (1999)
[35] Roweis,S.T。;Saul,L.K.,通过局部线性嵌入降低非线性维数,《科学》,290,5500,2323-2326(2000)
[36] Schölkopf,B。;Smola,A.J.,《使用内核学习:支持向量机、正则化、优化和超越》(2002),麻省理工出版社
[37] Seung,H.S。;Lee,D.D.,《感知的多种方式》,《科学》,290,5500,2268-2269(2000)
[38] Singhal,A.,《现代信息检索:简要概述》,IEEE数据工程公告。,24, 4, 35-43 (2001)
[39] Tenenbaum,J.B。;德席尔瓦,V。;Langford,J.C.,《非线性降维的全球几何框架》,《科学》,29055002319-2323(2000)
[40] Verma,Y。;Jawahar,C.V.,《通过传播语义邻域的标签进行图像注释》,国际计算机杂志。视觉。,121, 1, 126-148 (2017) ·Zbl 1441.68262号
[41] 冯安,L。;Dabbish,L.,用电脑游戏标记图像,SIGCHI计算机系统人为因素会议,319-326(2004)
[42] Wang,J。;Yang,Y。;毛,J。;黄,Z。;黄,C。;Xu,W.,Cnn-rnn:多标签图像分类的统一框架,IEEE计算机视觉和模式识别会议论文集,2285-2294(2016)
[43] 王,M。;傅伟(Fu,W.)。;郝,S。;Tao,D.,通过有效锚图正则化实现可伸缩半监督学习,IEEE Trans。知识。数据工程,28,7,1864-1877(2016)
[44] 王,Q。;沈,B。;王,S。;李,L。;Si,L.,《不完全标签快速图像标记的二进制代码嵌入》,欧洲计算机视觉会议,425-439(2014)
[45] 王,Z。;Chen,T。;李·G。;Xu,R。;Lin,L.,通过反复发现注意区域实现多标签图像识别,IEEE计算机视觉和模式识别会议论文集,464-472(2017)
[46] Wu,L。;金·R。;Jain,A.K.,图像检索标签完成,IEEE Trans。模式分析。机器。智力。,35, 3, 716-727 (2013)
[47] 夏,T。;陶,D。;梅,T。;Zhang,Y.,多视图光谱嵌入,IEEE Trans。系统,Man Cybernet第B部分,40,6,1438-1446(2010)
[48] 薛,Z。;李·G。;黄奇,联合多视图表示学习和图像标注,AAAI人工智能会议,1366-1372(2016)
[49] 薛,Z。;李·G。;王,S。;张伟。;黄,Q.,双水平多视角潜在空间学习,IEEE Trans。电路系统。视频技术。,PP,99,1(2016)
[50] Yu,J。;Rui,Y。;Tang,Y.Y。;Tao,D.,图像分类中基于高阶距离的多视图随机学习,IEEE Trans。网络。,44, 12, 2431-2442 (2014)
[51] Zelnik-Manor,L。;Perona,P.,自校正谱聚类,神经信息处理系统进展,1601-1608(2004)
[52] 郑S。;蔡,X。;丁,C。;聂,F。;Huang,H.,多视角低阶回归的封闭式解决方案,AAAI人工智能会议(2015)
[53] 周,D。;黄,J。;Schokopf,B.,超图学习:聚类、分类和嵌入,神经信息处理系统进展,1601-1608(2006)
[54] 朱,F。;李,H。;欧阳,W。;Yu,N。;Wang,X.,通过图像级监督学习多标签图像分类的空间正则化,IEEE计算机视觉和模式识别会议(CVPR)(2017)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。