×

半自动动态辅助标记图像注释。 (英语) Zbl 1187.68518号

摘要:图像注释是许多实际应用程序的基础。在Web2.0时代,图像搜索和浏览在很大程度上基于图像标签。在本文中,我们将图像标注定义为一个多标签学习问题,并开发了一个半自动图像标注系统。该系统从词汇表中选择合适的单词作为给定图像的标签,并在用户反馈的帮助下对标签进行细化。该改进相当于一种新的多标签学习框架,称为半自动动态辅助标签辅助(SADATA),其中一个特定标签(目标标签)的分类结果可以通过其他标签(辅助标签)子集的分类结果来提高。辅助标签与目标标签具有很强的相关性,它们是根据归一化互信息来确定的。我们只选择那些相关性超过阈值的标记作为辅助标记,因此辅助集是稀疏的。一个辅助标签可以贡献多少取决于图像,因此我们还建立了一个以辅助标签和输入图像为条件的概率模型来动态调整辅助标签的权重。对于给定的图像,用户对标签的反馈纠正了辅助分类器的输出,SADATA将在下一轮推荐更合适的标签。SADATA根据大量Corel图像进行评估。实验结果验证了动态辅助标记辅助方法的有效性。此外,性能还得益于用户反馈,从而可以显著加快注释过程。

MSC公司:

68吨10 模式识别、语音识别
68平方英寸10 图像处理的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 弗利克纳,M。;Sawhney,H。;Niblack,W。;Ashley,J。;黄,Q。;多姆,B。;M.戈尔卡尼。;哈夫纳,J。;Lee,D。;佩特科维奇,D。;斯蒂尔,D。;Yanker,P.,《通过图像和视频内容进行查询:QBIC系统》,《计算机》,第28、9、23-32页(1995年)
[2] Gevers,T。;Smeulders,A.,Pictoseek:结合颜色和形状不变特征进行图像检索,IEEE图像处理汇刊,9,1,102-119(2000)
[3] 古普塔,A。;Jain,R.,《视觉信息检索》,ACM通讯,40,5,70-79(1997)
[4] W.Ma,B.Manjunath,Netra:导航大型图像数据库的工具箱,见:国际图像处理会议,1997年第1卷,第568页。;W.Ma,B.Manjunath,Netra:导航大型图像数据库的工具箱,见:国际图像处理会议,第1卷,1997年,第568页。
[5] J.R.史密斯。;Chang,S.-F.,Visualseek:一个完全自动化的基于内容的图像查询系统,(MULTIMEDIA’96:第四届ACM国际多媒体会议论文集(1996),ACM:美国纽约ACM),87-98
[6] Smeulders,A.W。;沃林,M。;Santini,S。;古普塔,A。;Jain,R.,早年末基于内容的图像检索,IEEE模式分析和机器智能汇刊,22,12,1349-1380(2000)
[7] 李,J。;Wang,J.Z.,实时计算机图像注释,IEEE模式分析和机器智能汇刊,30,6,985-1002(2008)
[8] 巴纳德,K。;Duygulu,P。;福赛斯,D。;德弗里塔斯,N。;布莱,D.M。;Jordan,M.I.,匹配单词和图片,机器学习研究杂志,31107-1135(2003)·Zbl 1061.68174号
[9] Tieu,K。;Viola,P.,促进图像检索,国际计算机视觉杂志,56,1-2,17-36(2004)
[10] S.-F.Cheng,W.Chen,H.Sundaram,《语义视觉模板:将视觉特征与语义联系起来》,载于《国际图像处理会议论文集》,ICIP 98,第3卷,1998年10月4日至7日,第531-535页。;S.-F.Cheng,W.Chen,H.Sundaram,《语义视觉模板:将视觉特征与语义联系起来》,载《国际图像处理会议论文集》,ICIP 98,第3卷,1998年10月4日至7日,第531-535页。
[11] 唐,S。;Chang,E.,支持向量机主动学习用于图像检索,(MULTIMEDIA'01:第九届ACM多媒体国际会议论文集(2001),ACM:美国纽约ACM),107-118
[12] 张,C。;Chen,T.,基于内容的信息检索的主动学习框架,IEEE多媒体汇刊,4,2,260-268(2002)
[13] 莫奈,F。;Gatica-Perez,D.,《关于利用潜在空间模型进行图像自动标注》(MULTIMEDIA’03:第十一届ACM国际多媒体会议论文集(2003),ACM:美国纽约ACM),275-278
[14] A.Singhal,J.Luo,W.Zhu,场景内容理解的概率空间上下文模型,摘自:IEEE计算机视觉和模式识别会议论文集,第1卷,2003年6月18日至20日,第I-235-I-241页。;A.Singhal,J.Luo,W.Zhu,场景内容理解的概率空间上下文模型,摘自:IEEE计算机视觉和模式识别会议论文集,第1卷,2003年6月18日至20日,第I-235-I-241页。
[15] 何,X。;马,W.-Y。;张海杰,《学习图像流形进行检索》,(MULTIMEDIA’04:第十二届ACM国际多媒体年会论文集(2004),ACM:美国纽约ACM),17-23
[16] Rui,Y。;黄,T。;奥尔特加,M。;Mehrotra,S.,《相关性反馈:基于交互式内容的图像检索的强大工具》,IEEE视频技术电路和系统汇刊,8,5,644-655(1998)
[17] Y.Rui,T.Huang,图像检索中的优化学习,载:《IEEE计算机视觉与模式识别会议论文集》,2000年第1卷,第236-243页。;Y.Rui,T.Huang,《图像检索中的优化学习》,载《IEEE计算机视觉和模式识别会议论文集》,2000年第1卷,第236-243页。
[18] 库什基,A。;Androutsos,P。;Plataniotis,K。;Venetsanopoulos,A.,交互式图像检索的查询反馈,IEEE视频技术电路和系统汇刊,14,5,644-655(2004)
[19] 关,J。;邱,G.,使用优化学习相关反馈中的用户意图,(MIR’07:多媒体信息检索研讨会国际研讨会论文集(2007),ACM:美国纽约ACM),41-50
[20] 刘杰。;李,Z。;李,M。;卢,H。;Ma,S.,图像检索的人类行为一致性相关反馈模型,(MULTIMEDIA'07:第十五届国际多媒体会议论文集(2007),美国纽约ACM),269-272
[21] L.Wenyin。;Dumais,S。;孙,Y。;张,H。;Czerwinski,M。;Field,B.,《半自动图像注释》(HCI会议记录(INTERACT)(2001),IOS出版社),326-333
[22] A.Dorado,E.Izquierdo,《使用频繁关键词挖掘的半自动图像注释》,载于:《第七届信息可视化国际会议论文集》,第四卷,2003年7月16日至18日,第532-535页。;A.Dorado,E.Izquierdo,《使用频繁关键词挖掘的半自动图像注释》,载于《第七届信息可视化国际会议论文集》,第四卷,2003年7月16日至18日,第532-535页。
[23] C.Yang,M.Dong,F.Fotouhi,(运营商名称{I}^2\运营商名称}A});C.Yang,M.Dong,F.Fotouhi,\(\操作员姓名{I}^2\操作员姓名{A}\)
[24] C.Fellbaum(编辑),WordNet:电子词汇数据库,麻省理工学院出版社,马萨诸塞州剑桥,1998年。;C.Fellbaum(编辑),WordNet:电子词汇数据库,麻省理工学院出版社,马萨诸塞州剑桥,1998年·兹比尔0913.68054
[25] 夏皮雷,R.E。;Singer,Y.,BoosTexter:一个基于增强的文本分类系统,机器学习,39,2/3,135-168(2000)·Zbl 0951.68561号
[26] 鲁苏,J。;桑德斯,C。;塞德马克,S。;Shawe-Taylor,J.,分层多标签分类模型的基于核的学习,机器学习研究杂志,71601-1626(2006)·兹比尔1222.68291
[27] Elisseeff,A。;Weston,J.,多标记分类的核心方法,(神经信息处理系统(2001)),681-687
[28] F.Kang,R.Jin,R.Sukthankar,相关标签传播与多标签学习应用,收录于:CVPR’06:2006年IEEE计算机学会计算机视觉和模式识别会议论文集,美国华盛顿特区,2006年,第1719-1726页。;F.Kang,R.Jin,R.Sukthankar,《相关标签传播与多标签学习应用》,载于:CVPR’06:2006年IEEE计算机学会计算机视觉和模式识别会议论文集,美国华盛顿特区,2006年,第1719-1726页。
[29] 张,M.-L。;Zhou,Z.-H.,Ml-KNN:多标签学习的惰性学习方法,模式识别,40,7,2038-2048(2007)·Zbl 1111.68629号
[30] 朱,S。;Ji,X。;徐伟(Xu,W.)。;Gong,Y.,使用最大熵方法的多标签分类,(SIGIR’05:第28届国际ACM SIGIR信息检索研究与开发会议论文集(2005),ACM:美国纽约ACM),274-281
[31] 齐国杰。;华,X.-S。;Rui,Y。;Tang,J。;梅,T。;Zhang,H.-J.,相关多标签视频注释,(MULTIMEDIA'07:第15届国际多媒体会议论文集(2007),美国计算机学会:美国纽约计算机学会),17-26
[32] 张,Z.-H。;Zhou,M.-L.,通过实例区分进行多标签学习,(第22届人工智能会议论文集,加拿大温哥华(2007)),669-674
[33] Boutel,M.R。;Luo,X.S.J。;Brown,C.M.,学习多标签场景分类,模式识别,37,9,1757-1771(2004)
[34] Gonçalves,T。;Quaresma,P.,葡萄牙司法文件多标签分类问题的初步探讨,(EPIA(2003)),435-444
[35] 李·T。;Ogihara,M.,《音乐中的情感探测》(ISMIR(2003))
[36] Vapnik,V.,《统计学习理论》(1998),威利出版社:威利纽约·Zbl 0935.62007号
[37] 双歧杆菌,S。;Tsoumakas,G。;Mitkas,P.A。;Vlahavas,I.P.,《使用多种算法进行蛋白质分类》,(泛希腊信息学会议(2005)),448-456
[38] Kozintsev,T.M.R.N。;Huang,I.V.,语义视频索引的因子图框架,IEEE视频技术电路和系统汇刊,12,1,40-52(2002)
[39] B.S.J.Wu,Y.Tseng,基于本体的视频概念检测多分类学习,收录于:IEEE 2004年国际多媒体会议和博览会,第2卷,2004年,第1003-1006页。;B.S.J.Wu,Y.Tseng,基于Ontology的视频概念检测多分类学习,收录于:2004年IEEE多媒体与博览会国际会议,第2卷,2004年,第1003-1006页。
[40] 雅各布斯,R.A。;M.I.乔丹。;Nowlan,S.J。;Hinton,G.E.,本地专家的自适应混合,神经计算,3,1,79-87(1991)
[41] Bishop,C。;Svensén,M.,Bayesian Hierarchical Mixtures of Experts(2003),Morgan Kaufmann:Morgan Koufmann San Francisco,CA
[42] J.Karmeshu(编辑),熵测度,最大熵原理和新兴应用,Springer,柏林,2003。;J.Karmeshu(编辑),《熵测度、最大熵原理和新兴应用》,施普林格出版社,柏林,2003年·邮编1083.94500
[43] Schwarz,G.,估算模型的维度,《统计年鉴》,6,2,461-464(1978)·Zbl 0379.62005年
[44] Rissanen,J.J.,《通过最短数据描述进行建模》,Automatica,1465-471(1978)·兹伯利0418.93079
[45] Gader,医学博士。;Mohamed,医学硕士。;Keller,J.M.,手写词分类器的融合,模式识别字母,17,6,577-584(1996)
[46] Ho,T.K。;赫尔,J。;Srihari,S.,多分类器系统中的决策组合,IEEE模式分析和机器智能汇刊,16,1,66-75(1994)
[47] 邱,G.,为基于内容的彩色图像检索索引彩色和非彩色模式,模式识别,35,8,1675-1686(2002)·Zbl 1017.68104号
[48] F.De Comité。;吉列隆,R。;Tommasi,M.,从文本和数据学习多标签交替决策树,模式识别中的机器学习和数据挖掘,251-274(2003)·Zbl 1029.68568号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。