跳到主要内容
10.1145/1646396.1646452acm会议文章/章节视图摘要出版物页面雪佛龙会议记录会议集合
海报

NUS-WIDE:来自新加坡国立大学的真实网络图像数据库

出版:2009年7月8日出版历史

摘要

本文介绍了新加坡国立大学媒体搜索实验室创建的网络图像数据集。数据集包括:(1)来自Flickr的269648个图像和相关标签,共有5018个唯一标签;(2) 从这些图像中提取的6种低层特征,包括64-D颜色直方图、144-D颜色相关图、73-D边缘方向直方图和128-D小波纹理、在5x5固定网格划分上提取的225-D块状颜色矩和基于SIFT描述的500-D单词包;以及(3)81个可用于评估的概念的基础。基于该数据集,我们突出了网络图像采集的特点,并确定了网络图像标注和检索的四个研究问题。我们还通过使用传统的k个-NN算法。基准测试结果表明,可以从足够大的图像数据集中学习有效的模型,以促进一般图像检索。

工具书类

  1. S.Arya、D.M.Mount、N.S.N.R.Silverman和A.Wu。一种近似最近邻搜索的优化算法。ACM学报, 45: 891--923, 1998.谷歌学者谷歌学者数字图书馆数字图书馆
  2. K.Barnard、P.Duygulu、D.Forsyth、N.de Freitas、D.M.Blei和M.I.Jordan。匹配单词和图片。机器学习研究杂志, 3: 1107--1135, 2003.谷歌学者谷歌学者数字图书馆数字图书馆
  3. F.博客。http://blog.flickr.net/en/2007/05/29/were-going-down/。谷歌学者谷歌学者
  4. L.Fei-Fei、R.Fergus和P.Perona。从很少的训练示例中学习生成性视觉模型:一种增量贝叶斯方法在101个对象类别上进行了测试。基于生成模型的视觉CVPR研讨会, 2004.谷歌学者谷歌学者数字图书馆数字图书馆
  5. A.Hauptmann、R.Yan、W.-H.Lin、M.Christel和H.Wactlar。高级概念能否填补视频检索中的语义空白?广播新闻案例研究。IEEE多媒体期刊, 9(5): 958--966, 2007.谷歌学者谷歌学者数字图书馆数字图书馆
  6. J.Huang、S.Kumar、M.Mitra、W.-J.Zhu和R.Zabih。使用颜色相关图进行图像索引。IEEE计算机视觉和模式识别会议,第762页至第768页,1997年6月。谷歌学者谷歌学者数字图书馆数字图书馆
  7. D.洛。具有与比例不变关键点不同的图像特征。国际计算机视觉杂志, 2(60): 91--110, 2004.谷歌学者谷歌学者数字图书馆数字图书馆
  8. 陆毅、张立良、田启超和马伟友。什么是语义缺口较小的高级概念?IEEE计算机视觉和模式识别会议, 2008.谷歌学者谷歌学者
  9. B.S.Manjunath和W.-Y.Ma。用于浏览和检索图像数据的纹理特征。IEEE模式分析和机器智能汇刊,18(8):837--8421996年8月。谷歌学者谷歌学者数字图书馆数字图书馆
  10. M.Naphade、J.R.Smith、J.Tesic、S.Chang、W.Hsu、L.Kennedy、A.Hauptmann和J.Curtis。多媒体的大规模概念本体。IEEE多媒体2006年7月,13:86--91。谷歌学者谷歌学者数字图书馆数字图书馆
  11. D.K.Park、Y.S.Jeon和C.S.Won。有效使用局部边缘直方图描述符。ACM多媒体, 2000.谷歌学者谷歌学者数字图书馆数字图书馆
  12. G.-J.Qi、X.-S.Hua、Y.Rui、J.Tang、T.Mei和H.-J.Zhang。相关多标签视频注释。ACM多媒体, 2007.谷歌学者谷歌学者数字图书馆数字图书馆
  13. G.-J.Qi、X.-S.Hua、Y.Rui、J.Tang和H.-J.Zhang。二维多标签主动学习和有效的在线自适应模型用于图像分类。IEEE模式分析和机器智能汇刊,以显示。谷歌学者谷歌学者数字图书馆数字图书馆
  14. L.G.夏皮罗和G.C.斯托克曼。计算机视觉普伦蒂斯·霍尔,2003年。谷歌学者谷歌学者数字图书馆数字图书馆
  15. C.G.M.Snoek、M.Worring、J.C.van Gemert、J.-M Geusebroek和A.W.M.Smeulders。多媒体中101个语义概念的自动检测的挑战性问题。ACM多媒体2006年10月。谷歌学者谷歌学者数字图书馆数字图书馆
  16. 斯特里克先生和奥伦戈先生。彩色图像的相似性。图像和视频数据库的SPIE存储和检索III1995年2月。谷歌学者谷歌学者交叉引用交叉引用
  17. J.Tang、X.-S.Hua、M.Wang、Z.Gu、G.-J.Qi和X.Wu。视频注释的相关线性邻域传播。IEEE系统、人与控制论汇刊B部分:控制论2009年4月,第39(2)页。谷歌学者谷歌学者数字图书馆数字图书馆
  18. J.Tang、Y.Song、X.S.Hua、T.Mei和X.Wu。构建视频标注的最优训练集。ACM多媒体2006年10月。谷歌学者谷歌学者数字图书馆数字图书馆
  19. A.Torralba、R.Fergus和W.Freeman。8000万张微小图像:用于非参数对象和场景识别的大型数据集。IEEE模式分析和机器智能汇刊,30(11):1958--1970,2008年11月。谷歌学者谷歌学者数字图书馆数字图书馆
  20. X.-J.Wang、L.Zhang、X.Li和W.-Y.Ma。通过挖掘图像搜索结果对图像进行注释。IEEE模式分析和机器智能汇刊,30(11):1919--1932,2008年11月。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. NUS-WIDE:新加坡国立大学的真实世界网络图像数据库

      建议

      评论

      登录选项

      检查您是否可以通过登录凭据或您的机构访问本文。

      登录

      完全访问权限

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用eReader联机查看。

      电子阅读器