海报

NUS-WIDE：来自新加坡国立大学的真实网络图像数据库

作者：
Tat Seng Chua先生

新加坡国立大学

新加坡国立大学
查看个人资料

,
金辉堂

新加坡国立大学

新加坡国立大学
查看个人资料

,
Richang Hong公司

新加坡国立大学

新加坡国立大学
查看个人资料

,
李浩杰

新加坡国立大学

新加坡国立大学
查看个人资料

,
罗志平

新加坡国立大学

新加坡国立大学
查看个人资料

,
郑燕涛

新加坡国立大学

新加坡国立大学
查看个人资料

作者信息和声明

CIVR’09：ACM国际图像和视频检索会议记录2009年7月文章编号：48第1-9页https://doi.org/10.1145/1646396.1646452

出版：2009年7月8日出版历史

CIVR’09：ACM国际图像和视频检索会议记录

第1-9页

摘要

本文介绍了新加坡国立大学媒体搜索实验室创建的网络图像数据集。数据集包括：（1）来自Flickr的269648个图像和相关标签，共有5018个唯一标签；（2）从这些图像中提取的6种低层特征，包括64-D颜色直方图、144-D颜色相关图、73-D边缘方向直方图和128-D小波纹理、在5x5固定网格划分上提取的225-D块状颜色矩和基于SIFT描述的500-D单词包；以及（3）81个可用于评估的概念的基础。基于该数据集，我们突出了网络图像采集的特点，并确定了网络图像标注和检索的四个研究问题。我们还通过使用传统的k个-NN算法。基准测试结果表明，可以从足够大的图像数据集中学习有效的模型，以促进一般图像检索。

工具书类

S.Arya、D.M.Mount、N.S.N.R.Silverman和A.Wu。一种近似最近邻搜索的优化算法。ACM学报, 45: 891--923, 1998.谷歌学者数字图书馆
K.Barnard、P.Duygulu、D.Forsyth、N.de Freitas、D.M.Blei和M.I.Jordan。匹配单词和图片。机器学习研究杂志, 3: 1107--1135, 2003.谷歌学者数字图书馆
F.博客。http://blog.flickr.net/en/2007/05/29/were-going-down/。谷歌学者
L.Fei-Fei、R.Fergus和P.Perona。从很少的训练示例中学习生成性视觉模型：一种增量贝叶斯方法在101个对象类别上进行了测试。在基于生成模型的视觉CVPR研讨会, 2004.谷歌学者数字图书馆
A.Hauptmann、R.Yan、W.-H.Lin、M.Christel和H.Wactlar。高级概念能否填补视频检索中的语义空白？广播新闻案例研究。IEEE多媒体期刊, 9(5): 958--966, 2007.谷歌学者数字图书馆
J.Huang、S.Kumar、M.Mitra、W.-J.Zhu和R.Zabih。使用颜色相关图进行图像索引。在IEEE计算机视觉和模式识别会议，第762页至第768页，1997年6月。谷歌学者数字图书馆
D.洛。具有与比例不变关键点不同的图像特征。国际计算机视觉杂志, 2(60): 91--110, 2004.谷歌学者数字图书馆
陆毅、张立良、田启超和马伟友。什么是语义缺口较小的高级概念？在IEEE计算机视觉和模式识别会议, 2008.谷歌学者
B.S.Manjunath和W.-Y.Ma。用于浏览和检索图像数据的纹理特征。IEEE模式分析和机器智能汇刊，18（8）：837--8421996年8月。谷歌学者数字图书馆
M.Naphade、J.R.Smith、J.Tesic、S.Chang、W.Hsu、L.Kennedy、A.Hauptmann和J.Curtis。多媒体的大规模概念本体。IEEE多媒体2006年7月，13:86--91。谷歌学者数字图书馆
D.K.Park、Y.S.Jeon和C.S.Won。有效使用局部边缘直方图描述符。在ACM多媒体, 2000.谷歌学者数字图书馆
G.-J.Qi、X.-S.Hua、Y.Rui、J.Tang、T.Mei和H.-J.Zhang。相关多标签视频注释。在ACM多媒体, 2007.谷歌学者数字图书馆
G.-J.Qi、X.-S.Hua、Y.Rui、J.Tang和H.-J.Zhang。二维多标签主动学习和有效的在线自适应模型用于图像分类。IEEE模式分析和机器智能汇刊，以显示。谷歌学者数字图书馆
L.G.夏皮罗和G.C.斯托克曼。计算机视觉普伦蒂斯·霍尔，2003年。谷歌学者数字图书馆
C.G.M.Snoek、M.Worring、J.C.van Gemert、J.-M Geusebroek和A.W.M.Smeulders。多媒体中101个语义概念的自动检测的挑战性问题。在ACM多媒体2006年10月。谷歌学者数字图书馆
斯特里克先生和奥伦戈先生。彩色图像的相似性。在图像和视频数据库的SPIE存储和检索III1995年2月。谷歌学者交叉引用
J.Tang、X.-S.Hua、M.Wang、Z.Gu、G.-J.Qi和X.Wu。视频注释的相关线性邻域传播。IEEE系统、人与控制论汇刊B部分：控制论2009年4月，第39（2）页。谷歌学者数字图书馆
J.Tang、Y.Song、X.S.Hua、T.Mei和X.Wu。构建视频标注的最优训练集。在ACM多媒体2006年10月。谷歌学者数字图书馆
A.Torralba、R.Fergus和W.Freeman。8000万张微小图像：用于非参数对象和场景识别的大型数据集。IEEE模式分析和机器智能汇刊，30（11）：1958--1970，2008年11月。谷歌学者数字图书馆
X.-J.Wang、L.Zhang、X.Li和W.-Y.Ma。通过挖掘图像搜索结果对图像进行注释。IEEE模式分析和机器智能汇刊，30（11）：1919--1932，2008年11月。谷歌学者数字图书馆

索引术语

NUS-WIDE：新加坡国立大学的真实世界网络图像数据库
1. 信息系统
  1. 信息检索
    1. 文件表示法
  2. 信息系统应用

建议

基于网络资源的图像标注标签训练集构建

最近，许多研究致力于通过利用网络图像的相关标签/关键字作为训练标签来进行图像注释。需要解决的一个关键问题是标签的准确性相对较低。在本文中，我们提出了一种新颖的。。。
阅读更多信息
用共现模型标记和检索图像：从corel到flickr
LS-MMRM’09：第一届ACM大型多媒体检索和挖掘研讨会会议记录

基于图像中标签和视觉特征的共现性，提出了两种基于内容的图像自动标注和检索模型。特别是，我们展示了如何采取其他措施。。。
阅读更多信息
Flickr中用户自定义图像标记的准确性：一个自然灾害案例研究
2016年第七届社交媒体与社会国际会议论文集

在过去几年中，社交媒体平台变得极为流行，为大规模全球社区内的信息传播提供了另一种途径，通常是首选途径。这种用户生成的多媒体内容正在成为。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
CIVR’09：ACM国际图像和视频检索会议记录
2009年7月
383页
国际标准图书编号：9781605584805
内政部：10.1145/1646396
会议主席：
孔帕蒂亚里斯
希腊CERTH-ITI
,
斯蒂芬·马尔坎德·梅利特
瑞士日内瓦大学
,
课程主席：
Yannis Avrithis公司
希腊NTUA
,
诺埃尔·奥康纳
爱尔兰DCU
,
丹尼尔·加蒂卡·佩雷斯
瑞士Idiap研究所
,
Tat Seng Chua先生
新加坡国立大学
版权所有©2009 ACM
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]
发起人
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2009年7月8日
权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
Flickr公司
注释
检索
标签细化
训练集构造
web图像
限定符
- 海报
会议
资金来源
其他指标
查看文章度量

文章指标
- 2,152
  引文总数
  查看引文
- 2,809
  总下载次数
- 下载次数（过去12个月）226
- 下载次数（最近6周）30
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

NUS-WIDE：来自新加坡国立大学的真实网络图像数据库

CIVR’09：ACM国际图像和视频检索会议记录

摘要

工具书类

引用人

索引术语

建议

基于网络资源的图像标注标签训练集构建

用共现模型标记和检索图像：从corel到flickr

Flickr中用户自定义图像标记的准确性：一个自然灾害案例研究

评论