转到|计算机视觉数据|科布斯·巴纳德的研究页面|科布斯·巴纳德的主页

的数据

“匹配单词和图片”,科布斯·巴纳德(Kobus Barnard)、皮纳尔·杜古鲁(Pinar Duygulu)、南多·德·弗雷塔斯(Nando de Freitas)、大卫·福塞斯(David Forsyth),David Blei和Michael I.Jordan,《机器学习研究杂志》,卷第3页,第1107-1135页。

(此数据的适当存档参考)。


(带有README文件的gzipped tar ball)

请注意,下载量约为160 Megs。如果你需要小包装,尝试单击 在这里。

描述

(以下描述包含在自述文件中)

此目录包含用于JMLR论文“匹配单词和图片”,作者:科布斯·巴纳德、皮纳尔·杜古鲁、南多·德·弗雷塔斯、大卫·福赛斯,David Blei和Michael I.Jordan,《机器学习研究杂志》,卷第3页,第1107-1135页。如果您使用此数据,这是适当的参考。

这些数据都是拼凑在一起的,有一些异常。更仔细一点准备好的数据将在未来提供。

每个图像段由46个特征表示。由于每个图像都有一个不同数量的分段,我们列出单独使用的分段数量文件,以便可以将整个图像段集读入单个Matlab文件。给定图像的分段按降序列出大小和与下一个图像的大小之间用几个空格隔开。对于我们使用的JMLR论文中最大的10个部分(如果有10个或更多),或如果有10个或更少的段,则为所有段。不同格式的数据其中包括未使用的段,可根据要求提供。

为了计算颜色特征,图像线性化的基础是它们是PCD图像,为了方便起见,它们被放大了(255/107),这是一个有点武断的因素,根据PCD格式。(事后来看,因子2更有意义,但使用这或任何其他因素都不会改变任何事情)。请注意都是多余的。还请注意,RGB和L*a*b功能被复制到为一个特定的实验增加体重(很久以前就完成了),我们随后没有删除重复的列。我不知道这是不是复制无意中帮助、阻碍或对这些没有影响实验。然而,如果您需要非奇异特征矩阵,您将必须将其移除。46项功能包括:

面积,x,y,边界/面积,凸度,惯性矩(6)ave RGB(3)ave RGB(3,是的,重复!)RGB标准偏差(3)平均rgS(3)rgS标准偏差(3)平均L*a*b(3)平均L*a*b(3,是的,重复!)实验室标准偏差(3)平均定向能量,30度增量(12)高斯平均差,4σ(4)
数据被组织成大约16000张图像的10个不同样本。对于每个样本有三个不相交的子集对应于训练数据,保留了数据,一个更难保留的数据集在论文中被称为“小说”。每个文件都没有前缀(training)“test_1_”(保留out)或“test_3”(新颖)。(没有test_2)。文件“words”适用于所有三组。

文件如下。

使用的词汇。我们计算从1开始的单词,所以“city”是单词1。文档_单词测试_文档_单词测试_文档_单词图像的单词。每行都有一个数字列表,这些数字是索引到词汇文件“words”中。计数从1开始。如果图像中的斑点少于最大斑点,行中填充了-99,以便文件可以作为Matlab矩阵读取。单词_计数测试_单词计数测试3_任务_计数每个图像的字数。这些文件包含相同的信息作为文档word文件。blob_counts数测试_1_blob_countstest_3_全局计数每行一个数字,给出用于该图像的斑点数。斑点test_1_球测试3_球图像的blob的功能,按图像顺序列出,然后减小blob大小。为了辨别哪个斑点与哪个图像,您需要文件blob_counts或文件document_blobs。请注意,对于每个图像。文档_博客测试_文档_博客测试_3_文档_blobs(2004年4月4日编辑:原文建议文件提供了blob标记。然而,这些文件只是指出到实际的斑点。获取用于ECCV的令牌2002年论文,查阅文件集群成员和test_1集群成员身份)图像的斑点。此数据仅与离散翻译法。每行有一个数字列表将索引表示为文件“blob”。如果图像较少blob大于最大值,则用-99填充该行,以便文件可以作为Matlab矩阵读取。(这些文件的名称有些误导,因为它们与documentwords和test_1_document_words。这些文件不再提供给您blob_counts和test_1_blob_counts。)集群成员身份测试_集群成员资格测试3集群成员与文件blob的每一行关联的blob标记,test1_blobs和test_3_blobs。此数据仅与离散翻译解决了这个问题。图像_编号测试_图像_编号测试_图像_编号Corel图像编号。我们无法分配实际图片版权限制。数据可以与一些没有图像的范围。我们为那些可以访问Corel图像。有多种版本的Corel数据,到目前为止,图像数字似乎是跨版本一致。因此,如果您有不同版本的可以构造一个子集的数据我们的数据和您的数据的交集。分段任务(_M)在seg_masks目录中,我们包含了JMLR论文使用的珊瑚图片。再一次,我们无法由于版权限制,分发实际图像。


(带有README文件的gzipped tar ball)

请注意,下载量约为160 Megs。如果你需要小包装,尝试单击 在这里。