“匹配单词和 图片”, 科布斯·巴纳德(Kobus Barnard)、皮纳尔·杜古鲁(Pinar Duygulu)、南多·德·弗雷塔斯(Nando de Freitas)、大卫·福塞斯(David Forsyth), David Blei和Michael I.Jordan,《机器学习研究杂志》,卷 第3页,第1107-1135页。
(此数据的适当存档参考)。
面积,x,y,边界/面积,凸度,惯性矩(6) ave RGB(3) ave RGB(3,是的,重复!) RGB标准偏差(3) 平均rgS(3) rgS标准偏差(3) 平均L*a*b(3) 平均L*a*b(3,是的,重复!) 实验室标准偏差(3) 平均定向能量,30度增量(12) 高斯平均差,4σ(4)
话 使用的词汇。 我们计算从1开始的单词,所以“city”是 单词1。 文档_单词 测试_文档_单词 测试_文档_单词 图像的单词。 每行都有一个数字列表,这些数字是 索引到词汇文件“words”中。 计数从1开始。 如果 图像中的斑点少于最大斑点,行中填充了 -99,以便文件可以作为Matlab矩阵读取。 单词_计数 测试_单词计数 测试3_任务_计数 每个图像的字数。 这些文件包含相同的 信息作为文档word文件。 blob_counts数 测试_1_blob_counts test_3_全局计数 每行一个数字,给出用于该图像的斑点数。 斑点 test_1_球 测试3_球 图像的blob的功能,按图像顺序列出, 然后减小blob大小。 为了辨别哪个斑点与 哪个图像,您需要文件blob_counts或文件 document_blobs。 请注意,对于 每个图像。 文档_博客 测试_文档_博客 测试_3_文档_blobs (2004年4月4日编辑:原文建议 文件提供了blob标记。 然而,这些文件只是指出 到实际的斑点。 获取用于ECCV的令牌 2002年论文,查阅文件集群成员和 test_1集群成员身份) 图像的斑点。 此数据仅与 离散翻译法。 每行有一个数字列表 将索引表示为文件“blob”。 如果图像较少 blob大于最大值,则用-99填充该行,以便 文件可以作为Matlab矩阵读取。 (这些文件的名称有些误导,因为它们 与documentwords和 test_1_document_words。 这些文件不再提供给您 blob_counts和 test_1_blob_counts。) 集群成员身份 测试_集群成员资格 测试3集群成员 与文件blob的每一行关联的blob标记, test1_blobs和test_3_blobs。 此数据仅与 离散翻译解决了这个问题。 图像_编号 测试_图像_编号 测试_图像_编号 Corel图像编号。 我们无法分配实际 图片版权限制。 数据可以与一些 没有图像的范围。 我们为那些 可以访问Corel图像。 有多种版本的 Corel数据,到目前为止,图像数字似乎是 跨版本一致。 因此,如果您有不同版本的 可以构造一个子集的数据 我们的数据和您的数据的交集。 分段任务(_M) 在seg_masks目录中,我们包含了 JMLR论文使用的珊瑚图片。 再一次,我们无法 由于版权限制,分发实际图像。