跳到主要内容
文章

Ferret:基于内容的特征丰富数据相似性搜索工具包

出版:2006年4月18日出版历史
跳过抽象节

摘要

为丰富的特征数据构建基于内容的搜索工具一直是一个具有挑战性的问题,因为丰富的特征信息(如音频记录、数字图像和传感器数据)固有的噪声和高维性。比较噪声数据需要基于相似性而不是精确匹配进行比较,因此搜索噪声数据需要相似性搜索而不是精确搜索。Ferret工具包旨在帮助系统构建者快速构建基于内容的相似性搜索系统,用于特征丰富的数据类型。该工具包的关键组件是一个基于内容的相似性搜索引擎,用于通用的多特征对象表示。为了解决高维空间中的相似性搜索问题,我们根据最近关于降维的理论结果开发了近似方法。搜索引擎从特征向量构建草图,作为高度紧凑的数据结构,用于匹配、过滤和排列数据对象。该工具包还包括其他几个组件,以帮助系统构建者解决搜索系统基础设施问题。我们已经实现了该工具包,并使用它成功构建了四种数据类型的基于内容的相似性搜索系统:音频记录、数字照片、3D形状模型和基因组微阵列数据。

工具书类

  1. 阿尔塔维斯塔。http://www.altavista.com。谷歌学者谷歌学者
  2. 聚光灯:立即在mac上找到任何东西。http://images.apple.com/macosx/pdf/macosx_Spotlight_TB.pdf。谷歌学者谷歌学者
  3. 三维模型检索。http://amp.ece.cmu.edu/projects/3DModelRetrieval/。谷歌学者谷歌学者
  4. 三维模型检索。http://3d.csie.ntu.edu.tw/~动态/。谷歌学者谷歌学者
  5. 三维模型检索。http://shape.cs.princeton.edu/search.html。谷歌学者谷歌学者
  6. A.Berenzweig和D.Ellis。在音乐信号中定位唱歌的声音片段。程序中。IEEE声学和音频信号处理应用研讨会,2001年10月。谷歌学者谷歌学者交叉引用交叉引用
  7. S.Brin和L.Page。对大型超文本网络搜索引擎的剖析。程序中。1998年第七届万维网大会。谷歌学者谷歌学者数字图书馆数字图书馆
  8. A.Broder、M.Charikar、A.Frieze和M.Mitzenmacher。Min-wise独立排列。计算机系统与科学杂志,60(3):630-6592000。谷歌学者谷歌学者数字图书馆数字图书馆
  9. A.Z.Broder、S.C.Glassman、M.S.Manasse和G.Zweig。网络的句法聚类。程序中。第六届国际互联网大会,第391-4041997页。谷歌学者谷歌学者数字图书馆数字图书馆
  10. A.Cardone、S.K.Gupta和M.Karnik。产品设计和制造应用中的形状相似性评估算法综述。《工程计算与信息科学杂志》,3(2):109-1182003。谷歌学者谷歌学者交叉引用交叉引用
  11. M.Charikar先生。取整算法中的相似性估计技术。程序中。第34届ACM年度研讨会。《计算理论》,第380-3882002页。谷歌学者谷歌学者数字图书馆数字图书馆
  12. Y.Deng和B.S.Manjunath。图像和视频中彩色纹理区域的无监督分割。IEEE传输。模式分析和机器智能,2001年。谷歌学者谷歌学者数字图书馆数字图书馆
  13. S.Dumais、E.Cutrell、J.Cadiz、G.Jancke、R.Sarin和D.C.Robbins。我见过的东西:个人信息检索和重用系统。程序中。第26届ACM SIGIR信息检索研究与开发会议,第72-79页,2003年。谷歌学者谷歌学者数字图书馆数字图书馆
  14. J.P.Eakins和M.e.Graham。基于内容的图像检索:向JISC技术应用程序方案提交的报告。技术报告,纽卡斯尔诺森比亚大学图像数据研究所,1999年。谷歌学者谷歌学者
  15. I.K.Fodor。降维技术综述。技术报告UCRL-ID-148494,劳伦斯·利弗莫尔国家实验室,2002年。谷歌学者谷歌学者交叉引用交叉引用
  16. J.S.Garofolo、L.F.Lamel、W.M.Fisher、J.G.Fiscus、D.S.Pallett和N.L.Dahlgren。DARPA TIMIT声学连续语音语料库,1993年。谷歌学者谷歌学者
  17. J.Gemmell、G.Bell、R.Lueder、S.Drucker和C.Wong。我的生命:实现Memex愿景。程序中。ACM多媒体,会议,第235-238页,2002年。谷歌学者谷歌学者数字图书馆数字图书馆
  18. K.Grauman和T.Darrell。使用近似推土机距离进行快速轮廓匹配。程序中。IEEE计算机视觉和模式识别会议,2004年。谷歌学者谷歌学者交叉引用交叉引用
  19. J.Gray和A.S.Szalay。橡胶与天空相遇的地方:缩小数据库与科学之间的差距。IEEE数据工程公告,27(4):3-112004年12月。谷歌学者谷歌学者
  20. A.Hauptmann、R.Jones、K.Seymore、S.Slattery、M.Witbrock和M.Siegler。从口语文档中检索信息的实验。正在进行中。《广播新闻转录与理解研讨会》,第175-181页,1998年。谷歌学者谷歌学者
  21. ftp://db.stanford.edu/pub/wangz/image.vary.jpg.tar。谷歌学者谷歌学者
  22. P.Indyk和R.Motwani。近似最近邻:消除维度诅咒。程序中。第30届美国计算机学会计算理论年会,第604-613页,1998年。谷歌学者谷歌学者数字图书馆数字图书馆
  23. P.Indyk和N.Thaper。通过嵌入实现快速图像检索。程序中。2003年,第三届国际视觉统计和计算理论研讨会。谷歌学者谷歌学者
  24. N.Iyer、S.Jayanti、K.Lou、Y.Kalyanaraman和K.Ramani。三维形状搜索:现状回顾和未来趋势。计算机辅助设计,37(5):509-5302005。谷歌学者谷歌学者数字图书馆数字图书馆
  25. M.Kazhdan、T.Funkhouser和S.Rusinkiewicz。三维形状描述符的旋转不变球谐表示。程序中。2003年欧洲制图几何处理研讨会。谷歌学者谷歌学者数字图书馆数字图书馆
  26. E.Kushilevitz、R.Ostrovsky和Y.Rabani。高效搜索高维空间中的近似最近邻。SIAM计算机杂志,30(2):457-4742000。谷歌学者谷歌学者数字图书馆数字图书馆
  27. Q.Lv、M.Charikar和K.Li。紧凑数据结构的图像相似性搜索。程序中。第13届美国计算机学会信息与知识管理会议,第208-217页,2004年。谷歌学者谷歌学者数字图书馆数字图书馆
  28. P.Lyman、H.Varian、K.Swaringen、P.Charles、N.Good、L.Jordan和J.Pal.2003年的信息量是多少?http://www.sims.berkeley.edu/research/projects/how-much-info-2003。谷歌学者谷歌学者
  29. W.Ma和H.Zhang。基于内容检索的图像特征基准测试。程序中。IEEE第32届信号、系统、计算机Asilomar会议,第1卷,第253-257页,1998年。谷歌学者谷歌学者
  30. N.Moreau、H.G.Kim和T.Sikora。基于语音的语音文档检索符合mpeg-7标准。程序。音频工程学会第25届国际会议,2004年。谷歌学者谷歌学者
  31. M.Olson、K.Bostic和M.Seltzer,伯克利数据库。程序中。1999年夏季USENIX技术会议,1999年6月。谷歌学者谷歌学者数字图书馆数字图书馆
  32. L.Rabiner和M.Sambur。确定孤立语句端点的算法。《贝尔系统技术期刊》,54:297--3151975。谷歌学者谷歌学者交叉引用交叉引用
  33. Y.Rubner、C.Tomasi和L.J.Guibas。推土机距离作为图像检索的度量。国际计算机视觉杂志,40(2):99-1212000。谷歌学者谷歌学者数字图书馆数字图书馆
  34. Y.Rui、T.S.Huang和S.F.Chang。图像检索:当前技术、有希望的方向和开放问题。视觉传达与图像表征杂志,10(4):39-621999。谷歌学者谷歌学者数字图书馆数字图书馆
  35. R.Schettini、G.Ciocca和S.Zuffi。图像数据库中彩色图像索引和检索方法综述。《彩色成像科学:利用数字媒体》,2001年。谷歌学者谷歌学者
  36. P.Shilane、M.Kazhdan、P.Min和T.Funkhouser。普林斯顿形状基准。形状建模与应用会议,2004年。谷歌学者谷歌学者数字图书馆数字图书馆
  37. M.Siegler和M.Witbrock。提高不完善笔录在口语文档信息检索中的适用性。IEEE声学、语音和信号处理国际会议,1999年。谷歌学者谷歌学者数字图书馆数字图书馆
  38. 相似图像集。http://dbvis.inf.unikonstanz.de/research/projects/SimSearch/effpics.html。谷歌学者谷歌学者
  39. A.W.Smeulders、M.Worring、S.Santini、A.Gupta和R.Jain。早期年末的基于内容的图像检索。IEEE传输。《模式分析和机器智能》,22(12),2000年。谷歌学者谷歌学者数字图书馆数字图书馆
  40. A.W.Smeulders、M.Worring、S.Santini、A.Gupta和R.Jain。早期基于内容的图像检索。IEEE模式分析和机器智能汇刊,22(12):1349-1380,2000。谷歌学者谷歌学者数字图书馆数字图书馆
  41. G.Tzanetakis和P.Cook。MARSYAS:音频分析框架。剑桥大学出版社,2000年。谷歌学者谷歌学者数字图书馆数字图书馆
  42. G.Tzanetakis和P.Cook。音频信号的音乐类型分类。IEEE语音和音频处理汇刊,10(5),2002年7月。谷歌学者谷歌学者交叉引用交叉引用
  43. R.C.Veltkamp公司。形状匹配:相似性度量和算法。程序中。《形状建模与应用国际会议》,第188页,2001年。谷歌学者谷歌学者数字图书馆数字图书馆
  44. R.C.Veltkamp和M.Tanase。基于内容的图像检索系统:调查,技术报告UU-CS-2000-34,乌得勒支大学,信息与计算机科学,2000年。谷歌学者谷歌学者
  45. J.Z.Wang、J.Li和G.Wiederhold。简单性:图片库的语义敏感集成匹配。IEEE传输。关于模式分析和机器智能,23(9):947-9632001。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. Ferret:基于内容的特征丰富数据相似性搜索工具包

    建议

    评论

    登录选项

    检查您是否可以通过登录凭据或您的机构访问本文。

    登录

    完全访问权限

    • 发布于

      封面图片ACM SIGOPS操作系统评论
      ACM SIGOPS操作系统审查 第40卷第4期
      2006年EuroSys会议记录
      2006年10月
      383页
      ISSN公司:0163-5980
      内政部:10.1145/1218063
      期刊目录
      • 封面图片ACM会议
        EuroSys’06:2006年第一届ACM SIGOPS/EuroSys欧洲计算机系统会议记录
        2006年4月
        420页
        国际标准图书编号:1595933220
        内政部:10.1145/1217935

      版权所有©2006作者

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      • 出版:2006年4月18日

      检查更新

      限定符

      • 文章

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用eReader联机查看。

    电子阅读器