跳到主要内容
10.1145/1376616.1376706acm会议文章/章节视图摘要出版物页面国防部会议记录会议收藏品
研究论文

EASE:一种有效的非结构化、半结构化和结构化数据三合一关键字搜索方法

出版:2008年6月9日出版历史

摘要

传统的关键词搜索引擎仅限于给定的数据模型,无法轻松适应非结构化、半结构化或结构化数据。本文提出了一种高效且自适应的关键字搜索方法,称为EASE,用于索引和查询大量异构数据。为了实现高效处理关键字查询,我们首先将非结构化、半结构化和结构化数据建模为图,然后对这些图进行汇总并构建图索引,而不是使用传统的反向索引。我们提出了一种扩展的反向索引来促进基于关键字的搜索,并提出了一个新的排名机制来提高搜索效率。我们使用实际数据集进行了广泛的实验研究,结果表明,EASE实现了高搜索效率和高精度,并且显著优于现有方法。

工具书类

  1. S.Agrawal、S.Chaudhuri和G.Das。Dbxplorer:在关系数据库上进行基于关键字的搜索的系统。在ICDE中,第5-16页,2002年。谷歌学者谷歌学者数字图书馆数字图书馆
  2. G.Bhalotia、A.Hulgeri、C.Nakhe、S.Chakrabarti和S.Sudarshan。使用银行在数据库中进行关键字搜索和浏览。在ICDE中,第431-440页,2002年。谷歌学者谷歌学者数字图书馆数字图书馆
  3. S.Chaudhuri、R.Ramakrishnan和G.Weikum。集成db和ir技术:单手拍手的声音是什么?在CIDR中,第1-12页,2005年。谷歌学者谷歌学者
  4. S.Cohen、J.Mamou、Y.Kanza和Y.Sagiv。Xsearch:一个XML语义搜索引擎。VLDB,2003年。谷歌学者谷歌学者数字图书馆数字图书馆
  5. P.DeRose、W.Shen、F.Chen、Y.Lee、D.Burdick、A.Doan和R.Ramakrishnan。数据库研究社区的社区信息管理平台。CIDR,2007年。谷歌学者谷歌学者
  6. B.Ding、J.X.Yu、S.Wang、L.Qin、X.Zhang和X.Lin。在数据库中查找top-k最小代价连通树。ICDE,2007年。谷歌学者谷歌学者交叉引用交叉引用
  7. R.费金。组合来自多个系统的模糊信息。在PODS中,第216至226页,1996年。谷歌学者谷歌学者数字图书馆数字图书馆
  8. R.费金。多媒体数据库系统中的模糊查询。在PODS中,第1-10页,1998年。谷歌学者谷歌学者数字图书馆数字图书馆
  9. J.Graupmann、R.Schenkel和G.Weikum。用于异构XML和web文档的统一分级检索的球体搜索引擎。VLDB,第529-540页,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  10. L.Guo、J.Shanmugasundaram和G.Yona。生物数据库的拓扑搜索。ICDE,2007年。谷歌学者谷歌学者交叉引用交叉引用
  11. L.Guo、F.Shao、C.Botev和J.Shanmugasundaram。Xrank:对XML文档进行排名关键字搜索。在SIGMOD中,第16-27页,2003年。谷歌学者谷歌学者数字图书馆数字图书馆
  12. 何浩、王浩、杨俊杰和余鹏。闪烁:图形上的排名关键字搜索。SIGMOD,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  13. V.Hristidis、L.Gravano和Y.Papakonstantinou。关系数据库上高效的ir-style关键字搜索。VLDB,第850-861页,2003年。谷歌学者谷歌学者数字图书馆数字图书馆
  14. V.Hristidis、N.Koudas、Y.Papakonstantinou和D.Srivastava。XML树中的关键字邻近搜索。在IEEE TKDE 18(4)中,第525--539页,2006年。谷歌学者谷歌学者数字图书馆数字图书馆
  15. V.Hristidis和Y.Papakonstantinou。发现:关系数据库中的关键字搜索。VLDB,2002年。谷歌学者谷歌学者数字图书馆数字图书馆
  16. V.Hristidis、Y.Papakonstantinou和A.Balmin。XML图上的关键词邻近搜索。在ICDE中,第367-378页,2003年。谷歌学者谷歌学者交叉引用交叉引用
  17. V.Kachoia、S.Pandit、S.Chakrabarti、S.Sudarshan、R.Desai和H.Karambelkar。图形数据库关键字搜索的双向扩展。在VLDB中,第505--516页,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  18. W.-S.Li、K.S.Candan、Q.Vu和D.Agrawal。通过“信息单元”检索和组织网页。WWW,2001年。谷歌学者谷歌学者数字图书馆数字图书馆
  19. G.Li、J.Feng、J.Wang和L.Zhou。高效关键字搜索XML文档上有价值的LCA。在CIKM,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  20. F.Liu、C.Yu、W.Meng和A.Chowdhury。关系数据库中的有效关键字搜索。SIGMOD,2006年。谷歌学者谷歌学者数字图书馆数字图书馆
  21. Z.Liu和Y.Chen。识别XML关键字搜索的返回信息。SIGMOD,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  22. Y.Luo、X.Lin、W.Wang和X.Zhou。Spark:关系数据库中的Top-k关键字查询。SIGMOD,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  23. A.Markowetz、Y.Yang和D.Papadias。关系数据流上的关键字搜索。SIGMOD,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  24. M.Mutsuzaki,M.Theobald,A.Keijzer,J.Widom,P.Agrawal,andet al.三合一:传统数据库上的分层不确定性和血统。CIDR,2007年。谷歌学者谷歌学者
  25. C.Sun、C.Y.Chan和A.K.Goenka。XML数据中基于多方向slca的关键字搜索。在WWW上,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  26. M.Theobald、R.Schenkel和G.Weikum。用于topx搜索的高效且通用的查询引擎。VLDB,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  27. G.威库姆。数据库(&D);爱尔兰:双方现在(主旨)。SIGMOD,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  28. Y.Xu和Y.Papakonstantinou。XML数据库中最小lca的高效关键字搜索。在SIGMOD中,第527-538页,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  29. 俞炳彦、李国健、索尔林斯和董亚凯。有效的基于关键字的关系数据库选择。SIGMOD,2007年。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. EASE:一种有效的非结构化、半结构化和结构化数据三合一关键字搜索方法

    建议

    评论

    登录选项

    检查您是否可以通过登录凭据或您的机构访问本文。

    登录

    完全访问权限

    • 发布于

      封面图片ACM会议
      SIGMOD'08:2008 ACM SIGMOD数据管理国际会议记录
      2008年6月
      1396页
      国际标准图书编号:9781605581026
      内政部:10.1145/1376616

      版权所有©2008 ACM

      如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。向请求权限[电子邮件保护]

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      • 出版:2008年6月9日

      权限

      请求有关此文章的权限。

      请求权限

      检查更新

      限定符

      • 研究论文

      接受率

      总体验收率785属于4,003提交,20%

    PDF格式

    以PDF文件的形式查看或下载。

    PDF格式

    电子阅读器

    使用eReader联机查看。

    电子阅读器