跳到主要内容
文章

数据库系统中的渐进轮廓计算

出版:2005年3月1日出版历史
跳过抽象节

摘要

天际线d日-维度数据集包含不受所有维度上任何其他点支配的点。Skyline计算最近在数据库界受到了相当大的关注,特别是对于渐进式方法,它可以快速返回初始结果,而无需读取整个数据库。然而,现有的所有算法都存在一些严重的缺陷,限制了它们在实践中的适用性。在本文中,我们开发了一种基于最近邻搜索的分支边界天际线(BBS)算法,它是I/O最优的,也就是说,它只对可能包含天际线点的节点执行一次访问。BBS易于实现,支持所有类型的渐进处理(例如,用户偏好、任意维度等)。此外,我们提出了几种有趣的天际线计算变体,并展示了如何应用BBS进行高效处理。

工具书类

  1. Acharya,S.、Poosala,V.和Ramaswamy,S.1999。空间数据库中的选择性估计。ACM数据管理会议记录(SIGMOD;宾夕法尼亚州费城,6月1-3日)。13--24.]]谷歌学者谷歌学者数字图书馆数字图书馆
  2. Balke,W.、Gunzer,U.和Zheng,J.,2004年。Web信息系统的高效分布式天际线。《扩展数据库技术国际会议论文集》(EDBT;希腊赫拉克利奥,3月14日至18日)。256--273.]]谷歌学者谷歌学者
  3. Beckmann,N.、Kriegel,H.、Schneider,R.和Seeger,B.1990年。R*-树:一种高效且稳健的点和矩形访问方法。ACM数据管理会议记录(SIGMOD;新泽西州大西洋城,5月23日至25日)。322--331.]]谷歌学者谷歌学者数字图书馆数字图书馆
  4. Berchtold,S.、Keim,D.和Kriegel,H.,1996年。X树:高维数据的索引结构。《超大数据库会议论文集》(VLDB;印度孟买,9月3-6日)。28-39.]]谷歌学者谷歌学者数字图书馆数字图书馆
  5. Böhm,C.和Kriegel,H.2001。确定大型多维数据库中的凸包。在《数据仓库和知识发现国际会议论文集》(DaWaK;德国慕尼黑,9月5-7日)。294--306.]]谷歌学者谷歌学者数字图书馆数字图书馆
  6. Borzsonyi,S.、Kossmann,D.和Stocker,K.,2001年。天际线操作员。在IEEE国际数据工程会议(ICDE;德国海德堡,4月2-6日)的会议记录中。421--430.]]谷歌学者谷歌学者数字图书馆数字图书馆
  7. Buchta,C.1989年。一组向量中最大值的平均数。通知。过程。莱特。,33, 2, 63--65.]]谷歌学者谷歌学者数字图书馆数字图书馆
  8. Chang,Y.、Bergman,L.、Castelli,V.、Li,C.、Lo,M.和Smith,J.,2000年。洋葱技术:线性优化查询的索引。在ACM数据管理会议记录中(SIGMOD;德克萨斯州达拉斯,5月16日至18日)。391--402.]]谷歌学者谷歌学者数字图书馆数字图书馆
  9. Chomicki,J.、Godfrey,P.、Gryz,J.和Liang,D.,2003年。天际线预选。在IEEE国际数据工程会议(ICDE;印度班加罗尔,3月5-8日)的会议记录中。717--719.]]谷歌学者谷歌学者
  10. Fagin,R.、Lotem,A.和Naor,M.,2001年。中间件的最佳聚合算法。在ACM SIGACT-SIGMOD-SIGART数据库系统原理研讨会的会议记录中(PODS;加州圣巴巴拉,5月21-23日)。102--113.]]谷歌学者谷歌学者数字图书馆数字图书馆
  11. Ferhatosmanoglu,H.、Stanoi,I.、Agrawal,D.和Abbadi,A.,2001年。受约束的最近邻查询。空间和时间数据库国际研讨会论文集(SSTD;加利福尼亚州雷东多海滩,7月12-15日)。257--278.]]谷歌学者谷歌学者数字图书馆数字图书馆
  12. Guttman,A.1984年。R树:用于空间搜索的动态索引结构。ACM数据管理会议记录(SIGMOD;马萨诸塞州波士顿,6月18-21日)。47--57.]]谷歌学者谷歌学者数字图书馆数字图书馆
  13. Hellerstein,J.、Anvur,R.、Chou,A.、Hidber,C.、Olston,C.、Raman,V.、Roth,T.和Haas,P.,1999年。交互式数据分析:控制项目。IEEE计算。32, 8, 51--59.]]谷歌学者谷歌学者数字图书馆数字图书馆
  14. Henrich,A.1994年。空间访问结构的距离扫描算法。ACM地理信息系统研讨会论文集(ACM GIS;马里兰州盖瑟斯堡,12月)。136-143.]]谷歌学者谷歌学者
  15. Hjaltason,G.和Samet,H.1999。空间数据库中的远程浏览。ACM事务处理。数据库系统。24265-318。]]谷歌学者谷歌学者数字图书馆数字图书馆
  16. Hristidis,V.、Koudas,N.和Papakonstantinou,Y.2001。PREFER:高效执行多参数排序查询的系统。《ACM数据管理会议记录》(SIGMOD;5月21日至24日)。259--270.]]谷歌学者谷歌学者数字图书馆数字图书馆
  17. Kossmann,D.、Ramsak,F.和Rost,S.,2002年。天空中的流星:天际线查询的在线算法。《超大数据库会议论文集》(VLDB;中国香港,8月20-23日)。275--286.]]谷歌学者谷歌学者数字图书馆数字图书馆
  18. Kung,H.、Luccio,F.和Preparia,F.1975。求一组向量的最大值。J.协会计算。机器。,22, 4, 469--476.]]谷歌学者谷歌学者数字图书馆数字图书馆
  19. Matousek,J.1991年。英语中的计算优势。通知。过程。莱特。38, 5, 277--278.]]谷歌学者谷歌学者数字图书馆数字图书馆
  20. Mclain,D.1974年。从任意数据点绘制等高线。计算。期刊17,4,318--324。]]谷歌学者谷歌学者交叉引用交叉引用
  21. Muralikrishna,M.和Dewitt,D.1988年。用于估计多维查询的选择性因子的等深度直方图。《美国计算机学会数据管理会议记录》(SIGMOD;伊利诺伊州芝加哥,6月1-3日)。28--36.]]谷歌学者谷歌学者数字图书馆数字图书馆
  22. Natsev,A.、Chang,Y.、Smith,J.、Li.,C.和Vitter。J.2001年。支持对分级输入进行增量连接查询。《超大数据库会议论文集》(VLDB;罗马,意大利,9月11-14日)。281--290.]]谷歌学者谷歌学者数字图书馆数字图书馆
  23. Papadias,D.、Tao,Y.、Fu,G.和Seeger,B.,2003年。天际线查询的优化渐进算法。在ACM数据管理会议记录中(SIGMOD;加利福尼亚州圣地亚哥,6月9-12日)。443--454.]]谷歌学者谷歌学者数字图书馆数字图书馆
  24. Papadias,D.、Kalnis,P.、Zhang,J.和Tao,Y.,2001年。空间数据仓库中的高效OLAP操作。空间和时间数据库国际研讨会论文集(SSTD;加利福尼亚州雷东多海滩,7月12-15日)。443--459.]]谷歌学者谷歌学者数字图书馆数字图书馆
  25. Preparata,F.和Shamos,M.1985年。计算几何导论。德国柏林施普林格。]]谷歌学者谷歌学者数字图书馆数字图书馆
  26. Roussopoulos,N.、Kelly,S.和Vincent,F.,1995年。最近邻居查询。ACM数据管理会议记录(SIGMOD;加州圣何塞,5月22日至25日)。71--79.]]谷歌学者谷歌学者数字图书馆数字图书馆
  27. 樱井,Y.,吉川,M.,Uemura,S.和小岛,H.2000。A树:使用相对近似的高维空间的索引结构。《超大数据库会议论文集》(VLDB;开罗,埃及,9月10-14日)。516--526.]]谷歌学者谷歌学者数字图书馆数字图书馆
  28. Salzberg,B.和Tsotras,V.1999。时态数据访问方法的比较。ACM计算。Surv公司。31, 2, 158--221.]]谷歌学者谷歌学者数字图书馆数字图书馆
  29. Sellis,T.、Roussopoulos,N.和Faloutsos,C.1987年。R&plus-树:多维对象的动态索引。《超大数据库会议论文集》(VLDB;英国布莱顿,9月1-4日)。507--518.]]谷歌学者谷歌学者数字图书馆数字图书馆
  30. Steuer,R.1986年。多准则优化。威利,纽约州纽约市。]]谷歌学者谷歌学者
  31. Tan,K.,Eng,P.和Ooi,B.,2001年。高效的渐进式天际线计算。《超大数据库会议论文集》(VLDB;罗马,意大利,9月11-14日)。301--310.]]谷歌学者谷歌学者数字图书馆数字图书馆
  32. Theodoridis,Y.、Stefanakis,E.和Sellis,T.2000。使用R树进行空间查询的高效成本模型。IEEE传输。知识。数据工程12、1、19--32。]]谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 数据库系统中的渐进轮廓计算

      建议

      评论

      奈德·查宾

      复杂的因素会减缓从数据库检索特定记录的搜索速度。本文解决的一个复杂因素是涉及多个维度时的查询选择标准,当维度使用非键数据时,这一复杂因素会更加严重。文献中经常使用的、本文中使用的一种经典多维搜索是从酒店数据库中对最靠近海滩且价格最低的酒店集进行二维检索:即所谓的天际线检索。本文首先在文献调查的基础上,对用于天际线搜索的主要算法进行了评估和比较。报告的六种算法是分治算法、块嵌套循环算法、排序优先天际线算法、位图算法、索引算法和最近邻算法。这种比较强调了累进性、无虚假遗漏、无虚假点击、公平性、检索引用的合并和普遍性。在最近邻算法的基础上,本文提出了一种比六种比较算法更好的算法,称之为分枝定界算法。本文解释了分枝定界算法,并提供了其正确性的广泛形式证明。然后,本文简要检查了对搜索到的数据库进行添加和删除的影响。接下来,本文确定了六种天际线搜索的“新变体”,以证明分支定界算法的优越性:约束天际线、分级天际线,按天际线分组、动态天际线以及枚举和K主导查询,以及天际带。只有分支和边界与所有六种变体兼容,除此之外,论文还引入了一种新的变体,即近似天带,它也在其中大放异彩。然后,本文对分枝定界算法与最近邻算法(通常是六种主要算法中用于大多数天际线搜索的最佳算法)的效率进行了实验评估。对于非新颖搜索,分支定界算法可以更好地显示三个评级因素中的每一个:维度、基数和累进行为。在这六种新的变种中,本文的分支定界算法最终也会比最近邻算法工作得更好。正如文章所指出的,保存与常见查询类型相关的天际线可以为活跃的数据库用户提供重要的节省。对我来说,分支定界算法所声称的理想属性表明,数据管理员应该调查该算法对他们自己的数据库的适用性。在线计算评论服务

      访问计算机文献的关键评论在这里

      成为评论员计算评论。

      评论

      登录选项

      检查您是否可以通过登录凭据或您的机构访问本文。

      登录

      完全访问权限

      • 发布于

        数据库系统上的封面图像ACM事务
        ACM数据库系统事务 第30卷第1期
        特刊:SIGMOD/PODS 2003
        2005年3月
        332页
        国际标准编号:0362-5915
        EISSN公司:1557-4644
        内政部:10.1145/1061318
        问题目录

        版权所有©2005 ACM

        出版商

        计算机协会

        美国纽约州纽约市

        出版历史

        • 出版:2005年3月1日
        发布于托兹第30卷第1期

        权限

        请求有关此文章的权限。

        请求权限

        检查更新

        限定符

        • 文章

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用eReader联机查看。

      电子阅读器