跳到主要内容
文章

分位数摘要的空间效率在线计算

作者信息和声明
出版:2001年5月1日出版历史
跳过抽象节

摘要

序列的∈-近似分位数摘要N个元素是一种数据结构,可以回答关于序列的分位数查询,精度在∈以内N个.

我们提出了一种新的在线算法来计算超大数据序列的∈-近似分位数摘要。该算法的最坏情况空间要求为¦Β(1÷∈log(∈N个)). 这改进了以前的最佳结果Ο(1÷∈log2(∈N个)). 此外,与早期的确定性算法相比,我们的算法不需要输入序列长度的先验知识。

最后,在实验数据上获得的实际空间边界明显优于我们算法的最坏情况保证以及早期算法的观测空间要求。

工具书类

  1. 1Rakesh Agrawal和Arun Swami。一种用于查找分位数的单程空间有效算法。程序。1995年12月28日至30日,COMAD第七届国际数据管理大会。谷歌学者谷歌学者
  2. 2哈立德·阿尔萨布蒂(Khaled Alsabti)、桑杰·兰卡(Sanjay Ranka)和维尼特·辛格(Vineet Singh)。一种用于精确估计磁盘驻留数据分位数的单程算法。1997年8月26日至29日在希腊雅典举行的第23届国际超大数据库会议记录,第346-355页,美国加利福尼亚州洛斯阿尔托斯,94022,1997年。摩根·考夫曼出版社。谷歌学者谷歌学者数字图书馆数字图书馆
  3. 苏拉吉特·乔杜里(Surajit Chaudhuri)、拉杰夫·莫特瓦尼(Rajeev Motwani)和维维克·纳拉萨亚(Vivek Narasayya)。直方图构建的随机抽样:多少是足够的?1998年6月1日至4日,华盛顿州西雅图,ACM SIGMOD’98,第28卷,第436-447页。谷歌学者谷歌学者数字图书馆数字图书馆
  4. 4菲利普·吉本斯(Phillip B.Gibbons)、尤西·马蒂亚斯(Yossi Matias)和维斯瓦纳特·普萨拉(Viswanath Poosala)。快速增量维护近似直方图。《第23届国际协调会超大数据库会议记录》,VLDB,第466-475页。Morgan Kaufmann,1997年8月25日至27日。谷歌学者谷歌学者数字图书馆数字图书馆
  5. 5迈克尔·格林沃尔德(Michael B.Greenwald)。用于自缩放直方图或优于平均数据采集的实用算法。绩效评估,27&1996年10月28日19时40分。谷歌学者谷歌学者数字图书馆数字图书馆
  6. 6R.Jain和I.Chlamtac。P2算法用于动态计算分位数和直方图,无需存储观测值。ACM通讯,28(10):1076-10851986年10月。谷歌学者谷歌学者数字图书馆数字图书馆
  7. 7I.波尔。计算中值的最小存储算法。IBM研究报告RC 27011969年11月。谷歌学者谷歌学者
  8. 8古梅特·辛格·曼库(Gurmeet Singh Manku)、斯里达尔·拉贾戈帕兰(Sridhar Rajagopalan)和布鲁斯·林赛(Bruce G.Lindsay)。一次通过且内存有限的近似中间值和其他分位数。ACM SIGMOD’98,第28卷,第426-435页,西雅图,华盛顿州,1998年6月。谷歌学者谷歌学者数字图书馆数字图书馆
  9. 9古梅特·辛格·曼库(Gurmeet Singh Manku)、斯里达尔·拉贾戈帕兰(Sridhar Rajagopalan)和布鲁斯·林赛(Bruce G.Lindsay)。用于大型数据集顺序统计的空间有效在线计算的随机抽样技术。ACM SIGMOD’99,第29卷,第251-262页。宾夕法尼亚州费城,1999年6月。谷歌学者谷歌学者数字图书馆数字图书馆
  10. 10J.I.Munro和M.S.Paterson。有限存储的选择和分拣。理论计算机科学,第12卷:315-323;1980谷歌学者谷歌学者交叉引用交叉引用
  11. 11M.S.帕特森。选择进度。技术报告,英国考文垂沃里克大学,1997年。谷歌学者谷歌学者
  12. 12Viswanath Poosala、Venkatesh Ganti和Yannis E.Ioanidis。使用直方图进行近似查询回答。IEEE数据工程技术委员会公报,22(4):6-151999年12月。谷歌学者谷歌学者
  13. 13Viswanath Poosala、Peter J.Haas、Yannis E.Ioanidis和Eugene J.Shekita。改进的直方图用于范围谓词的选择性估计。1996年6月4日至6日,加拿大魁北克省蒙特利尔市,ACM SIGMOD 96,第26卷,第294-305页。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 分位数摘要的空间高效在线计算

          建议

          评论

          登录选项

          检查您是否可以通过登录凭据或您的机构访问本文。

          登录

          完全访问权限

          • 发布于

            封面图片ACM SIGMOD记录
            ACM SIGMOD记录 第30卷第2期
            2001年6月
            625页
            国际标准编号:0163-5808
            DOI(操作界面):2014年10月14日/376284
            期刊目录

            版权所有©2001 ACM

            如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

            出版商

            计算机协会

            美国纽约州纽约市

            出版历史

            • 出版:2001年5月1日

            检查更新

            限定符

            • 文章

          PDF格式

          以PDF文件查看或下载。

          PDF格式

          电子阅读器

          使用eReader联机查看。

          电子阅读器