超日志

HyperLogLog:对一个近似最优基数估计算法的分析这个扩展的摘要描述和分析了一个近似最优的概率算法,HyperLogLog,专门用来估计非常大的数据集合中不同元素的数量(基数)。使用m个单位的辅助存储器(通常是“短字节”),HyperLogLog对数据执行一次传递,并生成基数的估计值,使得相对精度(标准误差)通常约为1·04/m。这改进了以前最著名的基数估计器LogLog,它的准确度只需消耗原始内存的64%。例如,新算法使得在使用1.5千字节内存的情况下,可以以2%的典型精度估计远远超过109的基数。该算法优化并行,适用于滑动窗口模型。


zbMATH中的参考文献(参考文献22条,1标准件)

显示第1到第20个结果,共22个。
按年份排序(引用)
  1. 蒙蒂尔,雅各布;哈尔福德,麦克斯;马斯特利尼,马蒂埃洛;鲍米尔,杰弗里;苏蒂,拉斐尔;范斯,罗宾;佐伊丁,阿迪尔;戈麦斯,海托·穆里洛;读吧,杰西;Abdessalem,滑石;Bifet,Albert:River:Python流数据的机器学习(2021)
  2. 布兰德斯,菲利普;卡尔达斯、马尔辛;克洛诺夫斯基,马雷克;帕克,多米尼克;Wattenhofer,Roger:蜂鸣模型中无线网络的快速规模近似(2020)
  3. 本·巴萨特,冉;艾因齐格,吉尔;弗里德曼,罗伊:给我点松懈:有效的网络测量(2019)
  4. 科斯利基,大卫;Zabeti,Hooman:通过遏制指数改进MinHash及其在元基因组分析中的应用(2019)
  5. 林伯格,阿里克;斯皮格尔曼,亚历山大;博特尼科夫,爱德华;希莱尔,埃什卡尔;基达尔,伊迪特;Servinsky,Hadar:快速并发数据草图(2019)
  6. 塞萨尔桑切斯;施耐德,杰拉多;阿伦特,沃尔夫冈;巴托奇、埃齐奥;比安库利,多梅尼科;科伦坡,基督教;法尔肯,伊莉丝;弗朗卡兰扎,阿德里安;Krstić,Srđan;卢伦索,若昂。;尼科维奇,德扬;佩斯,戈登J。;鲁菲诺,何塞;西诺尔斯,朱利安;特劳特尔,德米特里;Weiss,Alexander:来自高级应用领域(超越软件)的运行时验证挑战调查(2019)
  7. 布拉弗曼,弗拉基米尔;格里戈雷斯库,埃琳娜;朗,哈利;伍德拉夫,大卫P。;Zhou,Samson:《滑动窗上的近乎最佳的独特元素和重量级玩家》(2018)
  8. Rachkovskij,D.A.:实值向量快速相似性搜索的索引结构。一(2018)
  9. Rachkovskij,D.A.:用于快速距离和相似性估计的二进制向量(2017)
  10. Rachkovskij,D.A.:二进制向量快速相似性搜索的索引结构(2017)
  11. 伍德拉夫,大卫P。;张琴:当分布式计算是通信昂贵时(2017)
  12. 赵俊洲;王平辉;吕,约翰·C·S。;托斯利,唐;关晓红:磁盘驻留图(H)-群闭中心度的I/O有效计算(2017)
  13. 布兰德斯,菲利普;卡尔达斯、马尔辛;克洛诺夫斯基,马雷克;帕克,多米尼克;Wattenhofer,Roger:在嘟嘟声模型中近似无线网络的大小(2016)
  14. 科恩,鲁文;卡齐尔,利兰;Yehezkel,Aviv:将基数估计推广到和聚合的统一方案(2015)
  15. 福斯,迈克尔;黄显奎;Zacharovas,Vytas:trie统计和相关结构的渐近方差分析方法(2014)
  16. 李荣华;余,徐杰弗里;黄欣;程红;尚泽超:大型复杂网络中MVC攻击的影响度量(2014)
  17. Csűrös,Miklós:浮点计数器的近似计数(2010)
  18. Lumbroso,Jérémie:一种基于序统计及其全分析的最优基数估计算法(2010)
  19. Giroire,Frédéric:有序统计和海量数据集基数估计(2009)
  20. 内贾尔,塞巴斯蒂安;卡萨利,阿兰;西切蒂,松香;Lakhal,Lotfi:新兴立方体:边界、大小估计和无损缩减(2009)ioport公司