Optimal quantile estimation: beyond the comparison model

Meghal Gupta; Mihir Singhal; Hongxun Wu

由计算复杂性基础（CCF）

报告>详细信息：

纸张：

TR24-065 | 2024年4月6日08:43

最优分位数估计：超越比较模型

第24页至第065页作者：梅加尔·古普塔,米希尔·辛哈尔,吴洪勋
出版日期：2024年4月8日22:03
下载：705

关键词：

摘要：

分位数的估计是数据绘制的基础问题之一。给定来自某个大小为$U$的宇宙的$n$元素$x_1、x_2、\dots、x_n$到达数据流，分位数草图估计任何元素的秩，加性误差最多为$\varepsilon n$。解决此任务的低空间算法在数据库系统、网络测量、负载平衡和许多其他实际场景中都有应用。

当前描述为最优的分位数估计算法包括使用$O（\varepsilon^{-1}\log n）$words（确定性）的GK草图（Greenwald和Khanna 2001）和使用$O的KLL草图（Karnin、Lang和Liberty 2016）$word（随机，失效概率为$delta$）。然而，这两种算法仅在基于比较的模型中是最优的，而大多数典型的应用程序都涉及整数流，草图除了进行比较之外，还可以使用这些整数流。

如果我们超越基于比较的模型，确定性的q最大草图（Shrivastava、Buragohain、Agrawal和Suri 2004）的空间复杂度为$O（\varepsilon^{-1}\log U）$个单词，这与前面提到的草图是不可比的。长期以来，人们一直在问是否存在使用$O（\varepsilon^{-1}）$words of space的分位数草图（只要$n\leq\text{poly}（U）$，这是最佳的）。在这项工作中，我们提出了一种使用$O（\varepsilon^{-1}）$单词的确定性算法，解决了这一行。

国际标准编号1433-8092|印记