魏茨曼标志
ECCC公司
电子关于计算复杂度

计算复杂性基础(CCF)

登录 | 注册 | 经典风格



报告>详细信息:

纸张:

TR24-065 | 2024年4月6日08:43

最优分位数估计:超越比较模型

订阅




TR24-065型
作者:梅加尔·古普塔,米希尔·辛哈尔,吴洪勋
出版时间:2024年4月8日22:03
下载次数:130
关键词:


摘要:

估计分位数是数据绘制的基本问题之一。给定来自某个大小为$U$的宇宙的$n$元素$x_1、x_2、\dots、x_n$到达数据流,分位数草图估计任何元素的秩,加性误差最多为$\varepsilon n$。解决此任务的低空间算法在数据库系统、网络测量、负载平衡和许多其他实际场景中都有应用。

当前描述为最优的分位数估计算法包括使用$O(\varepsilon^{-1}\log n)$words(确定性)的GK草图(Greenwald和Khanna 2001)和使用$O的KLL草图(Karnin、Lang和Liberty 2016)$word(随机,失效概率为$delta$)。然而,这两种算法仅在基于比较的模型中是最优的,而大多数典型的应用程序都涉及整数流,草图除了进行比较之外,还可以使用这些整数流。

如果我们超越基于比较的模型,确定性的q最大草图(Shrivastava、Buragohain、Agrawal和Suri 2004)的空间复杂度为$O(\varepsilon^{-1}\log U)$个单词,这与前面提到的草图是不可比的。长期以来,人们一直在问是否存在使用$O(\varepsilon^{-1})$words of space的分位数草图(只要$n\leq\text{poly}(U)$,这是最佳的)。在这项工作中,我们提出了一种使用$O(\varepsilon^{-1})$单词的确定性算法,解决了这一行。



国际标准编号1433-8092|印记