计算机科学>数据结构和算法
标题: 前缀过滤器:实践和理论上都优于Bloom
摘要: 许多近似成员查询数据结构或过滤器的应用程序只需要支持插入而不支持删除的增量过滤器。 然而,增量过滤器的设计空间缺少一个结合了空间效率、快速查询和快速插入的“最佳点”过滤器。 增量过滤器(如Bloom和blocked Bloom过滤器)的空间效率不高。 动态过滤器(即支持删除),如布谷鸟过滤器或向量商过滤器,具有空间效率,但不能始终快速插入和查询。 在本文中,我们提出了前缀过滤器,这是一种解决上述挑战的增量过滤器:(1)其空间(以位为单位)类似于最先进的动态过滤器; (2) 查询吞吐量很高,与布谷鸟过滤器的查询吞吐量相当; 和(3)插入吞吐量高,总构建时间比向量商滤波器和布谷滤波器的构建时间分别快1.39倍$-1.46倍$和3.2倍$-3.5倍$。 我们对前缀过滤器进行了严格的分析,该过滤器也适用于实际的集合大小(即$n=2^{25}$)。 该分析处理失败概率、误报率和操作需要访问多条缓存线的概率。