×

一种改进Bloom滤波器有损数据压缩精度的近似动态规划方法。 (英语) Zbl 1346.94058号

摘要:Bloom过滤器是一种用于以压缩形式存储数据的数据结构。它们提供了出色的空间和时间效率,但会损失一些准确性(所谓的有损压缩)。这项工作提出了一个是非Bloom过滤器,它作为一个数据结构,由两部分组成:是过滤器,它是一个标准的Bloom过滤器和非过滤器,它的目的是表示那些被是过滤器错误识别的对象(即识别是过滤器的误报)。通过在对象被yes过滤器识别后查询no-filter,我们有机会拒绝它,这与相同总长度的标准Bloom过滤器相比,提高了数据识别的准确性。如果选择包含在非过滤器中的对象,使非过滤器能够识别尽可能多的假阳性但不识别真阳性,从而在所有是非Bloom过滤器中产生最准确的是非Bloum过滤器,则可以进一步提高精确度。本文研究了如何使用优化技术来最大化非过滤器识别的误报数量,其约束是它不应识别真阳性。为了实现这一目标,提出了一种整数线性规划(ILP)来优化误报选择。在实践中,问题规模通常很大,导致难以求解的最优解。考虑到ILP与多维背包问题的相似性,利用简化的ILP进行值函数逼近,建立了近似动态规划(ADP)模型。数值结果表明,与许多启发式算法以及CPLEX内置解算器(B&B)相比,ADP模型的工作效果最好,这是推荐用于是非Bloom过滤器的方法。在有损压缩算法研究的更广泛背景下,我们的研究是一个示例,展示了如何应用优化方法库来提高压缩数据的准确性。

MSC公司:

94甲12 信号理论(表征、重建、滤波等)
90立方厘米 动态编程
90立方厘米 混合整数编程

软件:

CPLEX公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Bertsekas,D.P.,《动态规划和最优控制:近似动态规划》(2012),雅典娜科学出版社·Zbl 1298.90001号
[2] Bertsimas博士。;Demir,R.,多维背包问题的近似动态规划方法,管理科学,48,4550-565(2002)·兹比尔1232.90322
[3] Bloom,B.H.,具有允许错误的哈希编码中的空间/时间权衡,ACM通信,13,7422-426(1970)·Zbl 0195.47003号
[4] 布罗德,A。;Mitzenmacher,M.,bloom过滤器的网络应用:一项调查,互联网数学,1,4,485-509(2002)·Zbl 1090.68515号
[5] 布鲁克·J。;高杰。;Jiang,A.,加权bloom滤波器,IEEE信息理论国际研讨会,2304-2308(2006),IEEE
[6] Carrea,L。;Vernitski,A。;Reed,M.,《利用最小化误报实现网络路径编码的优化散列》,《计算机网络》,58180-191(2014)
[7] 陈,H。;Jin,H。;Chen,L。;刘,Y。;Ni,L.M.,优化对等多关键字搜索中的bloom过滤器设置,IEEE知识与数据工程汇刊,24,4,692-706(2012)
[8] Dong,L。;Glazebrook,K.,《开发启发式的近似动态规划方法,用于在清算系统中调度不耐烦的工作》,海军研究后勤,57,3,225-236(2010)·Zbl 1188.90118号
[9] B.唐纳。;Baynat,B。;Friedman,T.,《Retouched bloom filters:允许网络应用程序在选定的误报和漏报之间进行权衡》,《2006年ACM conext会议论文集》,13(2006),ACM
[10] 弗莱维尔,A.,《多维0-1看板问题:综述》,《欧洲运筹学杂志》,155,1-21(2004)·邮编:1045.90050
[11] Garey,M.P。;Johnson,D.S.,《计算机与难处理性:NP-完备性理论指南》,《数学科学丛书》(1979),W.H.Freeman&Co.,美国纽约州纽约市·Zbl 0411.68039号
[12] 格罗特,A。;Yang,X.,《基于贝塞尔曲线/曲面的上百分位交通路线近似动态规划》,《欧洲运筹学杂志》,218,3,698-707(2012)·Zbl 1244.90056号
[13] 郭,D。;刘,Y。;李,X。;Yang,P.,计数bloom过滤器的假阴性问题,IEEE知识与数据工程学报,22,5,651-664(2010)
[14] Hao,F。;科迪亚拉姆,M。;Lakshman,T.,使用分区散列构建高精度bloom过滤器,ACM SIGMETRICS性能评估评论,35,1,277-288(2007)
[15] Kellerer,H。;Pferschy,美国。;Pisinger,D.,背包问题(2004),Springer·Zbl 1103.90003号
[16] Kirsch,A。;Mitzenmacher,M.,《更少的散列,相同的性能:构建更好的bloom过滤器》,《随机结构和算法》,33,2,187-218(2008)·Zbl 1156.68368号
[17] Lorie,J。;萨维奇,L.,《资本配给中的三个问题》,《商业杂志》,28229-239(1955)
[18] 卢梅塔,S。;Mitzenmacher,M.,《利用两种选择的力量改进bloom过滤器》,《互联网数学》,4,1,17-33(2007)·Zbl 1170.68447号
[19] Martello,S。;Toth,P.,《背包问题:算法和计算机解释》(1990年),威利国际科学出版社·Zbl 0708.68002号
[20] Mitzenmacher,M.,压缩bloom过滤器,IEEE ACM网络汇刊,10,5,604-612(2002)
[21] 纳姆豪泽,G。;Wolsey,L.,整数和组合优化(1988),《离散数学和优化中的Wiley跨学科系列:离散数学和最优化中的Willey跨学科系列》,纽约Wiley·兹比尔0652.90067
[22] 帕赫,R。;Rodler,F.F.,Lossy dictionarys,ESA 01:第九届欧洲算法年会论文集,300-311(2001),Springer·Zbl 1006.68525号
[23] Powell,W.,《近似动态规划解决维度的诅咒》(2007),John Wiley and Sons:John Wiley and Sons New Jersey·Zbl 1156.90021号
[24] Pugh,W.,跳过列表:平衡树的概率替代方案,计算机科学讲义,382437-449(1989)·兹比尔0767.68023
[25] Tarkoma,S。;罗森伯格,C.E。;Lagerspetz,E.,分布式系统布鲁姆滤波器的理论与实践,IEEE通信调查与教程,14,1,131-155(2012)
[26] Tarkoma,S。;Rothenbergand,C.E。;Lagerspetz,E.,分布式系统布鲁姆滤波器的理论与实践,IEEE通信调查与教程,14,1,131-155(2012)
[29] Winston,W.L.,《运筹学:应用与算法》(2003),布鲁克斯/科尔
[30] Yang,X.先生。;Grothe,A.,《通过近似动态规划解决上百分位交通路径问题》,IMA管理数学杂志,23,4,413-434(2012)·Zbl 1250.90026号
[31] Yang,X.先生。;斯特劳斯,A.K。;Currieb,C.S.M。;Eglese,R.,电子化履行中基于选择的需求管理和车辆路线,运输科学(2014)
[32] 张,D。;Adelmany,D.,《利用客户选择进行网络收益管理的近似动态规划方法》,《运输科学》,第43、3、381-394页(2009年)
[33] 钟,M。;卢,P。;沈,K。;Seiferas,J.,优化数据流行意识的bloom过滤器,第二十七届ACM分布式计算原理研讨会论文集,355-364(2008),美国纽约州纽约市·Zbl 1301.90081号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。