×

对动态压缩序列和应用程序进行排名/选择。 (英语) Zbl 1194.68103号

摘要:对符号序列进行排序和选择的操作在设计简洁和压缩的数据结构方面有许多应用,这些数据结构管理文本集合、结构化文本、二进制关系、树、图等。我们感兴趣的是,可以通过插入和删除符号来更新集合。当前的两种解决方案在空间与时间的权衡中脱颖而出(当考虑所有操作时)。Mäkinen和Navarro的一个解决方案实现了所有操作的压缩空间(即,(nH_{0}+o(n\log\sigma)位)和(o(\log n\log\sigma))最坏情况时间,其中,\(n)是序列长度,\(\sigma\)是字母表大小,\(H_{0}\)是序列的零阶熵。Lee和Park提出的另一种解决方案实现了(O(\log n(1+\frac{\log\sigma}{\log\log n}))摊销时间和未压缩空间,即(n\log_{2}\sigma+O(n)+O(n\og\sigma)位。在本文中,我们表明可以实现两个世界的最佳状态。我们结合这些解来获得所有操作的空间位和最坏情况时间。除了该问题的当前最佳解决方案外,我们还获得了几个适用于部分和、文本索引、后缀数组、Burrows-Wheeler变换等的独立副产品。

MSC公司:

68第05页 数据结构
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] J.Barbay,A.Golynski,I.Munro,S.Rao,简洁编码二进制关系和树结构文档中的自适应搜索,收录于:Proc。第17届CPM,2006年,第24-35页;J.Barbay,A.Golynski,I.Munro,S.Rao,简洁编码二进制关系和树结构文档中的自适应搜索,收录于:Proc。第17届CPM,2006年,第24-35页·Zbl 1144.68307号
[2] J.Barbay,M.He,I.Munro,S.Rao,《字符串、二元关系和多标记树的简洁索引》,收录于:Proc。第18届SODA,2007年,第680-689页;J.Barbay,M.He,I.Munro,S.Rao,《字符串、二元关系和多标记树的简洁索引》,收录于:Proc。第18届SODA,2007年,第680-689页·Zbl 1302.68097号
[3] D.Blandford,G.Blelloch,有序集的紧表示,in:Proc。第15届SODA,2004年,第11-19页;D.Blandford,G.Blelloch,有序集的紧表示,in:Proc。第15届SODA,2004年,第11-19页·Zbl 1317.68040号
[4] M.Burrows,D.Wheeler,块排序无损数据压缩算法,技术代表124,数字设备公司,1994年;M.Burrows,D.Wheeler,块排序无损数据压缩算法,技术代表124,数字设备公司,1994
[5] Chan,H。;尊敬的W。;Lam,T。;Sadakane,K.,动态文本集合的压缩索引,ACM算法事务,3,2,21(2007)·Zbl 1321.68261号
[6] Chan,H.-L。;尊敬的W.-K。;Lam,T.-W.,动态文本集的压缩索引,(第15届组合模式匹配年度研讨会,第15届联合模式匹配年度会议,CPM), 445-456 ·Zbl 1103.68473号
[7] 科曼,T.H。;Leiserson,C.E。;Rivest,R.L。;Stein,C.,《算法导论》(2001),麻省理工学院出版社和McGraw-Hill·兹比尔1047.68161
[8] 费拉吉纳,P。;Manzini,G。;梅基宁,V。;Navarro,G.,序列和全文索引的压缩表示,ACM算法事务,3,2(2007),第20条·Zbl 1321.68263号
[9] 费拉吉纳,P。;文丘里尼,R.,实现熵界的字符串的简单存储方案,理论计算机科学,372,1,115-121(2007)·Zbl 1110.68029号
[10] Foschini,L。;格罗西,R。;古普塔,A。;Vitter,J.,《索引等于压缩时:压缩后缀数组和应用程序的实验》,ACM算法事务,2,4,611-639(2006)·Zbl 1430.68099号
[11] M.Fredman,M.Saks,《细胞探测动态数据结构的复杂性》,摘自:Proc。第43届ACM STOC,1989年,第345-354页;M.Fredman,M.Saks,《细胞探测动态数据结构的复杂性》,摘自:Proc。第43届ACM STOC,1989年,第345-354页
[12] A.Golynski,I.Munro,S.Rao,《大型字母表的排名/选择操作:文本索引工具》,in:Proc。第17届SODA,2006年,第368-373页;A.Golynski,I.Munro,S.Rao,《大型字母表的排名/选择操作:文本索引工具》,in:Proc。第17届SODA,2006年,第368-373页·Zbl 1192.68800号
[13] González,R。;Navarro,G.,简明数据结构的统计编码,(Proc.17th CPM.Proc.17st CPM,LNCS,vol.4009(2006)),295-306
[14] R.Grossi,A.Gupta,J.Vitter,高阶熵压缩文本索引,in:Proc。第14届SODA,2003年,第841-850页;R.Grossi,A.Gupta,J.Vitter,高阶熵压缩文本索引,收录于:Proc。第14次SODA,2003年,第841-850页·Zbl 1092.68584号
[15] A.Gupta,W.-K.Hon,R.Shah,J.S.Vitter,动态化简洁数据结构的框架,摘自:Proc。第34届ICALP,2007年,第521-532页;A.Gupta,W.-K.Hon,R.Shah,J.S.Vitter,动态化简洁数据结构的框架,摘自:Proc。第34届ICALP,2007年,第521-532页·Zbl 1171.68435号
[16] W.-K.Hon,T.-W.Lam,K.Sadakane,W.-K Sung,S.-M.Yiu,构建压缩后缀数组的时空高效算法,算法48(1);W.-K.Hon,T.-W.Lam,K.Sadakane,W.-K Sung,S.-M.Yiu,构建压缩后缀数组的时空高效算法,算法48(1)·Zbl 1123.68137号
[17] 尊敬的W.-K。;Sadakane,K。;Sung,W.-K.,可搜索部分和的简洁数据结构,(Proc.14th ISAAC。Proc.14th ISAAC,LNCS,vol.2906(2003)),505-516·Zbl 1205.68129号
[18] J.Kärkkäinen,通过分块后缀排序在小空间中快速BWT,in:Proc。DIMACS关于Burrows-Wheeler转变的研讨会:十年之后,2004年;J.Kärkkäinen,通过分块后缀排序在小空间中快速BWT,in:Proc。2004年,DIMACS关于Burrows-Wheeler转变的研讨会:十年之后
[19] Lee,S。;Park,K.,《动态等级选择结构及其对运行长度编码文本的应用》(Proc.18th CPM.Proc.18st CPM,LNCS,vol.4580(2007)),95-106·Zbl 1138.68418号
[20] 梅基宁,V。;Navarro,G.,动态熵压缩序列和全文索引,ACM算法事务,4,3(2008),第32条·Zbl 1446.68043号
[21] 梅基宁,V。;Navarro,G.,《隐含压缩增强与自我索引应用》(Proc.14th SPIRE.Proc.14st SPIRE,LNCS,vol.4726(2007)),214-226
[22] 美国曼伯。;Myers,G.,《后缀数组:在线字符串搜索的新方法》,SIAM计算杂志,22935-948(1993)·Zbl 0784.68027号
[23] Manzini,G.,《Burrows-Wheeler变换的分析》,美国医学会杂志,48,3,407-430(2001)·Zbl 1323.68262号
[24] Munro,I.,表,(《第16届FSTTCS会议录》,《第16期FSTTCS会录》,LNCS,第1180卷(1996年)),第37-42页
[25] 纳瓦罗,G。;Mäkinen,V.,压缩全文索引,ACM Computing Surveys,39,1(2007),第2条·Zbl 1321.68263号
[26] 帕特拉斯库,M。;Demaine,E.,细胞探针模型中的对数下限,SIAM计算杂志,35,4,932-963(2006)·Zbl 1122.68044号
[27] 普格利西,S。;Smyth,W。;Turpin,A.,后缀数组构造算法的分类法,ACM计算调查,39,2(2007),第4条
[28] R.Raman,V.Raman,S.Rao,简洁的可索引字典及其在编码中的应用\(k\);R.Raman、V.Raman和S.Rao,《简明可索引词典及其编码应用》·Zbl 1093.68582号
[29] Raman,R。;Rao,S.S.,《简明动态词典和树》(Proc.30th ICALP.Proc.30st ICALP,LNCS,vol.2719(2003)),357-368·Zbl 1039.68043号
[30] K.Sadakane,R.Grossi,将简洁的数据结构压缩到熵边界,in:Proc。第17届SODA,2006年,第1230-1239页;K.Sadakane,R.Grossi,将简洁的数据结构压缩到熵边界,in:Proc。第17届SODA,2006年,第1230-1239页·Zbl 1192.68188号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。