×

动态排名/选择结构,应用于运行长度编码文本。 (英语) Zbl 1181.68121号

摘要:给定一个长度为n的文本覆盖一个sigma大小的字母表,我们提出了一个文本的动态排序/选择结构框架及其一些应用。对于带有\(sigma\leq\log n)的小字母表,我们提出了一种由计数方案和存储方案组成的两级结构,该存储方案支持\(O(\log n)\)最坏情况下的时间秩/选择操作和\(O)\)摊销时间插入/删除操作。对于带有\(log n<\sigma \leq n)的大字母表,我们将其扩展为获得\(O(1+\frac{\log\sigma}{\log\ log n})\log n \)最坏情况下的时间秩/选择和\(O。我们的结构提供了文本集合索引的简单表示。此外,我们还介绍了文本的游程编码(RLE)的秩/选择结构。对于长度为(n)的文本的长度为(n^{prime})的RLE,我们的静态版本使用(n^}prime}\log\sigma+O(n)位提供了(O(1))时间选择和(O(log\log\sigma)时间秩,而动态版本给出了(O)(1+frac{log\sigma}{log\sigran})时间操作西格玛)+O(n)\)位。

MSC公司:

68第05页 数据结构
68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
68瓦32 字符串上的算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 格罗西,R。;Vitter,J.S.,压缩后缀数组和后缀树及其在文本索引和字符串匹配中的应用,SIAM计算杂志,35,2,378-407(2005)·Zbl 1092.68115号
[2] Sadakane,K.,压缩后缀数组的新文本索引功能,《算法杂志》,48,2,294-313(2003)·Zbl 1100.68563号
[3] P.Ferragina,G.Manzini,机会主义数据结构及其应用,摘自:第41届IEEE计算机科学基础研讨会论文集,2000年,第390-398页;P.Ferragina,G.Manzini,机会主义数据结构及其应用,摘自:第41届IEEE计算机科学基础研讨会论文集,2000年,第390-398页
[4] K.Sadakane,R.Grossi,将简洁的数据结构压缩到熵界,摘自:第17届ACM-SIAM离散算法年会论文集,2006年,第1230-1239页;K.Sadakane,R.Grossi,将简洁的数据结构压缩到熵界,摘自:第17届ACM-SIAM离散算法年会论文集,2006年,第1230-1239页·Zbl 1192.68188号
[5] 费拉吉纳,P。;文丘里尼,R.,《字符串实现熵界的简单存储方案》,《理论计算机科学》,372115-121(2007)·Zbl 1110.68029号
[6] Manzini,G.,《Burrows-Wheeler变换的分析》,ACM杂志,48,3,407-430(2001)·Zbl 1323.68262号
[7] G.Jacobson,空间效率静态树和图,摘自:1989年IEEE第30届计算机科学基础研讨会论文集,第549-554页;G.Jacobson,空间效率静态树和图,摘自:1989年IEEE第30届计算机科学基础研讨会论文集,第549-554页
[8] D.R.Clark,《紧凑的pat-tree》,博士论文,滑铁卢大学,1998年;D.R.Clark,《紧凑型pat-tree》,博士论文,滑铁卢大学,1998年
[9] J.I.Munro,表,摘自:《软件技术和理论计算机科学基础第16届会议论文集》,1996年,第37-42页;J.I.Munro,表,摘自:《软件技术和理论计算机科学基础第16届会议论文集》,1996年,第37-42页
[10] R.Raman、V.Raman和S.S.Rao,《简明可索引词典及其编码应用》(k);R.Raman、V.Raman和S.S.Rao,《简明可索引词典及其编码应用》·Zbl 1093.68582号
[11] A.Golynski、R.Grossi、A.Gupta、R.Raman、S.S.Rao,《简明指数的大小》,载《第十五届欧洲算法年会论文集》,2007年,第371-382页;A.Golynski,R.Grossi,A.Gupta,R.Raman,S.S.Rao,《简明指数的大小》,摘自:2007年第15届欧洲算法研讨会论文集,第371-382页·Zbl 1151.68385号
[12] M.Patrascu,Succinctor,摘自:第49届IEEE计算机科学基础研讨会论文集,2008年,第305-313页;M.Patrascu,Succinctor,摘自:第49届IEEE计算机科学基础研讨会论文集,2008年,第305-313页
[13] 费拉吉纳,P。;Manzini,G。;梅基宁,V。;Navarro,G.,序列和全文索引的压缩表示,ACM算法事务,3,2(2007)·Zbl 1321.68263号
[14] R.Grossi,A.Gupta,J.S.Vitter,高阶熵压缩文本索引,收录于:第14届ACM-SIAM离散算法年会论文集,2003年,第841-850页;R.Grossi,A.Gupta,J.S.Vitter,高阶熵压缩文本索引,收录于:2003年第14届ACM-SIAM离散算法年会论文集,第841-850页·Zbl 1092.68584号
[15] W.-K.Hon,K.Sadakane,W.-K Sung,《打破全文索引构建的时空障碍》,载《第44届IEEE计算机科学基础研讨会论文集》,2003年,第251-260页;W.-K.Hon,K.Sadakane,W.-K Sung,《打破全文索引构建的时空障碍》,载《第44届IEEE计算机科学基础研讨会论文集》,2003年,第251-260页
[16] A.Golynski,J.I.Munro,S.S.Rao,《对大字母表的排序/选择操作:文本索引工具》,载于:《第17届ACM-SIAM离散算法年度研讨会论文集》,2006年,第368-373页;A.Golynski,J.I.Munro,S.S.Rao,《大字母的秩/选择操作:文本索引工具》,载于:2006年第17届ACM-SIAM离散算法研讨会论文集,第368-373页·Zbl 1192.68800号
[17] J.Barbay,M.He,J.I.Munro,S.S.Rao,字符串、二元关系和多标记树的简洁索引,收录于:第18届ACM-SIAM离散算法年会论文集,2007年,第680-689页;J.Barbay,M.He,J.I.Munro,S.S.Rao,字符串、二元关系和多标记树的简洁索引,收录于:2007年第18届ACM-SIAM离散算法研讨会论文集,第680-689页·Zbl 1302.68097号
[18] V.Mäkinen,G.Navarro,基于游程编码的简洁后缀数组,摘自:第16届组合模式匹配年度研讨会论文集,2005年,第45-56页;V.Mäkinen,G.Navarro,基于游程编码的简洁后缀数组,摘自:第16届组合模式匹配年度研讨会论文集,2005年,第45-56页·Zbl 1131.68431号
[19] R.Raman、V.Raman和S.S.Rao,《简明动态数据结构》,载于《第七届算法和数据结构国际研讨会论文集》,2001年,第426-437页;R.Raman、V.Raman和S.S.Rao,《简明动态数据结构》,载于《第七届算法和数据结构国际研讨会论文集》,2001年,第426-437页·Zbl 0997.68520号
[20] W.-K.Hon,K.Sadakane,W.-K Sung,可搜索部分和的简洁数据结构,收录于:第14届算法与计算年度研讨会论文集,2003年,第505-516页;W.-K.Hon,K.Sadakane,W.-K Sung,可搜索部分和的简洁数据结构,收录于:第14届算法与计算年度研讨会论文集,2003年,第505-516页·Zbl 1205.68129号
[21] V.Mäkinen,G.Navarro,动态熵压缩序列和全文索引,摘自:第17届组合模式匹配年度研讨会论文集,2006年,第306-317页;V.Mäkinen,G.Navarro,动态熵压缩序列和全文索引,摘自:第17届组合模式匹配年度研讨会论文集,2006年,第306-317页·Zbl 1196.68064号
[22] A.Gupta,W.-K.Hon,R.Shah,J.S.Vitter,动态化简洁数据结构的框架,摘自:第34届国际自动化学术讨论会论文集,语言与编程,2007年,第521-532页;A.Gupta,W.-K.Hon,R.Shah,J.S.Vitter,动态化简洁数据结构的框架,摘自:第34届国际自动化学术讨论会论文集,语言与编程,2007年,第521-532页·兹比尔1171.68435
[23] R.González,G.Navarro,《改进的动态秩选择熵界结构》,载于《第八届拉丁美洲理论信息学研讨会论文集》,2008年,第374-386页;R.González,G.Navarro,《改进的动态秩选择熵束缚结构》,载《第八届拉丁美洲理论信息学研讨会论文集》,2008年,第374-386页·Zbl 1136.68365号
[24] S.Lee,K.Park,《排名/选择文本的动态压缩表示法》,载《第十一届韩日算法与计算联合研讨会论文集》,2008年,第131-138页;S.Lee,K.Park,《排名/选择文本的动态压缩表示法》,载《第十一届韩日算法与计算联合研讨会论文集》,2008年,第131-138页
[25] H.-L.Chan,W.-K.Hon,T.-W.Lam,动态文本集合压缩索引,载于:2004年第15届组合模式匹配年度研讨会论文集,第445-456页;H.-L.Chan,W.-K.Hon,T.-W.Lam,动态文本集合压缩索引,收录于:2004年第15届组合模式匹配年度研讨会论文集,第445-456页·Zbl 1103.68473号
[26] 梅基宁,V。;Navarro,G.,动态熵压缩序列和全文索引,ACM算法事务,4,3(2008)·Zbl 1446.68043号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。