×

实际随机访问SLP压缩文本。 (英语) 兹比尔1523.68029

Boucher,Christina(编辑)等人,《字符串处理和信息检索》。第27届国际研讨会,SPIRE 2020,美国佛罗里达州奥兰多,2020年10月13-15日。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。12303, 221-231 (2020).
摘要:基于语法的压缩是一种流行且强大的压缩重复文本的方法,但直到最近,它在实际构建过程中相对较差的时空权衡使得它不适用于真正的海量数据集,例如基因组数据库。在最近的一篇论文中【Lect.Notes Compute.Sci.11811,35–44(2019;doi:10.1007/978-3-030-32686-93)]我们展示了简单的预处理如何显著改善这些权衡,在本文中,我们将注意力转向基于语法的压缩的一个吸引人的特性:支持快速随机访问的可能性。在许多处理语法压缩文本而不解压缩文本的算法中,这是一个基本的原语,关于它的理论界已经发表了很多,但实验已经滞后。我们给出了一种新的语法编码,它的大小与目前的实际情况差不多[S.丸山等,Lect。注释计算。科学。8214, 218–229 (2013;Zbl 1524.68127号)]但查询速度明显更快。
关于整个系列,请参见[Zbl 1502.68020号]。

MSC公司:

68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
2012年第68季度 语法和重写系统
PDF格式BibTeX公司 XML格式引用