文件Open Access徽标

语法压缩字符串中的手指搜索

作者 菲利普·比尔, 安德斯·罗伊·克里斯蒂安森, Patrick Hagge绳索, 英格·李·戈茨



PDF格式
缩略图PDF

文件

LIPIcs公司。FSTTCS.2016.36.pdf
  • 文件大小:0.57 MB
  • 16页

文件标识符

作者详细信息

菲利普·比尔
安德斯·罗伊·克里斯蒂安森
Patrick Hagge绳索
英格·李·戈茨

引用为获取BibTex

菲利普·比尔(Philip Bille)、安德斯·罗伊·克里斯蒂安森(Anders Roy Christiansen)、帕特里克·哈格·科尔丁(Patrick Hagge Cording)和英格·李·戈茨(Inge Li Gortz)。语法压缩字符串中的手指搜索。第36届IARCS软件技术和理论计算机科学基础年会(FSTTCS 2016)。莱布尼茨国际信息学论文集(LIPIcs),第65卷,第36:1-36:16页,达格斯图尔-莱布尼兹-泽特鲁姆信息学院(2016)
https://doi.org/10.4230/LIPIcs.FSTTCS.2016.36

摘要

基于语法的压缩是一种简单而强大的范例,它捕获了许多流行的压缩方案,即用生成字符串的小型无上下文语法替换长字符串。给定语法,随机访问问题是在支持随机访问的同时紧凑地表示语法,也就是说,给定原始未压缩字符串中的一个位置,报告该位置的字符。本文研究了具有finger搜索特性的随机访问问题,即随机访问查询的时间应该取决于指定索引f(称为finger)和查询索引i之间的距离,其中,我们首先放置一个手指,然后有效地访问手指附近的索引,并且支持动态变体,其中还移动手指,使得时间取决于移动的距离。让n是语法的大小,让n是字符串的大小。对于静态变量,我们给出了一个线性空间表示法,它支持将手指放在O(log(n))时间,然后在O(log(D))时间进行访问,其中D是手指和访问的索引之间的距离。对于动态变量,我们给出了一个线性空间表示法,该表示法支持将手指放置在O(log(N))时间,并支持在O(log(D)+log(N))时间访问和移动手指。与随机访问的最佳线性空间解决方案相比,我们改进了一个O(log(N))查询,该查询绑定到静态变量的O(log(D)),绑定到动态变量的O。作为结果的应用,我们获得了语法压缩字符串中最长公共扩展问题的改进解。为了获得我们的结果,我们引入了几个独立感兴趣的新技术,包括一种新颖的van Emde Boas风格的语法分解。
关键词
  • 压缩
  • 语法
  • 手指搜索
  • 算法

韵律学

工具书类

  1. 斯蒂芬·阿尔斯特鲁普(Stephen Alstrup)、托尔·赫斯菲尔德(Thore Husfeldt)和蒂斯·劳厄(Theis Rauhe)。标记的祖先问题。程序中。第39届FOCS,第534-543页,1998年。谷歌学者
  2. A.Apostolico和S.Lonardi。贪婪离线文本替换的一些理论和实践。程序中。DCC,第119-128页,1998年。谷歌学者
  3. A.Apostolico和S.Lonardi。通过贪婪的离线文本替换压缩生物序列。程序中。DCC,第143-152页,2000年。谷歌学者
  4. 阿尔贝托·阿波斯托利科(Alberto Apostolico)和斯特凡诺·罗纳尔迪(Stefano Lonardi)。通过贪婪的文本替换进行离线压缩。IEEE学报,88(11):1733-17442000。谷歌学者
  5. D.Belazzougui、T.Gagie、P.Gawrychowski、J.Karkkainen、A.Ordonez、S.J.Puglishi和Y.Tabei。查询lz边界编码。程序中。DCC,第83-92页,2015年4月。网址:http://dx.doi.org/10.1109/DCC.2015.69.
  6. Djamal Belazzougui、Patrick Hagge Cording、Simon J.Puglisi和Yasuo Tabei。在语法压缩字符串中访问、排序和选择。程序中。《欧洲账户体系》第23期,2015年。谷歌学者
  7. 乔恩·路易斯·本特利和安德鲁·奇奇姚。一种用于无界搜索的几乎最优算法。通知。过程。莱特。,5(3):82-87, 1976.谷歌学者
  8. 菲利普·比尔(Philip Bille)、帕特里克·哈格·科丁(Patrick Hagge Cording)和英格·李·格茨(Inge Li Görtz)。压缩子序列匹配和压缩树着色。《算法》,第1-13页,2015年。网址:http://dx.doi.org/10.1007/s00453-015-0068-9.
  9. 菲利普·比利(Philip Bille)、帕特里克·哈格·科丁(Patrick Hagge Cording)、英格·利·戈茨(Inge Li Görtz)、本杰明·萨克(Benjamin Sach)、霍尔特·维德尔·维德(Hjalte Wedel Vildhöj)和瑟伦·维德。压缩字符串中的指纹。程序中。2013年第13届SWAT。谷歌学者
  10. 菲利普·比尔(Philip Bille)、加德·兰道(Gad M.Landau)、拉杰夫·拉曼(Rajeev Raman)、库尼希科·萨达卡内(Kunihiko Sadakane)、斯里尼瓦萨·拉奥·萨蒂(Srinivasa Rao Satti)和奥伦·魏曼。随机访问语法压缩的字符串和树。SIAM J.Compute,44(3):513-5392014年。2011年SODA发布。谷歌学者
  11. 盖伊·E·布莱洛克、布鲁斯·M·麦格斯和单梁小牛·吴。在平衡度搜索树上进行节省空间的手指搜索。程序中。第14届SODA,第374-383页,2003年。谷歌学者
  12. 格思·斯特林特·布罗达尔。手指搜索树。在《数据结构和应用手册》中。查普曼和霍尔/CRC,2004年。谷歌学者
  13. 格思·斯特林特·布罗达尔(Gerth Stölting Brodal)、乔治·拉戈吉安尼斯(George Lagogannis)、克里斯托斯·马克里斯(Christos Makris)、阿萨纳西奥斯·查卡利迪斯(Athanasios K.Tsakalidis)和科斯塔斯·齐。指针机中的最优手指搜索树。J.计算。系统。科学。,67(2):381-418, 2003. 网址:http://dx.doi.org/10.1016/S0022-0000(03)00013-8.
  14. M.Charikar、E.Lehman、D.Liu、R.Panigrahy、M.Prabhakaran、A.Sahai和A.Shelat。最小的语法问题。IEEE传输。信息理论,51(7):2554-25762005。在STOC 2002和SODA 2002上发布。谷歌学者
  15. 弗朗西斯科·克劳德和冈萨洛·纳瓦罗。基于自索引语法的压缩。基金。通知。,111(3):313-337, 2011.谷歌学者
  16. Patrick Hagge Cording、Pawe Gawrychowski和Oren Weimann。语法压缩字符串中的书签。程序中。《第23次精神》,第x-y页,2016年。谷歌学者
  17. Paul F.Dietz和Rajeev Raman。恒定更新时间指搜索树。信息处理。莱特。,52(3):147-154, 1994.谷歌学者
  18. Martin Farach和S.Muthukrishnan。字符串的完美散列:形式化和算法。程序中。第7版CPM,第130-140页。施普林格,1996年。谷歌学者
  19. 鲁道夫·弗莱舍。一个简单的平衡搜索树,最坏情况更新时间为O(1)。发现的国际期刊。计算。科学。,7(2):137-150, 1996. 网址:http://dx.doi.org/10.1142/S0129054196000117.
  20. P.量规。一种新的数据压缩算法。《C用户杂志》,12(2):23-381994年。谷歌学者
  21. Travis Gagie、PawełGawrychowski、Juha Kärkkäinen、Yakov Nekrich和Simon J.Puglishi。更快的基于语法的自我索引。程序中。第六届拉丁美洲旅游协会,第240-251页,2012年。谷歌学者
  22. Travis Gagie、PawełGawrychowski、Juha Kärkkäinen、Yakov Nekrich和Simon J.Puglishi。基于LZ77的自我索引,具有更快的模式匹配。程序中。第11拉丁语,第731-742页。斯普林格,2014年。谷歌学者
  23. Travis Gagie、Pawel Gawrychowski和Simon J.Puglishi。lz77压缩文本中的近似模式匹配。《离散算法》,32:64-682015。网址:http://dx.doi.org/10.1016/j.jda.2014.10.003.
  24. Travis Gagie、Christopher Hoobin和Simon J.Puglishi。实际方块图。程序中。ICABD,第30-36页,2014年。谷歌学者
  25. Leszek Ga̧sieniec、Roman Kolpakov、Igor Potapov和Paul Sant。基于语法的压缩文件中的实时遍历。程序中。第15 DCC,第458页,2005年。谷歌学者
  26. Keisuke Goto、Hideo Bannai、Shunsuke Inenaga和Masayuki Takeda。LZD分解:简单实用的在线语法压缩,采用可变到固定编码。程序中。第26 CPM,第219-230页。斯普林格,2015年。谷歌学者
  27. Leonidas J.Guibas、Edward M.McCreight、Michael F.Plass和Janet R.Roberts。线性列表的一种新表示法。程序中。第9届STOC,第49-60页,1977年。谷歌学者
  28. Tomohiro I、Wataru Matsubara、Kouji Shimohira、Inenaga Shunsuke、Hideo Bannai、Masayuki Takeda、Kazuyuki Narisawa和Ayumi Shinohara。检测语法压缩字符串的规律性。通知。计算。,240:74-89, 2015.谷歌学者
  29. J.C.Kieffer和E.H.Yang。基于语法的代码:一类新的通用无损源代码。IEEE传输。《信息论》,46(3):737-7542000。谷歌学者
  30. J.C.Kieffer、E.H.Yang、G.J.Nelson和P.Cosman。通过多级模式匹配实现通用无损压缩。IEEE传输。信息理论,46(5):1227-12452000。谷歌学者
  31. S.Rao Kosaraju。排序列表中的本地化搜索。程序中。第13届STOC,第62-69页,美国纽约州纽约市,1981年。网址:http://dx.doi.org/10.1145/800076.802458.
  32. N.Jesper Larsson和Alistair Moffat。基于词典的离线压缩。程序。IEEE,88(11):1722-17322000。谷歌学者
  33. 库尔特·梅尔霍恩(Kurt Mehlhorn)。用于表示排序列表的新数据结构。程序中。工作组,第90-112页,1981年。谷歌学者
  34. 冈萨洛·纳瓦罗和阿尔贝托·奥尔多内斯。具有秩/选择支持的语法压缩序列。《21世纪体育》,第31-44页。斯普林格,2014年。谷歌学者
  35. Craig G.Nevill-Manning和Ian H.Witten。识别序列中的层次结构:线性时间算法。《人工智能研究杂志》,7:67-821997年。谷歌学者
  36. 西本孝明、友弘一世、英内加顺辅、班奈秀都和武田正彦。压缩空间中LCE查询的完全动态数据结构。程序中。第41届MFCS,第72:1-72:152016页。网址:http://dx.doi.org/10.4230/LIPIcs.MFCS.2016.72.
  37. 威廉·普格。跳过列表:平衡树的一种概率替代方法。Commun公司。ACM,33(6):668-6761990年。谷歌学者
  38. W.莱特。Lempel-Ziv因子分解在基于语法的压缩近似中的应用。西奥。计算。科学。,302(1-3):211-222, 2003.谷歌学者
  39. 雷蒙德·塞德尔(Raimund Seidel)和塞西莉亚·R·阿拉贡(Cecilia R.Aragon)。随机搜索树。《算法》,16(4/5):464-4971996。谷歌学者
  40. Y.Shibata、T.Kida、S.Fukamachi、M.Takeda、A.Shinohara、T.Shinohara和S.Arikawa。字节对编码:一种加速模式匹配的文本压缩方案。技术报告DOI-TR-161,九州大学信息学系,1999年。谷歌学者
  41. Daniel Dominic Sleator和Robert Endre Tarjan。自我调整的二进制搜索树。J.ACM,32(3):652-6861985年7月。谷歌学者
  42. 田中俊彦(Toshiya Tanaka)、友弘一郎(I Tomohiro)、内纳加顺介(Shunsuke Inenaga)、班奈秀秀(Hideo Bannai)和武田正彦(Masayuki Takeda)。计算语法压缩文本的卷积。程序中。第23 DCC,第451-460页,2013年。谷歌学者
  43. 我是Tomohiro、Takaaki Nishimoto、Shunsuke Inenaga、Hideo Bannai和Masayuki Takeda。用于字典匹配的压缩自动机。西奥。计算。科学。,578:30-41, 2015.谷歌学者
  44. P.van Emde Boas、R.Kaas和E.Zijlstra。高效优先级队列的设计和实现。理论计算。系统。,10(1):99-127, 1976.谷歌学者
  45. Elad Verbin和Wei Yu。随机访问语法压缩字符串的数据结构下限。程序中。第24 CPM,第247-258页,2013年。谷歌学者
  46. 特里·A·韦尔奇。一种高性能数据压缩技术。IEEE计算机,17(6):8-191984。谷歌学者
  47. E.H.Yang和J.C.Kieffer。基于贪婪序列语法变换的高效通用无损数据压缩算法-第一部分:无上下文模型。IEEE传输。《信息论》,46(3):755-7542000。谷歌学者
  48. 雅各布·齐夫和亚伯拉罕·伦佩尔。序列数据压缩的通用算法。IEEE传输。《信息论》,23(3):337-3431977年。谷歌学者
  49. 雅各布·齐夫和亚伯拉罕·伦佩尔。通过可变速率编码对单个序列进行压缩。IEEE传输。信息论,24(5):530-5361978。谷歌学者
问题/备注/反馈
X(X)

Dagstuhl出版社反馈


感谢您的反馈!

已提交反馈

无法发送消息

请稍后再试或发送电子邮件