Finger Search in Grammar-Compressed Strings

Bille, Philip; Christiansen, Anders Roy; Cording, Patrick Hagge; Gortz, Inge Li

doi:10.4230/LIPIcs.FSTTCS.2016.36

语法压缩字符串中的手指搜索

作者详细信息

菲利普·比尔

安德斯·罗伊·克里斯蒂安森

Patrick Hagge绳索

英格·李·戈茨

引用为获取BibTex

菲利普·比尔（Philip Bille）、安德斯·罗伊·克里斯蒂安森（Anders Roy Christiansen）、帕特里克·哈格·科尔丁（Patrick Hagge Cording）和英格·李·戈茨（Inge Li Gortz）。语法压缩字符串中的手指搜索。第36届IARCS软件技术和理论计算机科学基础年会（FSTTCS 2016）。莱布尼茨国际信息学论文集（LIPIcs），第65卷，第36:1-36:16页，达格斯图尔-莱布尼兹-泽特鲁姆信息学院（2016）
https://doi.org/10.4230/LIPIcs.FSTTCS.2016.36

@会议记录{bill_et_al:LIPIcs.FSTTCS.2016.36，author={Bille、Philip和Christiansen、Anders Roy和Cording、Patrick Hagge和Gortz、Inge Li}，title={{语法压缩字符串中的手指搜索}}，booktitle={第36届IARCS软件技术与理论计算机科学基础年会（FSTTCS 2016）}，页数={36:1--36:16}，series={Leibniz国际信息学论文集（LIPIcs）}，国际标准图书编号={978-3-95977-027-9}，ISSN={1868-8969}，年份={2016年}，体积={65}，editor={Lal，Akash and Akshay，S.和Saurabh，Saket and Sen，Sandeep}，publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik}，地址={Dagstuhl，德国}，URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.FSTTCS.2016.36},URN＝{URN:nbn:de:00030-drops-68717}，doi={10.4230/LIPIcs.FSTTCS.2016.36}，annote={关键词：压缩、语法、手指搜索、算法}}

<trans data-src="@InProceedings{bille_et_al:LIPIcs.FSTTCS.2016.36,">@会议记录{bill_et_al:LIPIcs.FSTTCS.2016.36，</trans><trans data-src="author =	{Bille, Philip and Christiansen, Anders Roy and Cording, Patrick Hagge and Gortz, Inge Li},">author={Bille、Philip和Christiansen、Anders Roy和Cording、Patrick Hagge和Gortz、Inge Li}，</trans><trans data-src="title =	{{Finger Search in Grammar-Compressed Strings}},">title={{语法压缩字符串中的手指搜索}}，</trans><trans data-src="booktitle =	{36th IARCS Annual Conference on Foundations of Software Technology and Theoretical Computer Science (FSTTCS 2016)},">booktitle={第36届IARCS软件技术与理论计算机科学基础年会（FSTTCS 2016）}，</trans><trans data-src="pages =	{36:1--36:16},">页数={36:1--36:16}，</trans><trans data-src="series =	{Leibniz International Proceedings in Informatics (LIPIcs)},">series={Leibniz国际信息学论文集（LIPIcs）}，</trans><trans data-src="ISBN =	{978-3-95977-027-9},">国际标准图书编号={978-3-95977-027-9}，</trans><trans data-src="ISSN =	{1868-8969},">ISSN={1868-8969}，</trans><trans data-src="year =	{2016},">年份={2016年}，</trans><trans data-src="volume =	{65},">体积={65}，</trans><trans data-src="editor =	{Lal, Akash and Akshay, S. and Saurabh, Saket and Sen, Sandeep},">editor={Lal，Akash and Akshay，S.和Saurabh，Saket and Sen，Sandeep}，</trans><trans data-src="publisher =	{Schloss Dagstuhl -- Leibniz-Zentrum f{\"u}r Informatik},">publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik}，</trans><trans data-src="address =	{Dagstuhl, Germany},">地址={Dagstuhl，德国}，</trans><trans data-src="URL =		{">URL={</trans><trans data-src="https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.FSTTCS.2016.36">https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.FSTTCS.2016.36</trans><trans data-src="},">},</trans><trans data-src="URN =		{urn:nbn:de:0030-drops-68717},">URN={URN:nbn:de:0030-drops-68717}，</trans><trans data-src="doi =		{10.4230/LIPIcs.FSTTCS.2016.36},">doi={10.4230/LIPIcs.FSTTCS.2016.36}，</trans><trans data-src="annote =	{Keywords: Compression, Grammars, Finger search, Algorithms}">annote={关键词：压缩、语法、手指搜索、算法}</trans><trans data-src="}">}</trans>

摘要

基于语法的压缩是一种简单而强大的范例，它捕获了许多流行的压缩方案，即用生成字符串的小型无上下文语法替换长字符串。给定语法，随机访问问题是在支持随机访问的同时紧凑地表示语法，也就是说，给定原始未压缩字符串中的一个位置，报告该位置的字符。本文研究了具有finger搜索特性的随机访问问题，即随机访问查询的时间应该取决于指定索引f（称为finger）和查询索引i之间的距离，其中，我们首先放置一个手指，然后有效地访问手指附近的索引，并且支持动态变体，其中还移动手指，使得时间取决于移动的距离。让n是语法的大小，让n是字符串的大小。对于静态变量，我们给出了一个线性空间表示法，它支持将手指放在O（log（n））时间，然后在O（log（D））时间进行访问，其中D是手指和访问的索引之间的距离。对于动态变量，我们给出了一个线性空间表示法，该表示法支持将手指放置在O（log（N））时间，并支持在O（log（D）+log（N））时间访问和移动手指。与随机访问的最佳线性空间解决方案相比，我们改进了一个O（log（N））查询，该查询绑定到静态变量的O（log（D）），绑定到动态变量的O。作为结果的应用，我们获得了语法压缩字符串中最长公共扩展问题的改进解。为了获得我们的结果，我们引入了几个独立感兴趣的新技术，包括一种新颖的van Emde Boas风格的语法分解。

工具书类

斯蒂芬·阿尔斯特鲁普（Stephen Alstrup）、托尔·赫斯菲尔德（Thore Husfeldt）和蒂斯·劳厄（Theis Rauhe）。标记的祖先问题。程序中。第39届FOCS，第534-543页，1998年。
A.Apostolico和S.Lonardi。贪婪离线文本替换的一些理论和实践。程序中。DCC，第119-128页，1998年。
A.Apostolico和S.Lonardi。通过贪婪的离线文本替换压缩生物序列。程序中。DCC，第143-152页，2000年。
阿尔贝托·阿波斯托利科（Alberto Apostolico）和斯特凡诺·罗纳尔迪（Stefano Lonardi）。通过贪婪的文本替换进行离线压缩。IEEE学报，88（11）：1733-17442000。
D.Belazzougui、T.Gagie、P.Gawrychowski、J.Karkkainen、A.Ordonez、S.J.Puglishi和Y.Tabei。查询lz边界编码。程序中。DCC，第83-92页，2015年4月。网址：http://dx.doi.org/10.1109/DCC.2015.69.
Djamal Belazzougui、Patrick Hagge Cording、Simon J.Puglisi和Yasuo Tabei。在语法压缩字符串中访问、排序和选择。程序中。《欧洲账户体系》第23期，2015年。
乔恩·路易斯·本特利和安德鲁·奇奇姚。一种用于无界搜索的几乎最优算法。通知。过程。莱特。，5(3):82-87, 1976.
菲利普·比尔（Philip Bille）、帕特里克·哈格·科丁（Patrick Hagge Cording）和英格·李·格茨（Inge Li Görtz）。压缩子序列匹配和压缩树着色。《算法》，第1-13页，2015年。网址：http://dx.doi.org/10.1007/s00453-015-0068-9.
菲利普·比利（Philip Bille）、帕特里克·哈格·科丁（Patrick Hagge Cording）、英格·利·戈茨（Inge Li Görtz）、本杰明·萨克（Benjamin Sach）、霍尔特·维德尔·维德（Hjalte Wedel Vildhöj）和瑟伦·维德。压缩字符串中的指纹。程序中。2013年第13届SWAT。
菲利普·比尔（Philip Bille）、加德·兰道（Gad M.Landau）、拉杰夫·拉曼（Rajeev Raman）、库尼希科·萨达卡内（Kunihiko Sadakane）、斯里尼瓦萨·拉奥·萨蒂（Srinivasa Rao Satti）和奥伦·魏曼。随机访问语法压缩的字符串和树。SIAM J.Compute，44（3）：513-5392014年。2011年SODA发布。
盖伊·E·布莱洛克、布鲁斯·M·麦格斯和单梁小牛·吴。在平衡度搜索树上进行节省空间的手指搜索。程序中。第14届SODA，第374-383页，2003年。
格思·斯特林特·布罗达尔。手指搜索树。在《数据结构和应用手册》中。查普曼和霍尔/CRC，2004年。
格思·斯特林特·布罗达尔（Gerth Stölting Brodal）、乔治·拉戈吉安尼斯（George Lagogannis）、克里斯托斯·马克里斯（Christos Makris）、阿萨纳西奥斯·查卡利迪斯（Athanasios K.Tsakalidis）和科斯塔斯·齐。指针机中的最优手指搜索树。J.计算。系统。科学。，67(2):381-418, 2003. 网址：http://dx.doi.org/10.1016/S0022-0000(03)00013-8.
M.Charikar、E.Lehman、D.Liu、R.Panigrahy、M.Prabhakaran、A.Sahai和A.Shelat。最小的语法问题。IEEE传输。信息理论，51（7）：2554-25762005。在STOC 2002和SODA 2002上发布。
弗朗西斯科·克劳德和冈萨洛·纳瓦罗。基于自索引语法的压缩。基金。通知。，111(3):313-337, 2011.
Patrick Hagge Cording、Pawe Gawrychowski和Oren Weimann。语法压缩字符串中的书签。程序中。《第23次精神》，第x-y页，2016年。
Paul F.Dietz和Rajeev Raman。恒定更新时间指搜索树。信息处理。莱特。，52(3):147-154, 1994.
Martin Farach和S.Muthukrishnan。字符串的完美散列：形式化和算法。程序中。第7版CPM，第130-140页。施普林格，1996年。
鲁道夫·弗莱舍。一个简单的平衡搜索树，最坏情况更新时间为O（1）。发现的国际期刊。计算。科学。，7(2):137-150, 1996. 网址：http://dx.doi.org/10.1142/S0129054196000117.
P.量规。一种新的数据压缩算法。《C用户杂志》，12（2）：23-381994年。
Travis Gagie、PawełGawrychowski、Juha Kärkkäinen、Yakov Nekrich和Simon J.Puglishi。更快的基于语法的自我索引。程序中。第六届拉丁美洲旅游协会，第240-251页，2012年。
Travis Gagie、PawełGawrychowski、Juha Kärkkäinen、Yakov Nekrich和Simon J.Puglishi。基于LZ77的自我索引，具有更快的模式匹配。程序中。第11拉丁语，第731-742页。斯普林格，2014年。
Travis Gagie、Pawel Gawrychowski和Simon J.Puglishi。lz77压缩文本中的近似模式匹配。《离散算法》，32:64-682015。网址：http://dx.doi.org/10.1016/j.jda.2014.10.003.
Travis Gagie、Christopher Hoobin和Simon J.Puglishi。实际方块图。程序中。ICABD，第30-36页，2014年。
Leszek Ga̧sieniec、Roman Kolpakov、Igor Potapov和Paul Sant。基于语法的压缩文件中的实时遍历。程序中。第15 DCC，第458页，2005年。
Keisuke Goto、Hideo Bannai、Shunsuke Inenaga和Masayuki Takeda。LZD分解：简单实用的在线语法压缩，采用可变到固定编码。程序中。第26 CPM，第219-230页。斯普林格，2015年。
Leonidas J.Guibas、Edward M.McCreight、Michael F.Plass和Janet R.Roberts。线性列表的一种新表示法。程序中。第9届STOC，第49-60页，1977年。
Tomohiro I、Wataru Matsubara、Kouji Shimohira、Inenaga Shunsuke、Hideo Bannai、Masayuki Takeda、Kazuyuki Narisawa和Ayumi Shinohara。检测语法压缩字符串的规律性。通知。计算。，240:74-89, 2015.
J.C.Kieffer和E.H.Yang。基于语法的代码：一类新的通用无损源代码。IEEE传输。《信息论》，46（3）：737-7542000。
J.C.Kieffer、E.H.Yang、G.J.Nelson和P.Cosman。通过多级模式匹配实现通用无损压缩。IEEE传输。信息理论，46（5）：1227-12452000。
S.Rao Kosaraju。排序列表中的本地化搜索。程序中。第13届STOC，第62-69页，美国纽约州纽约市，1981年。网址：http://dx.doi.org/10.1145/800076.802458.
N.Jesper Larsson和Alistair Moffat。基于词典的离线压缩。程序。IEEE，88（11）：1722-17322000。
库尔特·梅尔霍恩（Kurt Mehlhorn）。用于表示排序列表的新数据结构。程序中。工作组，第90-112页，1981年。
冈萨洛·纳瓦罗和阿尔贝托·奥尔多内斯。具有秩/选择支持的语法压缩序列。《21世纪体育》，第31-44页。斯普林格，2014年。
Craig G.Nevill-Manning和Ian H.Witten。识别序列中的层次结构：线性时间算法。《人工智能研究杂志》，7:67-821997年。
西本孝明、友弘一世、英内加顺辅、班奈秀都和武田正彦。压缩空间中LCE查询的完全动态数据结构。程序中。第41届MFCS，第72:1-72:152016页。网址：http://dx.doi.org/10.4230/LIPIcs.MFCS.2016.72.
威廉·普格。跳过列表：平衡树的一种概率替代方法。Commun公司。ACM，33（6）：668-6761990年。
W.莱特。Lempel-Ziv因子分解在基于语法的压缩近似中的应用。西奥。计算。科学。，302(1-3):211-222, 2003.
雷蒙德·塞德尔（Raimund Seidel）和塞西莉亚·R·阿拉贡（Cecilia R.Aragon）。随机搜索树。《算法》，16（4/5）：464-4971996。
Y.Shibata、T.Kida、S.Fukamachi、M.Takeda、A.Shinohara、T.Shinohara和S.Arikawa。字节对编码：一种加速模式匹配的文本压缩方案。技术报告DOI-TR-161，九州大学信息学系，1999年。
Daniel Dominic Sleator和Robert Endre Tarjan。自我调整的二进制搜索树。J.ACM，32（3）：652-6861985年7月。
田中俊彦（Toshiya Tanaka）、友弘一郎（I Tomohiro）、内纳加顺介（Shunsuke Inenaga）、班奈秀秀（Hideo Bannai）和武田正彦（Masayuki Takeda）。计算语法压缩文本的卷积。程序中。第23 DCC，第451-460页，2013年。
我是Tomohiro、Takaaki Nishimoto、Shunsuke Inenaga、Hideo Bannai和Masayuki Takeda。用于字典匹配的压缩自动机。西奥。计算。科学。，578:30-41, 2015.
P.van Emde Boas、R.Kaas和E.Zijlstra。高效优先级队列的设计和实现。理论计算。系统。，10(1):99-127, 1976.
Elad Verbin和Wei Yu。随机访问语法压缩字符串的数据结构下限。程序中。第24 CPM，第247-258页，2013年。
特里·A·韦尔奇。一种高性能数据压缩技术。IEEE计算机，17（6）：8-191984。
E.H.Yang和J.C.Kieffer。基于贪婪序列语法变换的高效通用无损数据压缩算法-第一部分：无上下文模型。IEEE传输。《信息论》，46（3）：755-7542000。
雅各布·齐夫和亚伯拉罕·伦佩尔。序列数据压缩的通用算法。IEEE传输。《信息论》，23（3）：337-3431977年。
雅各布·齐夫和亚伯拉罕·伦佩尔。通过可变速率编码对单个序列进行压缩。IEEE传输。信息论，24（5）：530-5361978。

语法压缩字符串中的手指搜索

作者菲利普·比尔, 安德斯·罗伊·克里斯蒂安森, Patrick Hagge绳索, 英格·李·戈茨

文件

文件标识符

作者详细信息

引用为获取BibTex

摘要

关键词

韵律学

工具书类

感谢您的反馈！

无法发送消息

语法压缩字符串中的手指搜索

作者 菲利普·比尔, 安德斯·罗伊·克里斯蒂安森, Patrick Hagge绳索, 英格·李·戈茨

文件

文件标识符

作者详细信息

引用为获取BibTex

摘要

关键词

韵律学

工具书类

感谢您的反馈！

无法发送消息

作者菲利普·比尔, 安德斯·罗伊·克里斯蒂安森, Patrick Hagge绳索, 英格·李·戈茨