LIPIcs,第78卷

第28届组合模式匹配年会(CPM 2017)



缩略图PDF

事件

CPM 2017年7月4日至6日,波兰华沙

编辑

Juha Karkkäinen公司
雅库布·拉多舍夫斯基
沃伊切赫·莱特

出版物详细信息

  • 发布时间:2017-06-30
  • 出版商:Schloss Dagstuhl–Leibniz Zentrum für Informatik
  • 国际标准图书编号:978-3-95977-039-2
  • DBLP:数据库/conf/cpm/cpm2017

接入号码

文件

找不到与您的筛选器选择匹配的文档。
文件
完整卷
LIPIcs,第78卷,CPM’17,完整卷

作者:Juha Kärkkäinen、Jakub Radoszewski和Wojciech Rytter


摘要
LIPIcs,第78卷,CPM’17,完整卷

引用为

第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学会议录(LIPIcs),第78卷,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@诉讼程序{karkkainen_et_al:LIPIcs.CPM.2017,title={{LIPIcs,第78卷,CPM'17,完整卷}},booktitle={第28届组合模式匹配年会(CPM 2017)},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 伊宁Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017},URN={URN:nbn:de:0030-drops-75091},doi={10.4230/LIPIcs.CPM.2017},annote={关键词:数据结构,数据存储表示,编码和信息理论,计算理论,离散数学,信息系统,}}
文件
前部物质
封面、目录、前言、会议组织、外部审查人员

作者:Juha Kärkkäinen、Jakub Radoszewski和Wojciech Rytter


摘要
Front Matter、目录、序言、会议组织、外部评审

引用为

第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第0:i-0:xvi页,达格斯图尔-莱布尼兹-泽特鲁姆信息技术学院(2017)


将BibTex复制到剪贴板

@会议记录{karkkainen_et_al:LIPIcs.CPM.2017.0,author={K\“{a} rkk公司\"{a} 内恩,Juha和Radoszewski,Jakub和Rytter,Wojciech},title={{前言、目录、前言、会议组织、外部审核人}},booktitle={第28届组合模式匹配年会(CPM 2017)},页面={0:i--0:xvi},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/LIPIcs.CPM.2017.0},URN={URN:nbn:de:0030-drops-73178},doi={10.4230/LIPIcs.CPM.2017.0},注释={关键词:前言、目录、前言、会议组织、外部审阅者}}
文件
惠勒图:Burrows和Wheeler关于主题的变奏曲

作者:乔瓦尼·曼齐尼


摘要
著名的Burrows-Wheeler变换最初是为单个字符串定义的,但已经为字符串集、标记树、de Bruijn图、对齐等开发了变体。在本次演讲中,我们提出了一个统一的观点,其中包括许多变体,我们希望能简化对更多变体的搜索。令人惊讶的是,通过考虑与不同模式匹配问题相关的非确定性有限自动机,我们得到了统一的观点。我们展示了与这些自动机关联的状态图具有我们用惠勒图概念总结的共同属性。使用惠勒图的概念,我们表明即使自动机是非确定性的,也可以有效地处理字符串。此外,我们还表明,惠勒图可以使用最多三个数组进行紧凑表示和遍历,这些数组具有支持高效排序和选择操作的附加数据结构。事实证明,这些数组与文献中描述的许多Burrows-Wheeler变换变体的输出一致,或实质上等价。这是与Travis Gagie和Jouni Sirén的联合工作。

引用为

乔瓦尼·曼齐尼。惠勒图形:Burrows和Wheeler的主题变奏曲。在第28届组合模式匹配年度研讨会(CPM 2017)上。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第1:1页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{manzini:LIPIcs.CPM.2017.1,作者={Manzini,Giovanni},title={{Wheeler Graphs:Burrows和Wheeler主题的变体},booktitle={第28届组合模式匹配年会(CPM 2017)},页面={1:1--1:1},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/LIPIcs.CPM.2017.1},URN={URN:nbn:de:0030-drops-73343},doi={10.4230/LIPIcs.CPM.2017.1},annote={关键词:压缩数据结构,模式匹配}}
文件
SLP再压缩

作者:阿图尔·杰兹


摘要
在本次演讲中,我将探讨SLP的重压缩技术。该技术基于对SLP表示的字符串应用简单的压缩操作(用新字母替换两个不同字母的对,用新符号替换字母的最大重复)。为此,我们修改了SLP,以便在SLP上执行此类压缩操作。例如,当我们想替换字符串中的ab,并且SLP的乘积为X到aY,并且Y生成的字符串为bw时,我们改变Y的规则,使其生成w,并在所有规则中用by替换Y。通过这种方式,规则变成X到abY,因此ab可以替换,为非终结符的右侧定义了类似的操作。因此,我们最感兴趣的是SLP表示,而不是字符串本身及其组合属性。然而,我们需要控制的是SLP的规模。通过适当选择要压缩的子串,可以证明它保持线性。结果证明,所提出的方法非常有效,适用于各种场景:例如,它可以用于测试SLP在时间O(n log n)中的相等性,其中n是SLP的大小,n是生成字符串的长度;另一方面,它可以用于近似给定字符串的最小SLP,近似比为O(log(n/g)),其中n是字符串的长度,g是该字符串的最小SIP的大小,与最佳已知边界相匹配。

引用为

阿图尔·杰兹。SLP的再压缩。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第2:1页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{jez:LIPIcs.CPM.2017.2,author={Jez,Artur},title={{SLPs}}的重新压缩,booktitle={第28届组合模式匹配年会(CPM 2017)},页数={2:1--2:1},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/LIPIcs.CPM.2017.2},URN={URN:nbn:de:00030-drops-73475},doi={10.4230/LIPIcs.CPM.2017.2},annote={关键词:直线程序,最小语法问题,压缩,处理压缩数据,重新压缩}}
文件
最短超弦

作者:马金·穆查


摘要
在最短超弦问题(SS)中,必须找到包含给定字符串s_1、…、,。。。,s_n作为子字符串。这个问题是NP-hard,所以一个自然的问题是它的近似性。近似求解SS的一种自然方法是以下GREEDY启发式:重复合并重叠最大的两个字符串,直到只剩下一个字符串。这种启发式被推测为2-近似,但即使在该猜想提出30年后,我们仍然远远没有证明它。这种情况对于非贪婪近似算法更好,因为已知有几种方法可以产生2.5近似(甚至更好)。在本次演讲中,我们将调查该领域的主要成果,重点关注基本思想和直觉。

引用为

马金·穆查。最短超弦。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第3:1页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{mucha:LIPIcs.CPM.2017.3,author={穆查,马辛},title={{最短超串}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={3:1--3:1},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},editor={K}“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/LIPIcs.CPM.2017.3},URN={URN:nbn:de:0030-drops-73483},doi={10.4230/LIPIcs.CPM.2017.3},annote={关键词:最短超弦,近似算法}}
文件
保证性能的重复收款文件清单

作者:冈萨洛·纳瓦罗


摘要
我们考虑字符串集合上的文档列表,即查找给定模式出现在哪些字符串中。特别是,我们关注的是重复集合:字母表[1上的大小为N的集合,a]由大小为N的字符串的D个副本组成,并且对副本应用s个单字符编辑。我们引入了第一个文档列表索引,其大小为O~(n+s),精确到O((nlga+slg^2N)lgD)位,并且具有有用的最坏情况时间保证:给定长度为m的模式,对于任何常数e>0,该索引报告其出现在时间O(m^2+mlgN(lgD+lg^eN)ndoc中的ndoc字符串。

引用为

冈萨洛·纳瓦罗。保证性能的重复收款文件清单。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第4:1-4:13页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{navarro:LIPIcs.CPM.2017.4,author={纳瓦罗,冈萨罗},title={{保证性能的重复收集文件列表}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={4:1--4:13},series={Leibniz国际信息学论文集(LIPIcs)},ISBN={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.4},URN={URN:nbn:de:0030-drops-73268},doi={10.4230/LIPIcs.CPM.2017.4},annote={关键词:重复字符串集合、文档列表、语法压缩、最小范围查询、简洁的数据结构}}
文件
函数的路径查询

作者:Travis Gagie、Meng He和Gonzalo Navarro


摘要
设f:[1..n]->[1..n]是一个函数,l:[1..n]->[1]表示分配给域中每个元素的标签。我们设计了几种紧凑的数据结构,用于回答对f中路径标签的各种查询。例如,我们可以使用n lg n+O(n)位,或使用2n lg n+O(n)位,找到给定i和给定范围[k1..k2]中任意k>=0的f^(-k)(i)中的最小标签,时间O(lg n/lg lg n)。通过使用n lgs+o(n lgs)进一步的位,我们还可以在同一时间内计算标签范围内的元素数,并在o(1+lgs/lg lgn)额外的时间内报告每个这样的元素。还考虑了其他几个可能的查询,如top-t查询和t-majorities。

引用为

Travis Gagie、Meng He和Gonzalo Navarro。函数的路径查询。第28届组合模式匹配年度研讨会(CPM 2017)。《莱布尼茨国际信息学论文集》,第78卷,第5:1-5:15页,Schloss Dagstuhl–Leibniz Zentrum für Informatik(2017)


将BibTex复制到剪贴板

@会议记录{gagie_et_al:LIPIcs.CPM.2017.5,author={Gagie、Travis和He、Meng和Navarro、Gonzalo},title={{函数上的路径查询}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={5:1--5:15},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/LIPIcs.CPM.2017.5},URN={URN:nbn:de:0030-drops-73274},doi={10.4230/LPIcs.CPM.2017.5},annote={关键词:简洁的数据结构、整数函数、范围查询、树和排列}}
文件
压缩字符串的确定性索引

作者:菲利普·比尔(Philip Bille)、英格·李·高兹(Inge Li Görtz)和弗雷德里克·赖·斯科约尔登森(Frederik Rye Skjoldjensen)


摘要
给定长度为n的字符串S,经典的字符串索引问题是将S预处理为支持高效后续模式查询的紧凑数据结构。在确定性变体中,目标是解决字符串索引问题,而不需要任何随机化(在预处理时间或查询时间)。在压缩变体中,字符串与单个单词中的几个字符一起存储,使我们有机会同时读取多个字符。我们的主要结果是在确定性和压缩设置下的一个新字符串索引。给定字母表S上长度为n的压缩字符串S,我们展示了如何在O(n)(确定性)时间和空间O(n。我们的查询时间始终至少与以前的最佳边界一样好,并且只要在一个单词中包含几个字符,即logs<<w,查询时间就会更快。

引用为

菲利普·比尔(Philip Bille)、英格·李·高兹(Inge Li Görtz)和弗雷德里克·赖·斯科约尔登森(Frederik Rye Skjoldjensen)。打包字符串的确定性索引。第28届组合模式匹配年度研讨会(CPM 2017)。《莱布尼茨国际信息学论文集》,第78卷,第6:1-6:11页,Schloss Dagstuhl–Leibniz Zentrum für Informatik(2017)


将BibTex复制到剪贴板

@会议记录{bill_et_al:LIPIcs.CPM.2017.6,author={Bille、Philip和G{\o}rtz、Inge Li和Skjoldjensen、Frederik Rye},title={{压缩字符串的确定索引}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={6:1--6:11},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/LIPIcs.CPM.2017.6},URN={URN:nbn:de:0030-drops-73351},doi={10.4230/LIPIcs.CPM.2017.6},annote={关键词:后缀树,后缀数组,确定性算法,单词打包}}
文件
用CDAWG表示后缀树

作者:Djamal Belazzougui和Fabio Cunial


摘要
给定一个字符串T,已知其后缀树可以使用带e_T弧的紧凑有向无环字图(CDAWG)表示,取空间的全部O(e_T+e_REV(T))字,其中REV(T)与T相反,并在最坏的情况下支持O(1)和O(log(n))之间的一些键操作。这种表示对于高度重复的字符串特别有吸引力,例如类似基因组或版本控制文档的集合,其中e_T实际上在T的长度上呈次线性增长。在本文中,我们增强了这种表示,在RAM模型中的O(1)和O(log(n))之间的最坏情况下支持许多额外的查询,而不会渐进地增加空间复杂性。我们的技术基于后缀树的重路径分解,还支持后缀数组、反向后缀数组和T本身的表示,该表示采用空间的O(e_T)字,并支持O(log(n))时间的随机访问。此外,我们在T的反向CDAWG和产生T且仅产生T的无上下文语法之间建立了联系,T可能具有独立的兴趣。

引用为

贾马尔·贝拉佐古(Djamal Belazzougui)和法比奥·库尼亚尔(Fabio Cunial)。用CDAWG表示后缀树。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第7:1-7:13页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{belazzougui_et_al:LIPIcs.CPM.2017.7,作者={Belazzougui,Djamal和Cunial,Fabio},title={{用CDAWG}}表示后缀树,booktitle={第28届组合模式匹配年会(CPM 2017)},页数={7:1--7:13},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/LIPIcs.CPM.2017.7},URN={URN:nbn:de:0030-drops-73402},doi={10.4230/LIPIcs.CPM.2017.7},annote={关键词:CDAWG,后缀树,重路径分解,最大重复,无上下文语法}}
文件
参数化字符串的位置堆

作者:Diptarama Diptarama、Takashi Katsura、Yuhei Otomo、Kazuyuki Narisawa和Ayumi Shinohara


摘要
我们提出了一种新的参数化字符串索引结构,称为参数化位置堆。参数化位置堆适用于参数化模式匹配问题,如果存在从模式符号到子字符串符号的双射映射,则模式匹配文本的子字符串。我们提出了一种文本参数化位置堆的在线构建算法,并表明我们的算法与文本大小呈线性关系。我们还表明,通过使用参数化位置堆,我们可以在与模式大小和字母大小的乘积相关的线性时间内找到文本中出现的所有模式。

引用为

Diptarama Diptarama、Takashi Katsura、Yuhei Otomo、Kazuyuki Narisawa和Ayumi Shinohara。为参数化字符串定位堆。在第28届组合模式匹配年度研讨会(CPM 2017)上。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第8:1-8:13页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{diptarama_et_al:LIPIcs.CPM.2017.8,作者={迪普塔拉马、迪普塔拉马和桂树、高石和大通、余辉和奈泽一郎、川崎和信原、Ayumi},title={{参数化字符串的位置堆}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={8:1--8:13},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/documents/10.4230/LIPIcs.CPM.2017.8},URN={URN:nbn:de:0030-drops-73396},doi={10.4230/LIPIcs.CPM.2017.8},annote={关键词:字符串匹配,索引结构,参数化模式匹配,位置堆}}
文件
相似文本的在线模式匹配

作者:罗伯特·格罗西(Roberto Grossi)、科斯塔斯·伊利奥普洛斯(Costas S.Iliopoulos)、张刘(Chang Liu)、娜迪娅·皮桑蒂(Nadia Pisanti)、索伦·皮西斯(Solon P.Pissis)、艾哈迈德·雷塔(Ahmad Retha)、乔瓦娜·罗松(Giovanna Ros


摘要
在一组相似文本上的模式匹配受到了广泛关注,尤其是最近,这主要是因为它在人类遗传变异编目中的应用。特别地,针对这个问题的离线版本,已经提出了许多不同的算法;也就是说,为一组相似文本构建一个压缩索引,以便有效地回答模式匹配查询。然而,这个问题的在线、更基本的版本是一个尚未开发的主题。在线版本的解决方案有很多好处;例如,有效的在线解决方案可以与部分指标结合使用,作为实际权衡。我们试图通过提出两种有效的算法来解决这个问题,从而缩小这个差距。值得注意的是,对于短模式,其中一种算法要求文本表示的大小具有时间线性。此外,实验结果从实际角度证实了我们的理论发现。

引用为

罗伯特·格罗西(Roberto Grossi)、科斯塔斯·伊利奥普洛斯(Costas S.Iliopoulos)、张刘(Chang Liu)、娜迪娅·皮桑蒂(Nadia Pisanti)、索伦·皮西斯(Solon P.Pissis)、艾哈迈德·雷塔(Ahmad Retha)、乔瓦娜·罗松(Giovanna Rosone)、法蒂玛·瓦亚尼(Fatima Vayani。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第9:1-9:14页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{grossi_et_al:LIPIcs.CPM.2017.9,作者={格罗西、罗伯托和伊利奥普洛斯、科斯塔斯·S·和刘、张和皮桑蒂、纳迪亚和皮西斯、梭伦·P·和雷塔、艾哈迈德和罗森、乔瓦纳和瓦亚尼、法蒂玛和维萨里、卢卡},title={{相似文本上的在线模式匹配}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={9:1--9:14},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.9},URN={URN:nbn:de:0030-drops-73379},doi={10.4230/LIPIcs.CPM.2017.9},annote={关键词:字符串算法,模式匹配,退化字符串,弹性退化字符串,在线算法}}
文件
最大双保留串映射问题的一类近似算法

作者:巴特洛米耶·杜德克(Bartlomiej Dudek)、帕维尔·加鲁里科夫斯基(Pawel Gawrychowski)和彼得·奥斯特洛斯基(Piotr Ostropolski-Nalewaja)


摘要
在最大双保留字符串映射问题中,我们得到了两个字符串,希望将前者的字母映射到后者的字母,以最大化双保留的数量。duo是一对连续的字母,映射为一对顺序相同的连续字母。这是对经过深入研究的最小公共字符串划分问题的补充,该问题的目标是将前一个字符串划分为可以进行置换和连接以获得后一个字符串的块。最大双保留字符串映射为APX-hard。经过一系列改进,Brubach[WABI 2016]展示了多项式时间3.25近似算法。我们的主要贡献是,对于任何eps>0,都存在多项式时间(2+eps)近似算法。与Boria等人[CPM 2016]的先前解决方案类似,我们的算法使用了局部搜索技术。然而,这只是在一个初步的贪婪过程之后才使用,这给了我们更多的结构,并使更通用的局部搜索成为可能。我们用一种特殊版本的算法对此进行补充,该算法在二次时间内达到2.67近似值。

引用为

巴特洛米耶·杜德克(Bartlomiej Dudek)、帕维尔·加鲁里科夫斯基(Pawel Gawrychowski)和彼得·奥斯特罗普斯基(Piotr Ostropolski-Nalewaja)。最大双保留字符串映射问题的一系列近似算法。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第10:1-10:14页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{dudek_et_al:LIPIcs.CPM.2017.10,author={杜德克、巴特洛米耶和加鲁里科斯基、帕维尔和奥斯特洛斯基-纳莱瓦贾、彼得罗},title={{最大二值保留字符串映射问题的近似算法族}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={10:1--10:14},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 伊宁Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.10},URN={URN:nbn:de:0030-drops-73458},doi={10.4230/LIPIcs.CPM.2017.10},annote={关键词:近似方案,最小公共字符串分区,局部搜索}}
文件
重新审视最大双保留字符串映射的参数化复杂性

作者:Christian Komusewicz、Mateus de Oliveira Oliveila和Meirav Zehavi


摘要
在最大双保留字符串映射(Max-Duo PSM)问题中,输入由两个长度为n的相关字符串A和B以及一个非负整数k组成。目标是确定是否存在从a的位置集到B的位置集的映射m,该映射仅映射到具有相同字符的位置,并保留至少k个二重奏,即相邻位置对。我们开发了一个在时间4^k*n^{O(1)}内求解Max-Duo PSM的随机算法,以及一个在6.855^k*n ^{O。以前针对该问题的最著名(确定性)算法具有运行时间(8e)^{2k+o(k)}*n^{o(1)}[Beretta等人,Theor.Comput.Sci.2016]。我们还证明了Max-Duo PSM承认一个大小为O(k^3)的问题核,改进了以前最著名的大小为O的问题核(k^6)。

引用为

Christian Komusewicz、Mateus de Oliveira Oliveila和Meirav Zehavi。重温最大双保留字符串映射的参数化复杂性。在第28届组合模式匹配年度研讨会(CPM 2017)上。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第11:1-11:17页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{komusiewicz_et_al:LIPIcs.CPM.2017.11,author={Komusiewicz、Christian和de Oliveira Oliveirea、Mateus和Zehavi、Meirav},title={{重新审视最大双保留字符串映射的参数化复杂性}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={11:1--11:17},series={Leibniz国际信息学论文集(LIPIcs)},ISBN={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.11},URN={URN:nbn:de:00030-drops-73436},doi={10.4230/LIPIcs.CPM.2017.11},annote={关键词:比较基因组学,参数化复杂性,核化}}
文件
基于Clique的树邻接语法分析下限

作者:卡尔·布林曼和菲利普·威尼茨


摘要
树邻接文法是上下文无关文法的泛化,非常适合模拟人类语言,因此在计算语言学中很受欢迎。在树邻接语法识别问题中,给定语法G和长度为n的字符串s,任务是决定是否可以从G.Rajasekaran和Yooseph的解析器(JCSS'98)中获得s,并在时间O(n^2w)内解决这个问题,其中w<2.373是矩阵乘法指数。避免快速矩阵乘法的最佳算法耗时O(n^6)。Satta(J.Comp.Linguist.’94)给出了硬度的第一个证据:对于更一般的解析问题,任何避免快速矩阵乘法并且在|G|=Theta(n^12)的情况下显著快于O(|G|·n^6)的算法都意味着布尔矩阵乘法的突破。遵循Abboud等人(FOCS’15)的无上下文语法识别方法,本文解决了先前下限的许多缺点。我们表明,即使在常量语法上,对Rajasekaran和Yooseph的解析器的任何改进都意味着对k-Clique问题的突破。这将树邻接语法分析确立为一个实际相关的问题,其异常运行时间为n^2w,高达低阶因子。

引用为

Karl Bringmann和Philip Wellnitz。解析树邻接语法的基于Clique的下界。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第12:1-12:14页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{bringmann_et_al:LIPIcs.CPM.2017.12,author={Bringmann,Karl和Wellnitz,Philip},title={{解析树邻接语法的基于Clique的下限}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={12:1--12:14},series={Leibniz国际信息学论文集(LIPIcs)},ISBN={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.12},URN={URN:nbn:de:00030-drops-73329},doi={10.4230/LIPIcs.CPM.2017.12},annote={关键词:条件下限,k-Clique,解析,树连接语法}}
文件
近似模式匹配的通信和流复杂度

作者:塔蒂亚娜·斯塔里科夫斯卡娅


摘要
我们考虑近似模式匹配问题。给定长度为2n的文本T和长度为n的模式P,任务是确定T的每个前缀T[1,j]是否以距离P最多k的编辑距离结束。如果是这样,我们必须输出编辑距离和相应的编辑操作。首先,我们展示了当Alice和Bob共享模式,Alice持有文本的前半部分,Bob持有文本的后半部分时,以及当Alice持有前半部分文本,Bob持文本的后半部分,Charlie持有模式时,问题的通信复杂性。然后,我们为该问题开发了第一个次线性空间流算法。该算法是随机的,错误概率最多为1/poly(n)。

引用为

塔蒂亚娜·斯塔里科夫斯卡娅(Tatiana Starikovskaya)。近似模式匹配的通信和流处理复杂性。第28届组合模式匹配年度研讨会(CPM 2017)。《莱布尼茨国际信息学论文集》,第78卷,第13:1-13:11页,Schloss Dagstuhl–Leibniz Zentrum für Informatik(2017)


将BibTex复制到剪贴板

@会议记录{starikovskaya:LIPIcs.CPM.2017.13,作者={Starikovskaya,Tatiana},title={{近似模式匹配的通信和流复杂性}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={13:1--13:11},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.13},URN={URN:nbn:de:0030-drops-73206},doi={10.4230/LIPIcs.CPM.2017.13},annote={关键词:近似模式匹配、编辑距离、随机算法、流算法、通信复杂性}}
文件
最长填充的常见子序列问题

作者:毛罗·卡斯泰利、里卡多·唐迪、吉安卡洛·毛里和伊塔洛·佐皮斯


摘要
受最近一种从不完整数据重建基因组的方法的启发,我们考虑了用于比较两个序列的最长通用子序列问题的一个变体,其中一个序列是不完整的,即它有一些缺失元素。新的组合问题称为最长填充公共子序列(Longest Filled Common Subsequence),给定两个序列A和B,以及B中缺失符号的多集合M,要求将M的符号插入到B中得到序列B*,以便B*导出一个具有最大长度A的公共子序列。首先,我们研究了该问题的计算和近似复杂性,并证明了当A包含每个符号最多两次出现时,它是NP难的和APX难的。然后,我们给出了该问题的3/5近似算法。最后,我们提出了一个固定参数算法,当问题由插入B中“匹配”a符号的符号数参数化时。

引用为

毛罗·卡斯泰利(Mauro Castelli)、里卡多·唐迪(Riccardo Dondi)、吉安卡洛·毛里(Giancarlo Mauri)和伊塔洛·佐皮斯(Italo Zoppis)。填充时间最长的常见子序列问题。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第14:1-14:13页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{castelli_et_al:LIPIcs.CPM.2017.14,author={卡斯泰利、毛罗和唐迪、里卡多和毛里、吉安卡洛和佐皮斯、伊塔洛},title={{最长填充常见子序列问题}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={14:1--14:13},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.14},URN={URN:nbn:de:0030-drops-73293},doi={10.4230/LIPIcs.CPM.2017.14},annote={关键词:最长公共子序列,近似算法,计算复杂性,固定参数算法}}
文件
滑动窗口中的Lempel-Ziv压缩

作者:菲利普·比尔、帕特里克·哈格·科丁、约翰·菲舍尔和英格·李·格茨


摘要
我们提出了滑动窗口Lempel-Ziv(LZ77)问题和近似最右边LZ77解析问题的新算法。我们的主要结果是一个新的、令人惊讶的简单算法,它计算O(w)空间中的滑动窗口LZ77解析以及O(n)预期时间或O(n log log w+z log logs)确定性时间。这里,w是窗口大小,n是输入字符串的大小,z是解析中短语的数量,s是字母表的大小。这与之前结果的空间和时间边界相匹配,同时取消了对字母表大小的常量大小限制。为了实现我们的结果,我们将后缀树的简单修改和增强与滑动窗口的周期特性结合起来。我们还应用这一新技术获得了一个近似最右侧LZ77问题的算法,该算法使用O(n(log z+log log n))时间和O(n)空间,并产生最右侧解析的(1+e)-近似(任意常数e>0)。虽然这并没有改善精确最右边解析的最佳时空权衡,但我们的算法明显更简单,并且揭示了滑动窗口解析和近似最右边匹配问题之间的直接联系。

引用为

菲利普·比尔(Philip Bille)、帕特里克·哈格·科丁(Patrick Hagge Cording)、约翰·菲舍尔(Johannes Fischer)和英格·李·格茨(Inge Liörtz)。滑动窗口中的Lempel-Ziv压缩。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第15:1-15:11页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{bill_et_al:LIPIcs.CPM.2017.15,author={Bille、Philip和Cording、Patrick Hagge和Fischer、Johannes和G{\o}rtz、Inge Li},title={{滑动窗口中的Lempel-Ziv压缩}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={15:1--15:11},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},editor={K}“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.15},URN={URN:nbn:de:0030-drops-73316},doi={10.4230/LPIcs.CPM.2017.15},annote={关键词:Lempel-Ziv解析,滑动窗口,最右边的匹配}}
文件
Lempel-Ziv压缩索引的时空权衡

作者:菲利普·比尔(Philip Bille)、米科·贝格伦·埃蒂安(Mikko Berggren Ettienne)、英格·利·戈茨(Inge Liörtz)和哈尔特·韦德尔·维尔德(Hjalte Wedel Vildhöj)


摘要
给定一个字符串S,压缩索引问题是将S预处理为支持快速子字符串查询的压缩表示。目标是在支持快速查询的同时,相对于S的压缩大小使用很少的空间。我们提出了一个基于Lempel-Ziv 1977压缩方案的压缩索引。让n和z分别表示输入字符串和压缩的LZ77字符串的大小。我们获得了以下时空权衡。给定长度为m的模式字符串P,我们可以在(i) O(m+occ lglg n)时间,使用O(z lg(n/z)lglg z)空间,或(ii)O(m(1+lg^e z/lg(n/z))+occ(lglg n+lg*e z))时间,使用O(z-lg(n/z))空间,对于任何0<e<1特别是,(i)将先前最佳解的查询时间中的前导项从O(mlgm)改进为O(m),代价是将空间增加了一个因子lglgz。或者,(ii)匹配先前最佳空间边界,但在查询时间中有一个前导项O(m(1+lg^e z/lg(n/z)))。然而,对于任何多项式压缩比,即z=O(n^{1-d}),对于常数d>0,这将成为O(m)。我们的索引还支持在O(l+lg(n/z))时间内提取长度为l的任何子串。从技术上讲,我们的结果是通过独立感兴趣的现有数据结构的新扩展和组合获得的,包括弱前缀搜索的新批量变体。

引用为

菲利普·比利(Philip Bille)、米科·贝格伦·埃蒂安(Mikko Berggren Ettienne)、英格·利·戈茨(Inge Li Gortz)和哈拉尔特·维德尔·维德(Hjalte Wedel Vildhöj)。Lempel-Ziv压缩索引的时空权衡。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第16:1-16:17页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{bill_et_al:LIPIcs.CPM.2017.16,author={Bille、Philip和Ettienne、Mikko Berggren和G{o}rtz、Inge Li和Vildh{o}j、Hjalte Wedel}、,title={Lempel-Ziv压缩索引的时空权衡}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={16:1--16:17},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 伊宁Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.16},URN={URN:nbn:de:0030-drops-73254},doi={10.4230/LIPIcs.CPM.2017.16},annote={关键词:压缩索引,模式匹配,LZ77,前缀搜索}}
文件
从LZ77到行程长度编码的Burrows-Wheeler变换,以及返回

作者:阿尔贝托·波利克里蒂和尼古拉·普雷扎


摘要
Lempel-Ziv因式分解(LZ77)和Run-Length编码的Burrows-Wheeler变换(RLBWT)是文本压缩和索引中的两个重要工具,因为它们的大小z和r与文本的自相关性密切相关。在本文中,我们考虑在与输入和输出成比例的工作空间内将两种表示相互转换的问题。设n为文本长度。我们证明了RLBWT可以在工作空间的O(n log r)时间和O(r)字内转换为LZ77。相反,我们提供了一种算法,将LZ77转换为工作空间中O(n(log r+log z))时间和O(r+z)字的RLBWT。请注意,如果文本高度重复,r和z可以是常数,并且我们的算法可以在比基于完全解压缩的天真解决方案小(最多)指数级的空间下运行。

引用为

阿尔贝托·波利克里蒂(Alberto Policriti)和尼古拉·普雷扎(Nicola Prezza)。从LZ77到Run-Length编码Burrows-Wheeler变换,然后返回。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第17:1-17:10页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{policiti_et_al:LIPIcs.CPM.2017.17,author={Policriti、Alberto和Prezza、Nicola},title={{From LZ77 to the Run-Length Encoded Burrows-Wheeler Transform,and Back}},booktitle={第28届组合模式匹配年度研讨会(CPM 2017)},页数={17:1--17:10},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩,Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.17},URN={URN:nbn:de:0030-drops-73215},doi={10.4230/LIPIcs.CPM.2017.17},annote={关键词:Lempel-Ziv,Burrows-Wheeler变换,压缩计算,重复文本集合}}
文件
具有重新压缩的最长公共扩展

作者:友弘一世


摘要
给定长度为N的字符串T中的两个位置i和j,最长公共扩展(LCE)查询要求从i和j开始的后缀之间的最长公共前缀的长度。压缩的LCE数据结构以压缩形式存储T,同时支持快速LCE查询。在本文中,我们展示了重新压缩技术是压缩LCE数据结构的强大工具。我们提出了一种新的压缩LCE数据结构,其大小为O(z-lg(N/z)),支持O(lg-N)时间内的LCE查询,其中z是Lempel-Ziv 77因子分解的大小,无需自引用T。给定T作为未压缩形式,我们展示了如何在O(N)时间和空间中构建数据结构。给定T作为语法压缩形式,即一个大小为n的直线程序生成T,我们展示了如何在O(n-lg(n/n))时间和O(n+z-lg(n/z))空间中构建数据结构。我们的算法是确定性的,总是返回正确的答案。

引用为

Tomohiro I.最长的普通拉伸与再压缩。在第28届组合模式匹配年度研讨会(CPM 2017)上。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第18:1-18:15页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{i:LIPIcs.CPM.2017.18,author={I,Tomohiro},title={{带重新压缩的最长公共扩展}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={18:1--18:15},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.18},URN={URN:nbn:de:0030-drops-73234},doi={10.4230/LIPIcs.CPM.2017.18},annote={关键词:最长公共扩展(LCE)查询、压缩数据结构、语法压缩字符串、直线程序(SLP)}}
文件
二进制运行长度编码字符串的快速简单交错索引

作者:路易斯·库尼亚(Luis Cunha)、西蒙·丹塔斯(Simone Dantas)、特拉维斯·加吉(Travis Gagie)、罗兰·维特勒(Roland Wittler)、路易斯·科瓦达(Luis Kowada)和延斯·斯托耶(Jens Stoye)


摘要
最近出现了一些关于为二进制字符串索引以进行混杂模式匹配的重要论文,进一步降低输入大小的时间界限现在将是一个具有广泛意义的突破。然而,通过考虑其他自然参数,我们仍然可以在这个问题上取得进展。Badkobeh等人(IPL,2013)和Amir等人(TCS,2016)给出了以O(n+r^2 log r)时间为单位对二进制字符串进行索引的算法,其中n是长度,r是运行次数,Giaquinta和Grabowski(2013)给出了一个以O(n+r^2)时间运行的算法。在本文中,我们提出了一种新的非常简单的算法,该算法也在O(n+r^2)时间内运行,并且可以进行扩展,从而使索引返回匹配的位置(如果有匹配的话),或者使该算法只使用O(n)位空间而不使用O(n)个字。

引用为

路易斯·库尼亚(Luís Cunha)、西蒙·丹塔斯(Simone Dantas)、特拉维斯·加吉(Travis Gagie)、罗兰·维特勒(Roland Wittler)、路易斯·科瓦达(Luis Kowada)和延斯·斯托耶(Jens Stoye)。二进制运行长度编码字符串的快速简单交错索引。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第19:1-19:9页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{cunha_et_al:LIPIcs.CPM.2017.19,author={Cunha,Lu和Dantas,Simone和Gagie,Travis和Wittler,Roland和Kowada,Luis和Stoye,Jens,title={{二进制运行长度编码字符串的快速简单交错索引}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={19:1--19:9},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.19},URN={URN:nbn:de:0030-drops-73418},doi={10.4230/LIPIcs.CPM.2017.19},annote={关键词:字符串算法,索引,混杂模式匹配,运行长度编码}}
文件
通过RLE实现更快的STR-IC-LCS计算

作者:Keita Kuboi、Yuta Fujishige、Shunsuke Inenaga、Hideo Bannai和Masayuki Takeda


摘要
约束LCS问题要求找到两个输入字符串a和B在某些约束条件下的最长公共子序列。STR-IC-LCS问题是约束LCS问题的一个变体,其中的解决方案必须包括给定的约束字符串C作为子字符串。给定两个长度分别为M和N的字符串a和B,以及长度最多为min{M,N}的约束字符串C,这是Deorowicz(Inf。过程。莱特。,2012年11月423-426日),运行时间为O(MN)。在本文中,我们给出了STR-IC-LCS问题的O(mN+nM)时间解,其中m和n分别表示A和B的游程编码的大小。由于m<=m和n<=n总是成立的,我们的算法始终与Deorowicz的算法一样快,并且当输入字符串通过RLE可压缩时速度更快。

引用为

Keita Kuboi、Yuta Fujishige、Shunsuke Inenaga、Hideo Bannai和Masayuki Takeda。通过RLE实现更快的STR-IC-LCS计算。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第20:1-20:12页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{kuboi_et_al:LIPIcs.CPM.2017.20,author={Kuboi、Keita和Fujishige、Yuta和Inenaga、Shunsuke和Bannai、Hideo和Takeda、Masayuki},title={{通过RLE}}实现更快的STR-IC-LCS计算,booktitle={第28届组合模式匹配年会(CPM 2017)},页数={20:1--20:12},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.20},URN={URN:nbn:de:0030-drops-73335},doi={10.4230/LIPIcs.CPM.2017.20},annote={关键词:最长公共子序列,STR-IC-LCS,运行长度编码}}
文件
缺口模式统计

作者:菲利普·杜雄(Philippe Duchon)、西里尔·尼科德(Cyril Nicaud)和卡琳·皮沃托(Carine Pivoteau)


摘要
在均匀分布和无记忆分布(其中字母具有不同的概率,但独立绘制)下,我们对随机单词中与字母重叠和回文相关的参数进行了概率分析。更准确地说,我们研究了最大字母重叠模式的预期数量,以及随机单词中最长字母重叠模式预期的长度。

引用为

菲利普·杜雄(Philippe Duchon)、西里尔·尼科德(Cyril Nicaud)和卡琳·皮沃托(Carine Pivoteau)。缺口模式统计。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第21:1-21:12页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@在诉讼中{duchen_et_al:LIPIcs.CPM.2017.21,author={Duchon、Philippe和Nicaud、Cyril和Pivoteau、Carine},title={{Gapped Pattern Statistics}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={21:1--21:12},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.21},URN={URN:nbn:de:00030-drops-73309},doi={10.4230/LIPIcs.CPM.2017.21},annote={关键词:单词组合,字母重复,随机单词,无记忆来源,分析组合}}
文件
整数字母在线性时间中计算所有可分辨平方

作者:Hideo Bannai、Shunsuke Inenaga和Dominik Köppl


摘要
给定整数字母表上的字符串,我们提出了一种算法,该算法计算属于该字符串的所有不同方块的集合,其时间与字符串长度呈线性关系。作为应用,我们展示了如何在线性时间内计算最小增广后缀树的树拓扑。除此之外,我们详细阐述了一种算法,该算法使用压缩的工作空间以简洁的表示方式计算最长的前一个表。

引用为

Hideo Bannai、Shunsuke Inenaga和Dominik Köppl。计算整数字母的线性时间中的所有不同平方。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第22:1-22:18页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{bannai_et_al:LIPIcs.CPM.2017.22,author={Bannai、Hideo和Inenaga、Shunsuke和K\“{o} 应用程序,多米尼克},title={{计算整数字母在线性时间内的所有不同平方}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={22:1--22:18},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},editor={K}“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.22},URN={URN:nbn:de:0030-drops-73224},doi={10.4230/LIPIcs.CPM.2017.22},annote={关键词:串联重复,不同方块,计数算法}}
文件
线性时间中的回文长度

作者:基里尔·博罗兹丁(Kirill Borozdin)、德米特里·科索洛波夫(Dmitry Kosolobov)、米哈伊尔·鲁宾奇克(Mikhail Rubinchik)和阿塞尼·M·舒尔(Arseny M.Shur)


摘要
字符串的回文长度是指其串联等于该字符串的最小回文数。求回文长度的问题引起了一些关注,最近为其设计了一些O(n log n)时间联机算法。本文给出了该问题的第一个线性时间联机算法。

引用为

基里尔·博罗兹丁(Kirill Borozdin)、德米特里·科索洛波夫(Dmitry Kosolobov)、米哈伊尔·鲁宾奇克(Mikhail Rubinchik)和阿塞尼·M·舒尔(Arseny M.Shur)。线性时间中的回文长度。在第28届组合模式匹配年度研讨会(CPM 2017)上。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第23:1-23:12页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{borozdin_et_al:LIPIcs.CPM.2017.23,作者={博罗兹丁、基里尔和科索洛波夫、德米特里和鲁宾奇克、米哈伊尔和舒尔、阿塞尼M.},title={{线性时间中的回文长度}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={23:1--23:12},series={Leibniz国际信息学论文集(LIPIcs)},ISBN={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.23},URN={URN:nbn:de:00030-drops-73389},doi={10.4230/LIPIcs.CPM.2017.23},annote={关键词:回文,回文长度,回文因子分解,在线}}
文件
最短唯一子串最大数目的紧界

作者:Takuya Mieno、Shunsuke Inenaga、Hideo Bannai和Masayuki Takeda


摘要
字符串S的子串Q被称为S中区间[S,t]的最短唯一子串(SUS),如果Q在S中恰好出现一次,那么Q的出现包含区间[S、t],并且S中每个包含区间[S,t]且短于Q的子串在S中至少出现两次。SUS问题是,给定字符串S,对S进行预处理,以便对于任何后续查询间隔[S,t],可以快速回答间隔[S,t]的所有SUS。当s=t时,我们将[s,t]的SUS称为点SUS,当s<=t,我们将[s,t]的SUS命名为区间SUS。对于点SUS和区间SUS,都存在最优O(n)时间预处理方案,该方案在最优O(k)时间内回答查询,其中n是S的长度,k是给定查询的输出数。在本文中,我们揭示了SUS问题背后的结构和组合属性:即,我们证明了S中对应于S中所有查询位置的点SUS的区间数小于1.5n,并且表明这是一个匹配的上界和下界。此外,我们考虑S中对应于S中所有查询间隔的间隔SUS的最大间隔数。

引用为

Takuya Mieno、Shunsuke Inenaga、Hideo Bannai和Masayuki Takeda。最短唯一子串的最大数目的紧界限。在第28届组合模式匹配年度研讨会(CPM 2017)上。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第24:1-24:11页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{mieno_et_al:LIPIcs.CPM.2017.24,author={三野、Takuya和Inenaga、Shunsuke和Bannai、Hideo和Takeda、Masayuki},title={{最短唯一子串最大数目的紧界}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={24:1--24:11},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.24},URN={URN:nbn:de:0030-drops-73460},doi={10.4230/LIPIcs.CPM.2017.24},annote={Keywords:最短唯一子串,最大唯一子串}}
文件
我们能找回封面吗?

作者:Amihood Amir、Avivit Levy、Moshe Lewenstein、Ronit Lubin和Benny Porat


摘要
数据分析通常涉及错误恢复和规则检测,这是两个不同的关键任务。在本文中,我们展示了这两种任务可以有力地结合在一起的数据类型。弦的规则性的一个常见概念是覆盖。描述自然可覆盖现象测量值的数据可能会因测量过程引起的误差或现象本身的不精确特征而损坏。由于这个原因,引入了不同的近似覆盖变量,其中一些是需要计算的NP-hard。在本文中,我们假设汉明距离度量度量了所经历的损坏量,并研究了从由不匹配错误损坏的数据中恢复正确覆盖的问题,正式定义为覆盖恢复问题(CRP)。我们表明,对于汉明距离度量,覆盖性是一个强大的属性,允许在适当的条件下检测原始覆盖并更正数据。我们还研究了另一个问题的松弛问题,即近似覆盖问题(ACP)。由于ACP被证明是NP-hard[Amir,Levy,Lubin,Porat,CPM 2017],我们研究了一种松弛,我们称之为ACP的候选松弛,并表明它具有多项式时间复杂性。因此,我们得出ACP在许多实际情况下也具有多项式时间复杂性。我们的ACP松弛研究的一个重要应用也是覆盖恢复问题(CRP)的多项式时间算法。

引用为

Amihood Amir、Avivit Levy、Moshe Lewenstein、Ronit Lubin和Benny Porat。我们能找回封面吗?。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第25:1-25:15页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{amir_et_al:LIPIcs.CPM.2017.25,作者={Amir、Amihood和Levy、Avivit和Lewenstein、Moshe和Lubin、Ronit和Porat、Benny},title={{我们能找回封面吗?}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={25:1--25:15},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.25},URN={URN:nbn:de:0030-drops-73190},doi={10.4230/LIPIcs.CPM.2017.25},annote={关键词:周期性,准周期性,覆盖,近似覆盖,数据恢复}}
文件
弦的近似覆盖

作者:Amihood Amir、Avivit Levy、Ronit Lubin和Ely Porat


摘要
字符串中的正则性出现在科学的各个领域,包括编码和自动机理论、形式语言理论、组合学、分子生物学等。描述字符串T中规则性的一个常见概念是覆盖,它是字符串C,其中T的每个字母都位于C的某个出现处。给定文本中覆盖重复的对齐称为平铺。在许多应用中,由于存在错误,仅找到准确的重复是不够的。在本文中,我们使用了一种新的方法来处理可覆盖现象中的错误,并定义了近似覆盖问题(ACP),在该问题中,我们得到了一个文本,该文本是一些可能存在不匹配错误的覆盖重复序列,我们寻求一个包含错误数最少的文本的字符串。我们首先通过研究ACP的覆盖尺寸弛豫来证明ACP是NP-hard,其中输入字符串也给出了所需的近似覆盖尺寸。我们表明这种弛豫已经是NP-hard。我们还研究了ACP的另外两种松弛,我们称之为ACP的部分平铺松弛和ACP的完全平铺松弛,在这两种松弛中,所请求的覆盖的平铺也与输入字符串一起给出。给定的完整平铺保留了错误前覆盖的所有出现,在部分平铺时,可能会出现未被平铺标记的覆盖层的其他情况。我们证明了部分平铺松弛具有多项式时间复杂性,并给出了实验证据表明,完全平铺也具有多项式时间复杂度。对这些弛豫的研究,除了揭示ACP的复杂性外,还涉及对覆盖性质的深入理解,得出一些关键引理和观察结果,可能有助于未来研究存在误差的规律。

引用为

Amihood Amir、Avivit Levy、Ronit Lubin和Ely Porat。弦的近似覆盖。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第26:1-26:14页,达格斯图尔-莱布尼兹-泽特鲁姆信息学院(2017)


将BibTex复制到剪贴板

@会议记录{amir_et_al:LIPIcs.CPM.2017.26,author={Amir、Amihood和Levy、Avivit和Lubin、Ronit和Porat、Ely},title={{字符串的近似覆盖}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={26:1--26:14},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.26},URN={URN:nbn:de:0030-drops-73189},doi={10.4230/LPIcs.CPM.2017.26},annote={关键词:周期性,拟周期性,覆盖,近似覆盖}}
文件
超越相邻最大化:脚手架填充新的管柱距离

作者:Laurent Bulteau、Guillaume Fertin和Christian Komusewicz


摘要
在基因组支架填充中,一个目标是在电子版中抛光一个称为支架的基因组草图。支架是以一组有序的基因序列的形式给出的,称为contigs。这是通过与来自相近物种的已经完整的参考基因组的支架对抗来实现的。更准确地说,给定支架S、参考基因组G和两个基因组之间的得分函数f(),目的是通过添加G中缺失的基因来完成S,以便获得的完整基因组S*优化f(S*,G)。在本文中,我们扩展了Jiang等人[CPM 2016]的模型(i),允许插入字符串而不是单个字符(即一些基因组可能被强制插入在一起)和(ii)通过考虑两个可选的得分函数:第一个函数通过最大化S*和G(k-Mer脚手架填充)之间的公共k-Mer数来推广公共邻接的概念,第二个函数的目标是最小化S*和G(Min-Breakpoint脚手架填充)间的断点数。我们从参数化复杂性的角度研究这些问题,为这两个问题提供了固定参数(FPT)算法。特别是,我们证明了k-Mer脚手架填充是FPT wrt.参数l,通过完成S-实现的额外k-Mer数,这回答了Jiang等人的一个悬而未决的问题[CPM 2016]。我们还表明,最小断点支架填充是FPT wrt。一个结合缺失基因数、基因重复数和目标距离的参数。

引用为

Laurent Bulteau、Guillaume Fertin和Christian Komusewicz。超越相邻最大化:为新的字符串距离填充脚手架。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第27:1-27:17页,达格斯图尔-莱布尼兹-泽特鲁姆信息学院(2017)


将BibTex复制到剪贴板

@会议记录{bulteau_et_al:LIPIcs.CPM.2017.27,author={Bulteau、Laurent和Fertin、Guillaume和Komusewicz、Christian},title={{超越相邻最大化:新字符串距离的脚手架填充}},booktitle={第28届组合模式匹配年会(CPM 2017)},页码={27:1-27:17},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.27},URN={URN:nbn:de:0030-drops-73364},doi={10.4230/LIPIcs.CPM.2017.27},annote={关键词:计算生物学,字符串,FPT算法,内核化}}
文件
关于加权四方共识问题

作者:曼纽尔·拉丰德和塞琳·斯科纳瓦卡


摘要
在系统发育学中,一致性问题在于总结一组系统发育树,这些树都将同一组物种分类到一棵树中。文献中存在几种共识的定义;在本文中,我们关注的是迄今为止复杂性状态未知的加权四方共识问题。在这里,我们证明了加权四方共识问题是NP-hard,并给出了该问题的1/2因子近似。在这个过程中,我们提出了一个先前已知的随机1/3因子近似的去核化过程。我们还研究了该问题的固定参数可处理性。

引用为

曼纽尔·拉丰德和塞琳·斯科纳瓦卡。关于加权四方共识问题。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第28:1-28:18页,达格斯图尔-莱布尼兹-泽特鲁姆信息学院(2017)


将BibTex复制到剪贴板

@会议记录{lafond_et_al:LIPIcs.CPM.2017.28,author={拉丰德、曼努埃尔和斯科纳瓦卡、塞琳},title={{关于加权四方共识问题}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={28:1--28:18},series={Leibniz国际信息学论文集(LIPIcs)},ISBN={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.28},URN={URN:nbn:de:0030-drops-73284},doi={10.4230/LIPIcs.CPM.2017.28},注释={关键词:系统发育树,一致树,四分位,复杂性,固定参数可处理性}}
文件
安全完整外形装配的最佳省略列表

作者:马西莫·开罗(Massimo Cairo)、保罗·梅德韦杰夫(Paul Medvedev)、尼迪亚·奥布斯库拉·阿科斯塔(Nidia Obscura Acosta)、罗密奥·里齐(Romeo Rizzi)和亚历山大·托梅斯库(Alexa


摘要
基因组组装是从测序实验的一组读数中重建基因组序列的问题。装配问题的典型形式在实践中允许许多基因组重建,而实际的基因组装配者通常输出连续序列,即基因组中可能出现的子串。为了将理论与实践联系起来,Tomescu和Medvedev【RECOMB 2016】重新制定了contig组装,以发现所有基因组重建共有的所有子串。他们还给出了这些行走(omnitigs)的特征,这些行走是(有向)图的所有封闭边覆盖行走所共有的,这是基因组重建的典型概念。通过从每一条边发起穷举访问,提出了一种列出所有最大统计量的算法。在本文中,我们证明了对omnitigs结构的新见解,并解决了有关它们的几个开放问题。我们将这些结合起来,实现了一个O(nm)时间算法,用于输出图的所有最大全角点(具有n个节点和m条边)。这也是最优的,因为我们展示了总omnitig长度为Omega(nm)的图族。我们实现了该算法,并表明它在实践中比Tomescu和Medvedev的算法快9-12倍[RECOMB 2016]。

引用为

马西莫·开罗(Massimo Cairo)、保罗·梅德韦杰夫(Paul Medvedev)、尼迪亚·奥布斯库拉·阿科斯塔(Nidia Obscura Acosta)、罗密奥·里齐(Romeo Rizzi)和亚历山大·托梅斯库(Alexandru I.Tomescu)。安全完整外形装配的最佳省略列表。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第29:1-29:12页,达格斯图尔-莱布尼兹-泽特鲁姆信息学院(2017)


将BibTex复制到剪贴板

@会议记录{cairo_et_al:LIPIcs.CPM.2017.29,author={开罗、马西莫和梅德韦杰夫、保罗和奥布斯库拉·阿科斯塔、尼迪亚和里兹、罗密欧和托梅斯库、亚历山德鲁一世},title={{安全完整外形组件的最佳省略列表}},booktitle={第28届组合模式匹配年会(CPM 2017)},pages={29:1-29:12},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.29},URN={URN:nbn:de:0030-drops-73423},doi={10.4230/LIPIcs.CPM.2017.29},annote={关键词:基因组组装,图算法,边覆盖行走,强桥}}
文件
动态Elias Fano表示

作者:朱利奥·埃尔曼诺·皮比里和罗萨诺·文丘里尼


摘要
我们证明了在接近信息理论下限的空间中存储从u大小的有界宇宙中提取的n个整数的动态有序集S是可能的,同时保持了操作的渐近时间最优性。我们的结果利用了单调整数序列的Elias-Fano表示,可以证明每个元素距离信息理论最小值不到半比特。特别是,考虑到内存字大小为Theta(log u)位的RAM模型,当从大小为u=n ^ gamma的多项式宇宙中为任意gamma=Theta(1)提取整数时,我们将o(n)位添加到静态Elias-Fano表示中,以便:1.支持O(min{1+log(u/n),loglogn})中的静态前置/后继查询;2.通过每个插入元素花费O(1),使S以附加方式增长;3.描述一种动态数据结构,支持在O(log n/loglog n)最坏情况下的随机访问,在O(日志n/log n)摊销中的插入/删除,以及在O(min{1+log(u/n),loglog n})最坏条件下的前置/后继查询。这些时间限制是最佳的。

引用为

朱利奥·埃尔曼诺·皮比里和罗萨诺·文丘里尼。动态Elias-Fano代表。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第30:1-30:14页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{pibiri_et_al:LIPIcs.CPM.2017.30,author={Pibiri,Giulio Ermanno和Venturini,Rossano},title={{动态Elias-Fano表示}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={30:1--30:14},series={Leibniz国际信息学论文集(LIPIcs)},国际标准图书编号={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 伊宁Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.30},URN={URN:nbn:de:0030-drops-73244},doi={10.4230/LIPIcs.CPM.2017.30},annote={关键词:简洁的数据结构,整数集,前辈问题,Elias-Fano}}
文件
多集上的协同解决方案

作者:杰雷米·巴贝、卡洛斯·奥乔亚和斯里尼瓦萨·拉奥·萨蒂


摘要
Karp等人(1988年)将多重集的延迟数据结构描述为“惰性”数据结构,该结构对数据进行部分排序,以支持在线排名和选择查询,在最坏情况下,相对于大小为n的实例和数量为q的查询,工作量最小。Barbay等人(2016年)改进了这种方法,以利用查询所命中位置之间的差距(即查询中的结构)。我们开发了新技术,以进一步完善这种方法,并同时利用输入中的结构(即元素的多重性)、局部顺序(即运行次数和大小)和全局顺序(即现有枢轴的数量和位置)的一些概念;以及查询序列的结构和顺序。我们的主要结果是一种协同延迟数据结构,其性能优于仅利用这些功能子集的比较模型中的所有解决方案。作为中间结果,我们描述了两种新的协同排序算法,它们利用了输入中结构和顺序(局部和全局)的一些概念,改进了以前仅利用输入中结构(Munro和Spira 1979)或局部顺序(Takaoka 1997)的结果;以及一种新的多选择算法,它不仅利用了输入中的顺序和结构,还利用了查询中的结构。

引用为

杰雷米·巴贝、卡洛斯·奥乔亚和斯里尼瓦萨·拉奥·萨蒂。多集上的协同解决方案。第28届组合模式匹配年度研讨会(CPM 2017)。莱布尼茨国际信息学论文集(LIPIcs),第78卷,第31:1-31:14页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)


将BibTex复制到剪贴板

@会议记录{barbay_et_al:LIPIcs.CPM.2017.31,作者={Barbay,J\'{e} 对\'{e} 我的奥乔亚、卡洛斯、萨蒂、斯里尼瓦萨·拉奥,title={{多集上的协同解决方案}},booktitle={第28届组合模式匹配年会(CPM 2017)},页数={31:1--31:14},series={Leibniz国际信息学论文集(LIPIcs)},ISBN={978-3-95977-039-2},ISSN={1868-8969},年份={2017年},体积={78},编辑器={K\“{a} rkk公司\"{a} 内恩Juha和Radoszewski,Jakub和Rytter,Wojciech},publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik},地址={Dagstuhl,德国},URL={https://drops.dagstuhl.de/entities/document/10.4230/LIPIcs.CPM.2017.31},URN={URN:nbn:de:00030-drops-73441},doi={10.4230/LIPIcs.CPM.2017.31},annote={关键词:延迟数据结构,多元分析,快速排序,选择}}

过滤器


问题/备注/反馈
X(X)

Dagstuhl出版社反馈


感谢您的反馈!

已提交反馈

无法发送消息

请稍后再试或发送电子邮件