×

关于字符串吸引子的组合视图。 (英语) Zbl 1467.68051号

摘要:概念字符串吸引子最近引入[N.普雷扎,“字符串吸引器”,预打印,arXiv:1709.05314] 并在[D.坎帕N.普雷扎,摘自:第50届ACM SIGACT计算理论研讨会论文集,STOC’18。纽约州纽约市:计算机协会(ACM)。827–840 (2018;兹伯利1418.68085)] 以提供用于已知的基于字典的压缩器的统一框架。单词\(w=w_1 w_2\cdots w_n\)的字符串吸引子是位置\({1,\ldots,n\}\)的子集\(\Gamma\),这样,\(w\)的所有不同因子都有一个穿过\(\Gamma\)的至少一个元素的出现。
本文通过研究字符串吸引子的组合性质来探讨其概念。特别地,我们展示了当应用组合运算时,单词的最小字符串吸引器的大小是如何变化的,并且我们推断出这样的度量不是单调的。此外,我们引入了字符串吸引子概念的循环变体,以提供标准Sturmian词的共轭类的特征。

MSC公司:

68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
68兰特 单词组合学

软件:

大BWT;r指数
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 巴图罗,P。;Rytter,W.,标准Sturmian单词中的压缩字符串匹配,Theor。计算。科学。,410, 30, 2804-2810 (2009) ·Zbl 1173.68045号
[2] 伯斯特尔,J。;德卢卡,A.,斯图尔语,林登语和树,西奥。计算。科学。,178, 1, 171-203 (1997) ·Zbl 0901.68155号
[3] Bonomo,S。;Mantaci,S。;雷斯蒂沃,A。;Rosone,G。;Sciortino,M.,后缀、变位和林登词,(DLT.DLT,Lect.Notes Compute.Sc.,第7907卷(2013),施普林格出版社),131-142·Zbl 1381.68230号
[4] Bonomo,S。;Mantaci,S。;雷斯蒂沃,A。;Rosone,G。;Sciortino,M.,《在多集合中对单词的变位和后缀进行排序》,国际期刊《发现》。计算。科学。,25, 8, 1161-1175 (2014) ·Zbl 1310.68172号
[5] Borel,J.P。;Reutenauer,C.,关于Christoffel类,RAIRO Theor。通知。申请。,40, 1, 15-27 (2006) ·Zbl 1085.68116号
[6] Boucher,C。;加吉,T。;Kuhnle,A。;Langmead,B。;Manzini,G。;Mun,T.,构建大型BWT的无前缀解析,算法分子生物学。,第14、1条第13页(2019年)
[7] Brlek,S.,《图伊-莫尔斯词中因素的列举》,离散应用。数学。,24, 1-3, 83-96 (1989) ·Zbl 0683.20045号
[8] Burrows,M。;Wheeler,D.J.,块排序数据压缩算法(1994),数字系统研究中心,技术代表。
[9] Castiglione,G。;雷斯蒂沃,A。;Sciortino,M.,Circular Sturmian words and Hopcroft’s algorithm,Theor。计算。科学。,410, 43, 4372-4381 (2009) ·Zbl 1187.68360号
[10] Castiglione,G。;雷斯蒂沃,A。;Sciortino,M.,关于Hopcroft算法的极值情况,Theor。计算。科学。,411, 38-39, 3414-3422 (2010) ·Zbl 1214.68193号
[11] Castiglione,G。;雷斯蒂沃,A。;Sciortino,M.,霍普克罗夫特算法和循环自动机,(LATA.LATA,Lect.Notes Compute.Sc.,第5196卷(2008),施普林格),172-183·Zbl 1163.68021号
[12] Gagie,T。;纳瓦罗,G。;Prezza,N.,bwt-runs有界空间中的最优时间文本索引,(SODA(2018),SIAM),1459-1477·Zbl 1403.68051号
[13] Gagie,T。;纳瓦罗,G。;Prezza,N.,《BWT-runs有界空间中的全功能后缀树和最优文本搜索》,J.ACM,67,1(2020)·Zbl 1491.68067号
[14] Giancarlo,R。;雷斯蒂沃,A。;Sciortino,M.,《通过组合优化从第一原理到Burrows和Wheeler变换及其以外》,Theor。计算。科学。,387, 3, 236-248 (2007) ·Zbl 1144.68019号
[15] 游击队,V。;Louza,F。;Rosone,G.,通过扩展的Burrows-Wheeler变换进行元基因组分析,BMC生物信息。,21 (2020)
[16] Kempa,D。;Prezza,N.,《字典压缩的根源:字符串吸引子》,(STOC 2018(2018),ACM),827-840·Zbl 1418.68085号
[17] Kempa,D。;Kociumaka,T.,《Burrows-Wheeler变换猜想的解析》,(第61届计算机科学基础年会(FOCS 2020)(2020))(2019年),CoRR出版社
[18] Kempa,D。;Policriti,A。;北卡罗来纳州普雷扎。;Rotenberg,E.,《字符串吸引子:验证与优化》,(ESA.ESA,莱布尼茨国际信息学论文集(LIPIcs),第112卷(2018年),《Schloss Dagstuhl-Leibniz-Zentrum fuer Informatik:Schloss Dgstuhl-Leibniz-Zentrum fuer-Informatik》,德国),52:1-52:13·Zbl 1524.68126号
[19] Knuth,D。;莫里斯,J。;Pratt,V.,字符串中的快速模式匹配,SIAM J.Compute。,6, 2, 323-350 (1977) ·Zbl 0372.68005号
[20] 科丘马卡,T。;纳瓦罗,G。;Prezza,N.,《走向确定的重复性测量》(第14届拉丁美洲理论信息学研讨会(拉丁语2020年)(2020年))(2019年),CoRR出版社·Zbl 1525.68043号
[21] Kutsukake,K。;松本,T。;Y.中岛。;Inenaga,S。;班奈,H。;武田,M.,《关于Thue-Morse单词的重复性度量》,(SPIRE.SPIRE,Lect.Notes Compute.Sc.,第12303卷(2020年),施普林格),213-220·Zbl 1524.68250号
[22] Lempel,A。;Ziv,J.,《有限序列的复杂性》,IEEE Trans。Inf.理论,22,1,75-81(1976)·Zbl 0337.94013号
[23] Lothaire,M.,《单词代数组合学》(2002),剑桥大学出版社·Zbl 1001.68093号
[24] F.A.Louza。;特尔斯,G.P。;高格,S。;Zhao,L.,《字符串集合的计算Burrows-Wheeler相似性分布》(SPIRE 2018)。2018年巴黎奥运会,Lect。注释计算。Sc.,第11147卷(2018),施普林格),285-296·Zbl 1517.68438号
[25] 德卢卡,A。;Mignosis,F.,斯图尔语单词的一些组合性质,Theor。计算。科学。,136, 2, 361-385 (1994) ·Zbl 0874.68245号
[26] de Luca,A.,《斯图尔密语词:结构、组合及其算术》,Theor。计算。科学。,183, 1, 45-82 (1997) ·Zbl 0911.68098号
[27] Mantaci,S。;雷斯蒂沃,A。;罗马纳,G。;Rosone,G。;Sciortino,M.,单词上的字符串吸引子和组合,(ICTCS.ICTCS,CEUR研讨会论文集,第2504卷(2019年),CEUR-WS.org),57-71
[28] Mantaci,S。;雷斯蒂沃,A。;Rosone,G。;Sciortino,M.,后缀数组和文本的Lyndon因子分解,J.Discret。算法,28,2-8(2014)·Zbl 1306.68127号
[29] Mantaci,S。;雷斯蒂沃,A。;Rosone,G。;西奥蒂诺,M。;Versari,L.,通过RLE测量BWT的聚集效应,Theor。计算。科学。,698, 79-87 (2017) ·Zbl 1380.68174号
[30] Mantaci,S。;雷斯蒂沃,A。;Sciortino,M.,Burrows-Wheeler变换和Sturmian单词,Inf.过程。莱特。,86, 241-246 (2003) ·Zbl 1162.68511号
[31] Policriti,A。;Prezza,N.,LZ77基于运行长度编码BWT的计算,Algorithmica,80,7,1986-2011(2018)·Zbl 1392.68186号
[32] Prezza,N.,字符串吸引子(2017),CoRR
[33] 北普里扎。;北卡罗来纳州皮桑蒂。;西奥蒂诺,M。;Rosone,G.,通过eBWT位置聚类检测SNP,算法分子生物学。,14,1,第3条第(2019)页
[34] 北卡罗来纳州普雷扎。;北卡罗来纳州皮桑蒂。;西奥蒂诺,M。;Rosone,G.,通过Burrows-Wheeler变换发现无参考变量,BMC Bioninform。,21 (2020)
[35] 雷斯蒂沃,A。;Rosone,G.,《Burrows-Wheeler变换中单词的平衡和聚类》,Theor。计算。科学。,412, 27, 3019-3032 (2011) ·Zbl 1220.68081号
[36] 西奥蒂诺,M。;Zamboni,L.Q.,后缀自动机和标准Sturmian词,(DLT.DLT,Lect.Notes Compute.Sc.,第4588卷(2007年),Springer),382-398·Zbl 1202.68300号
[37] Ziv,J。;Lempel,A.,序列数据压缩的通用算法,IEEE Trans。《信息论》,23,3,337-343(1977)·Zbl 0379.94010号
[38] Ziv,J。;Lempel,A.,通过可变长度编码压缩单个序列,IEEE Trans。Inf.理论,24,530-536(1978)·Zbl 0392.94004号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。