×

将字符串分解为重复。 (英语) 兹伯利07523543

摘要:字符串\(w\)的因式分解\(f_1,\dots,f_m\)称为重复因子分解如果每一个因子(fi)都是一个重复,即,对于某些非空字符串(x),一个整数(k\geq2)和(x^{prime})是一个适当的前缀。Dumitran等人(Proc.SPIRE 2015)提出了一种算法,该算法计算给定字符串在\(O(n)\)时间内的任意重复因式分解,其中\(n)是\(w)的长度。算法输出中包含的因子数量(即重复次数)未知或无法保证。在本文中,我们提出了两种计算(O(n \log n))时间内最小/最大重复因子分解的算法,它们分别由最小/最大数量的因子组成。第一个算法是一个简单的(O(n\log n))空间算法,它基于将问题简化为大小为(O(n \log n)的DAG上的最短/最长路径问题。第二种算法基于第一种算法的思想,模拟了(O(n)空间中最短/最长路径问题的动态规划算法。此外,我们还讨论了Fibonacci字符串最小/最大重复因式分解的组合结构。

MSC公司:

68瓦xx 计算机科学中的算法
68卢比 离散数学与计算机科学
68页 数据理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Badkobeh,G。;班奈,H。;Goto,K。;一、 T。;伊利奥普洛斯,CS;Inenaga,S。;普格利西,SJ;Sugimoto,S.,闭因子分解,离散。申请。数学。,212,23-29(2016)·Zbl 1350.68299号 ·doi:10.1016/j.dam.2016.04.009
[2] 班奈,H。;一、 T。;Inenaga,S。;Y.中岛。;武田,M。;Tsuruta,K.,“运行”定理,SIAM J.计算。,46, 5, 1501-1514 (2017) ·Zbl 1375.68093号 ·数字对象标识代码:10.1137/15M1011032
[3] 班奈,H。;加吉,T。;Inenaga,S。;Kärkkäinen,J。;Kempa,D。;Piatkowski,M。;Sugimoto,S.,《多元回文因子分解是NP-完全的》,国际期刊发现。计算。科学。,29, 2, 143-164 (2018) ·Zbl 1387.68119号 ·doi:10.1142/S012905411800014
[4] Borozdin,K.,Kosolobov,D.,Rubinchik,M.,Shur,A.M.:线性时间中的回文长度。收录于:CPM 2017,第23:1-23:12页(2017)·Zbl 1434.68724号
[5] 陈,KT;右侧狐狸;林登,RC,《自由微分学》。iv.下中心级数的商群,Ann.Math。,68, 1, 81-95 (1958) ·Zbl 0142.22304号 ·doi:10.2307/1970044
[6] 克罗西莫尔,M。;Ilie,L.,《计算线性时间中的最长前因子和应用》,Inf.Process。莱特。,106, 2, 75-80 (2008) ·Zbl 1186.68591号 ·doi:10.1016/j.ipl.2007.10.006
[7] 克罗西莫尔,M。;Rytter,W.,Sqares,立方体和时空高效字符串搜索,算法,13,5405-425(1995)·Zbl 0849.68044号 ·doi:10.1007/BF01190846
[8] Crochemore,M.,Ilie,L.,Smyth,W.F.:计算Lempel-Ziv因式分解的简单算法。摘自:《2008年DCC会议记录》,第482-488页(2008年)
[9] 卡明斯,LJ;摩尔,D。;Karhumäki,J.,斐波那契弦的边界,J.Comb。数学。梳子。计算。,20, 81-88 (1996) ·Zbl 0847.68085号
[10] Dumitran,M.,Manea,F.,Nowotka,D.:关于前缀/后缀平方自由词。摘自:《SPIRE学报》,第54-66页(2015年)·Zbl 1380.68469号
[11] Duval,J.,在有序字母表上分解单词,J.算法,4,4,363-381(1983)·Zbl 0532.68061号 ·doi:10.1016/0196-6774(83)90017-2
[12] Ellert,J.,Fischer,J.:线性时间在一般有序字母表上运行。收录于:Bansal,N.、Merelli,E.、Worrell,J.(编辑)第48届国际自动化、语言和编程学术讨论会,ICALP 20212021年7月12日至16日,苏格兰格拉斯哥(虚拟会议),LIPIcs,第198卷,第63:1-63:16页。达格斯图尔宫(Schloss Dagstuhl)-莱布尼兹·泽特鲁姆(Leibniz-Zentrum für Informatik)(2021年)
[13] 菲奇,G。;加吉,T。;Kärkkäinen,J。;Kempa,D.,最小回文因子分解的次二次算法,《离散算法》,28,41-48(2014)·Zbl 1305.68382号 ·doi:10.1016/j.jda.2014.08.001
[14] 新泽西州Fine;Wilf,HS,周期函数的唯一性定理,Proc。美国数学。Soc.,16,1,109-114(1965)·兹伯利0131.30203 ·doi:10.1090/S002-9939-1965-174934-9
[15] 弗伦克尔,AS;Simpson,J.,斐波那契单词中的确切平方数,Theor。计算。科学。,218, 1, 95-106 (1999) ·Zbl 0916.68122号 ·doi:10.1016/S0304-3975(98)00252-7
[16] Inoue,H.,Matsuoka,Y.,Nakashima,Y.、Inenaga,S.、Bannai,H.、Takeda,M.:计算O(n log n)时间内的最小和最大重复因式分解。摘自:Holub,J.,Zdárek,J.(编辑)《2016年布拉格弦学会议论文集》,捷克共和国布拉格,2016年8月29日至31日,第135-145页(2016)
[17] Kolpakov,R.M.,Kucherov,G.:寻找线性时间内单词的最大重复次数。载于:1999年FOCS会议记录,第596-604页(1999年)
[18] 科尔巴科夫,R。;波多尔斯基,M。;波西普金,M。;Khrapov,N.,搜索单词中的间隙重复和子重复,J.离散算法,46-47,1-15(2017)·Zbl 1380.68324号 ·doi:10.1016/j.jda.2017.1004
[19] Kufleitner,M.:关于Burrows-Wheeler变换的双射变体。摘自:PSC 2009年会议记录,第65-79页(2009年)
[20] Lothare,M.:《词汇组合学》。Addison-Wesley,雷丁(1983)·Zbl 0514.2004年5月
[21] Matsuoka,Y.,Inenaga,S.,Bannai,H.,Takeda,M.,Manea,F.:将字符串分解为线性时间的平方。摘自:《2016年CPM会议录》,第27:1-27:12页(2016)·Zbl 1380.68480号
[22] Y.中岛。;Takagi,T。;Inenaga,S。;班奈,H。;Takeda,M.,《为大型字母构建LZ78尝试并在线性时间内定位堆》,Inf.Process。莱特。,115, 9, 655-659 (2015) ·Zbl 1329.68087号 ·doi:10.1016/j.ipl.2015.04.002
[23] 斯托尔,J。;Szymanski,T.,《通过文本替换进行数据压缩》,J.ACM,29,4,928-951(1982)·Zbl 0489.68041号 ·数字对象标识代码:10.1145/322344.322346
[24] Tanimura,Y.、Fujishige,Y.,I,T.、Inenaga,S.、Bannai,H.、Takeda,M.:计算字符串中最大α间隙重复的更快算法。摘自:《2015年SPIRE学报》,第124-136页(2015)·Zbl 1433.68636号
[25] I、 T.,Sugimoto,S.,Inenaga,S.,Bannai,H.,Takeda,M.:在线计算回文因子分解和回文覆盖。摘自:《CPM 2014会议录》,第150-161页(2014)·Zbl 1407.68575号
[26] TA韦尔奇,《高性能数据压缩技术》,IEEE计算。,17, 8-19 (1984) ·doi:10.1109/MC.1984.1659158
[27] Ziv,J。;Lempel,A.,序列数据压缩的通用算法,IEEE Trans。信息理论,IT-23,337-349(1977)·Zbl 0379.94010号 ·doi:10.10109/TIT.1977.1055714
[28] Ziv,J。;Lempel,A.,通过可变长度编码压缩单个序列,IEEE Trans。Inf.理论,24,5,530-536(1978)·Zbl 0392.94004号 ·doi:10.1109/TIT.1978.1055934
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。