吉安卡洛,R。;A.雷斯蒂沃。;西奥蒂诺,M。 通过组合优化,从第一原理到Burrows和Wheeler变换及其他。 (英语) Zbl 1144.68019号 西奥。计算。科学。 387,第3期,236-248(2007). 摘要:我们引入了一个组合优化框架,该框架考虑了单词之间相关性的各种度量,自然地诱导了一类关于适当定义的成本函数的最优单词排列。Burrows和Wheeler变换(BWT)[M.伯罗斯和D.惠勒,一种块排序无损数据压缩算法。技术报告124,数字设备公司(1994)],及其标记树的模拟[P.Ferragina、F.Luccio、G.Manzini和S.穆图克里希南,“构建标记树以获得最佳简洁性,以及更高的简洁性”,in:Proc。第45届IEEE计算机科学基础年会(198-207(2005))是本课程的特例。我们还表明,这里定义的最佳单词排列类与Ferragina等人确定的压缩增强类相同[P.Ferragina、R.Giancarlo、G.Manzini和M.西奥蒂诺,“在最佳线性时间内增强文本压缩”,J.ACM 52,688–713(2005)]。因此,它们都是高度可压缩的。我们还通过使用单词组合学的技术,提供了一种快速计算BWT的方法,无需使用任何字符串结束符号。我们还研究了更一般的最佳单词排列类别,其中符号的相关性可以通过比上下文长度更复杂的函数来衡量。对于这个一般问题,我们提供了一个MAX-SNP困难的实例,因此不太可能有效地求解或近似。这里给出的结果表明,Burrows和Wheeler变换的一个关键特征似乎除了可压缩性之外,还存在有效的计算和反演算法。 引用于10文件 MSC公司: 68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面) 68兰特 单词组合学 90C27型 组合优化 关键词:Burrows-Wheeler变换;最佳词排列;后缀树;林登语 PDF格式BibTeX公司 XML格式引用 \textit{R.Giancarlo}等人,Theor。计算。科学。387,第3号,236--248(2007;Zbl 1144.68019) 全文: 内政部 参考文献: [1] 阿罗拉,A。;Lund,C。;Motwani,R。;苏丹,M。;Szegedy,M.,近似问题的证明验证和硬度,ACM杂志,45,501-555(1998)·Zbl 1065.68570号 [2] Bentley,J。;回转器,D。;Tarjan,R。;Wei,V.,局部自适应压缩方案,ACM通信,29,4,320-330(1986)·Zbl 0648.94007号 [3] Blum,A。;李,M。;Tromp,J。;Yannakakis,M.,最短超弦的线性近似,ACM杂志,41630-647(1994)·Zbl 0812.68075号 [4] M.Burrows,D.Wheeler,块排序无损数据压缩算法,技术报告124,数字设备公司,1994年;M.Burrows,D.Wheeler,块排序无损数据压缩算法,技术报告124,数字设备公司,1994年 [5] B.Chapin,S.R.Tate,通过修改排序从Burrows-Wheeler变换得到的更高压缩,见:数据压缩会议,1998年,第532页;B.Chapin,S.R.Tate,通过修改排序从Burrows-Wheeler变换获得更高压缩,载于:数据压缩会议,1998年,第532页 [6] Choffrut,C.,《关于自由幺半群上度量的一些组合性质》,(Cummings,L.J.,《单词组合数学》,《进展与展望》(1983),学术出版社),247-255·Zbl 0566.20052号 [7] 费拉吉纳,P。;Giancarlo,R。;Manzini,G。;Sciortino,M.,在最佳线性时间内增强文本压缩,美国计算机学会杂志,52688-713(2005)·Zbl 1323.68260号 [8] P.Ferragina,F.Luccio,G.Manzini,S.Muthukrishnan,《构建标记树以实现最佳简洁性》,摘自:Proc。第45届IEEE计算机科学基础年会,2005年,第198-207页;P.Ferragina,F.Luccio,G.Manzini,S.Muthukrishnan,《构建标记树以实现最佳简洁性》,摘自:Proc。第45届IEEE计算机科学基础年会,2005年,第198-207页 [9] Gusfield,D.,《字符串、树和序列的算法:计算机科学和计算生物学》(1997),剑桥大学出版社·Zbl 0934.68103号 [10] Lothaire,M.(单词组合数学。单词组合数学,数学百科全书,第17卷(1983年),Addison-Wesley:Addison-Whesley Reading,马萨诸塞州),转载于剑桥数学图书馆,剑桥大学出版社,1997年·Zbl 0514.2004年5月 [11] Lothaire,M.(单词应用组合数学。单词应用组合学,数学及其应用百科全书,第105卷(2005),剑桥大学出版社)·Zbl 1133.68067号 [12] Mantaci,S。;Restivo,A。;Sciortino,M.,Burrows-Wheeler变换和Sturmian词,信息处理快报,86241-246(2003)·Zbl 1162.68511号 [13] Manzini,G.,《Burrows-Wheeler变换的分析》,美国医学会杂志,48,3,407-430(2001)·Zbl 1323.68262号 [14] 偏头痛,F。;Restivo,A.,《周期性》(Lothaire,M.,《单词代数组合学》(2002),剑桥大学出版社),237-274·Zbl 1001.68093号 [15] 纳瓦罗,G。;Mäkinen,V.,压缩全文索引,ACM计算调查,39,1(2007)·Zbl 1321.68263号 [16] Papadimitriou,C.H。;Yannakakis,M.,《优化、近似和复杂性类》,《计算机与系统科学杂志》,43,3,425-440(1991)·Zbl 0765.68036号 [17] Puglishi,S.J。;史密斯,W.F。;Turpin,A.,后缀数组构造算法分类,ACM计算调查,39,2(2007) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。