×

通过组合优化,从第一原理到Burrows和Wheeler变换及其他。 (英语) Zbl 1144.68019号

摘要:我们引入了一个组合优化框架,该框架考虑了单词之间相关性的各种度量,自然地诱导了一类关于适当定义的成本函数的最优单词排列。Burrows和Wheeler变换(BWT)[M.伯罗斯D.惠勒,一种块排序无损数据压缩算法。技术报告124,数字设备公司(1994)],及其标记树的模拟[P.Ferragina、F.Luccio、G.ManziniS.穆图克里希南,“构建标记树以获得最佳简洁性,以及更高的简洁性”,in:Proc。第45届IEEE计算机科学基础年会(198-207(2005))是本课程的特例。
我们还表明,这里定义的最佳单词排列类与Ferragina等人确定的压缩增强类相同[P.Ferragina、R.Giancarlo、G.ManziniM.西奥蒂诺,“在最佳线性时间内增强文本压缩”,J.ACM 52,688–713(2005)]。因此,它们都是高度可压缩的。我们还通过使用单词组合学的技术,提供了一种快速计算BWT的方法,无需使用任何字符串结束符号。我们还研究了更一般的最佳单词排列类别,其中符号的相关性可以通过比上下文长度更复杂的函数来衡量。对于这个一般问题,我们提供了一个MAX-SNP困难的实例,因此不太可能有效地求解或近似。这里给出的结果表明,Burrows和Wheeler变换的一个关键特征似乎除了可压缩性之外,还存在有效的计算和反演算法。

MSC公司:

68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
68兰特 单词组合学
90C27型 组合优化
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿罗拉,A。;Lund,C。;Motwani,R。;苏丹,M。;Szegedy,M.,近似问题的证明验证和硬度,ACM杂志,45,501-555(1998)·Zbl 1065.68570号
[2] Bentley,J。;回转器,D。;Tarjan,R。;Wei,V.,局部自适应压缩方案,ACM通信,29,4,320-330(1986)·Zbl 0648.94007号
[3] Blum,A。;李,M。;Tromp,J。;Yannakakis,M.,最短超弦的线性近似,ACM杂志,41630-647(1994)·Zbl 0812.68075号
[4] M.Burrows,D.Wheeler,块排序无损数据压缩算法,技术报告124,数字设备公司,1994年;M.Burrows,D.Wheeler,块排序无损数据压缩算法,技术报告124,数字设备公司,1994年
[5] B.Chapin,S.R.Tate,通过修改排序从Burrows-Wheeler变换得到的更高压缩,见:数据压缩会议,1998年,第532页;B.Chapin,S.R.Tate,通过修改排序从Burrows-Wheeler变换获得更高压缩,载于:数据压缩会议,1998年,第532页
[6] Choffrut,C.,《关于自由幺半群上度量的一些组合性质》,(Cummings,L.J.,《单词组合数学》,《进展与展望》(1983),学术出版社),247-255·Zbl 0566.20052号
[7] 费拉吉纳,P。;Giancarlo,R。;Manzini,G。;Sciortino,M.,在最佳线性时间内增强文本压缩,美国计算机学会杂志,52688-713(2005)·Zbl 1323.68260号
[8] P.Ferragina,F.Luccio,G.Manzini,S.Muthukrishnan,《构建标记树以实现最佳简洁性》,摘自:Proc。第45届IEEE计算机科学基础年会,2005年,第198-207页;P.Ferragina,F.Luccio,G.Manzini,S.Muthukrishnan,《构建标记树以实现最佳简洁性》,摘自:Proc。第45届IEEE计算机科学基础年会,2005年,第198-207页
[9] Gusfield,D.,《字符串、树和序列的算法:计算机科学和计算生物学》(1997),剑桥大学出版社·Zbl 0934.68103号
[10] Lothaire,M.(单词组合数学。单词组合数学,数学百科全书,第17卷(1983年),Addison-Wesley:Addison-Whesley Reading,马萨诸塞州),转载于剑桥数学图书馆,剑桥大学出版社,1997年·Zbl 0514.2004年5月
[11] Lothaire,M.(单词应用组合数学。单词应用组合学,数学及其应用百科全书,第105卷(2005),剑桥大学出版社)·Zbl 1133.68067号
[12] Mantaci,S。;Restivo,A。;Sciortino,M.,Burrows-Wheeler变换和Sturmian词,信息处理快报,86241-246(2003)·Zbl 1162.68511号
[13] Manzini,G.,《Burrows-Wheeler变换的分析》,美国医学会杂志,48,3,407-430(2001)·Zbl 1323.68262号
[14] 偏头痛,F。;Restivo,A.,《周期性》(Lothaire,M.,《单词代数组合学》(2002),剑桥大学出版社),237-274·Zbl 1001.68093号
[15] 纳瓦罗,G。;Mäkinen,V.,压缩全文索引,ACM计算调查,39,1(2007)·Zbl 1321.68263号
[16] Papadimitriou,C.H。;Yannakakis,M.,《优化、近似和复杂性类》,《计算机与系统科学杂志》,43,3,425-440(1991)·Zbl 0765.68036号
[17] Puglishi,S.J。;史密斯,W.F。;Turpin,A.,后缀数组构造算法分类,ACM计算调查,39,2(2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。