×

一些非规范无前缀代码的高效紧凑表示。 (英语) Zbl 07477121号

摘要:对于许多类型的无前缀代码,都有高效紧凑的替代方案来替代传统的基于树的表示。然而,由于这些将代码转换为规范形式,因此只有当我们可以选择代码字分配给符号的顺序时,才能使用它们。在本文中,我们首先展示了在给定\(\西格玛\)符号字母表上的概率分布的情况下,我们如何将最优的无字母前缀代码存储在\(\mathcal{O}(\西格玛\lg L)\)位中,这样我们就可以在\(\mathcal{O}(\ min(\ ell,\ lg L))\)时间内对长度为\(\ ell \)的任何码字进行编码和解码,其中\(L \)是最大码字长度。对于任何常数(epsilon>0),我们可以使用\(mathcal{O}(2^{L^\epsilon})\)进一步的位来编码和解码\(mathcal{O{(lg\ell))时间。然后,我们展示了如何将几乎最优的无字母前缀代码存储在\(o(\ sigma)\)位中,以便能够在恒定时间内进行编码和解码。我们还考虑了最近引入的一种最优无前缀代码,其中如果按其相反的字典顺序排列,则码字的长度不会减少。我们将它们的存储空间减少到\(\mathcal{O}(\sigma\lg L)\),同时在\(\mathcal{O}(\ ell)\)中保持编码和解码时间。我们还展示了如何使用\(mathcal{O}(2^{\epsilonL})\)更多位在恒定时间内进行编码和解码。我们的所有结果都适用于单词-RAM模型。

MSC公司:

68第05页 数据结构
68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
94A45型 前缀、长度可变、无逗号代码
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 法里尼亚,a。;Gagie,T。;Manzini,G。;纳瓦罗,G。;Ordóñez,A.,《一些非规范无前缀代码的高效紧凑表示法》,(第23届字符串处理和信息检索国际研讨会(SPIRE)(2016)),50-60·Zbl 1397.68069号
[2] 盖,T。;Thomas,J.,《信息理论要素》(2006),Wiley·Zbl 1140.94001号
[3] Huffman,D.A.,最小冗余码的构造方法,Proc。爱尔兰共和国,40,9,1098-1101(1952)·Zbl 0137.13605号
[4] Moffat,A.,基于文字的文本压缩,Softw。实际。实验,19,2,185-198(1989)
[5] Ziviani,N。;Moura,E。;纳瓦罗,G。;Baeza-Yates,R.,《压缩:下一代文本检索系统的关键》,IEEE计算。,33, 11, 37-44 (2000)
[6] 费拉吉纳,P。;Giancarlo,R。;Manzini,G。;Sciortino,M.,在最佳线性时间内增强文本压缩,J.ACM,52,4688-713(2005)·Zbl 1323.68260号
[7] 新泽西州布里萨博。;Fariña,a。;纳瓦罗,G。;Paramá,J.,轻量级自然语言文本压缩,Inf.Ret。,10, 1-33 (2007)
[8] 施瓦茨,E.S。;Kallick,B.,生成规范前缀编码Commun。ACM,7166-169(1964)·Zbl 0131.34405号
[9] Gagie,T。;纳瓦罗,G。;Nekrich,Y。;Ordóñez,A.,前缀码的高效紧凑表示,IEEE Trans。信息理论,61,9,4999-5011(2015)·Zbl 1359.94090号
[10] 北布里萨博阿。;纳瓦罗,G。;Ordóñez,A.,《自然语言的较小自我索引》(Proc.19th International Symposium on String Processing and Information Retrieval,2012),372-378
[11] Martínez-Prieto,医学硕士。;新墨西哥州布里萨博。;Cánovas,R。;Claude,F。;Navarro,G.,实用压缩字符串词典,Inf.Sci。,5673-108(2016)
[12] Navarro,G.,《所有人的小波树》,J.Discret。算法,25,2-20(2014)·Zbl 1284.68217号
[13] 胡总。;塔克,A.C.,《最佳计算机搜索树和可变长度字母代码》,SIAM J.Appl。数学。,21, 4, 514-532 (1971) ·Zbl 0228.94002
[14] 蒙罗,J.I。;Raman,V.,平衡括号和静态树的简洁表示,SIAM J.Compute。,31, 3, 762-776 (2001) ·Zbl 1017.68037号
[15] Claude,F。;纳瓦罗,G。;Ordóñez,A.,小波矩阵:一种适用于大字母的有效小波树,Inf.Sci。,47, 15-32 (2015)
[16] 佩特拉什cu,M。;Thorup,M.,《前人搜索的时空权衡》,(第38届ACM计算理论年会(STOC)(2006)),232-240·Zbl 1301.68150号
[17] Clark,D.R.,《紧凑PAT树》(1996年),滑铁卢大学:加拿大滑铁卢分校,博士论文
[18] Munro,J.I.,Tables,(第16届软件技术和理论计算机科学基础会议(FSTTCS)(1996)),37-42
[19] Pátrašcu,M.,Succinctor,(第49届IEEE计算机科学基础年会(FOCS)(2008)),305-313
[20] 格罗西,R。;古普塔,A。;Vitter,J.S.,高阶熵压缩文本索引,(第14届ACM-SIAM离散算法年会(SODA)论文集(2003)),841-850·Zbl 1092.68584号
[21] Belazzougui,D。;Navarro,G.,表示序列的最佳上界和下界,ACM Trans。算法,11,4,第31条pp.(2015)·Zbl 1398.68103号
[22] Navarro,G.,《紧凑数据结构-实用方法》(2016),剑桥大学出版社
[23] Kraft,L.G.,《振幅调制脉冲的量化、分组和编码装置》(1949年),麻省理工学院电子工程系,理学硕士论文
[24] 莫法特,A。;Turpin,A.,关于最小冗余前缀码的实现,IEEE Trans。社区。,45, 10, 1200-1207 (1997)
[25] 古普塔,A。;尊敬的W.-K。;Shan,R。;Vitter,J.S.,《压缩数据结构:词典和数据软件度量》,Theor。计算。科学。,387, 3, 313-331 (2007) ·Zbl 1144.68017号
[26] Evans,W。;Kirkpatrick,D.G.,重组有序二叉树,J.算法,50,168-193(2004)·兹比尔1067.68101
[27] Wessner,R.L.,最大高度受限的最优字母搜索树,Inf.Process。莱特。,4, 90-94 (1976) ·Zbl 0319.68021号
[28] Itai,A.,最优字母树,SIAM J.Compute。,5, 9-18 (1976) ·Zbl 0328.68040号
[29] 纳瓦罗,G。;Providel,E.,《位图上的快速、小型、简单排序/选择》(第11届实验算法国际研讨会(SEA)论文集(2012年)),295-306
[30] Gagie,T.,《动态香农编码》,(第十二届欧洲算法年会(ESA)(2004)),359-370·Zbl 1111.94327号
[31] Gagie,T。;卡宾斯基,M。;Nekrich,Y.,低记忆自适应前缀编码(Proc.19th Data Compression Conference(DCC)(2009)),13-22
[32] 加吉,T。;Nekrich,Y.,《最坏情况下的最优自适应前缀编码》(Proc.16th International Symposium on Algorithms and Data Structures(WADS),2009),第315-326页·Zbl 1253.94038号
[33] Gagie,T。;Nekrich,Y.,在线稳定排序的严格界限,J.Discret。算法,9,2,176-181(2011)·Zbl 1221.68077号
[34] 戈林,M.J。;伊阿科诺,J。;Langerman,S。;蒙罗,J.I。;Nekrich,Y.,《具有几乎最优访问成本的动态树》(Proc.第26届欧洲算法年会(ESA)(2018)),第38条,pp·Zbl 1524.68109号
[35] 戈林,M.J。;Li,J.,《不等字母成本无前缀编码的更有效算法和分析》,IEEE Trans。Inf.理论,54,8,3412-3424(2008)·Zbl 1329.94046号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。