×

使用Lempel–Ziv算法对低熵字符串进行压缩。 (英语) Zbl 0941.68055号

摘要:我们将Lempel-Ziv算法的压缩比与输入字符串的经验熵进行了比较。这种方法可以在不对输入进行任何假设的情况下分析这些算法的性能,并获得最坏情况的结果。我们表明,在这种情况下,最优压缩算法的标准定义并不令人满意。事实上,尽管根据标准定义,Lempel-Ziv算法是最优的,但仍存在一些未进行最优压缩的低熵字符串族。更准确地说,通过LZ78型(分别为。,LZ77型)可以大大高于零阶熵(H_0)(即一阶熵(H1))。
为此,我们引入了(λ)最优算法的概念。一个算法对于(H_k)是(lambda)最优的,如果广义地说,它的压缩比渐近有界于(lambda\)乘以(k\)阶经验熵(H_k\)。我们证明了这一点LZ78型对于具有\(k\geq0\)的任何\(H_{k}\),不能是\(\lambda\)-最优的。然后,我们描述了一种新的算法LZ78型使用游程编码(RLE),相对于\(H_0)是3-最优的。最后,我们证明LZ77型对于(H_0)是8-最优的,对于任何(k\geq 1),对于(H_k)它都不可能是(lambda)-最优的。

MSC公司:

65年第68季度 算法和问题复杂性分析
68第20页 信息存储和数据检索
PDF格式BibTeX公司 XML格式引用
全文: DOI程序