战斗 swMATH ID: 19583 软件作者: 吴银军;陈、珍;文宇豪;郑文勋;曹俊伟 描述: COMBAT:一种新的大数据位图索引编码算法。位图索引由于其按位操作的速度快,在各种应用中得到了广泛的应用。然而,它会消耗大量内存。为了解决这个问题,人们提出了各种位图编码算法。本文提出了一种新的位图索引编码算法——二进制和三元混合编码(COMBAT)。从单词对齐混合(WAH)派生出的典型算法是压缩自适应索引(COMPAX)和压缩“n”可组合整数集(CONCISE),它们可以在WAH编码后组合两个或三个连续单词。COMBAT结合了这两种机制,生成了更紧凑的位图索引。此外,COMBAT的查询时间比COMPAX和CONCISE更快,因为位图索引更小,并且将其加载到内存中所需的时间更少。为了证明COMBAT的优点,我们扩展了我们小组提出的理论分析模型,该模型由对各种可能的位图索引的分析组成。文中还提供了基于实际数据的一些实验结果,表明了COMBAT的存储和速度优势。我们的结果证明了COMBAT和码字统计的优点,从而巩固了证明。 主页: 网址:http://www.mit.edu/~caoj/pub/doc/jcao_j_combat.pdf 关键词: 位图索引;大数据;索引编码;绩效评估 相关软件: 引用于: 1文件 5位作者引用 1 曹俊伟 1 陈,珍 1 文宇豪 1 吴银军 1 郑文勋 连载1篇 1 清华大学学报英文版 在1个字段中引用 1 计算机科学(68至XX) 按年份列出的引文