加州大学洛杉矶分校

字节字符串,但将任何UnicodeString(16位单位的任意序列)映射到32位整数值。这可以使用更简单的代码,因为每个单元中有更多的位可供使用,而且对于排序收缩/前缀、CJK字典,它可能比BytesTree更合适,速度更快,并且在不知道我们使用小脚本或主要使用ASCII的情况下,也可能通常用于Unicode字符串。

代码和数据结构与BytesTree非常相似。通常,使用更大的单位以单个单位存储比BytesTree中可能的更大的值和增量,并且在所有情况下都需要更少的可变长度单位。

此外,匹配节点的一些位(线性匹配和分支节点)用于中间值(小值或最高有效位),而不是BytesTrie中的独立中间值节点。较大的中间值在匹配节点头之后有一个或两个单位,然后是匹配节点的内容。