[统一码]  Unicode统计 技术网站|站点地图|搜索
 

Unicode®统计

本页提供了有关Unicode标准和相关规范的各种统计信息。

上次更新时间:2023年10月2日

字符计数

关于Unicode标准最基本的问题之一是“编码了多少个字符?”这个问题的答案令人惊讶地复杂,因为有很多不同体系结构和维护中涉及的字符类型(和代码点)这个普遍的字符编码。

多年来,已经制定了如何跟踪编码数量的约定Unicode标准中各种类型的字符。计数传统上是发布于附录D,标准版本历史在每个新版本中。为了使此信息更容易访问,已对其进行了重组,以便在此处进行演示。有关的解释与这些表中提到的代码点类型相关的术语,请参见第2.4节,代码点和字符在核心规范中。有关某些奇怪类型的信息Unicode字符数,另请参阅这个专用字符和非字符常见问题解答

为了帮助可视化Unicode标准随时间的增长,以下简单图表按年份显示一些重要的原始字符计数。

表情符号计数

在Unicode标准中计算表情符号是一项特殊的挑战,因为表情符号的定义包括许多不同类型的字符序列,它们是作为单个表情符号呈现给最终用户。一个明显的例子是两个区域指示器字符,然后将其解释并显示为单个字符,独特的“旗帜表情符号”。已编译了枚举所有不同类型表情符号的表适用于UTS#51 3.0版的不同版本,Unicode表情符号注意Emoji版本3.0是最早的带有有意义表情符号计数的版本。表情符号版本号版本11.0之前的版本没有与Unicode标准的版本紧密同步。

有关哪些表情符号字符是早期Unicode标准的一部分的信息与Unicode 9.0相比,请参见:表情符号版本

脚本数量

随着Unicode标准在过去一年中的扩展,该标准支持的脚本数量也急剧增加。逐个版本添加的内容记录在这个支持的脚本第页。为了方便起见,该表还跟踪了标准中运行的脚本总数。

 


获得版权和使用条款