2020年3月11日星期三

ICU 66发布

ICU徽标Unicode®ICU 66已发布。它更新为Unicode 13码,包括新字符、脚本、表情符号和相应的API常数。它还更新到CLDR公司36.1带有Unicode 13更新和错误修复。

这些新的、额外的第1季度发行版是为那些无法以最新版本的Unicode发布其产品。这些是低影响版本,没有其他重要的功能添加或实施变更。下一个功能版本将是CLDR 37和ICU 67,计划于2020年4月。

有关详细信息,请参阅http://site.icu-project.org/download/66.

2020年3月10日,星期二

宣布Unicode®标准13.0版

[图表图像] Unicode标准的13.0版现在可用,包括核心规范、附件和数据文件。这个版本增加了5390个字符,总共143859个字符。这些新增内容包括四个新脚本,总共154个脚本,以及55个新表情符号字符。

版本13.0中的新脚本和字符增加了对非洲、巴基斯坦、南亚和中国现代语言组的支持:
  • 为编写豪萨语、沃洛夫语和非洲其他语言而添加的阿拉伯语脚本,以及为编写巴基斯坦印地语和旁遮普语而添加的其他脚本
  • 南亚Syloti Nagri的角色
  • 粤语拼音
对学术工作的支持在全世界范围内扩展,包括:
  • 耶齐迪(Yezidi),在伊拉克和格鲁吉亚历史上用于礼拜仪式,现代用法有所复兴
  • Chorasmian,历史上在中亚乌兹别克斯坦、哈萨克斯坦和土库曼斯坦使用,书写一种已灭绝的东伊朗语
  • Akuru潜水器,马尔代夫历史上一直使用到20世纪
  • 契丹小字,中国北方历史上使用
流行的符号添加包括:
  • 55个表情符号,包括几个新的表情符号,用于表情符号、中性人、动物和盆栽。有关新表情符号字符的完整列表,请参见Unicode 13.0的表情符号添加、和表情符号计数。有关Unicode标准支持表情符号字符的详细说明,请参阅UTS#51,Unicode表情符号.
  • 六个知识共享许可证符号,用于描述在网络上广泛使用的与知识产权相关的功能、权限和概念
  • 两个越南语阅读标记,表示表意文字具有独特的口语阅读
  • 214个图形字符,可与20世纪70年代中期至80年代中期的各种家用计算机和早期图文电视广播标准兼容
通过在扩展G中添加4939个字符(这是第一个在平面3中编码的块)以及对Unihan数据库的重大更正和改进,13.0版增强了对中文、日语和韩语(CJK)统一表意文字的支持。对Unihan的更改包括更新了许多属性的正则表达式,添加了几个新属性,并删除了三个过时的临时属性。请参见UAX#38,Unicode汉数据库(Unihan)有关更新的更多信息。

重要的图表字体更新,包括:
  • 更新Adlam脚本的代码表,现在使用Ebrima字体。这种字体的设计经过了改进,在用户群体中得到了广泛的接受。
  • CJK字根增补和康熙字根块的完全更新字体。该字体还用于显示CJK统一表意字符代码表以及根-笔划索引中的部首。
扩大了对非主流语言和学术工作的额外支持,包括:
  • 僧伽罗语中用于书写梵语的字符
Unicode属性和规范决定了计算机和手机上文本的行为。变化在13.0版中,包括以下Unicode标准附件和技术标准修改:

为版本13.0更新了五个重要的Unicode附件:
为版本13.0更新了三个重要的Unicode规范:
Unicode标准是世界各地所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和Web(URL、HTML、XML、CSS、JSON等)。Unicode标准、其相关标准和数据构成了CLDR和ICU版本的基础。


超过140000个字符可用于采用帮助Unicode联盟在数字弱势语言方面的工作

[徽章]

2020年3月6日星期五

Unicode Locale Data v37α可用于测试

Unicode CLDR版本37的alpha版本现在可用于测试。测试版v37将包含LDML规范的更新,计划于3月25日发布,而v37的发布计划于4月22日发布。

Unicode CLDR为支持世界语言的软件提供了关键构建块的更新。CLDR数据供所有人使用主要软件系统(包括手机)进行软件国际化和本地化,使软件适应不同语言的约定。

v37是一个更新版本,重点关注单元和注释(表情符号和符号名称以及搜索关键字)。

扩展了测量单位的区域设置首选项.新的单位首选项和转换数据允许格式化功能为区域设置和使用选择正确的测量单位,并将输入测量转换为这些单位。请参阅中的其他详细信息规范变更.

表情符号13.0.添加了新Unicode 13.0表情符号的表情符号注释(名称和搜索关键字)。更新了新Unicode 13.0和表情符号的排序序列。

注释(名称和关键字)扩展到超过表情符号。此版本包含一小组Unicode符号(箭头、数学、标点符号、货币、字母和几何),在未来的版本中还会添加更多。例如,请参见v37/annotations/romance.html.

添加了9个新区域设置。Caddo[cad]、拉丁文字中的印地语[hi_Latn]、梵文中的克什米尔语[ks_Deva]、Maithili[mai]、Manipuri(Meitei Mayek)[mni_Mtei]、尼日利亚Pidgin[pcm]、Santali[sat]、Santari(梵文)[sat_Deva]和Sindhi(梵语)[sd_Deva]。请参见区域设置覆盖数据对于每个语言环境的覆盖率,对于新语言环境和旧语言环境。

添加了语法功能。许多语言都增加了语法功能,这是允许程序员根据语法上下文设置单位格式的第一步(例如,与格版本的“3km”)。

更新代码集。 尤其是更新了欧盟(删除了GB)。

有关顺利迁移实现的更多详细信息和重要注意事项,请参阅发行说明草稿Unicode CLDR版本37。要访问数据,请参阅GitHub标记:发布-37-alpha2.


超过130000个字符可用于采用帮助Unicode联盟在数字弱势语言方面的工作

[徽章]