显示带有标签的帖子重症监护病房4X 1.3.显示所有帖子
显示带有标签的帖子重症监护病房4X 1.3.显示所有帖子

2023年10月6日,星期五

ICU4X 1.3:现在有内置数据、案例映射、附加日历系统等

作者:ICU4X技术委员会Robert Bastian

ICU徽标在全球范围内,人们上网的次数越来越少各种设备,包括智能手机、智能手表和小工具。的一个分支国际Unicode组件(ICU)委员会,ICU4X委员会是负责使这些下一代设备能够与其通信数千种语言的用户。用Rust书写,ICU4X带来轻盈,面向低资源设备和许多编程语言。

自2023年4月发布上一个版本以来,ICU4X团队一直很忙构建附加功能并提高库的可用性。今天我们很高兴宣布1.3版本,包括内置数据,一个新的datagenAPI是案例映射组件的第一个稳定版本,支持更多日历系统、基于规则的音译技术预览等等。

我们听到反馈,ICU4X的数据管道,同时允许强大的定制功能,具有显著的学习曲线。在ICU4X 1.3中,我们因此,引入了一个称为“编译数据”的新功能,我们可以在其中传输数据根据库中最新的CLDR和ICU版本生成。这意味着每个ICU4X类型都会获得一个不需要数据提供程序的新构造函数参数,但使用编译的数据。此数据使用我们现有的“烘焙数据”格式,它只是Rust代码,允许编译器执行优化并从粒度上排除不必要的数据。事实上不使用任何新构造函数都不会看到二进制大小差异即使有编译的数据货物功能已启用(默认情况下已启用)。

除了添加编译数据外,我们还修改了数据生成APIicu数据源。新API更符合人体工程学,允许更多诸如选择要包括哪些分割模型之类的灵活的数据生成,并且可以更好地优化生成数据的大小。例如,使用新的“回退模式”标志,可以在假设区域设置的情况下生成数据fallback将在运行时使用。这样,例如。环境-CA不会如果与数据匹配,则必须包含英语,因为在运行时en将如果尝试过环境-CA不存在。此数据复制模式已用于编译后的数据,带有内置回退功能。

ICU4X 1.3还稳定了一个新组件:病例映射。许多脚本是两院制的,这意味着它们有大小写。案例映射允许在大小写和标题大小写之间进行转换casefolding操作允许执行区分大小写的字符串匹配。这些操作可能非常细微,并且依赖于区域设置:例如在土耳其语中,字母“i”大写为“i”,现代希腊语删除了重音和在大写时添加direses。

此版本还完成了一组日历,包括所有CLDR日历。除了格里高利、泰国太阳佛教徒、科普特人,埃塞俄比亚历法、印度国家历法和日本历法从1.0开始支持,ICU4X现在还支持中文、韩文(Dangi)、,希伯来语、波斯语(太阳回历)、R.O.C.和伊斯兰历法的四种变体(民用、观测、表格和Umm al-Qura)。此支持包括格式,尽管目前正在预览中文和韩文的格式状态。

我们还推出了一个音译API作为技术预览版。音译是文字之间的转换,例如从阿拉伯语到拉丁语,尽可能保留发音。CLDR支持许多音译,本次发布将这些CLDR音译带到ICU4X。虽然数据生成尚不可用,但用户可以运行时构造在CLDR支持的任何脚本之间转换的音译。

最后,ICU4X 1.3为其他组件。实验显示名称组件现在支持格式化语言标识符,以及语言、脚本和区域显示名称;有全面的性能改进;以及一些API,例如LocaleFallbacker已移至更好的位置。

阅读全文重症监护病房4X 1.3发行说明然后ICU4X教程开始在项目中使用ICU4X。




支持Unicode
支持Unicode的使命,确保每个人都可以在所有设备上的语言,请考虑采用一个字符,赠送股票, 捐款.作为Unicode,Inc.是一家基于美国的开源、开放标准、非盈利的公司,501(c)3组织,您的供款可能有资格享受减税。拜托有关详细信息,请咨询税务顾问。

[徽章]