2023年10月31日,星期二

ICU 74发布

ICU徽标Unicode®ICU 74刚刚发布。ICU是顶级软件库国际化,由使用广泛的公司和组织为了支持世界上的语言,实现最新版本的Unicode标准和Unicode区域设置数据(CLDR)。ICU 74更新至Unicode 15.1码,和CLDR公司44带有各种添加和更正的区域设置数据。

ICU 74和CLDR 44是主要版本,包括新版本的Unicode和主要区域设置数据改进。它们包含对ICU 73.2和CLDR 43.1维护版本

Unicode 15.1添加了源代码安全机制,改进了行打破了东南亚文字,增加了重要的中日韩统一表意文字。

CLDR 44增加或改进了多种语言的数据已新增ICU,并改进了测量单元处理,转换和格式化。

ICU 74实现了这些改进,为语言环境添加了新的C API处理,添加用于分词的插件API,并切换Java构建系统到Maven。

有关详细信息,请参阅https://icu.unicode.org/download/74

支持Unicode
支持Unicode的使命,确保每个人都可以在所有设备上的语言,请考虑采用一个字符,赠送股票, 捐款.作为Unicode,Inc.是一家基于美国的开源、开放标准、非盈利的公司,501(c)3组织,您的供款可能有资格享受减税。拜托有关详细信息,请咨询税务顾问。

[徽章]

提供Unicode CLDR v44

[图像] Unicode CLDR版本44现已推出,并已集成到版本74中重症监护室。在CLDR 44中,重点是:
  1. 设置人名格式。进一步添加用于格式化人名的增强功能(数据和结构)。更多信息有关添加此功能的原因及其功能的信息,请参阅背景
  2. Emoji 15.1支持。添加了短名称,关键字和新的Unicode 15.1表情符号的排序顺序。
  3. Unicode 15.1增补。成为常规对Unicode新版本的添加和更改,包括新版本的名称脚本、汉字的校对数据等。
  4. 数字弱势语言覆盖。工作开始提高DDL覆盖率,现在有了以下DDL区域设置具有更高的覆盖级别:
    1. 现代:切罗基语、下索布语、上索布语
    2. 中等:阿尼伊、语际语、库尔德语、,毛利人、威尼斯人
    3. 基本:世界语、中间语、康里语、,库维语、库维语(梵文)、库维语(奥迪亚语)、库维语(泰卢固语)、利古里亚语、伦巴第语,低级德语、卢森堡语、马丘瓦语、马耳他语、恩科语、奥西坦语、普鲁士语、,西里西亚语、沼泽克里语、叙利亚语、托基波纳语、维吾尔语、西弗里斯语、,雅库特,壮族
CLDR为支持世界语言(日期、时间、数字、排序等)。例如,所有主要浏览器和所有现代手机都使用CLDR提供语言支持。(请参见谁使用CLDR?)

通过在线调查工具,贡献者为其语言(languages)&广泛用于支持世界上大部分软件的数据。此数据也是决定支持哪些语言的一个因素手机和计算机操作系统。

还有许多其他更改:要了解更多信息,请参阅CLDR v44发布页面, 其中包含访问日期、查看更改图表的信息,而且-重要的是-迁移问题。

在版本44中,达到了以下级别:

v44级别
兰斯
用法
现代
95
适合全UI国际化
切什蒂纳、德意志、法兰西、斯瓦希里、马扎尔、奥兹别克,罗马纳、蒂昂维特、λληνκ、БеЛаруска‎, ‎ᏣᎳᎩ‎, Ქართული‎, Հայերեն‎, ‎עברית‎, ‎اردو‎, አማርኛ‎, ‎नेपाली‎, অসমীয়া‎, ‎বাংলা‎, ‎ਪੰਜਾਬੀ‎, ‎ગુજરાતી‎, ‎ଓଡ଼ିଆ‎, தமிழ்‎, ‎తెలుగు‎, ‎ಕನ್ನಡ‎, ‎മലയാളം‎, ‎සිංහල‎, ‎ไทย‎, ‎ລາວ‎, မြန်မာ‎, ‎ខ្មែរ‎, ‎한국어‎, 中文, 日本語‎, … ‎
中等
13
适合“文档内容”国际化,例如电子表格
勃列日涅格(brezhoneg)、福罗伊斯克特(föroyskt)、伊希科萨(IsiXhosa)、萨尔都(sardu)、谢尔盖娃(Qiӑbval)…
基本
50
适用于区域设置选择,例如在手机上选择语言电话
asturianu、Rumantsch、毛利、沃洛夫、,कॉशुर‎, ‎মৈতৈলোন্, ‎ᱥᱟᱱᱛᱟᱲᱤ, …

我们目前计划将CLDR版本45关闭无提交期的发布。重点是改进调查用于提交数据、进行必要的基础结构更改的工具,以及一些高优先级数据质量修复。



支持Unicode
支持Unicode的使命,确保每个人都可以在所有设备上的语言,请考虑采用一个字符,赠送股票, 捐款.作为Unicode,Inc.是一家基于美国的开源、开放标准、非盈利的公司,501(c)3组织,您的供款可能有资格享受减税。拜托有关详细信息,请咨询税务顾问。

[徽章]

2023年10月30日,星期一

Unicode社区参与团队的更新

社区参与团队副主席Elango Cheran

如果你已收到Unicode新闻稿或关注我们LinkedIn链接,推特、和朋友Facebook上Unicode的,您可能已经看到有关新Unicode的信息事件和资源。

这些活动和工具是Unicode的社区参与(CE)团队。该团队成立于2022年3月在我们的国际化和Unicode会议物流合作伙伴和Unicode决定向不同方向发展之后。 

一小部分志愿者和Unicode工作人员认为这是有机会探索不同类型的活动,并了解如何实现更多全球观众。自去年7月以来,我们举行了七项在线活动.我们认真关注这些最初活动的在线媒体确保更广泛地接触和获取知识,这与Unicode过去曾处理过一些事件。从最近的在线活动来看,我们吸引了来自65多个国家的数百名新人。对于其中的每一个,我们已经在Unicode YouTube频道

这就是说,还有更多的事情要做!

作为一家依靠志愿者的小型非营利组织,我们开始谦逊,不断突破我们的界限,尝试我们的工具,以及通过每次活动扩展我们的能力。

即将到来的Unicode码技术研讨会是该实验的自然延伸。同时这是在加州举行的一场个人活动,我们希望我们能吸取教训学习并将此模型应用于地球仪。

我个人非常感谢有机会帮助Unicode考虑到基础性和影响力,与更全球化的受众建立联系Unicode的工作是研究世界各地的人、语言和社区。这个我们团队的工作是由我忠实的同事们促成的,其中一些是来自谷歌、加州大学伯克利分校和Spotify等组织。

令人鼓舞的是,人们对活动的兴趣越来越大与Unicode合作开展此类工作的人员。如果你对有助于您或他人的外联编程或教育工具的类型在您的国际化之旅中,请通过以下方式与我们联系事件@unicode.org



支持Unicode
支持Unicode的使命,确保每个人都可以在所有设备上的语言,请考虑采用一个字符,赠送股票, 捐款.作为Unicode,Inc.是一家基于美国的开源、开放标准、非盈利的公司,501(c)3组织,您的供款可能有资格享受减税。拜托有关详细信息,请咨询税务顾问。

[徽章]

2023年10月13日星期五

11月7日至8日的Unicode技术研讨会–会议更新!

Unicode技术研讨会指导委员会

这个Unicode技术研讨会(UTW)是国际化你今年想参加的活动。

听取Adobe、谷歌、Meta、,Square、UC Berkeley等。会议包括研讨会、研讨会、,以i18n库为中心的自由形式讨论和闪电对话,区域设置数据更新、全球化工具、本地化管道、输入方法和文本呈现。第2天包括由与会者。

研讨会的主题包括:
  • Unicode及其他简介
  • ICU4X研讨会简介
  • 真实世界中的人名
  • Unicode国际化指南
  • 互联网领域国际化名称系统
  • 走向全球的第一步
  • 修复Abugida脚本的输入方法
  • 消息中的自动语法协议格式化
  • 证明一下!数据驱动一致性测试
  • Unicode源代码处理
  • 脚本编码倡议:过去和未来
  • 字符到字形:Unicode®文本如何生成它显示在屏幕上
  • I18n测试的临界值
  • ADLaM,《脚本的力量:进化》,大学毕业后的社区影响和挑战
  • {}:消息格式v2
  • CLDR和ICU的新功能
  • Unicode属性和算法
  • 🔥😮‍💨🍄🪦💀🐷🐙😤
  • 推出数十种新语言的课程在UI中
  • 区域感知单位和单位弯曲
  • Mark Davis的“Ask Unicode Anything”,Unicode联合创始人兼首席技术官

我们鼓励与会者在活动中提出主题不同意会议和闪电会谈。

与开发人员和用户建立网络,帮助塑造未来Unicode技术。预计将在Unicode技术使软件为全球数十亿人服务设备。

时间和地点:2023年11月7日至8日。海湾地区(由谷歌主办)。仅供个人使用!

立即注册https://www.unicode.org/events/event-registration.html



支持Unicode
支持Unicode的使命,确保每个人都可以在所有设备上的语言,请考虑采用一个字符,赠送股票, 捐款.作为Unicode,Inc.是一家基于美国的开源、开放标准、非盈利的公司,501(c)3组织,您的供款可能有资格享受减税。拜托有关详细信息,请咨询税务顾问。

[徽章]

2023年10月6日星期五

ICU4X 1.3:现在有内置数据、案例映射、附加日历系统等

作者:ICU4X技术委员会Robert Bastian

ICU徽标在全球范围内,人们上网的次数越来越少各种设备,包括智能手机、智能手表和小工具。的一个分支国际Unicode组件(ICU)委员会,ICU4X委员会是负责使这些下一代设备能够与其通信数千种语言的用户。用Rust书写,ICU4X带来轻盈,模块化、安全的国际化库到低资源设备和许多编程语言。

自2023年4月发布上一个版本以来,ICU4X团队一直很忙构建附加功能并提高库的可用性。今天我们很高兴宣布1.3版本,包括内置数据,一个新的datagenAPI是案例映射组件的第一个稳定版本,支持更多日历系统、基于规则的音译技术预览等等。

我们听到反馈,ICU4X的数据管道,同时允许强大的定制功能,具有显著的学习曲线。在ICU4X 1.3中,我们因此引入了一个称为“编译数据”的新功能,我们可以在其中传送数据根据库中最新的CLDR和ICU版本生成。这意味着每个ICU4X类型都会获得一个不需要数据提供程序的新构造函数参数,但使用编译的数据。此数据使用我们现有的“烘焙数据”格式,它只是Rust代码,允许编译器执行优化和细粒度地排除不必要的数据。事实上,程序不使用任何新构造函数都不会看到二进制大小差异即使有编译的数据货物功能已启用(默认情况下已启用)。

除了添加编译数据外,我们还修改了数据生成APIicu数据源。新API更符合人体工程学,允许更多灵活的数据生成,例如选择要包括的分割模型,并且可以更好地优化生成数据的大小。例如,使用新的“回退模式”标志,可以在假设区域设置的情况下生成数据fallback将在运行时使用。这样,例如。环境-CA不会如果与数据匹配,则必须包含英语,因为在运行时en将如果尝试过环境-CA不存在。此数据复制模式已用于编译后的数据,带有内置回退功能。

ICU4X 1.3还稳定了一个新组件:病例映射。许多脚本是两院制的,这意味着它们有大小写。案例映射允许在大小写和标题大小写之间进行转换casefolding操作允许执行区分大小写的字符串匹配。这些操作可能非常细微,并且依赖于区域设置:例如在土耳其语中,字母“i”大写为“i”,现代希腊语删除了重音和在上体时添加diæreses。

此版本还完成了一组日历,包括所有CLDR日历。除了格里高利、泰国太阳佛教徒、科普特人,埃塞俄比亚历法、印度国家历法和日本历法从1.0开始支持,ICU4X现在还支持中文、韩文(Dangi)、,希伯来语、波斯语(太阳回历)、R.O.C.和伊斯兰历法的四种变体(民用、观测、表格和Umm al-Qura)。此支持包括格式,尽管目前正在预览中文和韩文的格式状态。

我们还推出了一个音译API作为技术预览版。音译是文字之间的转换,例如从阿拉伯语到拉丁语,尽可能保留发音。CLDR支持许多音译,本次发布将这些CLDR音译带到ICU4X。虽然数据生成尚不可用,但用户可以运行时构造在CLDR支持的任何脚本之间进行转换的transliterators。

最后,ICU4X 1.3为其他组件。实验显示名称组件现在支持格式化语言标识符,以及语言、脚本和区域显示名称;有全面的性能改进;以及一些API,例如LocaleFallbacker已移至更好的位置。

阅读全文ICU4X 1.3发行说明然后是ICU4X教程开始在项目中使用ICU4X。




支持Unicode
支持Unicode的使命,确保每个人都可以在所有设备上的语言,请考虑采用一个字符,赠送股票, 捐款.作为Unicode,Inc.是一家基于美国的开源、开放标准、非盈利的公司,501(c)3组织,您的供款可能有资格享受减税。拜托有关详细信息,请咨询税务顾问。

[徽章]

2023年10月5日星期四

Unicode CLDR v44 Beta可用于规范审查

[图像] Unicode码CLDR v44测试版现在可用于规范审查和集成测试。发布计划于11月1日发布,但对规范的任何反馈都需要提前提交。该规范可从以下网址获得:草稿LDML修改最大的变化是新的人名格式第节。

测试版已经集成到开发版本中重症监护室。我们特别感谢ICU用户和非ICU用户的反馈CLDR数据的使用者,以及迁移问题。 

反馈可在CLDR票据

CLDR为支持世界语言(日期、时间、数字、排序等)例如,all主要浏览器和所有现代手机都使用CLDR提供语言支持。(请参见谁使用CLDR?)

通过在线调查工具,贡献者为其语言(languages)&广泛用于支持世界上大部分软件的数据。此数据也是决定支持哪些语言的一个因素移动电话和计算机操作系统。

在CLDR 44中,重点是:
  1. 设置人名格式。进一步添加用于格式化人名的增强功能(数据和结构)。更多信息有关添加此功能的原因及其功能的信息,请参阅背景
  2. Emoji 15.1支持。添加了短名称,关键字和新的Unicode 15.1表情符号的排序顺序。
  3. Unicode 15.1增补。成为常规对Unicode新版本的添加和更改,包括新版本的名称脚本、汉字的校对数据等。
  4. 数字弱势语言覆盖。工作开始提高DDL覆盖率,现在有了以下DDL区域设置具有更高的覆盖级别:
    1. 现代:切罗基、下索布、上索布索布语
    2. 中等:阿尼伊、语际语、库尔德语、,毛利人、威尼斯人
    3. 基本:世界语、中间语、康里语、,库维语、库维语(梵文)、库维语(奥迪亚语)、库维语(泰卢固语)、利古里亚语、伦巴第语,低级德语、卢森堡语、马丘瓦语、马耳他语、恩科语、奥西坦语、普鲁士语、,西里西亚语、沼泽克里语、叙利亚语、托基波纳语、维吾尔语、西弗里斯语、,雅库特,壮族

还有许多其他更改:要了解更多信息,请参阅草稿CLDR v44发布页面, 其中包含访问日期、查看更改图表的信息,而且-重要的是-迁移问题。

在版本44中,达到了以下级别:
v44级别
兰斯
用法
现代
95
适合全UI国际化
切什蒂纳、德意志、法兰西、斯瓦希里、马扎尔、奥兹别克,罗马纳、蒂昂维特、λληνκ、БеЛаруска‎, ‎ᏣᎳᎩ‎, Ქართული‎, Հայերեն‎, ‎עברית‎, ‎اردو‎, አማርኛ‎, ‎नेपाली‎, অসমীয়া‎, ‎বাংলা‎, ‎ਪੰਜਾਬੀ‎, ‎ગુજરાતી‎, ‎ଓଡ଼ିଆ‎, தமிழ்‎, ‎తెలుగు‎, ‎ಕನ್ನಡ‎, ‎മലയാളം‎, ‎සිංහල‎, ‎ไทย‎, ‎ລາວ‎, မြန်မာ‎, ‎ខ្មែរ‎, ‎한국어‎, 中文, 日本語‎, … ‎
中等
13
适合“文档内容”国际化,例如电子表格
勃列日涅格(brezhoneg)、福罗伊斯克特(föroyskt)、伊希科萨(IsiXhosa)、萨尔都(sardu)、谢尔盖娃(Qiӑbval)…
基本
50
适用于区域设置选择,例如在手机上选择语言电话
asturianu、Rumantsch、毛利、沃洛夫、,कॉशुर‎, ‎মৈতৈলোন্, ‎ᱥᱟᱱᱛᱟᱲᱤ, …

我们是目前计划将CLDR版本45作为一个不提交的封闭版本期间。重点将是改进用于数据提交的调查工具,进行必要的基础设施更改,以及一些高优先级的数据质量修复了。



支持Unicode
支持Unicode的使命,确保每个人都可以在所有设备上的语言,请考虑采用一个字符,赠送股票, 捐款.作为Unicode,Inc.是一家基于美国的开源、开放标准、非盈利的公司,501(c)3组织,您的供款可能有资格享受减税。拜托有关详细信息,请咨询税务顾问。

[徽章]