2022年12月21日星期三

2022年Unicode

2022图像

大家好!

在新年到来之际,Unicode团队认为我们应该分享去年的一些亮点。从源代码欺骗到保存Unicode团队又度过了一整年,包括增加数十亿设备上出现的字符数全世界。


将近150000个字符!

在性格方面,我们的总数接近150000字符(精确到149186)。在15.0中添加的4489个字符中发布时,最大的一组是4192个汉字、日语和韩国人。还有两个新脚本,Nag Mundari和Kawi。Nag Mundari是用于书写印度蒙达里语的脚本,该语言拥有110万扬声器。卡维岛是东南亚岛国的一个重要历史遗迹从公元8年到20世纪,用多种语言书写的铭文和文物16世纪的今天,在狂热者中正经历着复兴。

我们不能忘记20表情符号字符-我们期待着看哪一个是最棒的流行语:摇头?鹅?马拉卡斯?粉红色的心?如果你参与了在实现emoji时,您还需要查看UTS公司#51 Unicode表情符号

请参阅单码15.0.0第页了解更多详细信息。我们也在改变发布方式-有关更多信息,请参阅2023年发布计划

ICU4X的推出

ICU用于每个主要设备和操作系统;就是这样例如,你会在手机上看到日期或号码。这个新项目,ICU4X旨在解决希望提供客户端的客户的需求在资源受限的环境和跨许多编程语言。经过谷歌两年半的工作,Unicode联盟发布了Mozilla、Amazon和社区合作伙伴ICU4X 1.0,第一个稳定版本。从地面开始建造,重量轻,ICU4X从数十年的经验中学习,可携带且安全,将本地化日期格式、数字格式、排序规则、文本分段等直到现在还没有合适解决方案的设备。有关详细信息,请参阅宣布ICU4X 1.0型

我什么时候≠i?

你能说出我和你的区别吗?是的,大多数人不能。帮助对抗源代码欺骗的第一组更改是包含在15.0版的9号UAXUnicode双向算法,UAX公司#31 Unicode标识符和模式语法、和UTS公司#39 Unicode安全机制

2023年有一个新草案UTS#55 Unicode码源代码处理,为编程语言设计者提供指导和工具开发人员,并指定避免可用性和由于Unicode处理不当而引起的安全问题。正在进行更多更改他们的方式9号UAX,UAX 31号、和UTS 39号也。

奥格·莫勒,∏έτρООааκλαОкККαρατζЛ,ராஜேந்திர சோழன்

我们在国际化格式方面取得了很大进展人们的名字。这是什么意思?软件需要能够格式化人名,如John Smith或宮崎駿。格式可能令人惊讶复杂:例如,人们可能有不同数量的名字,具体取决于他们可能只有一个名字(“Zendaya”),只有两个(“Albert”)爱因斯坦”),或三个或更多。所以软件需要处理丢失或额外的优雅地命名字段。

还有更多的复杂性-有关更多详细信息,请参阅设置人名格式

您有2条未读消息。

或者,您的购物车中有3个项目。每当计算机需要使用“占位符”构造一个句子,例如3,它正在格式化消息。当前的行业标准是ICU的消息格式;项目已启动关于3年前,目标是在此基础上进行改进,以构建更强大的可扩展机制。ICU现在有一个技术预览-我们敦促开发者来试试吧!

请参见消息格式-wg有关语法和消息2/package-summary.htmlAPI(注意ICU的约定对于技术预览,将标记为不推荐),并且测试代码位于消息格式2测试.java例如用法。

(当然,ICU还有其他修复、升级和新功能:看见重症监护室72重症监护室71了解更多详细信息。)

毛利、沃洛夫、,‎ትግርኛ, कॉशुर‎, ‎মৈতৈলোন্, ‎ᱥᱟᱱᱛᱟᱲᱤ

在CLDR中,我们现在有95种现代级别的语言(适用于完全UI国际化),6个中等级别(适用于“文档content“国际化”),以及基础级别29(适用于区域设置选择)。我们添加了人名格式的技术预览,以及Unicode 15.0的新增功能(表情符号名称和搜索关键字)脚本、新的CJK排序规则等。有关更多信息,请参阅CLDR第42版

振兴和保护土著语言

Nattilik语言社区无法使用他们的语言即使是简单的日常数字文本交换,如电子邮件或文本,也能可靠地进行消息传递。Typotheque音节项目,一项基于多伦多的倡议荷兰海牙与各地的语言管理员进行了研究加拿大各种使用印第安语的土著社区。通过与合作纳特利克语管理员和社区长者,纳特利克语的关键问题确定了努纳武特西部的社区,发现Unicode标准中缺少12个音节字符。这个联合会与Typotheque音节项目合作,在支持Unicode版本的Nattilik和其他语言的脚本14.0,并改进了Unicode版本15.0中的字形。请参见这篇六月的博文

旗表情符号的过去与未来

尽管是最大的表情符号类别,关联性很强与身份相关,标志是迄今为止使用最少的旗帜表情符号因其开放性而一直受到特殊标准的约束性质、不经常使用和实现负担。添加其他Unicode标准中的标志和数千个有效序列没有导致更广泛的采用。它们不会停滞不前,不断进化由于旗帜的开放性,加上一个标志就创造了排他性以牺牲他人为代价。想了解更多吗?阅读更多关于国旗表情符号的过去和未来

现已上市!新的YouTube播放列表和技术快速入门指南

9月28日,Unicode举办了一场关于“国际化和Unicode项目”。Unicode码技术领导和其他专家分享了我们核心项目的背景与会者来自30多个国家。如果你错过了网络研讨会,别担心!录制的会话在此上可用YouTube播放列表。如果您是Unicode和国际化的新手,或者只需要刷新一下,您也可以查看我们的技术快讯开始指南。这本方便的指南解释了Unicode是什么,包括回答问题是“什么是国际化以及为什么它很重要。”还有一些有用的链接,可以提供更详细的信息以及如何参与其中。点击此处阅读更多信息

支持Unicode💞💕💌💯✨🌟🤠🛟🎁

最后,如果您已经是-或Unicode成员(或您的公司或组织是!),谢谢你,丹克,德库尤,धन्यवाद, 谢谢,谢谢,谢谢!我们所完成的只是可能是因为你这样的支持者。

如果您想支持Unicode的使命,以确保每个人都可以通信在所有设备上使用他们的语言,请考虑采用性格,制作礼物库存的,或制作捐赠由于Unicode是一个基于美国的非营利501(c)3组织,您的供款可能有资格享受减税。请咨询税务部门顾问了解详细信息。