Unicode术语表
本词汇表定期更新,以与Unicode Consortium维护的各种标准的更改保持同步。
请参见关于Unicode术语用于各种术语的翻译。还有一个常见问题解答网站上的部分。
A类
辅音音素文字.一种书写系统,其中只有表示辅音。“阿布贾”一词来源于阿拉伯文字传统顺序的四个字母:阿列夫,呸,呸,达尔(请参见第6.1节,书写系统.)
抽象字符. 用于组织、控制或文本数据的表示。(参见中的定义D7第3.4节,字符和编码.)
抽象字符序列. 一个或多个抽象字符的有序序列。(请参见定义D8英寸第3.4节,字符和编码.)
阿布吉达.一种书写系统,其中辅音由一个固有的基本字母表示元音,其中其他元音由附加的修改基本字母的某种识别标记。这个术语“abugida”源自闪米特字母顺序的埃塞俄比亚文字:阿尔夫、赌注、赌博、丹特(请参见第6.1节,书写系统.)
强调文字标记.A型标记放在字符的上方、下方或侧面以改变其语音值。(另请参见 变音的.)
缩略语.用第一个字母表示字母或数字名称。例如,希腊的字母数字是变体这些首字母。
阿克萨拉(1)在梵语语法中,通常指“字母”,与辅音相反(维扬贾纳)或元音(斯瓦拉). 派生自梵语传统顺序的第一个字母和最后一个字母字母-“a”和“ksha”。(2) 一般来说,用印度语书写系统,阿克萨拉指的是正字法音节.
算法。Unicode标准中广义上使用的术语表示用于实现指定的结果。这不需要实际的程序描述了要遵循的算法;任何实现都是只要结果相同,就符合要求。
字母一种辅音和元音都是表明。术语“字母表”源自前两个字母希腊文字:α,β(请参见第6.1节,写作系统.)
字母属性.主要单位的信息属性字母和/或音节。(请参见第4.10节,字母、字母和表意字符.)
按字母排序(请参见
整理.)
注释.次要文本内容与主要文本的点或范围。(特定的注释是被认为是文本“内容”的一部分。典型的例子包括注释、引用、例证、,日本乐美等等。)
美国国家标准协会(1)美国国家标准协会。(2) 所有Windows代码页的Microsoft集体名称。有时使用特别是代码页1252,它是ISO/IEC的超集8859-1.
仪器批评.编辑使用的约定集合对文本进行注释和评论。
阿拉伯数字.术语“阿拉伯数字”可能表示阿拉伯文字中的任一数字(请参见
阿拉伯-印度数字)或与罗马数字相比的普通ASCII数字(参见
欧洲数字). 当术语“阿拉伯数字”在Unicode规范中使用,意思是阿拉伯-印度数字。请参见数字术语有关数字相关术语的更多信息。
阿拉伯-印度数字.Forms of decimal digits used in most parts of the 阿拉伯语世界(例如,U+0660、U+0661、U+0622、U+066)。尽管欧洲数字(1, 2, 3,…) 从历史上看,这些形式在视觉上是不同的分别编码。(阿拉伯-印度数字有时称为印度数字;然而,这个命名法导致与印度文字当前使用的数字。)所用阿拉伯-印度数字的变体形式主要在伊朗和巴基斯坦被称为东部阿拉伯印度语数字(请参见第9.2节,阿拉伯语.)请参见数字术语有关数字相关术语的更多信息。
ASCII码(1)美国信息交换标准代码用于信息交换的7位编码字符集。它是ISO/IEC 646的美国国家变体,正式为美国。标准ANSI X3.4。它由ANSI于1963年提出,并于1968.(2)从U+0000到U+007F的128个Unicode字符集,包括控制代码和图形字符。(3) ASCII具有被错误地用于指代各种8位字符编码在前128个码位中包含ASCII字符。
ASCII数字.数字字符U+0030到U+0039。也称为欧洲数字。请参阅数字术语有关数字相关术语的更多信息。
指定的字符。分配给抽象字符的代码点。这是指图形、格式、控制和专用字符已在Unicode标准中编码。(请参见第2.4节,代码点和字符.)
分配的代码点(请参见指定代码点.)
原子特性。不可分解的字符。(请参见
可分解特征.)
B类
基本字符.任何图形除具有组合的一般类别的字符外的字符标记(M)。(参见中的定义D51第3.6节,组合.)在结合字符序列,基本字符是初始字符应用组合标记的字符。
基本多语言平面. 平面0,缩写为BMP。
两院制。一个脚本区分两种情况。(请参见 案例.) 最常用于欧洲拉丁字母的上下文以及世界其他地方。
比迪.双向的缩写,参考从左到右和从右到左的混合文本。
双向显示器. 混合从左到右文本和从右到左文本的过程或结果单行文本。(请参见Unicode标准附录9,“Unicode双向算法”)
大发动机一台计算机存储多字节数值的体系结构最高有效字节(MSB)值优先。
二进制文件。文件包含非文本信息。
块.一组字符在用于组织代码图的Unicode编码空间内。每个块都是一个唯一命名的、连续的、非重叠的代码点范围,包含16个代码点的倍数,并且从16的倍数开始。块可以包含未分配的代码点,它们是保留的。
BMP公司.的缩写基本多语言平面.
BMP字符.Unicode编码具有BMP代码点的字符。(请参见
补充字符.)
BMP代码点.Unicode代码U+0000和U+FFFF之间的点。(请参见
辅助码位.)
BNF公司.的缩写巴克斯-努尔形式, 用于描述无上下文语法的正式元语法。(适用于详细信息,请参见附录A,符号惯例.)
BOCU-1型.Binary Ordered的缩写Unicode压缩。Unicode压缩方案MIME兼容(可直接用于电子邮件)并保留二进制顺序,这对数据库和排序列表很有用。
物料清单.的缩写
字节顺序标记.
汉语拼音。使用的字母脚本主要在中华民国(台湾)写发音普通话和一些其他方言。每个符号对应于音节首字母或音节尾音;它是因此,它的主要用法是一种亚音节脚本。名字是源于其前四个元素的名称。更恰当地说称为竹荫紫木或祝英富豪用普通话中国人。
Boutrophedon公司. A pattern of 在一些古代手稿和铭文中看到的文字,其中交替的文本行以相反的方向排列,以及其中从右到左的线条通常使用从其从左到右的形式。从字面上看,“当牛转弯时”指的是犁地。
盲文.使用一系列凸起的圆点供以下人员用手指阅读失明或视力不足以阅读印刷品材料。(请参见第21.1节,盲文.)
盲文图案。其中一个64(六点盲文)或256(八点盲文有形点组合。
字节.(1)最小单位特定计算机体系结构的可寻址存储。(2) 安八位字节。注意,许多早期的计算机体系结构使用更大的字节大小超过8位,但该行业现在几乎已经实现了标准化在8位字节上一致。Unicode标准遵循当前标准将该术语等同的行业实践字节具有八位字节并使用更熟悉的术语字节在所有上下文中。(请参见
八位字节.)
字节顺序标记.Unicode字符U+FEFF用于指示文本的字节顺序。(请参见第2.13节,特殊字符和非字符、和第23.8条,特殊条款.)
字节序列化. The 由计算机体系结构确定的一系列字节的顺序。
字节切换.撤销字节序列的顺序。
C类
Camelcase公司.复合词或标识符的大小写约定,其中字母大多为小写,但组成词或缩写可以大写。例如,“ThreeWordTerm”或“ThreeWordTerm”。
标准(1)符合编码的一般规则-未压缩、压缩或高级协议指定的任何其他形式。(2) 的特征规范映射和中规定的等价形式第章3、合规性.
典型合成。Unicode规范化形式算法中的一个步骤,在此过程中,分解的序列被主合成替换(如果可能)。(参见中的定义D115第3.11节,规范化表格.)
标准可分解字符. 与标准分解不同的字符。(参见中的定义D69第3.7条。分解.)
典型分解. 映射到本质上等价的序列,例如,映射ä到+组合元音变音。(有关完整的正式定义,请参见中的定义D68第3.7条。分解.)
标准等价物. 如果满足以下条件,则称两个字符序列为标准等价序列它们的完全标准分解是相同的。(见定义D70英寸第3.7条。分解.)
悬臂标志.一个标记它用于指示如何唱诵或唱诵文本。
大写字母.同义词大写字母(请参见 案例.)
案例.(1)某些特征字母有两种不同形式的字母表。这些变体,它们的形状和大小可能有显著差异,称为大写字母(也称为首都或令人毛骨悚然的)和小写字母字母(也称为小的或微小的). (2) 规范字符的属性,由大写、小写和标题大小写(Lu、Ll和Lt)组成。(请参见第4.2节,案例.)
案例映射.协会字母的大小写和标题大小写形式。(请参见第5.18节,案例映射.)
案例-可忽略。字符C定义为可识别的案例如果C的Word_Break属性的值为MidLetter(ML)、MidNumLet(MB)或Single_Quote(SQ),或者其General_Category是Nonspacing_Mark(Mn)、Enclosing_Mark(Me)、Format(Cf)、Modifier_Letter(Lm)或Modifier _Symbol(Sk)之一。(参见中的定义D136第3.13节,默认情况算法.)
案例-可忽略序列.零个或多个案例可识别的序列字符。(参见中的定义D137第3.13节,默认情况算法.)
CCS系统.(1)缩写
编码字符集(2)也用作
组合字符序列.
塞迪拉.最初放置的标记在法语、葡萄牙语和西班牙语字母c下方,表示这封信的发音是第页,如中所示立面. 过时的西班牙语缩写雪松,这封信z(z).
首席执行官.的缩写
字符编码形式.
消费电子产品.的缩写
字符编码方案.
字符.(1)最小值具有语义价值的书面语成分;指的是抽象意义和/或形状,而不是特定形状(参见也字形),尽管在代码表中有某种形式的可视化表现对于读者的理解至关重要。(2) 同义词抽象字符.(3)基本单位用于Unicode字符编码的编码。(4) 英文名称源于中国的表意文字。[参见
表意文字(2).]
字符块(请参见
块.)
字符类。一组字符共享一组特定的属性。
字符编码形式. 从字符集定义到实际代码单位的映射用于表示数据。
字符编码方案. A类字符编码形式加上字节序列化。有Unicode七字符编码方案:UTF-8、UTF-16、,UTF-16BE、UTF-16LE、UTF-32、UTF-32BE和UTF-32LE。
字符实体.形式的表达;对于“&”或;无中断空间。这些可以在HTML或XML等标记语言文件中找到。还有数字定义的字符实体。(另请参见字符转义.)
字符转义.格式为\uXXXX、\xXXXX或&#xXXXX;的数值表达式;其中X是十六进制数字,或&#dddd;其中d是十进制数字。这些可以在编程源代码或标记语言文件(如HTML或XML)中找到。
字符名称。唯一字符串用于标识标准中编码的每个抽象字符。(参见中的定义D4第3.3节,语义.)
字符名称别名。附加的唯一字符串标识符,其他字符名,与标准。(参见中的定义D5第3.3节,语义.)
字符属性.A型与个人关联的一组属性名称和属性值字符。(请参见第章4、字符属性.)
字符集. 字符集中包含的字符集合。
字符序列. 同义词抽象字符序列.
字符集。 用于表示文本信息的元素集合。
Charset(字符集)(请参见
编码字符集.)
Chillu公司.缩写奇拉阿克沙拉姆(单数)(西拉克·阿拉姆). 指马拉雅拉姆语中的任何一组响亮辅音,当出现在音节结尾位置,没有固有元音。
Choseong公司.朝鲜语中一个或多个前导辅音的序列。
楚·亨(Chu Hán).越南使用的汉字名称;派生自 哈尼兹.
楚纳姆.越南的通俗剧本由汉字的组成部分发展而来。它的创造者使用类似于中国人创造汉字的方法字符。
中日韩.中文、日语和韩国人。变体,CJKV公司, 指中文、日语、韩语和越南语。
CLDR公司.(请参见Unicode通用区域设置数据存储库.)
编码字符(请参见
编码字符.)
编码字符表示.同义词编码字符序列.
编码字符序列. 一个或多个代码点的有序序列。通常情况下由一系列编码字符组成,但也可以包括非字符或保留的代码点。(请参见定义D12英寸第3.4节,字符和编码.)
编码字符集.A型为每个字符分配数字代码的字符集点。经常缩写为字符集,字符集,或代码集; 首字母缩写CCS系统也会使用。
代码页.编码字符集,通常指个人使用的编码字符集例如,计算机,PC代码页437,默认编码字符DOS操作系统的美国英语版本所使用的集合。
代码点.(1)中的任何值Unicode码空间;也就是说,范围0到10FFFF的整数16(参见中的定义D10第3.4节,字符和编码.)并非所有代码点都分配给编码字符。请参见代码点类型.(2)一个值或位置字符,在任何编码字符集中。
代码点类型标准中七种基本代码点类别中的任意一种:图形、格式、控制、专用、代理、非字符、保留。(参见中的定义D10a第3.4节,字符和编码.)
代码位置.同义词代码点。用于ISO字符编码标准。
代码集(请参见
编码字符集.)
代码空间.(1)可用于编码的数值范围字符。(2) 对于Unicode标准,从0开始的整数范围至10FFFF16(参见中的定义D9第3.4节,字符和编码.)
代码单位。可以表示单位的最小位组合用于处理或交换的编码文本。Unicode标准使用UTF-8编码形式的8位代码单位,16位代码单位UTF-16编码形式,UTF-32 32位代码单元编码形式。(参见中的定义D77第3.9节,Unicode编码形式.)
代码值。的过时同义词
代码单元.
密码子. 对于映射,余域是它映射到的代码点或序列的集合,而域是映射的值集。例如,规范分解是来自代码集指向一组序列;余域是一组标准等价映射。(另请参见领域.)
排序规则.过程文本信息的排序单位。排序规则通常是特定的特定语言。也称为按字母顺序排列或字母排序.Unicode技术标准#10,“Unicode排序算法”定义完整、明确、指定的Unicode标准中所有字符的排序。
组合字符.A型带有组合标记(M)一般类别的字符。(请参见定义D52英寸第3.6节,组合)(另请参见
非间隔标记.)
组合字符序列.最大字符序列,包含后跟一个或多个字符序列的基本字符其中每个字符都是一个组合字符,零宽度接头,或零宽度非连接件; 或一个或多个字符的序列,其中每个字符都是一个组合字符,零宽度接头, 或零宽度非连接件. (参见中的定义D56第3.6节,组合.)
组合类。一个数字为每个Unicode代码点提供的0..254范围内的值,形式上定义为属性Canonical_Combining_Class。(见定义D104英寸第3.11节,规范化表格.)
组合用标记。的常用同义词组合字符.
兼容性.(1)与现有实践或先前存在的字符编码标准的一致性。(2) 规范映射的特征和中规定的等效形式第3.7条。分解.
兼容性字符.一个本来不会编码,除了与兼容和往返转换其他标准。(请参见第2.3节,兼容性字符.)
兼容性复合字符。的同义词兼容性可分解特征.
兼容性可分解字符. 一种字符,其兼容性分解与它的正则分解。(参见中的定义D66第3.7条。分解.)
兼容性分解.映射到大致等效的序列这可能在风格上有所不同。(有关完整、正式的定义,请参见定义D65英寸第3.7条。分解.)
等效兼容性. 如果满足以下条件,则称两个字符序列为兼容性等价物它们的完全兼容性分解是相同的。(请参见定义D67英寸第3.7条。分解.)
兼容性预组合字符.同义词兼容性可分解特征.
兼容性变量。通常可以重新映射到的字符另一个字符,除了格式之外,不会丢失其他信息。
合成字符(请参见可分解特征.)
合成字符序列(请参见组合字符序列.)
成分排除。属性值为Composition_Exclusion=True的标准可分解字符。(用于Unicode规范化表单的定义。)(请参阅定义D112英寸第3.11节,规范化表格.)
一致性.遵守使用标准。(请参见第章3、合规性.)
令人困惑的外观相似或相同的。当提及字符串中的字符时,易混淆字符的出现会使不同的标识符难以或无法区分。(另请参见Unicode技术标准#39,“Unicode安全机制”.)
连接字形式.表示辅音连词.
辅音群两个或多个辅音的序列。根据书写系统的不同,辅音簇可以是由单个字符或字符序列表示。(对比度有向图.)
辅音连词.两个或多个相邻辅音的序列字母形式,由一个或多个死辅音序列组成后面是一个正常的、活的辅音字母。辅音连词可以连成一个单一的连词形式,也可以表示通过图形上可分离的部分,例如辅音字母。辅音连词与印度文字的婆罗门家族。(请参见第12.1节,梵文.)
上下文变量。文本元素可以有一个表示形式取决于呈现它的文本上下文。这个表示形式称为上下文变量.
出资财产。一个简单的属性,其定义只是为了使定义派生属性的规则语句更紧凑或更通用。(参见中的定义D35a第3.5节,属性.)
控制代码.范围U+0000..U+001F和U+007F。。U+009楼。也称为控制字符.
核心规范。Unicode标准的中心部分–在5.0版之前作为单独一本书出版的部分。从5.2版开始,该标准的这一部分仅在网上发布,而不是作为一本书发布。核心规范包括标准的一般介绍和框架、形式一致性要求、许多实施指南以及提供有关所有编码字符的信息的大量章节,这些信息是按脚本或重要字符类组织的。从形式上讲,Unicode标准的一个版本是由这个核心规范的一个版以及代码图表,Unicode标准附件、和Unicode字符数据库
草书.在单词的字母相连的地方写作。
D类
达西亚.希腊语中粗呼吸标记的术语,用于多音希腊字符名称。
数据库控制系统.的缩写
双字节字符集.
死辅音.印度语辅音字符后跟a维拉马字符。这个序列表明辅音已经失去了固有的元音。(请参见第12.1节,梵文.)
十进制数字。数字可用于形成小数基数。
可分解字符. 相当于一个或多个其他字符序列的字符字符,根据在Unicode字符数据库,以及第3.12节,连接Jamo行为。它也可以称为预先合成的字符或混合成的字符。(参见中的定义D63第3.7条。分解.)
分解(1)过程将文本元素分离或分析为组件单元。这些组件单元可能没有任何功能状态,但可能简单的形式单位&即抽象形状。(2) 一个序列或多个等同于可分解字符的字符。(参见中的定义D64第3.7条。分解.)
分解映射.A型从一个字符映射到一个或多个字符的序列这是一个规范或兼容性等效项,已列出在字符名列表中或在中描述第3.12节,连接Jamo行为(参见中的定义D62第3.7条。分解.)
默认可忽略。默认可忽略的代码点是指在呈现时默认应忽略的那些代码点,除非明确支持。虽然它们可能会影响相邻或周围字符的显示、定位或装饰,但它们本身没有可见的字形或前进宽度。(请参见第5.21节,处理时忽略字符.)
有缺陷的组合字符序列.组合字符不以基本字符开头的序列。(见定义D57英寸第3.6节,组合.)
通俗文字.(1)脚本或一种用来写白话或普通演讲的脚本形式一些语言社区。(2) 古代的简化形式埃及神职人员书写。
从属元音.符号或表示元音并附加或组合在一起的符号另一个符号,通常表示辅音。对于例如,在基于阿拉伯语、希伯来语和印度语的书写系统中脚本、元音通常表示为从属元音符号。
已弃用.编码字符或字符属性,强烈建议不要使用。(不是等同于过时的.)
弃用字符.A型强烈反对使用的编码字符。这些字符被无限期保留在标准中,但不应使用。(请参见定义D13英寸第3.4节,字符和编码.)
指定代码点. 分配给抽象的任何代码点字符(指定的字符)或其他情况由标准(代理代码点)给定规范函数和非字符)。此定义不包括保留的代码点。也称为分配的代码点(请参见第2.4节代码点和字符.)
确定性比较。一种字符串比较,其中不具有相同内容的字符串将作为不相等的字符串进行比较。根据“相同”的含义,主要有两种类型:(a)二进制等式,或(b)规范等价。这是比较机制的属性,而不是排序算法的属性。也称为稳定的(或半稳定的)比较.
确定性排序。一种排序算法,每次将其应用于同一输入时都会返回完全相同的输出。这是排序算法的属性,而不是比较机制的属性。例如,随机快速排序(选择一个随机元素作为轴心元素,以获得最佳性能)是不确定的。排序算法的多处理器实现也可能不具有确定性。
音调评论家.(1)应用的标记或附着到符号以创建表示修改或新值。(2) 应用于符号的标记它是否会更改该符号的值。在后一种情况下,变音符号通常代表一个独立的值(例如,口音、语调或其他一些语言信息)。也称为变音符号或变音的(另请参见
组合字符 和非间隔标记.)
腹泻.两个水平点在一封信上,如天真.诊断不是区别于元音变音使用Unicode字符编码。(请参见元音变音.)
迪亚利提卡.希腊语术语
透析或特雷马牌手表,用于希腊字符名称。
数字(请参见
阿拉伯数字,
欧洲数字、和
印度数字.)请参见数字术语有关数字相关术语的更多信息。
有向图.一对标志或符号(两个图形),它们一起表示单个声音或单个语言单位。英语写作系统使用了许多有向图(例如,th、ch、sh、qu,等等)。同样的两个符号可能并不总是被解释为有向图(例如,加利福尼亚州第个颂歌对加利福尼亚州第个住宅). 当三个标志组合在一起,称为三角图.三个以上通常称为n图.
丁巴茨.印刷符号和装饰品。
双音(Diphthong).一对元音就音位而言被认为是单个元音区别。两个元音中的一个比另一个更突出。在书写系统中,双元音有时用一个符号书写有时使用多个符号(例如,使用有向图).
方向(请参见
段落方向.)
方向性属性. 决定其水平方向的每个图形字符的属性按照中的规定订购Unicode标准附录9,“Unicode双向算法”(请参见第4.4节,方向性.)
显示单元格.一个矩形显示设备上的一个或多个标志符号所在的区域图像。
显示顺序.的顺序文本呈现中显示的符号。(请参见 逻辑顺序和第2.2节,Unicode设计原则.)
域. 对于映射,域是被映射的代码点或序列的集合,而余域是是它们映射到的值集。例如,规范分解是来自一组代码点到一组序列;域是整个Unicode代码空间。(另请参见密码子.)
双字节字符集. 定义用于表示中文的若干字符集之一,日语或朝鲜语文本(例如,JIS X 0208-1990)。这些字符集的编码方式通常允许将双字节字符编码与单字节混合字符编码。缩写数据库控制系统(另请参见多字节字符集.)
延展性.草书的能力拉伸或压缩连接基线以影响文本的字体正当理由。
动态合成. 创建复合形式,如重音字母或朝鲜文一系列字符中的音节。
E类
EBCDIC公司.Extended的缩写二进制编码十进制交换码。一组编码字符在由8位编码字符组成的大型机上使用的集合。EBCDIC编码字符集保留前64个编码点(x00至x3F),并为图形字符保留x41至xFE的范围。英国人字母字符位于不连续的段中,带有大写字母在xC1到xC9、xD1到xD9、xE2到xE9以及在x81到x89处使用小写,x91至x99,xA2至xA9。
电子控制系统.的缩写
扩展组合字符序列.
EGC公司.的缩写
扩展字素簇.
嵌入.与以下内容相关的概念双向行为。(请参见Unicode标准附录9,“Unicode双向算法”详细的术语和定义。)
表情符号(1)日语单词“象形文字”。(2)某些象形文字和其他编码在Unicode标准中的符号,在设备上显示时通常会呈现出丰富多彩或有趣的外观。许多Unicode中的表情符号最初是为了与日本电话符号集兼容而编码的。(3) 彩色或有趣的符号,不编码为字符,但广泛用作图形。(请参见象形文字.)
表情符号。添加到文本中以表达情感影响或反应的符号,例如悲伤、幸福、开玩笑的意图、讽刺等等。表情符号通常由一种传统的“ASCII艺术”表示,使用序列用标点符号和其他符号来描绘面部表情的相似性。在西方语境中,这些词经常被歪斜,如:-)表示高兴的表情;在东亚的环境中,其他习俗通常将面部表情描绘为“^-^”,而不会转动。渲染系统通常会识别传统的表情序列,并将其显示为文本中的彩色甚至动画符号。还有一组专用的象形符号,主要代表Unicode标准中编码为字符的不同面部表情。(请参见象形文字.)
封装文本.(1)由格式化信息包围的纯文本。(2) 为通过狭窄的传输信道或匹配通信协议而重新编码的文本。
封闭标志.一般类别为附上标记(Me)。(参见中的定义D54第3.6节,组合.)封闭标记是非间隔标记的一个子类围绕基本角色,而不仅仅是放置在上面、下面或穿过它。
编码字符.一个之间的关联(或映射)抽象字符和a代码点(参见中的定义D11第3.4节,字符和编码.)抽象字符本身没有数字值,但“编码字符”的过程将具有特定抽象字符的特定代码点,因此导致“编码字符”
编码表单(请参见
字符编码形式.)
编码方案(请参见
字符编码方案.)
等效.在以下背景下文本处理,确定两个文本元素在某些方面是相同的。
等效序列(请参见典型等价物.)
转义序列.A序列用于代码扩展的字节数。中的第一个字节序列是逃跑(十六进制1B)。
欧盟数据中心。最终用户定义字符的缩写。由定义的字符最终用户,使用私有代码点表示特定字符编码中缺少字符。这些是在东亚实施中很常见。
欧洲数字.表格十进制数字最初在欧洲使用,现在在世界范围内使用。从历史上看,这些数字源于阿拉伯数字;他们有时被称为“阿拉伯数字”,但这种命名法导致了与真实相混淆 阿拉伯-印度数字也称为“西方数字”和“拉丁数字”。请参见数字术语有关数字相关术语的更多信息。
扩展底座.任何基本字符或任何标准韩语音节块。(参见中的定义D51a第3.6节,组合.)
扩展组合字符序列.一种最大字符序列,由一个扩展基和一个或多个字符序列组成,其中每个字符都是组合字符,零宽度接头,或零宽度非连接件; 或一个或多个字符的序列,其中每个字符都是组合字符,零宽度接头,或零宽度非连接件.缩写为电子控制系统(参见中的定义D56a第3.6节,组合.)
扩展图形簇.由指定的扩展字素簇边界之间的文本Unicode标准附件#29,“Unicode文本分段”缩写为EGC公司(参见中的定义D61第3.6节,组合.)
F类
花哨的文字(请参见
富文本.)
固定位置等级。的数值范围的子集特定地组合类,范围在10到199之间的任何值。(请参见定义D105英寸第3.11节,规范化表格.)
浮动(变音符号、重音、标记). (请参见
非间隔标记.)
折叠。将类似字符映射到公用字符的操作目标,例如字符串的大写或小写。折叠操作通常用于暂时忽略某些字符之间的区别。
字体。用于字符数据的可视化描述。字体通常是关联的使用一组参数(例如,尺寸、姿势、重量和连续性),设置后对于特定值,生成一组可成像的glyph。
设置字符格式一个天生看不见的角色对周围的字符有影响。
格式代码.同义词
格式化字符.
格式化文本(请参见
富文本.)
FSS-UTF系统.的缩写文件系统安全UCS转换格式, 由X/Open Company Ltd.发布,用于UNIX环境。现在称为UTF-8型.
完全成分排除。属性值为Full_Composition_Exclusion=True的标准可分解字符。(用于Unicode规范化表单的定义。)(请参阅定义D113英寸第3.11节,规范化表格.)
全角(Fullwidth).东亚的特点其字形图像延伸到整个字符的字符集显示单元格。在传统字符集中,全角字符通常编码为两个或两个三个字节。全角字符的日语术语是尖阁列岛.
FVS公司.的缩写蒙古语自由变体选择器.
G公司
G11n公司(请参见全球化.)
GC公司.1.缩写
字形簇. 2. General_Category属性的缩写,通常小写:gc。
GCGID公司.图形字符的缩写全局标识符。这些在IBM文档中列出字符数据表示体系结构,1级,注册表SC09-1391.
一般类别.分区将字符分为字母、标点符号、,和符号,以及每个主要类的进一步子类。(请参见第4.5节,一般类别.)
有创造力.同义词
多产的.
全球化(1)软件产品国际化和本地化的总体过程。(2) 国际化的同义词。也称为缩写“g11n”。请注意,与软件产品相关的“全球化”的含义应与经济学中更广泛使用的“全球化“相区别。(请参见国际化,本地化.)
标志符号.(1)一种抽象形式表示一个或多个字形图像。(2) 的同义词
字形.在显示Unicode时字符数据,可以选择一个或多个符号来描述特殊字符。这些图示符由渲染选择引擎在合成和布局处理期间。(另请参见性格.)
Glyph代码。一个数字代码指一个字形。通常,字体中包含的字形是被他们的字形代码引用。符号代码可能是本地的特殊字体;也就是说,不同的字体包含相同的符号可以使用不同的代码。
字形标识符。类似于字形代码,字形标识符是用于引用字形的标签在字体中。字体可以同时使用本地和全局字形标识符。
字形图像.实际的混凝土已光栅化或其他方式的字形表示的图像在一些显示表面上成像。
标志符号度量.收集指定相对大小和位置以及字形的其他特征。
笔迹(1)最低A特定写作语境中独特的写作单位系统。例如,b›和d›是英语中不同的图形书写系统是因为存在诸如big和dig之类的不同单词。相反,小写斜体字母一和a小写罗马字母a不是独特的字母,因为没有单词是根据这两种不同的形式来区分的。(2) 什么用户将其视为一个字符。
图形库.一个字符属性为Grapheme_Base或任何标准朝鲜语音节块。(参见中的定义D58第3.6节,组合.)
图形簇。由指定的字素簇边界之间的文本Unicode标准附件#29,“Unicode文本分段”(参见中的定义D60第3.6节,组合.)一个字素簇表示文本的一个水平可分割单元,由一些字素基(可能由朝鲜语音节组成)和任何数量的非空格标记组成。
图形扩展器.A型属性为Grapheme_Extend的字符。(参见中的定义D59第3.6节,组合.)图形扩展符字符包括所有非间隔标记,0宽度木工,0宽度不接合件和少量间隔标记。
图形字符.A型带有字母(L)一般类别的字符,组合标记(M) 、数字(N)、标点符号(P)、符号(S)或空格分隔符(Z)。(参见中的定义D50第3.6条。组合.)
吉耶梅.标点符号类似于小于或大于的小符号,用作引语法语和其他语言的标记。(参见“基于语言的用法引号“第6.2节,通用标点.)
H(H)
哈兰特.首选印地语同义词对于维拉马。它的字面意思是杀手,指它的功能谋杀辅音的固有元音信件。(请参见
维拉马.)
半辅音形式.英寸梵文手稿和婆罗门家族的某些其他手稿在印度文字中,一个死辅音可能被描述为半形。这种形式由没有竖直词干的辅音字母符号。它可以用来创建遵循水平布局模式的连接形式。阿尔索称为半形的.
半宽度.东亚特色其字形图像占字符一半的字符集显示单元格。在传统字符集中,半角字符是通常以单个字节编码。日语中的半角字符是汉卡库语.
汉字.象形文字源于中国的字符。(请参见第18.1节,Han.)
朝鲜文。用于的脚本的名称写韩语。
朝鲜文音节.(1)任何朝鲜文音节字符的11172个编码字符块,U+AC00…U+D7A3。也称为预编朝鲜文音节以清楚地将其与韩语音节块区分开来。(2) 松散地说起来,a朝鲜语音节块.
汉字.韩的韩语名称字符;源自汉语单词哈尼兹.
汉卡库(请参见
半宽度.)
汉族统一.过程识别文字中常见的汉字中文、日语、韩语和越南语的系统。
哈尼兹。普通话中文名称用于汉字。
哈拉卡.阿拉伯文字中用来表示用短元音发声。的一个子类型塔什基尔.
哈桑特.孟加拉语名称哈兰特(请参见维拉马.)
高级协议. 任何关于Unicode字符解释的协议超出了本标准的范围。请注意,这样的协议无需在数据中正式宣布;它可能是隐含的在上下文中。(参见中的定义D16第3.4节,字符和编码.)
高代理代码点. 范围为U+D800到U+DBFF的Unicode码位。(见定义D71英寸第3.8节,代理人.)
高代理代码单元. D800范围内的16位代码单元16至DBFF16, 在UTF-16中用作代理项对的前导代码单元。阿尔索称为主要代理(参见中的定义D72第3.8节,代理人.)
平假名(ひらな)。两个标准之一与日语写作系统相关的音节。平假名音节通常用于表示母语日语单词和语法助词,或当对应的汉字要么难以记忆,要么晦涩难懂。(另请参见片假名.)
HTML格式超文本标记语言。一段文字与SGML相关的描述语言;它混合了文本格式标记使用纯文本内容描述格式化文本。HTML是作为互联网上网页的源语言无处不在。从HTML 4.0开始,Unicode标准的功能是HTML内容的引用字符集。(另请参见
SGML公司.)
我
I18n公司(请参见国际化.)
国际机场协会“Internet Assigned”的缩写数字权威。
重症监护室。Unicode国际组件的缩写,一种开放的用于Unicode和软件的C/C++和Java库的源代码集国际化支持。有关信息,请参阅https://icu.unicode网址/
象形字(或表意文字). (1) 任何主要表示与声音或发音相反的想法或概念的符号,♻, 这表示通过一系列弯曲箭头回收的概念。(2) 逻辑音节书写系统的书写单位的通用术语。从这个意义上说,表意文字(或表意文字)并没有系统地与符号文字(或符号文字)区分开来。(3) 一个常用术语,专门指汉字,相当于有时也使用的中文、日语或韩语术语:哈尼兹,汉字,或汉加语(请参见标志记录器,象形文字,正弦图.)
表意字符属性. 表意字符的信息属性。(请参见第4.10节,字母、字母和表意字符.)
象形字变化序列.A型变化序列注册于象形字变体数据库.表意文字变化序列的注册应遵守Unicode技术标准#37,“Unicode象形字变体数据库”表意变化序列的基本字符必须是表意字符,并且它使用变量选择器范围为U+E0100..U+E01EF。表意变化序列有时缩写为“IVS”。
国际域名(请参见国际化域名.)
印尼国家航空公司(1) 的IDNA2008协议国际域名在RFC中定义5891,5892,5893和5894协议根据RFC中描述的Unicode属性对字符进行分类(例如PVALID或DISALLOWED)5892。(有关每个Unicode版本的有效代码点范围,请参阅派生IDNA2008_类别.) (2) 早期的IDNA2003协议。(请参见IDNA兼容性处理之间的差异IDNA2003年和IDNA2008年.)
IDNA兼容性处理(请参见Unicode技术标准#46,“Unicode IDNA兼容性处理”.)
IDNA2003年(请参见印尼国家航空公司(2).)
IDNA2008年(请参见印尼国家航空公司(1).)
国际表意文字核心通用CJK统一表意文字的子集,定义为ISO/IEC 10646中的固定集合370 IICore。这个子集包含9810个表意文字,用于东部地区亚洲环境,尤其是无法支持的小型设备以Unicode编码的全套CJK统一表意文字标准。
伊贾姆. 用于基本字母形式的区分标记派生扩展阿拉伯语的新字母(通常是辅音)字母。例如,请参阅下面出现在字母peh中的三个点:پ伊贾姆标记不单独编码为Unicode标准中的组合标记,但它们是整数每个原子编码阿拉伯字母的部分。对比度塔什基尔。另请参阅第9.2节,阿拉伯语.
格式错误的代码单元序列. 不遵循Unicode编码形式。(参见中的定义D84第3.9节,Unicode编码形式.)
格式错误的代码单元子序列.Unicode代码单元序列X的一个非空子序列,其中不包含也属于X的任何最小格式良好子序列的任何代码单元(参见中的定义D84a第3.9节,Unicode编码形式.)
输入法(请参见输入方法编辑.)
带内.带内信道传输通过将信息嵌入到文本中来获得有关文本的信息自身,使用特殊语法进行区分。银行内信息编码在与文本相同的字符集中,并且穿插在文本数据中并与文本数据一起携带。示例如下XML和HTML标记。
独立元音.印度语脚本,某些元音用独立字母描述独立存在的符号。当一个单词以元音开头或单词仅由元音组成。
印度数字.小数形式各种印度文字中使用的数字(例如,梵文:U+0966、U+0967、U+09968、U+0699)。阿拉伯数字(最终是欧洲数字)从历史上衍生而来从这些形式。请参见数字术语有关数字相关术语的更多信息。
信息。此中的信息不规范但有助于正确的标准标准的使用和实施。
固有元音.以书面形式基于婆罗门语脚本的系统印度文字家族,辅音字母符号通常有一个固有元音,除非另有说明。的语音值这个元音在用这些字母书写的各种语言中不同书写系统。固有元音被用明确的元音符号表示另一个元音,或使用维拉马创造一个死辅音。
内部大写字母.混合大小写格式大写字母位于例如,名称“McGowan”中的“G”
输入方法编辑(输入法)。一种基于UI的字符输入方法,与传统键盘相比具有更大的灵活性和范围。输入法可以使用击键、拼音或触摸屏输入从候选列表中选择字符,或从部分或完整候选单词中选择。
国际化设计和实现一个软件产品的过程,使其易于本地化,几乎不需要进行任何结构更改。理想情况下,国际化的软件产品可以简单地通过翻译显示给用户的消息和其他文本,以及通过调整图标和其他视觉元素来进行本地化。“国际化”软件产品也称为“本地化”产品。也称为缩写“i18n”和术语“World-Readeress”。(请参见本地化,全球化.)
国际化域名(IDN)。使用ASCII范围外至少一个字符的域名。(另请参见印尼国家航空公司.)
投资促进机构(1)国际音标。(2) 国际音标协会,负责定义和维护国际音标。
IRG公司.表意文字研究小组的缩写,是ISO/IEC JTC1/SC2/WG2的一个子组。(请参见附录E,汉族统一史.)
ISCII公司。信息交换印度文字代码的缩写。
ISO 10646标准(请参见 ISO/IEC 10646标准.)
ISO/IEC 10646标准ISO与Unicode标准同步维护的字符编码标准。
J
加莫。单曲的韩语名称的信件朝鲜文脚本。贾莫斯用于构成朝鲜文音节。
Joiner公司一个无形的角色影响周围角色的连接行为。(请参见第9.2节,阿拉伯语和中的“草书连接”第23.2条,布局控制.)
收音一个或一个序列韩语中更多的尾音辅音。
JTC1号机组.联合技术委员会国际标准化组织和国际电工委员会负责信息技术标准化。
中城一个或一个序列韩语中元音更多。
K(K)
假名. 所用两个音节文字的统称(连同汉字和罗马语)日本人写的写入系统。这两种形式是平假名和
片假名.
汉字汉字的日文名称;派生自中文单词哈尼兹.也被罗马化为甘孜语.
片假名(カタ)。与日语书写系统。片假名音节通常用于借用词汇的表示(源于中国的词汇除外),一些植物或动物名、音符号感叹词、重音或日语中的“难”汉字。(另请参见平假名.)
紧排.(1)将某些字母对之间的空格更改为改进文本的外观。(2) 映射的过程用于更改空间的定位偏移的符号对在字母之间。
朝鲜语音节Block. 由一个或多个前导字母组成的一系列韩国jamo辅音后面跟着一个或多个元音,后面跟着零个或更多个元音尾随辅音,或任何规范上等效的序列包括预编的朝鲜文音节。在正则表达式中注释:长宽比V*T*。也称为标准朝鲜语音节块(请参见第3.12节,连接Jamo行为.)
L(左)
L10个(请参见本地化.)
低密度脂蛋白(请参见Unicode区域设置数据标记语言.)
主要辅音.(1)在韩语中,带有Hangul_Syllable_Type属性值Leading_Jamo(在范围内U+1100..U+1159或U+115F汉城choseong填料). 缩写为L(左)(参见中的定义D122第3.12节,连接Jamo行为.) (2) 音节中的任何声母。
主要代理人.同义词高代理代码单元.
信件(1)字母表中的一个元素。从广义上讲,它包括音节和表意文字的要素。(2) 的信息属性用于书写单词的字符。
连字。表示两个或多个组合的符号字符。在拉丁文字中,现代使用的只有少数,例如“f”和“i”之间的连字或“f”与“l”之间的连接。其他脚本根据字体使用许多连字和风格。
小发动机.存储多字节的计算机体系结构首先是最低有效字节(LSB)值的数值。
本地化(1)调整软件产品以使用适合当地市场的语言和约定的过程,例如调整英美软件产品以在阿根廷使用西班牙语。(2) 软件产品翻译的管理,包括可翻译文本的提取、翻译的管理和语言资源模块的生成。也称为缩写“L10n”。本地化产生“本地化”的软件产品。(请参见国际化,全球化.)
逻辑顺序。中的顺序哪个文本存储在内存表示中。在大多数情况下,逻辑顺序对应于键入顺序和语音顺序。(请参见 显示顺序和第2.2节,Unicode设计原则.)
逻辑存储.内存表示。
行车记录仪(或标志图). (1) 主要代表单词(或语素)的符号,与声音或发音形成对比。(2) 逻辑音节书写系统的书写单位的通用术语。在这个意义上,符号(或符号)并没有系统地与表意文字(或表意文字)区分开来。(请参见表意文字,象形文字.)
Logosyllabary公司一种书写系统,其中的单位主要用于书写单词和/或单词的语素,一些辅助用法仅表示音节音。最好的例子是汉字。
小写字母(请参见
案例.)
低代理代码点. 范围为U+DC00到U+DFFF的Unicode码位。(见定义D73英寸第3.8节,代理人.)
低代理代码单元. DC00范围内的16位代码单元16至DFFF16,在UTF-16中用作代理项对的尾随代码单元。也称为拖尾代理(参见中的定义D74第3.8节,代理人.)
最低有效位.的缩写最低显著性字节.
LZW公司.的缩写Lempel-Ziv-Welch公司, 广泛用于数据压缩的标准算法。
M(M)
马朱苏莱.同义词大写(请参见案例.)
数学性质.字符的信息属性在数学公式中用作运算符。
马特拉。印度语脚本中的从属元音。它是的名称按逻辑顺序跟在辅音字母后面的元音字母。A类matra的字体通常与用作独立字母的同一语音元音。
MBCS系统.缩写
多字节字符集.
MIME公司.多用途Internet邮件扩展。MIME是一个标准允许嵌入任意文档和其他二进制数据处理的电子邮件中的已知类型(图像、声音、视频等)普通互联网电子邮件交换协议。
最小井形代码单元子序列.映射到单个Unicode标量值的格式良好的Unicode代码单元序列。(参见中的定义D85a第3.9节,Unicode编码形式.)
微小的.同义词小写字母(请参见案例.)
镜像属性. The 图像在中水平镜像的字符的属性从右到左(相对于从左到右)布局的文本右侧)。(请参见第4.7节,Bidi镜像.)
缺少Glyph(请参见
替换图示符.)
修饰字母.一个字符在Unicode字符数据库中使用Lm General Category。修饰字母看起来像字母或标点符号,可以修改其他字母的发音(类似于变音符号)。(请参见第7.8节,修饰字母.)
蒙古语自由变体选择器。的子集变体选择器,编码范围为U+180B。。U+180D,专门用于定义标准化变更序列用于蒙古文脚本。无蒙古语变体选择器总是以蒙古语字母为基础,但在架构上与通用变体选择器没有区别。通常缩写为FVS1、FVS2和FVS3。
蒙古语变体序列.A型标准化变更序列它以蒙古文字母为基本字符。目前定义的所有蒙古变异序列都使用范围为U+180B的无蒙古变异选择器。。U+180D,但没有体系结构约束阻止此类序列也使用范围为U+FE00.U+FE0D的通用变体选择器字符。蒙古语变体序列很少见,因为许多变体序列指定了位置上下文(例如,首字母、中间字母或尾字母)以及特定的字形表示。
单调的.现代希腊语以基本口音书写托诺斯.
莫拉音系术语:在某些语言中决定音节重量的发音。一些音节具有更多反映冰碛结构的特征或者不太准确。尤其是日语假名音节实际上每个mora写一个字符,而不是每个音节。瓦依语音节表也将最后的鼻音视为不同的moras,写moras而不是音节。
最高有效位.的缩写最高有效字节.
多字节字符集.用变量编码的字符集每个字符的字节数,通常缩写为MBCS系统.许多大型字符集被定义为MBCS,以保持严格与的兼容性ASCII码子集和/或ISO/IEC 2022。
N个
命名Unicode算法. Unicode标准或Unicode联盟发布的其他标准,即为了便于参考,给出了一个明确的名称。(参见中的定义D18第3.4节,字符和编码另见表3-1,“命名Unicode算法,”以获取命名的Unicode算法列表。)
命名空间.(1)一组名称,无其中两个是相同的。(2) 一组名称和名称匹配规则,以便匹配下的所有名称都是不同的规则。(参见中的定义D6第3.3节,语义.)字符如果名称匹配项下的名称不匹配,则名称是不同的标准的有效规则。
内库多.表示元音或其他修饰的符号希伯来语中的辅音字母。
中性字符.可以直接写入的字符从左到右,取决于上下文。(请参见Unicode标准附录9,“Unicode双向算法”)
非金融公司(请参见规范化表格C.)
非金融机构(请参见规范化表D.)
NFKC公司(请参见规范化表KC.)
NFKD公司(请参见标准化表格KD.)
非字符.一个代码点是永久保留的,并且永远不会分配给抽象字符。非字符由值U组成+n个FFFE和U型+n个FFFF(其中n个从0到1016)、和值U+FDD0..U+FDEF。请参阅上的常见问题解答专用字符、非字符和哨兵.
非联合体.一个无形的角色这会影响周围角色的连接行为。(请参见第9.2节,阿拉伯语和中的“草书连接”第23.2条,布局控制.)
不可覆盖。Unicode字符属性的特征不能被更高级别的协议更改。
非空格音符.变音符号非间隔标记.
无间隔标记.A组合带有非间距标记一般类别(Mn)的字符或附上标记(Me)。(参见中的定义D53第3.6节,组合.)展示中非间隔标记的位置取决于其基本字符。它通常不占用空间沿着视觉基线。(另请参见组合字符.)
非星分解。映射到由多个字符组成的序列的规范分解,该序列中的第一个字符不是Starter。(用于Unicode规范化表单的定义。)(请参阅定义D111英寸第3.11节,规范化表格.)
规范化. A process of 从中删除等价序列的替代表示文本数据,将数据转换为可以二进制比较等效性。在Unicode标准中,规范化特别指处理,以确保标准等价(和/或兼容等价)字符串具有独特的表现。有关更多信息,请参阅“等效序列“in第2.2节,Unicode设计原则、和第3.11节,规范化表格.
规范化表单.四种Unicode规范化形式之一定义于第3.11节,规范化表格-即NFC、NFD、NFKC和NFKD。有关更多信息和示例,请参阅第1.1节,规范和中的兼容性等效Unicode标准附件#15,“Unicode规范化格式”
规范化表格C(非金融公司). 消除任何规范差异的规范化形式,以及通常会产生一个合成的结果。例如,+umlaut是以这种形式转换为ä。这种形式与传统形式最为匹配用法。形式定义是D120英寸第3.11节,规范化表格.
规范化表D(非金融机构). 消除任何规范差异的规范化形式,以及生成分解的结果。例如,ä被转换为+这种形式的变音。这种形式最常用于内部处理,例如在排序中。这个形式定义为D118第3.11节,规范化表格.
规范化表KC(NFKC公司). 消除规范性和兼容性的规范化形式差异,通常会产生一个合成结果:例如,单个dž字符以这种形式转换为d+z。这种形式通常用于匹配。这个形式定义为D121第3.11节,规范化表格.
标准化表KD(NFKD公司). 消除规范性和兼容性的规范化形式差异,并生成分解结果:例如单个字符以这种形式转换为d+z+caron形式定义为D119第3.11节,规范化表格.
规范。需要符合Unicode标准。
NSM公司.的缩写
非间隔标记.
数值属性. 用于表示数字的字符属性。(请参见第4.6节,数值.)
O(运行)
过时的。适用于当前不再使用的字符,但这在历史上一直被使用。字符是否已过时取决于上下文:例如,西里尔字母大禹是俄文已过时,但在现代保加利亚语中使用。(不一样作为不赞成的.)
八倍频程。八位的有序序列被视为一个单位。这个Unicode标准遵循当前行业惯例八位字节作为字节(请参见字节.)
正交音节.构成单位的象形文字的二维视觉排列婆罗门经文。也称为阿克萨拉正字法音节的核心是一个基本字符,可以是辅音、独立元音或(在某些脚本中)数字字符,或由基本字符和其他字符组成的连字。附加到此核心可以是依赖形式(例如半形式、附加形式、repha形式、中间形式辅音或独立元音,以及努克塔标记、维拉玛标记、,从属元音标记、寄存器移位标记、声调标记、最后辅音标记和其他标记。正字法音节的不同成分形成是很常见的结扎。正字法音节通常与语音音节不对应;语音音节的最后辅音通常成为后续正字法音节的基本字符,有时甚至是从属形式。
带外.银行外渠道传递额外信息以这样一种方式处理文本内容,即编码后的文本内容完全未经修改。这通常由以下人员完成指向文本的独立数据结构。
可覆盖的。Unicode字符属性的一个特征可以通过更高级别的协议进行更改,以创建所需的实施效果。
Oxia公司。希腊语中表示重音的术语,用于多音希腊字符名称。
P-Q公司
段落方向.默认方向(左边或正确的)的段落的文本。此方向不会改变显示阿拉伯语或英语单词中的字符顺序。然而,它做更改相邻阿拉伯语和英语单词的显示顺序,以及中性字符的显示顺序,例如标点符号和空间。有关更多详细信息,请参阅Unicode标准附件#9,“Unicode双向算法,“尤其是BD2–BD5的定义。
段落嵌入级别. 确定默认双向的嵌入级别该段落中文本的方向。
佩里斯波门尼。希腊语中表示扬抑音的术语,用于多音希腊字符名。
音素.特定背景下的最小清晰声音口语。例如,在美式英语中,/p/和/b/是不同的音素是因为拍打和蝙蝠是不同的;然而,两者/t/in的不同发音打上钩和粘贴在中不明显英语,尽管它们在其他语言中是不同的,例如泰语。
象形文字(或象形图). 例如,通过或多或少的传统视觉相似性来表示物体的任何符号,✈. (请参见表情符号,表意文字,标志记录器.)
拼音.基于普通话发音的汉语罗马化标准体系。
数据透视转换。使用第三个字符编码作为两个其他字符之间转换的中间步骤编码。Unicode标准被广泛用于支持pivot转换,因为它的字符库是大多数其他字符的超集编码字符集。
纯文本。包含以下内容的计算机编码文本只有序列的来自给定标准的代码点,没有其他格式或结构信息。通常使用纯文本交换不共享高级协议的计算机系统之间。(另请参见富文本.)
平面.范围为65536(1000016) 连续的Unicode代码点,其中第一个代码点是65536(10000)的整数倍16). 平面已编号从0到16,数字是平面除以65536。因此,平面0为U+0000..U+FFFF,平面1为U型+10000…U+1FFFF。。。,和平面16(1016) 是U+100000。。10FFFF公司。(注意ISO/IEC 10646使用平面号的十六进制表示法,例如平面B,而不是平面11)。(请参见基本多语言平面和补充的平面.)
点数(1)书写希伯来语的非空格元音和其他符号。(2) 印刷术中的计量单位。
多元醇古希腊人用几种对比的口音书写。
预合成字符(请参见可分解特征.)
演示文稿表单.已编码的连字或变体符号作为兼容字符。(另请参见
兼容性特征(1) )
初级复合材料.A型非完全组合排除的标准可分解字符。(用于Unicode规范化表单的定义。)(见定义D114在里面第3.11节,规范化表格.)
私人使用。指Unicode中指定的代码点标准或其他字符编码标准,其解释这些标准中没有规定,其用途可以确定通过合作用户之间的私下协议。
私人使用区(PUA).任何Unicode中的三个私用代码点之一标准。
专用字符。已分配给私用代码点通过私人协议。
专用代码点. 范围为U+E000.U+F8FF、U+F0000.U+FFFFD的代码点,以及U+100000…U+10FFFD。(参见中的定义D49第3.5节,属性.)这些代码点在专用Unicode标准。
生产性.指一个特征或可用于新组合或情况的规则,而不是局限于一个固定的列表。在Unicode中标准的组合标记——特别是重音符号——是有成效的。相比之下,变体选择器故意没有效率。也称为
生成的.
财产(请参见
字符属性.)
属性别名.独一无二的特定Unicode字符属性的标识符。(请参见定义D47在第3.5节,属性.)
属性值别名.A型特定枚举值的唯一标识符Unicode字符属性。(参见中的D48定义第3.5节,属性.)
Prosgegrameni公司.希腊语中附加词iota的术语,用于多音希腊字符名称。
临时的.未经批准且暂时的属性或功能,这可能是不完整的,或者不处于可用状态。
Psili公司.希腊语中平滑呼吸标记的术语,用于多音希腊字符名称。
PUA公司.的缩写私人使用区.
普氏一号.泰米尔语名称维拉马(请参见维拉马.)
Puny代码.Punycode是一种算法,定义于副本请求3492,它使用7位ASCII简洁地表示Unicode字符串,同时不映射ASCII字符。Punycode字符串可以通过其特征前缀“xn--”来识别。Punycode用于转换国际域名ASCII兼容表格。
R(右)
激进派.传统意义上的汉字结构成分用于索引。这种部首的传统数量是214。
致使.(1)选择和布局符号的过程描绘人物的目的。(2) 制作过程显示设备上可见的符号。
剧目(请参见
角色剧目.)
替换字符. 一种字符,用于替代另一编码中无法解释的字符。Unicode码标准使用U+FFFD替换字符用于此函数。
替换标志符号。用于呈现不能以特定字体呈现正确外观。它经常发生显示为开放或黑色矩形。也称为缺少字形(请参见第5.3节,未知和缺失字符.)
可重新排序的对.编码字符序列中的两个相邻字符A和B<A,B>是可重排序对当且仅当ccc(A)>ccc(B)>0时。(用于Unicode规范化表单的定义。)(请参阅定义D108第3.11节,规范化表格.)
保留的代码点.为将来分配而保留的Unicode标准的任何代码点。也称为未分配代码点(参见中的定义D15第3.4节,字符和编码、和第2.4节,代码点和字符.)
RGI公司。通用交换建议的缩写。这是一个用于Unicode技术标准#51,“Unicode Emoji”,是指一组更大的表情符号(或表情符号序列)的子集,这些表情符号打算在多个平台上得到广泛支持。请参见使用RGI。
RTF格式也称为样式文本.添加的结果信息转换为纯文本。可以添加的信息示例包括字体数据、颜色、格式信息、语音注释、行间文本等。Unicode标准不处理富文本的表示。预计系统和应用程序将实现富的专有形式文本。一些公共形式的富文本可用(例如,ODA、,HTML和SGML)。删除除主要内容以外的所有内容时在富文本中,只应保留纯文本。
罗马吉语(罗马字符的日文名称,即拉丁字母。拉丁字符在日语书写系统中很常见作为单个字母,或完整的单词、缩写词或借用自其他语言。(另请参见汉字和假名.)
排。256个连续的Unicode代码点的范围,其中第一个码位是256的整数倍。两个代码点位于如果它们共享除最后两个十六进制数字以外的所有数字,则为同一行。(请参见飞机.)
S公司
山姆叙利亚语缩写标记的缩写。
SBCS公司.的缩写单字节字符集.任何单字节字符编码。该术语通常与数据库控制系统和/或MBCS系统.
标量值(请参见
Unicode标量值.)
脚本.信件和用于表示文本的其他书面符号一个或多个书写系统中的信息。例如,俄语是用西里尔字母的子集编写;乌克兰语是书面的具有不同的子集。日语书写系统使用几个脚本。
连续体脚本一篇文章没有空格或标点符号的样式。
SCSU公司.标准压缩的缩写Unicode方案。请参见Unicode技术标准#6,“Unicode的标准压缩方案”
半稳定比较(请参见确定性比较.)
SGML公司标准通用标记语言。标准框架,ISO 8879中定义的,用于定义特定的文本标记语言。SGML框架允许混合描述使用文档的纯文本内容格式化,以便使用花哨的文本可以在纯文本数据流中完全描述。(另请参见HTML格式, XML格式, 和富文本.)
塑造角色.具有不同字形的字符取决于上下文。
日文.日语字符编码的移位编码标准,JIS X 0208,广泛部署在PC中。
签名.可选代码编码字符流开头的序列标识了字符编码方案用于以下目的文本。(请参见Unicode签名.)
单点分解。从字符到不同单个字符的规范分解映射。(用于Unicode规范化表单的定义。)(请参阅定义D110英寸第3.11节,规范化表格.)
正弦图.汉字的技术术语。在Unicode标准中,汉字被系统地称为CJK表意文字或汉字表意文字。(请参见表意文字.)
国际单位制。单位为国际单位制,公制的现代形式。这包括基本单位系统,例如秒、米、,和千克,一组派生单位,如牛顿、焦耳和伏特,以及一组修改前缀,如milli-、nano-、pico-、mega-、,giga-、tera-等等。
上海国际机场.的缩写日文.
小写字母.同义词小写字母(请参见案例.)
排序(请参见
整理.)
间距标记.A型组合字符那不是一个非起搏标记。(参见中的定义D55第3.6节,组合)(请参见非间隔标记.)
稳定的比较(请参见确定性比较.)
稳定排序。一种排序,其中两条记录的字段比较结果相等,如果根据该字段进行排序,则它们将保持相对顺序。这是排序算法的属性,而不是比较机制的属性。例如,冒泡排序是稳定的,而快速排序则不是。
标准韩语音节Block. (请参见朝鲜语音节块.)
标准化变更顺序.A型变化序列定义在UCD公司数据文件StandardizedVariants.txt。标准化的变化序列不能以表意字符为基础,它使用变量选择器在范围U+FE00.U+FE0F或U+180B。。U+180D。请注意,当应用于表情符号基本字符时,U+FE0E和U+FE0是为特殊功能保留的。请参见Unicode技术标准#51,“Unicode Emoji”术语标准化变异序列有时缩写为“SVS”。
开胃菜.组合类为零(ccc=0)的任何代码点(指定或未指定)。(用于Unicode规范化表单的定义。)(请参阅定义D107第3.11节,规范化表格.)
静态表单(请参见
可分解特征.)
样式化文本(请参见富文本.)
副标题标记一种格式字符,其图形形式扩展到以下字符的序列,例如U+0600阿拉伯数字符号.
补充字符。一个Unicode编码字符,具有补充码位。
补充代码点。介于U+10000和之间的Unicode代码点U+10FFFF。
补充平面.平面1至16,包括补充代码点。
代理字符.用词不当。它将是一个编码字符拥有代理代码点,这是不可能的。不要使用此术语。
代理代码点.A型Unicode码位在U+D800..U+DFFF范围内。保留供UTF-16使用,其中一对代理代码单元(高代理后接低代理)“代替”补充码位。
代理对.A单个抽象字符的表示,该抽象字符由两个16位代码单元的序列,其中该对的第一个值是一个高代理代码单元、和第二个是低代理码单元. (参见中的定义D75第3.8节,代理人.)
教学大纲一种书写系统其中每个符号都代表辅音和元音,或在某些情况下不止一个辅音和一个元音。
音节(1)音节的一个要素。(2) 基本单位与肺脉搏相对应的发音。
音节Block.序列应分组到单个方形单元格中的朝鲜语字符用于显示。(请参见第3.12节,连接Jamo行为.)
对称交换。使用镜像字形,当其解析方向性为从右向左时双向上下文。(请参见镜像属性和Unicode标准附录9,“Unicode双向算法”)
吨
标记.文本属性与点或范围的关联主要文本的。特定标记的值通常不是被认为是文本“内容”的一部分。A典型标记的示例是标记部分的语言或字体文本的。
可定制。算法的一个特征更高级别的协议可能会指定与这些不同的结果在算法中指定。一种无需实际操作的可裁剪算法裁剪也被称为默认算法没有裁剪的算法称为默认结果。
坦温. 阿拉伯文字中用来表示用长元音或鼻音化发音。的一个子类型塔什基尔.
塔什基尔. 阿拉伯文字中用来表示文本的发音,以及其他类型的语音指南纠正发音。基本阿拉伯字母加上任何此类标记都不会被编码为单个预编码字符,并且应该始终表示为字母序列加上组合标记。对比度伊亚姆。另请参阅高谈阔论,坦温、和第9.2节,阿拉伯语.
TES公司.的缩写传输编码语法.
TeX公司.设计用于排版的计算机语言特别适用于排版数学和其他技术材料。(根据唐纳德·克努思的说法,TeX与这个词押韵咩咩.)
文本元素.与特定文本相关的最小文本单位文本处理,在给定的写作系统中。一般来说,文本元素和代码点之间的映射是多对多的。(请参见第2章,一般结构.)
标题酶.大写首字母后接小写字母用文字表示。标题、标题和词条,如本词汇表所示。
Titlo字母旧教堂斯拉夫文中使用的上标字母(写在上面)。
音调Sandhi.A音韵学声调中与一个音节相关联的过程语言影响与相邻音节。
音调标记.A型变音的或非起搏标记代表音素的音调。声调语言在东南亚和非洲很常见。因为声调总是伴随元音(音节核心)最常用的是功能独立的标记附在元音符号上。然而,一些书写系统,如辅音符号上的泰语位置声调标记;中文不使用声调标记(除非是按音素书写的)。
音调指基础,语言中声调系统的独特单位。音调的音调语言通常指数字(“音调1”、“音调2”和以此类推),每个音调都有一个理想化的、特定的音阶或被认为是其张力值的轮廓。术语是通过类比创建音位的.
色调。指表面,音调系统中音调的实际音调实现。色调值是什么可以通过跟踪俯仰轮廓直接测量实际语音记录。这个术语是通过类推而产生的语音的.
托诺斯.现代希腊语的基本口音,具有锐音符的形式口音。
尾随辅音. (1) 朝鲜语中具有Hangul_Syllable_Type属性的jamo字符值Trailing_Jamo(范围U+11A8..U+11F9)。缩写为
吨(参见中的定义D128第3.12节,连接Jamo行为(2)音节中的最后辅音。
追踪代理人.同义词
低代理代码单元.
转码.不同字符数据之间的转换字符集。
传输编码语法. 应用于文本和其他数据的可逆转换,以允许以Base64、uuencode为例进行传输。
转换格式.从编码字符序列到唯一的代码单元序列(通常是字节)。
三角测量(请参见
枢轴转换.)
排版交互. 相对位置中一个非间距标记的图形应用到已经被另一个非空格占据的字素基标记,以便必须进行一些渲染调整(例如默认堆叠或并排放置)以避免难以辨认象形文字的重叠或碰撞。(参见中的D106定义第3.11节,规范化表格.)
U型
UAX公司.的缩写Unicode标准附件.
加利福尼亚大学.的缩写Unicode排序算法.
UCD公司。的缩写Unicode字符数据库(请参见第4.1节,Unicode字符数据库.)
UCS公司.通用字符的缩写套,由国际标准ISO/IEC 10646规定,这在曲目上与Unicode标准相当。
UCS-2型.ISO/IEC 10646编码形式:以2个八位字节编码的通用字符集,仅限于基本字符集多语言平面。(请参见附录C,与ISO/IEC 10646的关系.)
UCS-4公司.ISO/IEC 10646编码形式:以4个八位字节编码的通用字符集。(请参见附录C,与ISO/IEC 10646的关系.)
乌姆劳特.字母上的两个水平点,如德语科普菲. The 元音变音与透析Unicode格式字符编码。(请参见透析.)
未分配字符。未分配给抽象字符的代码点。这是指代理代码点、非字符、,和保留的代码点。(请参见第2.4节,代码点和字符.)
未分配的代码点.同义词保留码位.
未指定的代码点.同义词保留码位.
单幅相机.一个没有案例区别。最常用的在欧洲字母的上下文中。
Unicode码.(1) 书写世界所有语言所用字符的数字表示标准。Unicode为任何语言的文本存储、搜索和交换提供了统一的方法。它被所有现代计算机使用,是在互联网上处理文本的基础。Unicode由Unicode联盟开发和维护:https://www.unicode网站(2)应用于Unicode联盟开发和维护的软件国际化和本地化标准的标签。
Unicode算法. The 用于实现指定结果的过程的逻辑描述包含Unicode字符。(参见中的定义D17第3.4节,字符和编码.)
Unicode字符数据库。一组文件提供规范性和信息性Unicode字符属性和映射。(请参见第章4.字符属性、和Unicode字符数据库.)
Unicode排序算法. 可定制的文本比较机制,和匹配的Unicode字符串。请参见Unicode技术标准#10,“Unicode排序算法”
Unicode公共区域设置数据存储库. 由Unicode联盟(https://cldr.unicode网址). 此存储库提供本地化所需的信息将软件产品转换为多种语言其他事项):日期、时间、数字和货币格式;排序,搜索和匹配信息;和翻译的名称语言、地区、脚本、货币和时区。(请参见也Unicode区域设置数据标记语言.)
统一码协会一个标准开发组织,创建广泛使用的与字符编码相关的规范,以及用于软件国际化和本地化。主要项目是Unicode标准和Unicode区域设置项目,它们定义了所需的标准化数据存储库为特定地区和文化开发软件。该联盟成立于1991年,总部位于加利福尼亚州山景城。它目前的成员包括主要的软件公司、政府和学术机构。请参见https://www.unicode网站.
Unicode编码形式. 一种字符编码形式,将每个Unicode标量值分配给唯一的代码单元序列。Unicode标准定义了三个Unicode编码形式:UTF-8、UTF-16和UTF-32。(见定义D79英寸第3.9节,Unicode编码形式.)
Unicode编码方案。的指定字节序列化Unicode编码形式,包括处理规范的字节顺序标记(BOM),如果允许。(见定义D94在里面第3.10节,Unicode编码方案.)
Unicode区域设置数据标记语言. 用于交换区域设置数据的XML规范,由Unicode技术标准#35,“Unicode区域设置数据标记语言(LDML)。”(另请参见Unicode通用区域设置数据存储库.)
Unicode标量值.任何Unicode
代码点高代理除外和低代理代码点。换句话说整数0到D7FF16和E00016至10FFFF16包容的。(参见中的定义D76第3.9节,Unicode编码形式.)
Unicode签名。用于将文件标识为的隐式标记包含特定编码形式的Unicode文本字节顺序标记(物料清单)可以用作Unicode签名。
Unicode标准附件. 作为单独出版的Unicode标准的组成部分文档。
Unicode字符串.A代码单元包含特定Unicode编码形式的代码单元的序列(无论格式是否正确)。(参见中的定义D80第3.9节,Unicode编码形式.)
Unicode技术说明. 包含可能感兴趣信息的信息性出版物关于Unicode标准或相关主题。
Unicode技术报告. 正式批准的Unicode联盟出版物,包含与Unicode相关的主题的信息技术分析标准。
Unicode技术标准正式批准的规范由与Unicode相关但不属于Unicode的Unicode联盟标准。
Unicode转换格式。两者的同义词不明确Unicode编码形式或Unicode编码方案.后一项现在是首选。
统一.识别中的字符的过程在书写系统中很常见。
UPA公司.乌拉尔语拼音字母的缩写。
大写(请参见
案例.)
城市轨道交通。Unified Repertoire and Ordering的缩写,原始集合属于中日韩Unicode标准中使用的统一表意文字。
用户定义的字符. (请参见欧盟数据中心.)
用户感知的字符. 每个人都认为剧本中的角色是什么。
联合技术框架。的缩写Unicode码(或UCS公司)转换格式.
UTF-2型。的过时名称
UTF-8型.
UTF-7型Unicode(或UCS)转换格式,7位编码形式,由指定副本请求2152.
UTF-8型。文本的多字节编码,用1到4个字节表示每个Unicode字符,并与ASCII向后兼容。UTF-8是的主要形式Unicode码在网页中。更具技术性:(1)这个UTF-8编码形式.(2)UTF-8编码方案(3)ISO/IEC 10646:2003附录D中定义的“UCS转换格式8”,在技术上等同于Unicode标准中的定义。
UTF-8编码形式. The Unicode编码形式,将每个Unicode标量值分配给按规定,长度为1到4个字节的无符号字节序列在表3-6中,“UTF-8位分布”。(参见中的定义D92第3.9节,Unicode编码形式.)
UTF-8编码方案. 序列化UTF-8代码单元的Unicode编码方案序列的顺序与代码单元序列本身的顺序完全相同。(参见中的定义D95第3.10节,Unicode编码方案.)
UTF-16型。文本的多字节编码用2或4个字节表示每个Unicode字符;它不是与ASCII向后兼容。它是Unicode码英寸许多编程语言,如Java、C#和JavaScript,以及许多操作系统。更具技术性:(1)这个UTF-16编码形式.(2)UTF-16编码方案.(3)“转换格式ISO/IEC 10646:2003附录C中定义的16个00组平面;在技术上等同于Unicode标准中的定义。
UTF-16编码表. 在中分配每个Unicode标量值的Unicode编码形式范围U+0000..U+D7FF和U+E000.U+FFFF到单个无符号16位代码单位,其数值与Unicode标量相同值,并指定范围中的每个Unicode标量值根据表3-5,U+10000..U+10FFFF到代理项对,“UTF-16位分配”(参见中的定义D91第3.9节,Unicode编码形式.)
UTF-16编码方案. 序列化UTF-16代码单元的UTF-16编码方案序列作为字节序列在大-中或小-中格式。(参见中的定义D98第3.10节,Unicode编码方案.)
UTF-16BE型.Unicode编码将UTF-16代码单元序列序列化为字节的方案序列采用大-中格式。(参见中的定义D96第3.10节,Unicode编码方案.)
UTF-16LE型.Unicode编码将UTF-16代码单元序列序列化为字节的方案序列为little-endian格式。(参见中的定义D97第3.10节,Unicode编码方案.)
UTF-32型。文本的多字节编码代表每个Unicode码4个字节的字符;它不是与ASCII向后兼容。更具技术性:(1)UTF-32编码形式.(2)UTF-32编码方案.
UTF-32编码形式. The Unicode编码形式,将每个Unicode标量值分配给单个无符号32位代码单元,其数值与Unicode标量值。(参见中的定义D90第3.9节,Unicode编码形式.)
UTF-32编码方案. 序列化UTF-32代码单元的Unicode编码方案序列作为字节序列在大-中或小-中格式。(参见中的定义D101第3.10节,Unicode编码方案.)
UTF-32BE标准.Unicode编码方案将UTF-32代码单元序列序列化为中的字节序列大引擎格式。(参见中的定义D99第3.10节,Unicode编码方案.)
UTF-32LE型.Unicode编码方案将UTF-32代码单元序列序列化为中的字节序列little-endian格式。(参见中的定义D100第3.10节,Unicode编码方案.)
UTN公司.的缩写Unicode技术说明.
UTR公司.的缩写Unicode技术报告.
UTS公司.的缩写Unicode技术标准.
V(V)
瓦里亚.希腊语中的重音,用于多音希腊字符名称。
变体选择器。指定用于定义变化序列.U+FE00..U+FE0F范围内的变体选择器称为通用变体选择器和用于标准化变异序列。其中两个U+FE0E和U+FE0与一起使用时具有特殊功能表情符号基本字符。U+180B范围内的变体选择器。。U+180D称为蒙古语自由变体选择器; 它们的使用仅限于蒙古文的标准变体序列。U+E0100..U+E01EF范围内的变量选择器称为表意文字的变体选择器和用于表意变化序列。变体选择器都是非空格组合标记(General_Category=Mn)。他们没有自己的图形形状;相反,它们的作用是为应用它们的基本字符挑选一个特定的、已定义的潜在图形表示子集。所有变体选择器都是默认可忽略代码点(DICP=Yes),这意味着如果它们不能与其基本字符结合使用进行解释,则应忽略它们进行显示,而不是用不可显示的字形框显示。请参见第23.4条,变体选择器。术语变体选择器有时缩写为“VS”。
变更顺序.由两个代码点组成的序列:基本字符(或间距标记[gc=Mc])后跟单个变量选择器。两个字符的序列被称为变体基本字符或间距标记。变化序列的功能是挑选出基本字符(或间距标记)潜在图形表示的特定、定义的子集。并非所有基本字符和变体选择器的潜在组合都有解释。只有以下变化序列具有有效解释:标准化变更序列,a已注册 表意变化序列,以及在与关联的数据文件中定义了表情符号基字符的变体序列Unicode技术标准#51,“Unicode Emoji”.
维拉玛来自梵语。许多印度语中使用的符号名称和其他婆罗门语派生的文字来压制应用它的辅音,从而生成死亡辅音(请参见第12.1节,梵文.)标志形状不同从一个脚本到另一个脚本,可以通过各种其他名称来知道语言。例如,在印地语中,它被称为哈尔或
哈兰特,英寸孟加拉语,它被称为哈桑,在泰米尔语中称为普利亚语.
视觉模糊.由两个字符(或(字符序列)无法区分地呈现。
视觉顺序.字符按阅读顺序排列。(与
逻辑顺序.)
发声.置于辅音上方、下方或内部的标记指出元音或发音的其他方面。的一个功能中东脚本。
元音.在韩语中,带有Hangul_Syllable_Type属性值Vowel_Jamo(在范围内U+1161..U+11A2或U+1160hangul-jungseong填料). 缩写为V(V). (参见中的定义D125第3.12节,连接Jamo行为.)
元音标记。在许多脚本中,用于表示元音或元音质量。
弗瑞奇。希腊语中短重音的术语,用于多音希腊字符名称。
W公司
W3C公司。万维网联盟的缩写。
wchar_t型ANSI C定义宽字符类型,通常实现16或32位。ANSI指定wchar_t为整数类型,并且C语言源字符集可由映射简单扩展(零或符号扩展)。
井格式代码单元序列.遵循Unicode编码形式规范的一种代码单元序列。(参见中的D85定义第3.9节,Unicode编码形式.)
书写方向.书写的方向或方向书写系统中文本行内的字符。三方向在现代书写系统中很常见:从左到右,从右到左,从上到下。
写入系统。使用一个或多个脚本写一种特殊的语言。例如美国英语写作系统,英国英语写作系统,法语书写系统和日语书写系统。
X-Y轴
XML格式可扩展标记语言。SGML的子集,构成用于交换结构化数据的特殊文本标记语言。Unicode标准是XML内容的参考字符集。(另请参见
SGML公司 和富文本.)XML是万维网的商标网络联盟。
Ypogegrammeni公司.希腊语下标iota的术语,用于多音希腊字符名称。
Y型变型.两个具有相同语义和不统一形状,例如U+732B和U+8C93。(请参见Z变量.)
Z轴
Z变量.两个具有相同语义和统一的形状,例如,U+8AAA和U+8AAC。(请参见
Y型变型.)
曾卡库(请参见
全幅.)
零宽度.某些空格或格式控制的特征不沿水平基线推进文本的字符。(请参见非间隔标记.)