ZFIN斑马鱼命名约定

基于遗传趋势遗传命名指南（1998）

术语信息

目前的命名指南是对1992年3月在德国林贝格举行的一次会议上讨论期间制定的规则的更新，并被大多数斑马鱼实验室广泛接受。

斑马鱼命名委员会（ZNC）

我们的活动,贡献者
有关适当术语的问题和建议，请联系我们namenclature@zfin.org。

基因和突变名的批准

请使用我们的提交表格之一为基因或突变提出新名称，并提供支持信息。您提交的文件将发送给ZFIN命名协调员审查，并将保密处理

提交建议的基因名称
 提交拟定LOCUS/LINE名称

额外资源

斑马鱼基因命名建议指南
 实验室生产线名称

其他命名指南： 人类,
鼠标,苍蝇（果蝇）,酵母（酵母菌）,基因家族

1.基因名称和符号

完整的基因名称是小写斜体，基因符号是三个或三个以上的小写字母，并且也是斜体。这些字母对于其他命名的斑马鱼突变体和基因来说应该是唯一的。基因符号不应与小鼠或人类中的基因缩写相同，除非是在已建立的同源性的情况下，基因符号应与同源性的基因符号相匹配。斑马鱼的基因命名不应包括对物种的任何引用，例如d、dr、z或zf。不鼓励在基因名称或符号中使用标点符号，如句点和连字符，除非在以下描述的特定情况下。
基因名称应注册在ZFIN公司。

1.1. 基因命名法
只要可能，基因应该以哺乳动物的直系亲属命名。当已知哺乳动物的直系亲属时，应使用相同的名称和缩写，但所有字母均为斜体和小写。基因家族的成员按顺序编号。

示例：
姓名-雕刻1a，雕刻2b
符号-eng1a、eng2b

在某些情况下，当斑马鱼基因从旧的斑马鱼名称重新命名为哺乳动物同源基因时，最好在出版物中引用以前的名称。通过在括号中附加前一个名称来引用前一个姓名。可在ZFIN上搜索以前的姓名。

示例： shha（syu）、bmp2b（swr）

1.2、。重复的基因斑马鱼基因组中含有重复片段，这些片段是在鳍鳐谱系从瓣鳍谱系（包括鸟类和哺乳动物）分化后，在其谱系中发生全基因组重复而产生的。由于这个原因，斑马鱼通常有两个基因拷贝，在哺乳动物中以单个拷贝的形式存在。

在这些情况下，两个斑马鱼基因的符号应与人类或小鼠同源基因的核准符号相同，后跟“a”或“b”，以表明它们是重复的副本。在分配这些符号之前，重要的是通过映射提供证据，证明这两个副本位于重复的染色体片段上。最好在一个重复染色体片段中的所有拷贝使用相同的“a”或“b”后缀，尽管出于历史原因，这并不总是可能的。后缀a或b并不表示出版物的首要地位，将纯粹根据周围基因的后缀进行分配。此术语不适用于鳍鳐和瓣鳍鱼类发散之前产生的重复。在这些情况下，最好使用与哺乳动物命名法最一致的术语。

示例： hoxa13a、hoxa13b

在某些情况下，当有一个独特的哺乳动物直系同源物，但添加a、b后缀会与不同的哺乳动物基因符号冲突时，则应将数字后缀.1、.2附加到直系同源哺乳动物基因符号，而不是a、b。

具有单个哺乳动物直系血统的串联重复基因应具有附加有.1、.2的基因符号，使用与哺乳动物直系生物相同的符号。基因名称应包含“串联重复”字样。

示例： 肠碱性磷酸酶，串联重复1（alpi.1）和 肠碱性磷酸酶，串联重复2（alpi.2）

当哺乳动物的基因复制阻止识别独特的哺乳动物同源基因时，应选择另一个基因符号。一个可能的选择是从一个独特的非哺乳动物同源基因中获得批准的基因符号。当一个基因与人类基因同源，但同源性不明确时，该基因应以最接近的哺乳动物同源物命名，并在同源物名称后附加单词“like”。在某些情况下，斑马鱼中描述的基因家族与哺乳动物基因家族同源，但该基因家族的进化并不明确。在这种情况下，斑马鱼基因家族应以与哺乳动物基因家族相同的茎命名，基因编号从哺乳动物编号结束后开始，并在整个基因家族中按顺序继续。如果基因家族的成员在同一染色体上，相邻的基因应该被赋予序列号。

1.3. 带有未知基因的突变位点尚未确定基因的突变位点被赋予占位符基因名。当该基因被鉴定后，按照上述标准命名指南对其进行重命名。通过突变识别的基因通常被命名以反映突变表型。符号应源自全名。通常不应使用数字来命名变种人。

例子： 触感、凝灰岩

突变体名称应注册在ZFIN公司。

1.4. 仅通过基因组测序项目鉴定的基因
大规模基因组测序项目使用各种预测方法来识别开放阅读框架和基因。其中一些基因是已知的，而另一些是新的。通过这些方法识别的新基因通常无法被识别，并被指定一个由前缀、克隆名和整数组成的名称。前缀用于指定识别该基因的研究机构（例如，桑格研究所的“si”）。冒号将前缀与克隆标识符分隔开。在许多情况下，单个克隆中有多个预测读取帧。这些基因以克隆名称和整数之间的句号（句点）来区分。整数被分配给克隆中的基因，因为它们被识别，并不表示基因的顺序。如果在多个克隆中发现一个基因的一部分，则发现该基因5'部分的第一个克隆的名称优先。

示例： si:bz3c13.1，si:bz 3c13.2，si:b z3c13.3

随着更多关于基因测序项目的信息可用，最初由基因组测序项目识别的基因将使用标准命名指南（如上所述）进行重命名。

1.5. 仅由其他大规模项目识别的基因
EST或全长cDNA克隆集的大规模测序通常会导致大量未知基因。这些是带有项目前缀、冒号和克隆号的占位符名称，类似于基因组测序项目识别的基因。在这些情况下，克隆通常只包含单个基因的一个或一个片段。

示例： 电话：7044540，zgc:165514

1.6. 转录物变体
源自同一基因的转录变体通常不会被赋予不同的基因符号和名称。然而，出版物中可以通过在全名末尾添加逗号、“转录变体”和序列号来区分单个基因的变体；并在符号末尾添加下划线、“tv”和序列号。

示例：
姓名-肌球蛋白VIa,转录变体1，肌球蛋白VIa,转录变体2,
符号-myo6a_tv1 myo6a _tv2

1.7假基因

假基因是指通常未翻译和未翻译的序列，与已鉴定的基因具有高度同源性。然而，最近的研究表明，在不同的生物体或组织中可能会发生功能激活。伪基因将被指定为相关符号序列中的下一个数字，后缀为“p”表示伪基因，例如。1.9便士是“穿孔素1.9，假基因”的符号。

2.蛋白质类

蛋白质符号与基因符号相同，但非斜体，第一个字母为大写。

示例：Ndrw、Brs、Eng1a、Eng2b、Ntl

注意斑马鱼和哺乳动物命名约定之间的差异：

物种/基因/蛋白质
斑马鱼/什哈/Shha（什哈）
人类/SHH公司/SHH公司
鼠标/嘘/SHH公司

在出版物中，有时可以方便地提及一种蛋白质，该蛋白质已根据正形学改名，在当前名称后面的括号中使用更常见的名称。

示例：Shha（Syu）、Bmp2b（Swr）

3.等位基因和基因型

3.1线路名称

在描述基因时，野生型等位基因用上标“+”表示，而突变等位基因则用上标的行名称表示。线路名称由特定机构的名称和数字组成。有关机构名称的完整列表，请访问ZFIN公司。

特定机构的线路名称应为两个或三个字母，最好是两个字母。这些名称不应与小鼠或人类的基因名称相同。机构名称后面应紧跟特定行的唯一编号。其他字母不应紧跟机构名称后面，但可以附加到行名称的末尾，以使其唯一。行名称应仅包含字母数字字符。显性和半显性等位基因在系命名的第一个位置有一个d，以区别于隐性等位基因。半显性是指突变等位基因/野生型等位基因杂合子中突变表型的表型低于突变等位纯合子的情况。这意味着字母“d”不能作为机构名称的开头。转基因株系的命名遵循这些相同的规则，因此不能给转基因株系和突变等位基因指定相同的数量。

示例：“b”是尤金名称；“m”代表波士顿MGH；“t”是德国图宾根

野生型：洛夫 , ndr2 ，个brs ⁺

突变体：洛夫 ^{数据传输2} ,ndr2 ^第16页 ，ndr2 ^101米 ，ndr2 ^t219型

3.2出版物的基因型命名

单个基因座中的杂合子和纯合子通过斜线“/”分隔每个等位基因来描述。

示例：

ednrb1a型 ^140元 /ednrb1a型 ⁺ （杂合子，可以缩写ednrb1a型 ^140元/+ )

ednrb1a型 ^140元 /ednrb1a型 ^140元 （纯合，可以缩写ednrb1a型 ^{b140美元/b140美元} 或ednrb1a型 ^140元 )

对于涉及多个基因座的纯合基因型，每个基因座的基因型按照染色体数的顺序排列，从1到25，用分号分隔不同染色体上的基因座。

示例：

ednrb1a型 ^140元 ; slc24a5型 ^第16页

对于杂合基因型，同源染色体上的位点用斜线分隔。

示例：

功能梯度3 ^t21142型 /功能梯度3 ^t24149型 ; slc24a5型 ^第16页 /slc24a5型 ^592米

对于连锁的基因座，每个染色体上的单倍型是按顺序写的，用一个空格隔开共有基因座。基因座按其在染色体上的出现顺序排列，从上到下。同源染色体用斜线分开，非同源染色体用分号分开。

示例：

ednrb1a型 ^140元 cx41.8码 ^t1时间 ; slc24a5型 ^第16页

对于未映射的基因座，未映射基因座的基因型在括号内按字母顺序列出，排在不同染色体上映射基因座基因型之后。

示例：

ednrb1a型 ^140元 ; mycbp2 ^tj236号 {编辑 ^tl35型 }(电子数据交换未映射，则所有三个基因座都写在不同的染色体上）

同一染色体上分辨率较差的基因座按字母顺序排列在括号内。

示例：

{美国广播公司 ⁰⁰⁰ 定义 ^千立方米 }（同一染色体上分辨不清的基因座）ednrb1a型 ^第140页 ｛abcb ⁰⁰⁰ 定义 ^千立方米 }cx41.8码 ^t1时间 （在映射的基因座之间的已知间隔内，所有基因座都位于同一染色体上，但解析较差）

3.3 ZFIN中的基因型显示

由于技术限制，ZFIN的基因型按基因的字母顺序显示，然后按等位基因名称显示。有关涉及转基因或染色体重排的复杂基因型的显示，请参见下文。

4.染色体和畸变

染色体编号系统对应于旧的连锁群名称，即LG1，现在命名为Chr1。染色体由非斜体数字1至25表示。提醒：细胞遗传学鉴定的染色体数目不同于用于连锁群和参考基因组序列的“Chr”命名。在实验室菌株中未观察到雄性和雌性之间的染色体差异。

示例：
Chr1至Chr25

染色体重排用以下前缀表示，后面是括号内的细节。具体示例见下文。常见的前缀包括：

英国国防部，不足
Dp公司，重复
在，反转
是，插入
T型，易位
玻璃钢，转基因

4.1. 不足之处

缺陷被定义为删除或中断2个或多个相邻基因座的缺失。基因内缺失不被视为缺陷，而被视为小缺失，应被命名为受损基因的等位基因（见第3节）。

缺陷命名的一般格式为：
英国国防部(信道##：xxx)线路#

英国国防部表示不足。术语xxx个应描述研究人员确定的缺陷的显著特征。如果缺陷从命名基因中删除了序列，则名称应包含这些基因的标准符号基因。已知时，应按顺序列出删除的基因，并用逗号隔开。这个线命名应遵循标准命名惯例（机构命名后接行号）。

缺陷图应使用两位数字（即03代表Chr03）通过编号（##）指定的染色体，以便计算机正确排序。

示例： Df（通道12:dlx3b、dlx4b、tbx24）b380

当一个基因在缺陷的两个断点之一被破坏时，请联系ZFIN的命名协调员寻求帮助(命名@zfin.org).

4.2. 换位
易位命名的一般格式取决于易位的类型：

互惠易位有两个独立的染色体元件，每个元件都有一个不同的名称：T（Chr##；Chr###）xxx<行号，##U.#L和T（Chr##；Chr###）xxxline#，##U.#L

T型表示易位。括号中的元素是所涉及的染色体，编号较低的染色体列在前面，染色体由分号分隔。染色体应使用两位数字（即03代表Chr03）通过编号（##）指定，以便计算机正确排序。

术语xxx个应描述研究人员确定的移位的一些显著特征。如果易位转移了研究人员主要研究的命名基因，xxx个通常是标准的符号因为那个基因。可替换地，xxx个可能只是一个实验序列号。

这个线命名应遵循标准命名惯例（机构命名后接行号）。在行号之后是一个逗号，然后是一个短语，表示染色体的新顺序，按照惯例从染色体顶部开始。第一个数字（##）是Chr数字，后跟大写字母U型用大写字母表示染色体的上臂L（左）表示染色体的下臂。着丝粒的位置由一个周期表示。没有空格。当基因在易位的一个断点被破坏时，易位被写为基因的等位基因。一个易位可能有多达四个等位基因。

示例：

T（Chr02；Chr12）ndr2b2131，02U.12L02L和T（Chr02；Chr12）ndr2b2131，12U.12L02L

这个例子说明了一种相互易位，即Chr12的一部分下臂间隙易位到Chr2的近端下臂，而Chr2下臂的一部分易位到

Chr12的远端下臂。

解析易位是易位的两个元素分离的地方，突变系只有其中一个元素。这导致动物的某些染色体区域为单体，而其他区域为三体。在这些情况下，突变系将被指定为只有一个元素，而不是像上面的倒数指定那样使用两个元素。等位基因名称将保持不变，以表明它们的共同起源和共同断点。

示例：

T（Chr02；Chr12）ndr2b2131，02U.12L02L

4.3. 转基因系和构建物

转基因构建物现在在ZFIN中有自己的页面。转基因构建体名称很重要，因为当插入不是基因的等位基因时，在转基因系命名法中使用构建体名称（见下文）。

4.3.1转基因结构

构造术语

Tg（调控序列：编码序列）

玻璃钢 表示转基因。在括号内，应描述转基因的最显著特征。总的来说，转基因名称的简洁和清晰比详尽的细节更受欢迎。调控序列可以从增强子或启动子中提取，应列在结肠的左侧。一般来说，调控序列是以其来源的基因或调控的基因/转录物命名的。编码序列放在冒号的右侧。并非所有的转基因构建物都具有调控和编码元素，在这种情况下，结肠将不会被使用。如果一个构造使用来自命名基因的序列，那么它应该包含该基因的标准斑马鱼小写符号。整个转基因名称应为斜体。

增强子陷阱、启动子陷阱、基因陷阱构造 ：这些都使用与转基因构建物相同的命名约定，必要时替换Et、Pt、Gt。
构建物中含有转录物的转基因：对于使用基因的特定转录本或转录启动子的情况，应使用转录本编号或名称。需要注意的是，这里使用的连字符不同于下面讨论的在监管或编码序列融合中使用连字符。转录本名称中的连字符是转录本名称的一个组成部分，用于划分基因的转录本编号。

例子: Tg（pitx2-002:GFP）在这种情况下，内部pitx2产生坑x2-002转录物是GFP表达的驱动因子。

结构中的融合：监管或编码序列融合应使用连字符分隔。

例子: Tg（actb2:stk11-mCherry）该结构编码stk11和mCherry的融合蛋白，受行为2发起人。

构造中不同大小的启动子元素：如果许多结构体是由不同大小的启动子元件生成的，则可以使用上游DNA的长度在括号内指定这些结构体：

    示例:这些例子代表了两个编码融合蛋白的结构特殊目的港和GFP由3.5kb或6.0kb 5'上游增强器驱动hhex公司基因。
    Tg（-3.5hhex:sptb-GFP）
    Tg（-6.0hhex:sptb-GFP）

然而，在许多情况下，构造中的更改可能太小或太复杂，无法更改kbp的数量或无法确定。为了区分这些结构，它们将在Tg（也称为Et、Pt、Gt）和括号之间附加一个序列号，而不是在名称中包含更多细节。详细信息将在构造页面的注释字段中提供。

示例：原始构造：Tg1（uxs1:GFP）; 后续构造：Tg2（uxs1:GFP）; 其他构造：Tg#（uxs1:GFP）

构建物中使用的外源基因：对于使用来自不同物种的基因的情况，应使用三个字母的物种缩写(智人[Hsa公司],小家鼠[嗯],鲑鱼沙拉[上海证券交易所])后面是一个句点和基因符号。对于人类基因，使用所有大写字母的标准基因符号约定。对于老鼠和其他物种，基因的第一个字母是大写的。三字母规则的一个例外是莱茵衣原体。请对此生物体使用Cr，因为3个字母的缩写（Cre）与Cre-Lox系统的缩写冲突。

例子: Tg（Hsa.FGF8:GFP）这里是人类的促进者FGF8公司基因驱动GFP的表达。

例子: Tg（标准Ndr2:GFP）这里鲑鱼Ndr2基因的启动子驱动GFP的表达。

构造中使用的突变：当在构建物中使用突变形式的基因时，该基因中的突变可以包含在构建物内。变异应在最基本的水平上表示，描述DNA或氨基酸的变化。突变序列的手稿描述应始终与参考序列（登录号）相关，以便具有相关性和信息性。登录号将添加到构造页面。

例子：Tg（cav3:cav3_R26Q-GFP）突变导致精氨酸在第26位取代谷氨酰胺的氨基酸。

示例：Tg（Hsa.MPZ_1026T>A:EGFP）核苷酸突变发生在人类基因MPZ的1026位，T被A取代。

构造中的克隆：使用修改克隆的转基因构建物，如BAC和PAC，应命名为在“Tg”和“（”之间插入克隆类型。克隆的登录号必须包含在出版物中，以便与构建物关联。将在构建页面中添加指向相应克隆的链接。

示例：TgPAC（tal1:GFP）GFP插入编码序列内或附近塔尔1在PAC中使用GenBank#AL592495。

一个结构中有两个或多个磁带盒：如果一个结构中有两个或多个盒带，则有必要使用逗号来区分盒带。

例子: Tg（isl2b:GAL4，UAS:GFP） 在这里， 岛3发起人推动GAL4，UAS推动GFP

插入同一位点的两个或多个不同结构：如果实验证明两个或多个独立注入的结构体在同一位置整合，则每个结构体应以逗号分隔。在这种情况下，该行将被分配一个行名称（等位基因）编号。注：如果后来确定结构集成在不同的位点，则需要额外的行号。

例子：Tg（sox9a:mCherry），Tg（usx1:YFP）测线#

一个启动子在结构中驱动两个或多个编码序列：当一个启动子用于驱动多个编码序列时，使用逗号分隔基因名称。这包括单向和双向促进剂。

例子：Tg（abhd2a:YFP，mCherry）

使用调节多个基因的调节元件构建体内 ：对于构建物利用来自调节两个或多个基因的基因的增强子或启动子的情况体内，名称中只应表示一个基因，以便列出数量最少的基因或与启动子最接近的基因。

示例：Tg（dlx1a:GFP)这种结构利用了dlx1a型和dlx2a型促进GFP的表达。在这种情况下，名称中列出了编号较低的基因。

例子：Tg（zic4:Gal4TA4，UAS:mCherry）此构造使用了zic1型和zic4码驱动Gal4TA4表达的基因，以及一个额外的带有UAS驱动mCherry表达的盒。在这种情况下，最接近增强子的基因被列在名称中。

4.3.2增强子陷阱、启动子陷阱、基因陷阱构造

这些都使用与上述转基因构建物相同的命名约定，必要时替换Et、Pt或Gt。

4.3.3转基因系

转基因系有两种类型，一种已知能产生基因等位基因，另一种未知能产生基因的等位基因。对于不产生基因等位基因的系，特征名由构造名加上没有上标的唯一行号组成。行号应以实验室名称开头，后跟唯一编号。

示例：

Tg（hsp70l:GFP）mik6

对于产生基因等位基因的品系，使用标准遗传表示，其中等位基因名称在基因上方上标，但附加Tg以表明它是转基因插入等位基因。有关所用构建体的详细信息将在基因型页面上提供。已知能产生基因等位基因的基因陷阱和增强子陷阱以类似的方式处理，在等位基因名称后面附加Gt或Et。

示例：

arnt2型 ^高2639cTg

帕加 ^{二氧化锰当量}

4.3.4来自另一转基因或创始系的稳定转基因系

当具有独特、稳定和可遗传的转基因成分的鱼类新品系从另一转基因品系中产生时，衍生品系都应获得独特的等位基因/品系名称。如果衍生系和原始系是在不同实验室生成的，则应为衍生系指定与第二个实验室相关的等位基因/系名称。

例子：

加州理工学院产生的原始等位基因：ct1；源自ct1并在加州理工学院生成的新品系：ct2、ct3或ct1a、ct1b；从ct1生成的新品系，但在俄勒冈州大学生成：b###

4.3.4在ZFIN上显示复杂基因型

ZFIN的基因型按字母顺序显示，首先是非基因等位基因的转基因株系，然后是其他等位基因。

示例：

Tg（-0.7her5:EGFP）ne2067；hmgcrb型 ^s617/s617

5.名称的优先级

如上所述，斑马鱼基因是根据与人类或小鼠基因的同源性命名的。如果无法识别直系词，那么将优先使用文献中最先出现的名称，前提是该名称遵循其他命名准则。ZFIN建议通过ZFIN表格或咨询斑马鱼命名委员会提交拟议基因名称(namenclature@zfin.org)用于命名分配。

当在先前克隆的斑马鱼基因中发现突变时，该突变将被称为该基因的等位基因。如果克隆的基因和突变都有不同的名称，并且后来发现是同一个基因，那么通常以该基因的名称为准。这一规则的例外是，当哺乳动物基因的基因符号少于两个字符时，例如带有符号T的小鼠基因短梗。在这种情况下，斑马鱼基因保留了原来的名称没有尾巴，ntl。

6.绘图和排序信息

这个基因组计划1994年开始，到1996年，基因图谱关闭。NIH资助的专业程序为了建立一个双单倍体减数分裂图谱面板、缺陷株和表达序列标签（EST），已在两个辐射杂交面板上绘制了EST和匿名标记。这个桑格研究所开始全基因组测序2001年。正在根据BAC库用于排序。基因组信息定期更新于ZFIN公司。

7.出资人

现任命名协调员：
艾米·辛格(asinger@zfin.org)，美国俄勒冈州大学斑马鱼信息网络ZFIN数据库团队

活跃贡献者：
理查德·多斯基(richard.dorsky@neuro.utah.edu)美国犹他大学神经生物学与解剖学系
马克·埃克尔(mekker@uottawa.ca)加拿大安大略省渥太华大学环境基因组学高级研究中心
玛丽·马林斯(mullins@mail.med.upenn.edu)美国宾夕法尼亚大学细胞与发育生物学系
约翰·波斯特拉斯韦(jpostle@oregon.uoregon.edu)美国俄勒冈州大学神经科学研究所
蒙特·韦斯特菲尔德(monte@uoneuro.uoregon.edu)美国俄勒冈州大学神经科学研究所
杰弗里·尤德(杰夫·尤德@ncsu.edu)美国北卡罗来纳州立大学兽医学院比较医学和转化研究分子生物医学科学中心系

过去的贡献者：
Erik Segerdell，加拿大卡尔加里大学XenBase
梅丽莎·海德尔(haendel@ohsu.edu)美国俄勒冈州健康与科学大学
塞里·范·斯莱克(van_slyke@uoneuro.uoregon.edu)，斑马鱼信息网，美国俄勒冈州大学
伊冯娜·布拉德福德(ybradford@zfin.org)，美国俄勒冈大学斑马鱼信息网络
史蒂夫·约翰逊@genetics.wustl.edu基因)美国华盛顿大学医学院遗传学系

8.参考文献

斑马鱼科学监测（1992）9月21日。
Mullins，M.（1995）《遗传方法：斑马鱼书中斑马鱼基因命名约定》（第三版，Westerfield，M.编辑），第7.1-7.4页，俄勒冈大学出版社。
遗传命名指南，遗传学趋势（1998年）。

----

有关适当术语的问题和建议，请联系我们 namenclature@zfin.org .