基因命名指南


 

基因名称格式

念珠菌基因名称应遵循既定格式对于酿酒酵母基因名称。此格式在中进行了描述指南中的详细信息酿酒酵母命名,发表在Trends in遗传学(TIG)(下载pdf文件). 基因名称应该由三个字母组成(基因符号)后跟一个整数(例如。ADE12公司). 显性等位基因基因(通常为野生型)由所有大写字母表示,而隐性等位基因全部用小写字母表示。

3个字母的基因符号应代表表型、基因产物或基因功能。此外,它是强大的最好是给定的基因符号只有一个相关描述(即,使用给定的3个字母符号的所有基因都应该有一个相关表型、基因产物或基因功能,以及3个字母符号具有相同的含义酿酒酵母念珠菌基因)。在哪里?念珠菌酿酒酵母基因似乎如果是直向同源的,它们最好共享相同的基因名称。在哪里?念珠菌酿酒酵母基因是相似的,但这些基因在两个物种中的功能不同,最好是这些基因不共享一个名称;相反,指定的基因名称应该对基因的功能有一定的意义。

有一些非标准基因格式的基因名称目前在CGD中使用。其中许多基因名是历史悠久,在研究界得到广泛认可(例如。,白色念珠菌WH11;OP4;MTLA1;ADE5,7或光滑梭菌UPC2A;MT-II;MT-IIB)。其他一些基因获得了一个非标准名称当该名称用于描述大规模实验(例如。,白色念珠菌FESUR1,CAM1-1)。

展望未来,新命名的基因最好使用标准尽可能格式化。将添加新的非标准基因名称将CGD作为别名,而不是作为标准名称。(例外情况可在案例,其中酿酒酵母正交表具有非标准格式中的标准名称新加坡元对于历史原因。)

基因名称前面使用的物种前缀(例如“Ca”或“Cg”)不是真正的基因名称。前缀的使用增加了论文讨论的清晰度来自不同物种的基因共享一个名称(例如CaURA3型与Sc对比URA3型),但基因名称本身不包括前缀。

选择基因名称

在决定基因名称之前,搜索新加坡元基因名称以3个字母开头的任何基因名称符号,输入3个字母的符号,后跟星号,例如查询框中的“ADE*”。

更改标准基因名称

基因的第一个公开名称通常用作其标准名称;然而,如果研究该基因的小组达成一致意见,基因名称可能会改变。CGD很高兴促进这一进程。要启动基因名称更改,请联系CGD策展人.

在CGD,我们管理出现在出版文献;我们自己并不为蛋白质编码基因命名。CGD公司收集每个基因的所有公开名称;除之外还有任何名称标准基因名称作为可搜索基因出现在数据库中别名。仅出现在GenBank中的基因名称或位点标签可能是用作CGD中的别名;它们不是标准的基因名除非它们出现在已出版的文献中。

对于白色念珠菌CGD还包括装配4和装配6期间分配的基因标识符,以及来自CandidaDB的IPF和CA标识符(d'Enfert等人,2005年). CandidaDB根据同源性分配的未公开基因名称作为别名包含在CGD中。注释工作组指定的建议名称仅在科学文献中公布这些名称后才被CGD采用。

CGD实施了一个基因名称保留系统。在发表之前保留一个基因名称,可以让其他组尽快开始使用该名称,并减少一个基因获得已发表文献中使用的多个不同名称的可能性。请使用CGD基因注册保留新的基因名称。

的格式白色念珠菌姓名

Assembly 22引入的系统名称遵循新的基于位置的染色体特征系统命名法。新的系统名称基于已知的染色体位置和单倍型,一个独特的数字,表示染色体特征的顺序、链(W代表沃森,C代表克里克)和单倍型(a或B)。例如,C4_03570W_A型表示位于第4染色体、Watson链和单倍型a上的特征。特征号从染色体的左端开始,增加10,以便在发现时在中间的空间中添加新特征。

以前程序集中使用的系统名称是分配给open的“orf19.#”名称(其中“#”是一个整数)基因组序列汇编19中识别的读取帧。这个注释工作组已将orf19标识符分配给某些打开的读取不属于原始组件的框架(如中所述布劳恩等人,2005年). 已为新orf指定格式名称“orf19.#.n”,其中“orf19.#”对应于上游orf19,“n”是一个整数。例如,或19.5006.1位于Contig19-10216或19.5006和或19.5007之间。

请注意,“orf19.#”格式的名称以GenBank的locus_tag字段中的格式略有不同与程序集19的发布相关联的记录。locus_tag“CaO19.#”相当于系统名“orf19.#”(即orf19.5197和CaO19.5197指同一ORF)。为了便于搜索替代别名,无论其格式如何,除了“orf19.#”名称外,CGD中还包括“CaO19.#”标识符。

白色念珠菌大会20和大会21继续使用orf19名称,并在文献中持续存在。为了促进两个命名系统之间的无缝转换,前一个或19个系统标识符完全可搜索,并在“位置摘要”页面上显著显示。还可以下载所有orf19和Assembly 22标识符之间的映射在这里.

系统tRNA名称的格式

的格式白色念珠菌系统tRNA名称与所描述的标准tRNA名称相同在下面.

IPF标识符

白色念珠菌“IPF#.n”形式的基因标识符已在坎迪达数据库,其中IPF代表“Individual Protein File”,“#”是整数,“n”是版本号或信息标签(如d'Enfert等人,2005年). CGD目前包括截至2005年2月22日注释工作组注释文件中存档的IPF名称、CGD馆长从已出版文献中收集的一些IPF名称以及直接从CandidaDB检索的IPF姓名。如果IPF标识符既分配给orf,也分配给其等位基因,CGD将这两个IPF标识符作为可搜索的别名包含在Locaus页面上。

关于基因名后缀的注意事项

请注意,数字后缀在orf19和IPF名称的上下文中具有不同的含义;orf19后缀表示orf是不同的,而IPF后缀要么用作版本编号系统,要么用作传递序列同源性信息的标签。例如,orf19.5006.1与orf19.5006不同。相反,IPF标识符IPF22272和IPF22272.1指的是同一个基因,后缀“.1”表示自程序集5以来该记录没有任何更改。IPF标识符后附加的后缀“.2”或“.3”表示程序集5和程序集19之间分别发生了一个或两个更改。在CandidaDB使用的一些基因名称的上下文中,后缀充当信息标签。后缀用于指示该基因似乎是一个5'或3'基因片段,有或没有相邻的3'或5'对应片段,即已发布的Assembly 19,并注意该片段是否位于contig的末端。例如,IPF13383.5eoc与相关基因的5'端相似,该ORF也位于contig的末端。请参阅Braun等人,2005年,d'Enfert等人,2005年,了解更多说明。

程序集4和6中的别名

CGD包含来自白色念珠菌基因组序列,组件4和6。程序集6中的别名的名称形式为“orf6.#”(其中“#”是一个整数)。程序集4中的别名的格式为“Contig4-$$$.####”(其中$$$$是contig的数字标识符,####1是contig中ORF的数字标识符)。这些别名出现在CGD Locaus页面上。此外,可以从CGD下载站点。程序集4标识符和orf19名称之间的映射基于Judy Berman提供的映射,还需要一些额外的手动管理。程序集6标识符和orf19名称之间的映射是在CGD中通过基于BLAST的orf19与orf6的比较生成的,如README文件在下载目录中。

的格式光滑梭菌基因名称

的格式光滑梭菌标准基因名称类似于是的白色念珠菌标准基因名称。

的格式光滑梭菌系统基因名称直接来自排序项目,如所述Dujon等人(2004):

“所有带注释的遗传元素都是使用新的命名系统指定的(http://cbi.labri.fr/Genelevures网站). 简单地说,使用11个递增步骤,沿着每条染色体从左到右的序列连接或支架对元素进行连续编号(以限制错误,并为随后插入新识别的元素提供可能性)。元素命名法表示物种(四个字母)、项目或菌株编号(一个数字)、染色体(一个字母)后跟序列号(例如,CAGL0G08492g)。后缀用于标识元素的类型(“g”表示其RNA产物可能被遗传代码翻译的任何元素;“r”表示RNA产物未翻译的元素;“s”表示顺作用元素;“v”表示基因间(干预))。"

系统tRNA名称的格式

光滑梭菌系统tRNA名称遵循上述测序项目系统命名惯例。

标准tRNA名称的格式

CGD使用tRNAscan-SE程序确认测序项目中注释的tRNAs。核tRNA使用真核模型选项,线粒体tRNA使用细胞器模型。通过与经实验验证的tRNA来自酿酒酵母.

CGD对标准tRNA名称使用以下格式:“t”+编码氨基酸[单字母代码]+(反密码子)+计数。例如,tQ(CUG)2表示带有反密码子“CUG”的tRNA-谷氨酰胺的第二实例。线粒体tRNA使用相同的格式,但附加了“mt”:例如,tH(GUG)4mt。线粒体tRNA的计数是从相同编码类型的核编码tRNA继续进行的。为了便于搜索,提供了一个别名,并将反密码中的每个“U”替换为“T”。

请注意,计数后缀是任意的,并且独立于CGD中的不同物种。它只是用来为给定物种的每个tRNA基因创建一个唯一的标识符,没有特殊的暗示了来自不同物种的具有相同标准名称的两个tRNA之间的关系。例如,tH(GUG)1 tRNA基因白色念珠菌和tH(GUG)1 tRNA基因光滑梭菌不一定会比两个基因组中的任何其他tH(GUG)更紧密地联系在一起。

有关物种特定的系统tRNA名称,请参阅上面特定物种的基因命名部分。

基因、等位基因和蛋白质的详细格式姓名(白色念珠菌示例)

非常感谢阿隆·米切尔提供以下表格白色念珠菌基因命名示例。
遗传位点ICG1
野生型等位基因ICG1
隐性突变体等位基因icg1-1
icg1型Δ5
icg1型
&#916::嘶嘶声
icg1型
&#916::hisG-URA3-hisG
显性突变等位基因ICG1-7
变异野生型等位基因ICG1-8型
标记野生型等位基因ICG1-GFP公司
ICG1-HA公司
野生型基因型ICG1/ICG1
ICG1-8/ICG1-9
杂合突变体基因型集成电路1&#916::hisG-URA3-hisG/ICG1
icg1型&#916::hisG/ICG1
纯合子突变体基因型icg1型Δ::嘶嘶声/icg1Δ::hisG-URA3-hisG
icg1型Δ::嘶嘶声/icg1Δ::嘶嘶声
野生型等位基因的重新整合(细菌
质粒)at突变轨迹
icg1型Δ::嘶嘶声/icg1Δ::hisG公司::ICG1
野生型等位基因的重新整合(细菌
质粒)ARG4公司基因座
icg1型Δ::嘶嘶声/icg1Δ::嘶嘶声ARG4公司::ICG/ARG4
野生型基因产品图标1
Icg1p公司
突变基因产物图标1-1
图标1-1p
标记的基因产品Icg1-GFP
Icg1p-GFP
Icg1-GFPp
野生型表型Icg公司+
突变表型Icg公司-
部分缺陷表型(如有时所见杂合子)Icgw(弱电)
ICG公司w个
Icg公司+/-


返回CGD 向CGD发送消息策展人