美国国旗

美国政府的官方网站

原核基因组注释指南

注释

Genome Workbench和table2asn(替换tbl2asn)使用简单的五列tab分隔的特征位置和限定符表来生成注释。

此特征表的格式允许指示不同类型的特征(例如基因、编码区、tRNA、repeat_region)和限定符(例如/product、/note)。验证器将检查错误,如编码区域中的内部停止。

指南真核生物基因组提交.

如果您不理解此处的任何说明或有疑问,请通过电子邮件联系我们genomes@ncbi.nlm.nih.gov在创建提交之前。这将为我们双方节省大量时间。

目录

  1. 准备注释表

准备注释表

这些功能必须位于一个简单的五列制表符分隔表中,称为功能表。特征表指定了表2asn(之前为tbl2asn)或Genome Workbench的每个特征的位置和类型,以包含在创建的GenBank提交中。表的第一行包含以下基本信息:

>功能SeqId table_name

SeqId必须与序列上使用的SeqId相同。table_name是可选的。表的后续行列出了功能。列由制表符分隔。

  • 第1列:要素的起始位置
  • 第2列:特征的停止位置
  • 第3列:功能键
  • 第4列:限定符键
  • 第5列:限定符值

图2显示了一个示例要素表,并说明了关于要素表格式的一些要点。与此表对应的GenBank平面文件如所示图3

互补链上的特征(如下面示例中的基因abrB)及其对应的CDS,通过反转区间位置来指示。请避免表格中输入的所有文本不必要的大写。

基因特征

基因特征通常是一个区间,其位置应涵盖所有相关特征的区间,如启动子和操作员结合位点。基因名称必须遵循三个小写字母的标准细菌命名规则。不同的基因座由大写字母后缀区分。

例子

正确的胞苷错误的CYTB错误的细胞色素B错误的orf1错误的假定基因片段

如果基因是假基因,请不要在基因名称或蛋白质名称中添加“伪”一词。相反,请使用/pseudogene限定符和适当的值限定符基因特征。请参阅基因片段了解更多详细信息。

位置标签

必须为所有基因分配一个系统的基因标识符,该标识符必须接收注释表中基因特征上的locus_tag限定符。基因也可能有科学文献中指定的功能名称。在本例中,OBB_0001是系统基因标识符,而abcD是功能基因名称。我们建议让BioProject注册过程自动指定locus_tag前缀,因为它们并不意味着赋予含义。locus_tag前缀必须是3-12个字母数字字符,第一个字符不能是数字。此外,locus_tag前缀区分大小写。单个基因组的所有染色体和质粒必须使用完全相同的locus_tag前缀,后跟下划线,然后是给定基因组中唯一的字母数字标识号。除了用于分隔前缀和标识号的单个下划线外,locus_tag中不能使用其他特殊字符。基因座标签只能与基因特征结合使用。阅读更多关于位置标记(_T)及其预期用途。

具有生物名称和locus_tag的基因的表视图

1 1575基因基因abcD本地标签OBB_0001

平面文件视图

基因1..1575/基因=“abcD”/locus_tag=“OBB_0001”

仅带有locus_tag的基因的表视图:

1 1575基因本地标签OBB_0001

平面文件视图:

基因1..157/locus_tag=“OBB_0001”

蛋白质id

提交者必须为所有蛋白质指定一个标识号。当序列更新时,NCBI使用这个数字来跟踪蛋白质。该数字在表中由CDS限定符protein_id表示,其格式必须为gnl|dbname|string,其中dbname是您认为唯一的实验室名称版本(例如SmithUCSD),string是提交者分配的唯一蛋白质SeqID。我们建议使用locos_tag编号作为蛋白质识别编号。

protein_id用于我们数据库中的内部跟踪,重要的是完整的protein_ id(dbname+string)不能被基因组中心复制。请注意,当处理WGS提交时,protein_id中的数据库名会自动更改为“WGS:XXXX”,其中XXXX是项目的登录号前缀。在你的基因组被释放到GenBank后,这些蛋白质被分配了登录号。我们将提供一个蛋白质SeqID和登录号表,供您将来使用更新.

例子

protein_id与记录一起保存(ASN.1格式),但它在平面文件中不可见。

1 1575基因基因abcD本地标签OBB_00011 1575张CDS产物烯醇化酶蛋白质_id gnl |史密斯UCSD | OBB_0001

蛋白质名称

所有CDS功能都必须有产品限定符(蛋白质名称)。NCBI蛋白质命名约定采用自国际蛋白质命名指南.

一致的命名法对于交流、文献检索和数据检索是必不可少的。许多物种特定的社区已经建立了基因命名委员会,试图分配一致的,如果可能的话,有意义的基因符号。其他科学界已经根据序列相似性和/或功能为一组蛋白质建立了蛋白质命名法。但是,没有一个既定的组织参与蛋白质名称的标准化,也没有任何努力来建立在尽可能大的物种范围内有效的命名规则。

有关基因/蛋白质名称的歧义是文献中的一个主要问题,在序列数据库中更为严重,因为序列数据库往往会传播这种混淆。因此,我们要求您遵循一些基本准则来命名您的蛋白质。蛋白质命名指南的前提是,一个好的、稳定的蛋白质推荐名称是一个尽可能中性的名称。

蛋白质命名指南:

  • 如果存在,请使用批准的术语。
  • 使用简洁的名称,而不是描述或短语。
  • 理想情况下,名称应该是唯一的,并归因于所有直系亲属。
  • 在蛋白质名称未知的情况下,使用“假想蛋白质”或“无特征蛋白质”作为产品名称。
  • 蛋白质名称不应反映蛋白质的亚细胞位置、分子量或来源种类。此信息可以包含在注释中。
  • 对于属于多基因家族的蛋白质,建议您选择带有数字的连贯命名法来指定该家族的不同成员。
  • 当命名可根据同源性或共享功能概念归类为一个家族的蛋白质时,应使用破折号“-”和阿拉伯数字来列举不同的成员。例如“桥粒芯蛋白-1”、“桥粒蛋白-2”等。
  • 功能未知的蛋白质包含一个确定的结构域或基序,可以根据存在的结构域来命名。名称应为以下类型:“<域|重复>-包含蛋白质”。例如“PAS结构域蛋白5”。
  • 蛋白质名称可以用与相应基因相同的符号表示,但符号以大写字母开头。
  • 希腊字母必须完整书写,例如“alpha”,在类固醇/脂肪酸代谢命名法中,除“Delta”外,其他字母必须全部小写。此外,后面跟着数字的希腊字母应该在前面或后面加一个破折号“-”,例如“独角兽字母-1”。
  • 使用小写字母,除非需要大写字母(例如,在缩写词中,如DNA或ATP)。
  • 在适当的情况下,名称应使用美国拼写惯例。
  • 避免在蛋白质名称中使用分子量“unicornase亚单位A”比“unicoranase 52 kDa亚单位”更可取
  • 避免在蛋白质中使用术语“同源物”,因为这意味着进化关系通常尚未确定。
  • 尽可能避免在蛋白质名称中使用逗号。
  • 尽可能避免使用罗马数字。请使用阿拉伯数字。
  • 不要将分子量缩写成缩写
  • 不要使用变音符号,例如重音符号、变音符号。许多计算机系统(包括我们的系统)只能理解ASCII字符。
  • 不要在蛋白质名称中使用复数。例如,“含有锚蛋白重复序列的蛋白质8”是错误的。

以下是一些好的蛋白质名称示例:

细胞色素b
细胞色素B
乌头水合酶B
假想蛋白质
细胞色素b样蛋白
4Fe-4S簇结合蛋白
腺苷酸转移酶/ADP-庚糖合成酶
2-羟基庚烷-2,4-二烯-1,7-二元酸异构酶
短链特异性酰基辅酶A脱氢酶
甲酰甲烷呋喃——四氢甲烷蝶呤甲酰转移酶
丝氨酸/苏氨酸蛋白激酶
翻译起始因子1
三磷酸基-dephospho-CoA合成酶
硫胺素生物合成蛋白ThiC
PAS结构域蛋白5
ABC转运蛋白ATP-结合蛋白AlbC
第0阶段产孢蛋白J
这些名称都简明扼要地描述了已知蛋白质的功能,避免提及结构、同源性和物种。

以下是一些不良蛋白质名称的示例:

钼酸盐有效并入钼蛋白所必需的
这描述了蛋白质在生物合成过程中的作用,但不是蛋白质名称。
伴侣Hsp70;DNA生物合成;自我调节的热休克蛋白
“伴侣Hsp70”这个名称是可以的,但剩余的注释最好作为注释或在函数限定符中显示。
假定碳酸酐酶(酶代码EC4.2.1.1)
EC编号不应是蛋白质名称的一部分,而应填入EC_number限定符中
类似于阿硝酸水合酶B
这句话可以作为注释,但作为一种蛋白质名称,硝酸阿糖水合酶B样蛋白质是首选
与功能未知的蛋白质有关
无信息的名称
细胞色素b样
首选细胞色素b样蛋白
ABC运输车相关
名称模糊,有许多ABC转运体和亚单位,更具体。“ABC转运蛋白相关蛋白”是可以接受的,但如果可能的话,一个更具体的名称会更好。
皮林,N端:皮林,C端
注意N端和C端相似性的统一名称
螺旋转螺旋图案
描述一个基序或结构域,但不是合适的蛋白质名称。
PP-停止
描述一个基序或结构域,但不是合适的蛋白质名称。
α/β水成褶皱
描述一个基序或结构域,但不是合适的蛋白质名称。
五肽重复
描述一个基序或结构域,但不是合适的蛋白质名称。
磷酸泛乙烯结合结构域
描述一个基序或结构域,但不是合适的蛋白质名称。
功能未知的蛋白质:保守
无信息的名称
假想的32.5kDa蛋白与植物烯和角鲨烯合成酶同源
仅假设蛋白质是合适的。其余评论应作为备注填写。
核糖体蛋白L3(大肠杆菌)
蛋白质名称不应包含对有机体名称的引用。核糖体蛋白L3本身就是一个合适的名称。
糖精脱氢酶或相关蛋白
“糖精脱氢酶”或“糖精脱水酶样蛋白”更合适
酪氨酸蛋白激酶(荚膜多糖生物合成)
酪氨酸蛋白激酶作为一种蛋白质名称很好,但荚膜多糖生物合成作为一种功能更合适。
RimM蛋白,16S rRNA加工所需
RimM可以作为蛋白质名称,但应在注释中添加描述性注释。
参与鞭毛生物合成
这是一个功能注释,而不是蛋白质名称。

笔记

请避免包含表示与数据库中其他条目的特定相似百分比的注释,因为您所指向的相应记录可能会发生更改,并使您当前的注释不准确、不正确和过时。描述、描述与其他蛋白质相似性的注释和功能注释必须放在适当的CDS限定符中,例如note或prot_desc,因为它们是产品的描述符。E.C.编号必须在EC_number限定符中字段化。

启动-停止CDS产物DNA回转酶亚基BEC编号5.99.1.3DNA旋转所需的注释

可用于CDS功能的限定符包括:

启动-停止CDS产品prot _ desc(保护_ desc)功能EC编号(_N)笔记实验推理go_组件go_进程go_函数数据库参考例外transl_except(转换除外)

双功能蛋白质

如果一个蛋白质包含两个独立和不同的功能,或者如果它有多个名称,可以用以下几种方式对其进行注释。

表格视图:

启动-停止CDS产物腺苷酸转移酶/ADP-庚糖合成酶注释双功能EC_编号2.7.7.2EC编号1.4.1.13

启动-停止CDS产品双功能腺苷酸转移酶/ADP-庚糖合成酶环水解酶EC_编号2.7.7.2EC编号1.4.1.13

启动-停止CDS产品FolD功能腺苷酸转移酶功能ADP-庚糖合成酶环水解酶注释双功能EC_编号2.7.7.2EC编号1.4.1.13

含硒半胱氨酸编码区

要注释硒代半胱氨酸,请包括一个transl_except限定符,该限定符具有密码子的核苷酸位置加上氨基酸“Sec”,如下所示:

1790 3187信用违约互换产品硒蛋白transl_except(位置:1817..1819,aa:秒)protein_id gnl|mycenter|ABC_0216437

其中硒代半胱氨酸密码子位于nt1817-1819。使用核苷酸位置,而不是氨基酸编号。

如果CDS在负链上,您仍然可以指示密码子的位置,从5'到3'。因此,在本例中,密码子包括为nt9395-9393:

9422 8208信用违约互换产品假想蛋白质transl_except(位置:9395..9393,aa:秒)protein_id gnl|mycenter|ACC_0216440

含内肽编码区

含内肽的编码区必须表示如下:

946506 950039基因基因recA本地标签OBB_0010946506 950039信用违约互换产物DNA重组蛋白前体protein_id gnl |数据库名| OBB_0010946506 946790功能错误948057  950036注意DNA重组蛋白946791 948056功能错误注释intein

内切蛋白应该用两个mat_peptide特征进行注释,一个用于内切蛋白,另一个用于最终蛋白质。我们还在CDS功能部件上的产品名称中添加“前体”。不幸的是,您不能在表中添加mat_peptide特性。相反,您可以添加mist_feature,我们可以为您转换它们。请参阅加入编号AY847267年例如,内含蛋白。

不完全基因组中的部分编码区

使用特征表中的“<”或“>”注释部分编码区域,以将特征指定为5'或3'部分。编码区必须从第一个核苷酸开始,然而翻译将从第一个完整的密码子开始。

注意:部分编码区只允许在原核生物中位于序列末端或与间隙相邻。内部编码区必须以起始密码子开始,以终止密码子结束。

示例:

在下面的第一个例子中,“<”将该编码区指定为5'部分,“codon_start 3”告诉软件用CDS的第三核苷酸开始翻译。请注意,如果未指定codon_start,则软件假定codon_sstart为1。下面的第二个编码区域在3'端是部分的,因此“>”用于指示3'部分特征。第三个例子是互补链或负链上的3'部分编码区。

<1497基因基因abcD本地标签OBB_0001<1497 CDS产品AbcD注释类似于枯草芽孢杆菌醛缩酶密码_开始3protein_id gnl|dbname|OBB_0001200>1575基因基因xyzA本地标签OBB_0002200>1575 CDS产品类肌动蛋白protein_id gnl|dbname|OBB_0002436>1基因基因nirK本地标签OBB_0003436>1张CDS产品NirKprotein_id gnl |数据库名| OBB_0003

这里有格式化部分CDS功能的更多示例.

中断的基因和基因片段

有时,基因组会有相邻或邻近的基因,这些基因似乎只是蛋白质的一部分。在许多情况下,这表明序列和/或注释可能存在问题。一个相关的问题是CDS的概念翻译中存在内部终止密码子,看起来应该是真正的CDS。这些问题可能是由多种原因造成的,包括突变、测序或组装工件。它们可以通过多种方式进行注释:

  1. 用/pseudo注释该基因,以表明该基因存在问题。注意,这个限定词并不意味着该基因是假基因。(如果已知该基因为假基因,请参见下文第2点)如果最初存在多个基因片段,则添加一个涵盖所有潜在编码区域的单个基因特征,并添加伪限定符。如果已知,可以添加注释限定符,指示该基因被破坏的原因,例如:

    1200基因基因phoA基因型碱性磷酸酶位置_标签OBB_0001注意由于帧移位而无法工作
  2. 如果你确定被破坏或错误填充的基因是生物假基因,那么添加假基因限定符和适当的假基因型例如:

    1200基因基因phoA基因desc碱性磷酸酶本地标签OBB_0001未加工假基因
  3. 一个编码区域包含一个被认为可以通过核糖体滑移纠正的移码,可以使用连接的特征跨度和“核糖体滑脱”异常进行注释。例如,特征上的连接跨距用于将序列的两个非相邻区域组合在一起以编码蛋白质。这通常用于结合真核生物外显子来翻译编码区。要创建连接CDS,必须指定编码蛋白质的序列的每个相邻区域的跨度。连接特征跨度的使用在细菌中很少见。在这种情况下,CDS还必须包含一个例外限定词,其准确文本为“核糖体滑移”。如果您出于不同的原因包含连接功能,请包含一个注释限定符,指示为什么连接两个核苷酸跨度。

    333255 333181信用违约互换333179  332157产品AbcDprotein_id gnl|dbname|OBB_0001异常核糖体滑移
  4. 包含由相位变化引起的真实移码的基因可以用带注释的基因特征表示。

    1200基因基因phoA基因desc碱性磷酸酶本地标签OBB_0001注意由相位变化引起的真实移码;此区域包含编码序列中真实的帧移位或帧内停止,而不是排序错误的结果

内含子基因

虽然很少见,但也有一些细菌基因含有内含子的例子。注释任何包含内含子的基因的基因特征,使基因特征跨度是覆盖所有外显子和内含子的单个跨度。实际特征(CDS、tRNA等)应该用一组核苷酸跨度进行注释,以显示外显子是如何连接以产生正确的产物的。在这个例子中,有两个外显子被转录以产生tRNA。第一个外显基因是1456到1419,第二个外显蛋白是1400到1361。注意基因特征跨度是如何包含外显子和内含子的。

1456 1361基因位置标签APO_t011456 1419 tRNA1400 1361产品tRNA-Cys

转切基因

转译基因是注释基因特征跨度规则的例外。转座基因与包含内含子的基因相似,只是这两段基因位于染色体的不同区域。这些基因被转录为两个或多个单独的RNA产物,这些RNA产物被转译为单个mRNA或tRNA。要使用表格对此进行注释,请输入核苷酸跨度,以便互补(负链)跨度从高到低排列,正链则相反。

36700 36618基因86988   87064位置标记NEQ_t38异常交叉拼接36631 36618错误特性注意在处理转剪接tRNAs过程中出现的序列断裂36673   3663587030 87064 tRNA产品tRNA-Glu异常交叉拼接注意,这种转剪接的tRNA由混合链上的两半组成;它与另一个tRNA共用一个3'半

平面文件视图:

基因连接(补体(36618..36700),86988..87064)/locus_tag=“NEQ_t38”/跨接(_S)错误特征补码(36618..36631)/locus_tag=“NEQ_t38”/注=“处理转剪接tRNAs过程中的序列断裂”tRNA连接(补体(36635..36673),87030..87064)/locus_tag=“NEQ_t38”/product=“tRNA-Glu”/跨接(_S)/注=“这个转剪接的tRNA由两部分组成混合股;它与另一个tRNA共用3'半“

两个contigs上的分裂基因

2012年9月:有时在不完整的基因组中,一个基因的末端可能位于不同的连接上。当确定这两个片段是同一基因的一部分时,将它们注释为具有唯一locus_tags的单独基因,以及具有不同蛋白_id的单独CDS。此外,将这些特征与涉及基因另一部分的注释链接在一起。然而,不要创建非常短的特征,例如,如果一端只是起始甲硫氨酸,或者在终止密码子之前只有几个氨基酸。

例子
>功能续01.001115000>7500基因位置标签KCS_2223A5488 5500张CDS6000    >7200产物烯醇化酶protein_id gnl |数据库名| KCS_2223A注释5'结束;3’端为基因KCS_2223B,位于contig Cont01.00224上>功能Cont01.00224<1 1000基因位置标记KCS_2223B<100 876 CDS产物烯醇化酶蛋白质_ id gnl |数据库名| KCS_2223B注释3'结束;5'端为基因KCS_2223A,位于contig Cont01.00111上

核糖体RNA、tRNA和其他RNA特征

RNA特征(rRNA、tRNA、ncRNA)必须包含带有locus_tag限定符的相应基因特征。请务必指定tRNA基因对应的氨基酸。如果tRNA的氨基酸未知,请使用tRNA-Xxx作为产物,如示例所示。许多提交者喜欢标记tRNA-Gly1等tRNAs。如果您希望这样做,请将“tRNA-Gly1”作为注释,而不是在/gene中。/gene的用法保留给实际的生物基因符号,如“trnG”。如果tRNA是假基因,请使用/pseudo限定符。

注释属于INSDC之一的ncRNAncRNA_类作为ncRNA功能,在所需的/ncRNA_class限定符中使用适当的值。RNA的区域应该标注为错误特征(如先导序列),或者如果它们与已知分子(如核糖开关)结合,则应标注为错误结合特征。请参见其他注释例如RNA区域。

一些rRNA、tRNA、ncRNA示例:
1400基因本地标签OBB_0001<1400 rRNA产品16S核糖体RNA401 500基因基因trnG注释tRNA-Gly1本地标签OBB_0002401 500 tRNA产物tRNA-Gly501 600基因本地标签OBB_0003501 600 tmRNA产品tmRNA601 700基因本地标签OBB_0004601 700 tRNA产品tRNA-Xxx701 800基因本地标签OBB_0005701 800 tRNA产品tRNA-Phe801 900基因本地标签OBB_0006801 900 ncRNAncRNA_类SRP_RNA信号识别颗粒的产物RNA成分

证据限定符

在2005年国际核苷酸序列数据库(INSD)年会上,DDBJ、EMBL和GenBank同意采用两个限定词来描述序列记录中特征的证据。它们是“/experimental=text”和“/inference=TYPE:text”,其中“TYPE”来自选择列表,“text”是结构化文本。这些新的限定词分别替换了不再支持的“证据=实验”和“证据=非实验”。阅读更多关于证据限定符

1100基因locus_tag测试_00011100张CDS产品RecAprotein_id gnl|center_name|Test_0001推理从头开始预测:Genscan:2.0200 300基因locus_tag测试_0002200 300 CDS产品SecAprotein_id gnl|center_name|Test_0002推断与DNA序列相似(同种):INSD:DQ060639.1400 500基因locos_tag测试_0003400 500 cd产物核糖核酸酶Rprotein_id gnl|center_name|Test_0003推断蛋白基序:InterPro:IPR001900db_xref InterPro:IPR001900600 700基因locus_tag测试_0004600 700 CDS产物硝基还原酶Aprotein_id gnl|center_name|Test_0004GST融合蛋白的实验表达

功能性噬菌体

如果细菌基因组包含功能性噬菌体,则必须在覆盖整个噬菌体序列的跨度中包含额外的源特征。然而,如果噬菌体没有功能或者你不确定,请将其注释为错误特征。

361 4200来源生物噬菌体xyz

插入序列和转座子

插入序列和转座子必须注释为repeat_region特征。插入序列或转座子的名称必须添加到insertion_seq或转座限定符中。注意,转座子和插入序列不应该被赋予locus_tags。

1 100个重复区域mobile_element插入序列:IS1363500 600重复区域mobile_element转座子:Athena-Av1

数据库交叉引用

可以向要素添加各种数据库交互参考。这些在功能上显示为/db_xref。此限定符用作将序列记录链接到其他外部数据库的工具。查看完整列表数据库参考.

1100基因locus_tag测试_00011100张CDS产品RecAprotein_id gnl|center_name|Test_0001db_xref InterPro:IPR000111180 210错误特性注释yybP-ykoY元素数据库_参考RFAM:RF00080

基因本体论

GO(基因本体论)术语可以包括在基因组中,以便描述蛋白质功能。基因本体论(GO)术语可以用以下限定词表示

1100张CDS产品AbcDgo组分外囊|0000145go_转录过程调控,依赖于DNA | 0006355go_process胞吐| 0006887go_function DNA结合| 0003677

值字段由竖线“|”分隔为描述性字符串、GO标识符(保留前导零)以及可选的PubMed ID和一个或多个证据代码。证据代码是第四个标记,因此根据需要包括空白字段(例如,最后一个限定符没有PubMed ID,所以第三个字段是空白的)。请参阅上的示例详细的真核生物注释第页。

变更

序列中的多态性可以用变异特征来表示。在序列中包含一个多态性(通常,这是最常见的序列),然后在.tbl文件中为其他每个可能性添加一个变体特性。

  • 变体功能需要一个“替换”限定符,其值是不在提交序列中的多态性序列。例如,如果CCC最常见于位置100-102,但也有CC(替换)、CCCCC(插入)和无(删除),那么序列将在该位置具有CCC,并且您将包括三个变异特征,每个多态性对应一个。
  • 对于插入多态性,克拉(^)是开始位置的一部分。
  • 当多态性是一个完全删除时,那么替换值只是两个双引号。
  • 您还可以包括可选的限定符-note,以及找到其他序列的频率。

以下是所有这些选项的示例:

100 102变化更换cc注释多态性100^102变化更换ccccc频率0.1100 102变化替换“”注释删除

这些功能将在GenBank视图中显示如下:

变化100..102/注=“多态性”/replace=“cc”变化100^102/频率=“0.1”/replace=“ccccc”变化100..102/注意=“删除”/replace=“”

其他注释

如果绑定部分已知,则在2017年之前使用misc_binding功能对Riboswitches进行了注释,例如:

1 100杂项绑定注意钴胺素核糖开关结合部腺苷钴胺

截至2017年,核糖开关被标注为regulatory_类“核糖开关”的监管特征:

1100监管调节类核糖开关注意钴胺素核糖开关结合部腺苷钴胺

如果绑定部分未知或序列是前导序列,请将其注释为mist_feature,例如:

1 100个错误特性注释yybP-ykoY元素

错误特征、错误结合和调控特征没有相关的基因特征。如果需要使用类似locus_tag的标识符标记这些功能,则将该值包含在注释中,并用分号和空格与其他信息分隔。

上次更新时间:2021-11-04T18:16:39Z