美国国旗

美国政府的官方网站

FASTA定义线的修改器

通用格式

中包含的源信息FASTA定义行可以使用NCBI提交工具自动将其发送到适当的特征或描述符。下面列出了当前可用的修改器。可以包含任意多个修改器,但每个修改器必须由一组括号限定。修饰符的名称必须与下表所示完全一致。

修饰符字符串的示例如下:

[生物体=小家鼠][菌株=BALB/c][染色体=5][性别=男性][组织类型=睾丸][铸型=mRNA]

不要在括号内的数据之间使用硬返回。FASTA定义行必须是一行文本,并且不能包含硬返回。如果您在导入FASTA序列时遇到问题,请确认您的编辑软件没有插入硬返回。

源修改器列表

可以找到这些修饰符的描述在这里。这些源修饰符应在格式中使用[修改器=文本]。

  • 首字母缩略词
  • 海拔高度
  • 变形
  • 权威
  • 生物材料
  • 生物型
  • 生物变种
  • 繁殖
  • 细胞线
  • 细胞类型
  • 化学变异菌
  • 染色体
  • 克隆
  • 克隆样
  • 由收集
  • 收款日期
  • 常见的
  • 国家
  • 品种
  • 文化收集
  • 开发阶段
  • 生态型
  • 内源性病毒名称
  • 形式
  • 形式特异性
  • fwd-PCR-计时器名称
  • fwd-PCR-时间序列
  • 基因型
  • 单倍群
  • 单倍型
  • 主办
  • 识别人
  • 隔离
  • 隔离源
  • 实验室管理员
  • 拉长
  • 连杆组
  • 地图
  • 交配型
  • 笔记
  • 有机体
  • 病理变种
  • 质粒名称
  • 塑料名称
  • 流行变种
  • rev-PCR-计时器名称
  • rev-PCR-时间序列
  • 血清群
  • 血清型
  • 血清型
  • 样品-凭证
  • 拉紧
  • 亚种
  • 子克隆
  • 子组
  • 子串
  • 子类型
  • 同义词
  • 远成象
  • 组织样的
  • 组织类型
  • 类型
  • 品种

带格式值的修饰符

Culture-collection的强制格式为“机构代码:集合代码:Culture_id”。但是,收集代码不是必需的。

标本馆和生物材料有可选的结构化格式。

其他修饰符不包括任何提交者提供的文本。FASTA定义行中这些修饰符的格式为:

[修改器=][修改器=真]

使用此格式的修改器包括:

  • 环境样品
  • 生殖系
  • 宏基因组学
  • 重新安排的
  • 转基因的

带受控词汇的描述符

许多涉及测序分子和遗传密码的描述符可以使用FASTA定义行进行编辑。在所有情况下,这些描述符都有一个受控的词汇表,只有当它们的值与默认值不同时才应该添加。

默认的分子类型是基因组DNA。如果提交来源于信使核糖核酸,您可以将此信息添加到FASTA定义行。当使用tbl2asn提交mRNA序列时,必须在FASTA定义行中指定分子类型。例如:

【moltype=mRNA】

为了指定尚未列入NCBI分类浏览器,可以在FASTA定义行中使用修饰符“gcode”或“mgcode”。只有当序列来自线粒体时,才需要包含mgcode。在这两种情况下,修饰符的值都必须是整数分配给适当的遗传密码。例如:

[g代码=1][mg代码=5]

将核遗传密码设置为“标准密码”(翻译表1),或将线粒体遗传代码设置为“无脊椎动物线粒体密码”(转换表5)。

上次更新时间:2021-02-22T20:52:45Z