FASTA定义线的修改器
中包含的源信息FASTA定义行可以使用NCBI提交工具自动将其发送到适当的特征或描述符。下面列出了当前可用的修改器。可以包含任意多个修改器,但每个修改器必须由一组括号限定。修饰符的名称必须与下表所示完全一致。
修饰符字符串的示例如下:
[生物体=小家鼠][菌株=BALB/c][染色体=5][性别=男性][组织类型=睾丸][铸型=mRNA]
不要在括号内的数据之间使用硬返回。FASTA定义行必须是一行文本,并且不能包含硬返回。如果您在导入FASTA序列时遇到问题,请确认您的编辑软件没有插入硬返回。
源修改器列表
可以找到这些修饰符的描述在这里。这些源修饰符应在格式中使用[修改器=文本]。
- 首字母缩略词
- 海拔高度
- 变形
- 权威
- 生物材料
- 生物型
- 生物变种
- 繁殖
- 细胞线
- 细胞类型
- 化学变异菌
- 染色体
- 克隆
- 克隆样
- 由收集
- 收款日期
- 常见的
- 国家
- 品种
- 文化收集
- 开发阶段
- 生态型
- 内源性病毒名称
- 形式
- 形式特异性
- fwd-PCR-计时器名称
- fwd-PCR-时间序列
- 基因型
- 组
- 单倍群
- 单倍型
- 主办
- 识别人
- 隔离
- 隔离源
- 实验室管理员
- 拉长
- 连杆组
- 地图
- 交配型
- 笔记
- 有机体
- 病理变种
- 质粒名称
- 塑料名称
- 流行变种
- rev-PCR-计时器名称
- rev-PCR-时间序列
- 段
- 血清群
- 血清型
- 血清型
- 性
- 样品-凭证
- 拉紧
- 亚种
- 子克隆
- 子组
- 子串
- 子类型
- 同义词
- 远成象
- 组织样的
- 组织类型
- 类型
- 品种
Culture-collection的强制格式为“机构代码:集合代码:Culture_id”。但是,收集代码不是必需的。
标本馆和生物材料有可选的结构化格式。
其他修饰符不包括任何提交者提供的文本。FASTA定义行中这些修饰符的格式为:
[修改器=]或[修改器=真]
使用此格式的修改器包括:
- 环境样品
- 生殖系
- 宏基因组学
- 重新安排的
- 转基因的
带受控词汇的描述符
许多涉及测序分子和遗传密码的描述符可以使用FASTA定义行进行编辑。在所有情况下,这些描述符都有一个受控的词汇表,只有当它们的值与默认值不同时才应该添加。
默认的分子类型是基因组DNA。如果提交来源于信使核糖核酸,您可以将此信息添加到FASTA定义行。当使用tbl2asn提交mRNA序列时,必须在FASTA定义行中指定分子类型。例如:
【moltype=mRNA】
为了指定尚未列入NCBI分类浏览器,可以在FASTA定义行中使用修饰符“gcode”或“mgcode”。只有当序列来自线粒体时,才需要包含mgcode。在这两种情况下,修饰符的值都必须是整数分配给适当的遗传密码。例如:
[g代码=1]或[mg代码=5]
将核遗传密码设置为“标准密码”(翻译表1),或将线粒体遗传代码设置为“无脊椎动物线粒体密码”(转换表5)。