美国国旗

美国政府的官方网站

目标基因座研究(TLS)提交指南

前提条件

  • 向提交序列读取SRA公司强烈推荐。
  • 生物项目生物样品ID。

    • 这个NCBI提交门户包括在提交大规模原核16S核糖体rRNA TLS项目期间进行生物项目和生物样本注册的步骤。以前分配的BioProject和BioSample ID也可以在提交向导中提供。
    • 在提交其他类型的TLS项目之前,必须将研究和样本元数据提交给BioProject和BioSample。如果序列读取已经提交,请在提交期间提供指定的生物项目和生物样本ID。

创建TLS提交文件

[1] 序列

  • 每个单独的fasta文件应包括来自单个大规模研究的序列。作为单个项目一部分的所有fasta文件中包含的序列总数应大于2500。
  • fasta文件中的每个序列都应包含一个唯一的ID。这些ID将包含在GenBank平面文件的定义行中个别序列。此序列ID可以表示OTU、phylotype或其他唯一的序列标识符。
  • 在提交之前,从序列中删除矢量、嵌合体、低质量序列和可疑数据。
  • 可以找到有关fasta文件格式和序列要求的更多信息在这里.

[2] 项目信息

包括大规模/TLS研究的描述生物项目。BioProject ID将包含在TLS主平面文件和函数中,以提供指向属于项目一部分的所有数据类型的单个链接。同一研究中的所有提交文件应包含相同的生物项目ID。

[3] 源信息

源元数据应包含在生物样品使用适当的软件包。有关每个BioSample包要求的详细信息,请参阅在这里GenBank提交向导,用于在NCBI提交门户允许使用以下包类型创建BioSamples:

  • 影响公共卫生的病原体
  • 宏基因组或环境样本
  • 基因组、元基因组或标记序列(符合MIxS):MIMS和MIMARKS(调查)

所有提交的材料都应包含有关标本获取地的丰富背景信息,包括但不限于:隔离源或宿主、采集日期、国家和经纬度。未培养样本需要一个元基因组生物名称(例如,海洋元基因组),该名称将应用于整个TLS提交。如果需要更多描述性生物名称,请发送请求至gb-admin@ncbi.nlm.nih.gov在提交文件之前。

如果提交中的序列是从多个BioSamples中获得的,则需要一个以tab分隔的映射文件,其中列出了提交中每个序列应包含的BioSample。该映射文件应包括如果样品在序列提交之前注册,则分配的BioSample Accessions。如果在16S核糖体RNA提交向导中创建了生物样本,则应使用样本名称。目前,每个序列只能包含一个生物样本ID。如果每个序列应包含多个生物样本ID,请联系gb-admin@ncbi.nlm.nih.gov.

[4] 功能

  • 核糖体RNA提交向导将包含适当的特征注释。
  • 其他序列类型,如单个基因座或保守元件,应包括适当的特征类型(如基因、misc_feature)。可以找到有关向GenBank提交数据选项的更多信息在这里.

提交TLS文件

  • 这个NCBI提交门户应使用GenBank向导提交核糖体RNA序列。
  • 其他靶向基因座研究报告应通过以下方式提交给GenBank表2asn创建可以通过电子邮件发送到的提交文件gb-sub@ncbi.nlm.nih.gov。

TLS 16S rRNA序列分析

核糖体RNA序列在被GenBank接受之前,会检查其是否存在一些问题。可以找到这些检查的摘要在这里这些包括嵌合体分析、向量筛选和序列长度。

使用额外的分析程序验证未培养原核生物大规模提交的16S rRNA,这些原核生物作为TLS项目进行处理核糖传感器(版本0.27)。在该分析中,对照rRNA参考数据集对每个序列进行BLAST,并将其与从SSU rRNA序列的代表性比对构建的轮廓HMM集进行比较。每个剖面HMM模型都是根据该系列50-100个代表性序列的多重比对构建的。包括细菌模型在内的一些比对的来源是Rfam数据库(Rfam.xfam.org)。每个序列都与每个配置文件对齐,并根据序列与配置文件的匹配程度计算分数。每个序列都是根据给它最高分数的模型进行分类的。结合BLAST和剖面HMM结果,报告具有意外特征的序列。检测到的一些意外特征示例包括分数低、覆盖率低和重复区域,这些区域暗示着装配错误。

如果序列有任何这些问题,将在提交处理过程中通知您。如果您有问题,请写信给:gb-admin@ncbi.nlm.nih.gov并包括您的提交编号。

更新TLS提交

  • 如果要更新出版物,请将TLS加入前缀和电子邮件文本部分中的完整出版物信息发送到gb-admin@ncbi.nlm.nih.gov。
  • 如果您正在更新任何其他信息,请不要创建新的提交。请联系gb-admin@ncbi.nlm.nih.gov以获取指导,并在您的请求中包含以下信息:

    • 您的更新描述
    • TLS接入前缀

    我们将发送有关如何继续进行所请求更新的说明。


上次更新时间:2022-08-16T17:42:17Z