美国国旗

美国政府的官方网站

转录组Shotgun组装序列数据库

什么是转录组霰弹枪组件(TSA)数据库?

TSA(交通安全管理局)是来自EST和下一代测序技术等原始数据的计算组装转录序列的存档。从完整转录组读取的重叠序列通过计算方法组装成转录本,而不是通过克隆cDNA的传统克隆和测序。组件中使用的主要序列数据必须由同一提交人通过实验确定。TSA序列记录与GenBank记录不同,因为组件没有物理对应项。

TSA序列记录与其他GenBank/EMBL/DDBJ记录有何不同?

TSA序列的显示与其他国际核苷酸序列数据库协作(INSDC)记录类似,但包括以下内容:

  • 每个定义行开头的标签“TSA:”。
  • DBLINK(数据库链接)
    • 生物项目
    • 生物样品
    • 序列片段归档
  • 关键词:TSA;转录组枪组件
  • 装配数据
  • 描述程序集的注释(如果来自多步骤流程)。

每个TSA项目都分配了一个稳定的4个字母的TSA加入前缀,该前缀不会随着项目的更新而改变。除了TSA加入前缀外,抄本标识符还具有与特定TSA项目更新相对应的版本号。最后,为每个单独的组件分配一个唯一的登录号,前缀为TSA登录前缀和版本号。例如,如果一个TSA项目的指定登录号是XXXX00000000,那么该项目的第一个成绩单版本将是XXXX010000000,该版本的第一个汇编将是XXXX1000001。(此ID的最后六位数字标识每个单独的组件)。重新组装项目时,新组件将作为TSA项目的02版本提交。新旧组件之间不应存在任何联系或关系,新组件将获得以XXXX02000001开头的新加入编号。发布02转录本时,01转录本被抑制。

TSA主记录的示例如下GAAA00000000。

核苷酸序列必须符合以下标准

  • 提交的序列必须根据提交者实验确定的数据进行组合。
  • 对载体污染进行筛查,并删除任何载体/链接器序列。这包括去除NextGen测序引物。
  • 序列长度应大于200 bp。
  • 不明确的基础不应超过总长度的10%或连续超过14n。
  • 如果有足够的证据证明序列之间存在链接,则可能存在已知长度的序列间隙,并使用assembly_gap特征进行注释。请参阅TSA提交指南有关添加assemblygap功能的更多信息,请参阅。
  • 间隙的长度不能未知。

要求

  • 原始读取应提交给SRA公司在提交成绩单之前。TSA提交需要SRA运行登录(SRRXXXXXX)和相关的生物项目(PRJNAXXXXX)和生物样本(SAMNXXXXX)。
  • 程序集数据结构化注释。此信息直接输入到提交门户对话框中。
  • 如果进行了多步骤装配,则应在“备注”部分中提供装配过程的描述。
  • 如果提供了注释,则产品名称应遵循国际蛋白质命名指南.
  • 对于转录组数据的所有目标子集,应包括关键字“Targeted”和特征注释。请参见针对性与非针对性TSA研究了解更多信息。
  • 注释必须具有生物有效性。

如何提交给TSA

所有TSA提交文件必须通过TSA提交提交门户。提交详细信息可在TSA提交指南.

如何更新现有TSA提交

请参见更新TSA记录.联系人gb-admin@ncbi.nlm.nih.gov还有其他问题。

如何搜索TSA序列

  • 您可以使用以下术语搜索Entrez Nucleotide:tsa-master[prop]和“Genus Species”[orgn]
    • 例如:tsa-master[prop]AND Nitella mirabilis[orgn]
  • 公众意见可通过WGS/TSA浏览器.
  • 序列可以从NCBI FTP GenBank站点.

不应提交给TSA

  • 提交者未直接对序列进行排序的程序集。
  • 基于克隆的程序集。这些文件应提交给GenBank。
  • 多个有机体的单一组合。
  • 转录组研究的子集,除非它是目标研究的一部分。请参阅TSA提交指南有关提交目标研究的更多信息。

上次更新时间:2022-08-26T17:10:33Z