美国国旗

美国政府的官方网站

什么是GSS?

GenBank的GSS分部与EST分部相似,只是大多数序列起源于基因组,而不是cDNA(mRNA)。需要注意的是,两类(外显子捕获产物和基因捕获产物)可通过cDNA中间产物衍生。分析这些类别中的任意一个序列时应小心,因为剪接事件可能已经发生,并且与基因组序列相比,记录中表示的序列可能会中断。GSS部门包含(但不限于)以下类型的数据:

  • 随机“单通读取”基因组调查序列。
  • cosmid/BAC/YAC末端序列
  • 外显子捕获基因组序列
  • Alu PCR序列
  • 转座标记序列

GenBank 96.0第1.3.3节发行说明提供了有关GSS部门的更多信息。

dbGSS序列并入GenBank(基因银行).

如何提交数据

从2019年开始,您可以使用tbl2asn(待定)。只有REQUIRED下的输入数据文件1和2才能生成GSS提交。

  1. 模板文件包含文本ASN.1 Submit-block对象(后缀.sbt)
  2. 核苷酸序列数据FASTA格式(后缀.fsa)
    FASTA文件中的每个序列应包括[生物体=属种][tech=调查][moltype=基因组DNA]。SeqID将用作克隆值。您可以使用其他相关源修饰符以及[strain=ABC123]、[clone-lib=BAC库]等。
  3. 功能不是必需的,但您可以包括要素表注释中带有“类似…”的每个序列不超过一个misc_feat。GSS不可应用其他功能。

生成template.sbt和GSS.fsa文件后,运行tbl2asn的命令行如下所示:

tbl2asn-t模板.sbt-i GSS.fsa-a s-V V

本例中生成的提交文件为GSS.sqn

tbl2asn页面上提供了对可能的命令行参数的更详细描述。

您还可以包括生物项目生物样品信息,如果GSS序列是更大的正在进行的项目的一部分。

请将GSS提交文件(.sqn文件)发送至gb-sub@ncbi.nlm.nih.gov。

任何问题均可发送至info@ncbi.nlm.nih.govgb-admin@ncbi.nlm.nih.gov。

访问dbGSS的其他方式

GSS序列包含在GenBank的GSS部门中,可从NCBI通过E-Utilities获得。

GSS序列也可以通过匿名FTP在FTP.nlm.nih.gov的/repository/dbGSS目录中获得

请注意,2018年底之前收到的GSS可通过FTP获取,网址为FTP.ncbi.nlm.nih.gov/repository/dbGSS

2018年后收到的GSS将不包括在此格式中。

上次更新时间:2019-06-05T20:59:28Z