什么是GSS?
GenBank的GSS分部与EST分部相似,只是大多数序列起源于基因组,而不是cDNA(mRNA)。需要注意的是,两类(外显子捕获产物和基因捕获产物)可通过cDNA中间产物衍生。分析这些类别中的任意一个序列时应小心,因为剪接事件可能已经发生,并且与基因组序列相比,记录中表示的序列可能会中断。GSS部门包含(但不限于)以下类型的数据:
- 随机“单通读取”基因组调查序列。
- cosmid/BAC/YAC末端序列
- 外显子捕获基因组序列
- Alu PCR序列
- 转座标记序列
GenBank 96.0第1.3.3节发行说明提供了有关GSS部门的更多信息。
dbGSS序列并入GenBank(基因银行).
如何提交数据
从2019年开始,您可以使用tbl2asn(待定)。只有REQUIRED下的输入数据文件1和2才能生成GSS提交。
- 模板文件包含文本ASN.1 Submit-block对象(后缀.sbt)
- 核苷酸序列数据FASTA格式(后缀.fsa)
FASTA文件中的每个序列应包括[生物体=属种][tech=调查][moltype=基因组DNA]。SeqID将用作克隆值。您可以使用其他相关源修饰符以及[strain=ABC123]、[clone-lib=BAC库]等。
- 功能不是必需的,但您可以包括要素表注释中带有“类似…”的每个序列不超过一个misc_feat。GSS不可应用其他功能。
生成template.sbt和GSS.fsa文件后,运行tbl2asn的命令行如下所示:
tbl2asn-t模板.sbt-i GSS.fsa-a s-V V
本例中生成的提交文件为GSS.sqn
tbl2asn页面上提供了对可能的命令行参数的更详细描述。
您还可以包括生物项目或生物样品信息,如果GSS序列是更大的正在进行的项目的一部分。
请将GSS提交文件(.sqn文件)发送至gb-sub@ncbi.nlm.nih.gov。
任何问题均可发送至info@ncbi.nlm.nih.gov或gb-admin@ncbi.nlm.nih.gov。
访问dbGSS的其他方式
GSS序列包含在GenBank的GSS部门中,可从NCBI通过E-Utilities获得。
GSS序列也可以通过匿名FTP在FTP.nlm.nih.gov的/repository/dbGSS目录中获得
请注意,2018年底之前收到的GSS可通过FTP获取,网址为FTP.ncbi.nlm.nih.gov/repository/dbGSS
2018年后收到的GSS将不包括在此格式中。