美国国旗

美国政府的官方网站

什么是dbEST?

数据库EST(《自然遗传学》4:332-3;1993)是一个划分GenBank(基因银行)包含序列数据和其他关于“单程”cDNA序列或“表达序列”的信息标签”GenBank中的人类EST可用(《生物化学科学趋势》20:295-6;1995)。此外,请参阅《自然》特别版《基因组目录》(第377卷,第6547S期,1995年9月28日)。

关于EST

表达序列标签(EST)很短(通常<1000 bp),单程序列读取mRNA(cDNA)。通常是批量生产。它们代表基因的快照在特定组织和/或特定发育阶段表达阶段。它们是用于感兴趣的cDNA文库。

有关EST的其他信息,请参阅:Boguski理学硕士、Lowe TM、Tolstoshev CM。1993.dbEST——“表达序列标签”数据库。《自然遗传学》4(4):332-333。

大多数EST项目生成大量序列。这些是通常以数十批提交给GenBank和dbEST数千条条目,共享引用、提交者和来源信息。提高提交过程的效率对于这种类型的数据,我们设计了一个简化的提交进程使用tbl2asn(待定).

dbEST保留用于单次读取。组装顺序应不提交给dbEST。GenBank接受汇编的EST提交通过TSA(交通安全管理局)(转录组枪组件)部门。请联系gb-admin@ncbi.nlm.nih.gov了解更多有关向TSA提交EST程序集的信息。个人阅读组件的组成应提交给dbEST或Short在提交程序集之前,请阅读存档(SRA)。

注:来自“下一代”测序平台的序列应提交给短读存档(SRA)(如需了解,请联系sra@ncbi.nlm.nih.gov.)

不应包含在EST提交中的序列包括如下:线粒体序列、rRNA、病毒序列、载体、,污染物和低质量序列。矢量和链接器区域应为使用标识VecScreen(视频屏幕)并在提交之前删除。

如何提交数据

从2019年开始,您可以使用tbl2asn(待定). 只有REQUIRED下的输入数据文件1和2才能生成EST提交。

  1. 模板文件包含文本ASN.1 Submit-block对象(后缀.sbt)
  2. 核苷酸序列数据FASTA格式(后缀.fsa)。FASTA文件中的每个序列应包括[organic=Genus species][tech=EST][moltype=mRNA]。SeqID将用作克隆值。您可以使用其他相关源修饰符也包括组织类型、发育阶段等,如[组织类型=心肌]、[发育阶段=成人]、[应变=ABC123]等。
  3. 功能不是必需的,但您可以包括要素表注释中带有“类似…”的每个序列不超过一个misc_feat。EST不能应用其他功能。

生成template.sbt和ESTs.fsa文件后,运行tbl2asn的命令行如下所示:

tbl2asn-t模板.sbt-i ESTs.fsa-a s-V V

本例中生成的提交文件为ESTs.sqn

有关可能的命令行参数的更详细描述,请参见tbl2asn(待定)第页。

您还可以包括生物项目生物样品信息,如果EST是一个更大的正在进行的项目的一部分。

请将EST提交文件(.sqn文件)发送至gb-sub@ncbi.nlm.nih.gov。
任何问题均可发送至info@ncbi.nlm.nih.govgb-admin@ncbi.nlm.nih.gov。

访问dbEST的其他方法

EST序列包含在GenBank的EST部分,可从NCBI通过E-Utilities获得。

EST序列也可以通过匿名ftp在ftp.ncbi.nih.gov的/repository/dbEST目录中获得

请注意,2018年底之前收到的EST可通过FTP获取,网址为ftp.ncbi.nlm.nih.gov/仓库/dbEST
2018年后收到的EST将不包括在此格式中。

上次更新时间:2019-06-05T20:33:05Z