DNA和RNA

数据库

装配

一种数据库,提供有关组装基因组结构、组装名称和其他元数据、统计报告以及基因组序列数据链接的信息。

生物采集

为文化藏品、博物馆、标本馆和其他自然历史藏品策划的一组元数据。这些记录显示了藏品代码、藏品所在机构的信息以及与NCBI相关数据的链接。

基因组学、功能基因组学和遗传学研究的集合及其结果数据集的链接。该资源描述了项目范围、材料和目标,并提供了一种机制来检索由于注释不一致、多次独立提交以及经常存储在不同数据库中的不同数据类型的多样性而通常很难找到的数据集。

生物样品

BioSample数据库包含实验分析中使用的生物源材料的描述。

共识CDS(CCDS)

一项合作努力,以确定一组具有一致注释和高质量的人类和小鼠蛋白质编码区的核心。

包括单核苷酸变异、微卫星和小规模插入和缺失。dbSNP包含特定人群的频率和基因型数据、实验条件、分子背景以及中性变异和临床突变的映射信息。

NIH基因序列数据库,是所有公开可用DNA序列的注释集合。GenBank是国际核苷酸序列数据库合作组织的一部分,该组织由日本DNA数据库(DDBJ)、欧洲分子生物学实验室(EMBL)和NCBI的GenBank组成。这三个组织每天交换数据。GenBank由几个部门组成,其中大部分可以通过核苷酸数据库访问。例外情况是EST和GSS部门,分别通过核苷酸EST和核苷酸GSS数据库访问。

流感病毒

NIAID流感基因组测序项目和GenBank的数据汇编。它提供了流感序列分析、注释和提交给GenBank的工具。该资源还链接到其他流感序列资源,以及关于流感病毒的出版物和一般信息。

NCBI病原检测项目

一个涉及收集和分析来自食品、环境和患者分离物的细菌病原基因组序列的项目。目前,一个自动化管道集群并识别主要由公共卫生实验室提供的序列,以协助调查食源性疾病暴发并发现潜在的食品污染源。

来自多个来源的核苷酸序列集合,包括GenBank、RefSeq、第三方注释(TPA)数据库和PDB。搜索核苷酸数据库将从其每个成分数据库中产生可用的结果。

来自比较研究的相关DNA序列数据库:系统发育、种群、环境,以及在较小程度上的突变。数据库中的每条记录都是一组DNA序列。例如,种群集提供了生物体内遗传变异的信息,而系统发育集可能包含从几个相关生物体获得的单个基因的序列及其比对。

探查

设计用于多种生物医学研究应用的核酸试剂的公共注册,以及试剂分配器、探针有效性和计算序列相似性的信息。

人类基因特异性参考基因组序列的集合。RefSeq基因是NCBI RefSeq数据库的一个子集,是根据特定于当地数据库和基因检测社区的管理者的审查而定义的。它们为报告突变、建立一致的内含子和外显子编号约定以及定义其他具有生物学意义的变异的坐标奠定了稳定的基础。RefSeqGene是基因座参考基因组的一部分(液化天然气)协作。

由NCBI产生的精选、非冗余基因组DNA、转录物(RNA)和蛋白质序列的集合。RefSeq为基因组注释、基因鉴定和表征、突变和多态性分析、表达研究和比较分析提供了稳定的参考。通过核苷酸和蛋白质数据库访问RefSeq集合。

序列读取档案(SRA)存储来自下一代测序平台的测序数据,包括Roche 454 GS System®、Illumina Genome Analyzer®、Life Technologies AB SOLiD System®、Helicos Biosciences Heliscope®、Complete Genomics®和Pacific Bioscinces SMRT®。

第三方注释(TPA)数据库

一个数据库,包含根据GenBank中现有的主要序列数据构建的序列。这些序列和相应的注释得到了实验支持,并发表在同行评审的科学期刊上。TPA记录通过核苷酸数据库检索。

下载

为Solaris、LINUX、Windows和MacOSX系统提供了本地使用的BLAST可执行文件。有关更多信息,请参阅ftp目录中的README文件。用于BLAST核苷酸、蛋白质和翻译搜索的预格式化数据库也可在db子目录下下载。

FTP:BLAST数据库

用于独立BLAST程序的序列数据库。此目录中的文件是预格式化的数据库,可以与BLAST一起使用。

FTP:FASTA BLAST数据库

FASTA格式的序列数据库,用于单机BLAST程序。这些数据库必须使用formatdb进行格式化,然后才能与BLAST一起使用。

FTP:GenBank

此站点包含GenBank中所有序列记录的默认平面文件格式的文件。这些文件由GenBank部门组织,完整内容在README.GenBank文件中进行了描述。

FTP:参考序列

该站点包含参考序列(RefSeq)集合中的所有核苷酸和蛋白质序列记录。“发布”目录包含完整集合的最新发布,而选定生物体(如人类、小鼠和大鼠)的数据可在单独的目录中获得。数据以FASTA和平面文件格式提供。有关详细信息,请参阅README文件。

FTP:序列读取存档(SRA)下载工具

此站点包含由提交的测序项目组织的下一代测序数据。

FTP:UniVec

此站点包含FASTA格式的UniVec和UniVec_Core数据库。有关详细信息,请参阅README.uv文件。

FTP:全基因组鸟枪序列

该站点包含由4位项目代码组织的全基因组鸟枪序列数据。数据包括GenBank和GenPept平面文件、质量分数和汇总统计数据。有关更多信息,请参阅README.genbank.wgs文件。

提交文件

生物项目提交

一个在线表单,为研究人员、财团和组织注册其生物项目提供界面。这是为研究提交基因组和遗传数据的起点。生物项目注册时无需提交数据。

一个基于web的序列提交工具,用于向GenBank数据库提交一个或几个文件,旨在使提交过程快速简便。

GenBank:条形码

用于将标准遗传位点的条形码短核苷酸序列提交给GenBank数据库以用于物种鉴定的工具。

一个命令行程序,使用与Sequin相同的许多功能自动创建序列记录以提交给GenBank。它主要用于提交完整基因组和大批量序列。

序列读取存档提交

此链接描述了SRA数据的提交者如何为其数据获取安全的NCBI FTP站点,还描述了允许的数据格式和目录结构。

提交门户

提交者链接到NCBI所有数据提交流程并查找相关信息的单一入口点。目前,这是生物项目和生物样品注册以及WGS和GTR数据提交的接口。该网站未来的新增内容正在计划中。

工具

查找生物序列之间的局部相似区域。该程序将核苷酸或蛋白质序列与序列数据库进行比较,并计算匹配的统计意义。BLAST可用于推断序列之间的功能和进化关系,以及帮助识别基因家族成员。

批量输入

允许您通过上传核苷酸或蛋白质数据库中的GI或登录号文件,或其他Entrez数据库中的唯一标识符文件,从许多Entrez数据中检索记录。搜索结果可以以各种格式直接保存到计算机上的本地文件中。

提供在常规web查询界面之外访问NCBI Entrez系统内数据的工具。它们提供了一种在软件应用程序中自动化Entrez任务的方法。每个实用程序都执行一个专门的检索任务,只需编写一个特殊格式的URL即可使用。

基因组BLAST

该工具将核苷酸或蛋白质序列与基因组序列数据库进行比较,并使用基本局部比对搜索工具(BLAST)算法计算匹配的统计显著性。

打开阅读框查找器(ORF查找器)

一种图形分析工具,用于查找用户序列中或数据库中已有序列中的所有打开的读取帧。可以使用16种不同的遗传密码。推导出的氨基酸序列可以以各种格式保存,并使用BLAST根据蛋白质数据库进行搜索。

Primer-BLAST工具使用Primer3为序列模板设计PCR引物。然后根据用户指定的数据库,通过BLAST搜索自动分析潜在产品,以检查目标的特异性。

用于计算蛋白质与基因组核苷酸序列的比对的实用程序。它基于Needleman-Wunsch全局比对算法的一种变体,特别考虑了内含子和剪接信号。由于该算法,ProSplign能够准确地确定剪接位点,并且能够容忍测序错误。

序列查看器

提供核苷酸或蛋白质序列的可配置图形显示,以及已在该序列上注释的特征。除了在NCBI序列数据库页面上使用外,此查看器还可以作为可嵌入的网页组件使用。详细文档包括API参考指南,供希望将查看器嵌入自己页面的开发人员使用。

计算cDNA到基因组序列比对的实用程序。它基于Needleman-Wunch全局对齐算法的一种变体,特别考虑了内含子和剪接信号。由于该算法,Splign能够准确地确定剪接位点并容忍测序错误。

VecScreen(视频屏幕)

一种用于快速鉴定可能是载体来源的核酸序列片段的系统。VecScreen在查询序列中搜索与专用非冗余向量数据库(UniVec)中任何序列匹配的段。