蛋白质

数据库

基因组学、功能基因组学和遗传学研究的集合及其结果数据集的链接。该资源描述了项目范围、材料和目标,并提供了一种机制来检索由于注释不一致、多次独立提交以及经常存储在不同数据库中的不同数据类型的多样性而通常很难找到的数据集。

序列比对和图谱的集合,代表分子进化中保守的蛋白质结构域。它还包括域与MMDB数据库中已知三维蛋白质结构的比对。

HIV-1,人类蛋白质相互作用数据库

已知HIV-1蛋白与人类宿主蛋白相互作用的数据库。它提供了已发表的蛋白质相互作用报告的注释书目,以及相应PubMed记录和序列数据的链接。

相同的蛋白质组

描述在GenBank和RefSeq的注释编码区以及SwissProt和PDB蛋白质序列中识别的蛋白质的合并记录集合。该资源使研究人员能够获得更有针对性的搜索结果,并快速识别感兴趣的蛋白质。

相关蛋白质序列(簇)的集合,由完整的原核和细胞器质粒和基因组编码的参考序列蛋白质组成。该数据库提供了对注释信息、出版物、域、结构、外部链接和分析工具的轻松访问。

一个数据库,包括来自各种来源的蛋白质序列记录,包括GenPept、RefSeq、Swiss-Prot、PIR、PRF和PDB。

蛋白质家族模型是代表具有共同功能的同源蛋白质的模型集合。它包括保守域结构、隐马尔可夫模型和BlastRules。原核生物基因组注释管道使用这些模型的子集(PGAP程序)为预测的蛋白质指定名称和其他属性。

由NCBI产生的精选、非冗余基因组DNA、转录物(RNA)和蛋白质序列的集合。RefSeq为基因组注释、基因鉴定和表征、突变和多态性分析、表达研究和比较分析提供了稳定的参考。通过核苷酸和蛋白质数据库访问RefSeq集合。

下载

为Solaris、LINUX、Windows和MacOSX系统提供了本地使用的BLAST可执行文件。有关更多信息,请参阅ftp目录中的README文件。用于BLAST核苷酸、蛋白质和翻译搜索的预格式化数据库也可在db子目录下下载。

FTP:BLAST数据库

用于独立BLAST程序的序列数据库。此目录中的文件是预格式化的数据库,可以与BLAST一起使用。

FTP:客户尽职调查

该网站提供了CDD的完整数据记录,以及各个位置特定评分矩阵(PSSM)、mFASTA序列和每个保守域的注释数据。有关详细信息,请参阅README文件。

FTP:FASTA BLAST数据库

FASTA格式的序列数据库,用于独立的BLAST程序。这些数据库必须使用formatdb格式化,然后才能与BLAST一起使用。

FTP:GenPept

为每个GenBank版本收集与GenBank中编码序列(CDS)翻译相对应的蛋白质序列。。有关更多信息,请参阅目录中的README文件。

FTP:参考序列

该站点包含参考序列(RefSeq)集合中的所有核苷酸和蛋白质序列记录。“release”目录包含完整集合的最新版本,而选定生物体(如人类、老鼠和老鼠)的数据可在单独的目录中获得。数据以FASTA和平面文件格式提供。有关详细信息,请参阅README文件。

提交文件

生物项目提交

一个在线表单,为研究人员、财团和组织注册其生物项目提供界面。这是为研究提交基因组和遗传数据的起点。生物项目注册时无需提交数据。

工具

查找生物序列之间的局部相似区域。该程序将核苷酸或蛋白质序列与序列数据库进行比较,并计算匹配的统计意义。BLAST可用于推断序列之间的功能和进化关系,以及帮助识别基因家族成员。

批次输入

允许您通过上传核苷酸或蛋白质数据库中的GI或登录号文件,或其他Entrez数据库中的唯一标识符文件,从许多Entrez数据中检索记录。搜索结果可以以各种格式直接保存到计算机上的本地文件中。

COBALT公司

COBALT是一种蛋白质多序列比对工具,它使用RPS-BLAST、BLASTP和PHI-BLAST,从保守域数据库、蛋白质模体数据库和序列相似性中找到一组成对约束。

从NCBI的Entrez检索服务查看三维结构的独立应用程序。Cn3D在Windows、Macintosh和UNIX上运行,可以配置为从大多数流行的web浏览器接收数据。Cn3D同时显示结构、序列和对齐,并具有强大的注释和对齐编辑功能。

识别蛋白质序列中存在的保守结构域。CD-Search使用RPS-BLAST(反向位置特定BLAST)将查询序列与保存域数据库(CDD)中保存的域比对生成的位置特定得分矩阵进行比较。

提供在常规web查询界面之外访问NCBI Entrez系统内数据的工具。它们提供了一种在软件应用程序中自动化Entrez任务的方法。每个实用程序都执行一个专门的检索任务,只需编写一个特殊格式的URL即可使用。

一种用于计算蛋白质与基因组核苷酸序列比对的实用程序。它基于Needleman-Wunsch全局比对算法的一种变体,特别考虑了内含子和剪接信号。由于该算法,ProSplign能够准确地确定剪接位点,并且能够容忍测序错误。

序列查看器

提供核苷酸或蛋白质序列的可配置图形显示,以及已在该序列上注释的特征。除了在NCBI序列数据库页面上使用外,此查看器还可以作为可嵌入的网页组件使用。详细文档包括API参考指南,供希望将查看器嵌入自己页面的开发人员使用。