蛋白质结构域和大分子结构:
用于发现序列/功能/结构关联的工具
 
 
 
 

各种数据类型,如文献、核苷酸和蛋白质序列以及三维结构,通常由不同的研究小组相互独立地提交到公共数据库。然而,这些数据通过不同的研究方法对同一主题的报道而相互关联,它们所包含的信息之和大于任何一部分。

为了解决这一问题,NCBI蛋白质分类和结构小组致力于提供更广泛的NCBI工作集成访问以前不同的数据通过Entrez公司检索系统,使用计算方法识别相关数据,并使从文学关于疾病基因位置和顺序蛋白质序列保守域&蛋白质功能,3D结构,小分子&它们的生物活性等等。

下图提供了一个例子,以公共医学关于人类的文章CLCN1基因和贝克尔型肌强直,然后与蛋白质序列,其保守域、和相关3D结构.如果要以交互方式探索这些路径,请打开PubMed记录PMID 7951242如下所示(或公共医学或其他Entrez公司数据库),然后使用“相关信息”菜单,以选择感兴趣的相关数据并开始遍历Entrez系统。

由于Entrez用户界面的不断增强,实时Entrez系统中相关数据链接的确切外观和位置可能与下图不同。它们可以显示为“链接“显示器顶部附近的下拉菜单或广告在显示器的右边距(例如查找相关数据搜索结果页面右边距的下拉菜单,或相关信息“数据库记录右侧空白处显示的广告)。

 
Entrez中通过其Links功能进行数据集成的示例。从任何Entrez数据库中的单个记录开始,您可以使用Links菜单遍历其他Entrez数据中的相关数据。这可以通过识别先前不同数据之间的关联来促进生物发现。
 
 
集成访问以前不同的数据 返回顶部
 

NCBI蛋白质分类和结构组有助于更广泛的NCBI工作,通过Entrez公司检索系统。反过来,识别这些数据之间的关系可以带来新的发现。

该系统的开发是因为许多不同的实验室经常从多个角度研究生物学问题,例如人类疾病的分子机制,其中一些实验室可能专注于基因鉴定和测序,而另一些实验室可能侧重于分析蛋白质功能和三维结构,然而,其他人可能会研究相关的遗传变异、基因表达谱或表型。由于每个组独立于其他组将其数据提交到公共数据库,因此生成的不同但相关的数据集可能分散在各种数据库中。

Entrez认识到总知识的总和大于任何一个部分,因此将来自不同来源的广泛数据类型引入单个搜索系统,并确定单个数据库内和跨数据库的记录之间的关系。这些关联表示为链接在Entrez搜索结果中显示和在单个数据库记录中。因此,一旦您在Entrez中检索到一个数据元素,例如一篇报告疾病基因测序的文章的PubMed记录,那么只需单击鼠标即可获得相应的序列数据以及更多数据,如上图所示。

 

进一步阅读:

  Ostell,J.Entrez搜索和检索系统。NCBI手册[互联网],美国国家医学图书馆,国家生物技术信息中心,马里兰州贝塞斯达,第15章,2002年10月9日[2003年8月13日修订]。[引用自2008年10月2日]。可从以下位置获得https://www.ncbi.nlm.nih.gov/books/NBK21081在Entrez书架上(https://www.ncbi.nlm.nih.gov/sites/entrez?db=books)
  Geer RC、Sayers EW。Entrez:利用它的力量。生物信息简介:4(2):179-842003年6月。
 
 
 
 
2021年8月25日修订