蛋白质数据库中3D结构的组织


视频:条目、实体、程序集和实例


概述

生物分子是层次结构。例如,蛋白质由线性氨基酸链组成,这些氨基酸链(通常)折叠成紧密的亚单位,然后可以与其他蛋白质、小分子配体、水或其他溶剂分子结合成更高级的组装体。蛋白质数据库(PDB)档案中的生物分子使用此层次结构进行组织和表示,以简化搜索和探索。

定义

通常使用四个层次结构级别:条目、实体、实例和程序集:

  • ENTRY是与存放在PDB中的特定结构有关的所有数据,并用称为PDB标识符或PDB ID(例如2hbs)的4个字符的字母数字标识符指定。
  • 实体是一种化学上独特的分子,可以是聚合物,例如蛋白质链或DNA链,也可以是非聚合物,例如可溶性配体。一些条目甚至可能具有分支聚合物实体,例如低聚糖。
  • 实例是实体的特定出现。ENTRY可以包含实体的多个实例,例如,同源寡聚蛋白中的蛋白质链的多个副本。
  • 组件是由一个或多个实体的一个或一个以上实例组成的生物相关组,这些实体相互关联以形成稳定的复合物和/或执行功能。

探索PDB的相关性

理解这些术语中的层次结构有助于探索PDB,搜索和识别相关结构,并对其进行有意义的可视化/分析。

  • PDB中的每个ENTRY包含至少一个聚合物实体或一个分支实体(线性或分支低聚糖)。入口由PDB ID标识。
  • 由于ENTRY中可以有给定实体的多个实例,因此聚合物或分支实体的每个实例都有一个唯一的链标识符或链ID(一个或多个字母数字字符,例如a、AA…)。链ID提供了一种简单的方式来参考、选择和显示每个聚合物和支链实体的每个特定实例。然而,没有指定链ID的具体理由。因此,在同一蛋白质的两个不同入口中分配给实体的链ID可能不同。了解有关标识符的更多信息在这里
  • 非聚合物实体的每个实例由聚合物实体的最近相邻实例的链ID标识,并通过唯一编号进行额外区分(例如,与ID=a的同一蛋白质链相关联的两个血红素基团可标识为A101和A102)。
  • 形成ASSEMBLIES的实体实例的各种分组被分配了程序集ID(例如,1、2、…)。

总之,沉积的ENTRY包含至少一个聚合物或分支实体的一个或多个实例,它们排列在一个或更多组件中。

例子

图1:PDB条目2hbs中的实体、条目、实例和程序集示例
图1:PDB条目2hbs中的实体、条目、实例和程序集示例
  1. PDB ENTRY 2hbs包括两个完整的镰状细胞血红蛋白四聚体,其中包含血红素辅因子,并被许多水分子包围。
  2. 每个四聚体都是一个组件(具有不同的生物组件ID),由两个聚合物实体组成:α链的两个实例(以橙色和黄色显示)和β链的两种实例(以蓝色阴影显示)。四聚体还包括四个血红素片段(与蛋白质链的四个片段相关)和许多水片段。血红蛋白的两个四聚体组合几乎相同。在细胞中,这种四聚体是与血液结合并输送氧气的功能单位。
  3. 除了聚合物实体外,ENTRY还包括两个非聚合物实体:血红素(残留名称HEM,此处以红色显示)和水(残留名称HOH,此处以绿色显示)。有八个血红素片段,每个片段与α链或β链结合,入口中有几百个水片段。
  4. 该ENTRY包括两个聚合物实体,α链和β链。
  5. 这里,alpha链实体的所有四个实例都是彩色的(为清晰起见,未显示水域)。
  6. 这里,阿尔法链实体的一个实例是彩色的(为清晰起见,未显示水域)。


请向报告任何遇到的断开链接info@rcsb.org
上次更新时间:2023年10月25日