生物单元

来自Proteopedia

跳转到:航行,搜索

这个生物单元,也称为生物组件[1][2],是第四纪构造这被认为是大分子的主要功能形式。通常不是发布的pdb文件,称为非对称单元因此,重要的是要可视化生物单元,以便将功能与结构联系起来。

目录

定义

这个生物单元,也称为生物组件[1][2],是蛋白质的四元结构,被认为是分子的主要功能形式。它可以是单个,或多个相同或不相同的四元组合例如,血红蛋白的生物单位包括两条α链和两条β链,使其成为四聚体α2β2结构。当一个生物单元包含多条链,这些链共同进化并相互结合时,它也可以被称为特异性低聚物.

当然,一组条件下的功能形式(生物单元)可能会在不同的条件下发生变化,因此可能存在包含给定蛋白质链的多个功能形式(生物学单元)。例如,蛋白激酶或磷酸酶的磷酸化或去磷酸化通常会改变蛋白质之间的亲和力,从而改变蛋白质的四元组装。

已发布的高分子结构数据文件(原子坐标文件,通常在PDB文件格式)包含非对称单元,可能与生物单位相同,或仅为其一部分,或可能包含多个生物单位。发生在生物单元中不存在的不对称单元中的链间接触被称为晶体触点在发表大分子结构时,作者可以选择指定生物单位。PDB文件格式,这在REMARK 350中完成。

示例

模型

在里面
非对称单元

链在中
生物单位

1b6亿
3vpa公司
第12页第8页
3dxa公司

2
4
4
15

1
1
2
5

4英里/小时
3天x千

2
7

2
7

5伏

6

6*

第1季度

2

2* **

3m6年

4

4**, 4*, 2, 2

3dxp(3dxp)
1小时
3dxr(3dxr)

1
2
2

2
4
6, 12

1sva(1sva)

6

360 (病毒衣壳)


*此生物单元中的触点不同于非对称单元中的接触。

**“作者指定”程序集(在本例中与非对称单元)考虑到国际学生成绩评估,具有更大的埋表面积。

截短的蛋白质可能形成在天然蛋白质中不可能形成的低聚物。例如,1千5(核蛋白α)是天然链的截断部分,形成二聚体,可被全长链阻止。二聚取决于Y397。突变Y397D阻止了这种人工二聚化,导致单体1个5.


可视化生物单元

蛋白质体

在标题为PDB代码,Proteopedia默认显示生物单位1,但可以选择显示非对称单位。一个简单的例子是3液压:生物单元1有4条小肽链,而不对称单元有一条单链。一个大的例子是1个pov脊髓灰质炎病毒衣壳。当生物单元1变得过大,JSmol无法有效处理时,它显示在摩尔*("Molstar公司“)而不是JSmol公司例如,东部马脑炎病毒的衣壳大得多,6米x4.

Jmol简介

Jmol中的FirstGlance使其能够快速、轻松地查看、探索和分析生物单元。FirstGlance中的初始显示自动为REMARK 350中的“生物分子1”。当它非常大时,它将简化为α-碳原子(或其子集)由FirstGlance自动执行。

  • 在FirstGlance中以Jmol显示分子:
    • 输入PDB代码位于Proteopedia中任何页面左边缘的顶部搜索栏中。在Proteopedia中标题为PDB代码的页面上资源,单击FirstGlance的链接。
    • 或者,直接转到http://FirstGlance.Jmol.Org(不是http)并输入PDB代码。
  • 分子信息选项卡(第一个/最左边的选项卡),单击生物单元并遵循说明。当有多个生物单元时,会列出所有生物单元,您可以显示和分析每个生物单元。

如何显示蛋白质体中的生物单位

请参阅生物单元:展示.

PDB文件头中REMARK 350的不可靠性

当结构物沉积在PDB公司,如果已知,作者需要指定生物单位。这在备注350的标题中给出PDB文件格式不幸的是,REMARK 350中的信息通常不正确(请参阅罗兰·邓布雷克对这个问题的讨论)[1][2]在许多例子中,作者声明生物单元是REMARK 350中的单体,但在报告生物单元是二聚体的结构的论文中提供了良好的实验证据。Jose Duarte提供了一个示例列表.

2022年,wwPDB将在PDB格式文件中添加REMARK 350存放时未注明,大多数模型由核磁共振不幸的是,添加的REMARK 350指定了“作者已确定”,尽管似乎没有就沉积模型是否被认为是生物单元(主要功能组件)征求作者的意见。一个例子是2z59型2007年存放,2008年发布,在2022年3月16日添加之前,该版本缺少REMARK 350(参见PDB格式文件中的REVDAT记录)。

在某些情况下,REMARK 350中规定了一个以上的假定生物单位。作者指定的生物单位与软件预测的生物单位不同。一个例子是3时尚,详见生物组装和PDB档案简介.

找出生物单位的最可靠方法是阅读文献和/或联系有关分子的专家。如果没有这样的努力,以下是一些建议:

  • 当REMARK 350中所述的“作者确定”生物单位具有不同数量的非对称单元生物单位更有可能是正确的,因为链的差异表明作者对REMARK 350进行了真正的考虑。
  • 当REMARK 350中所述的“作者确定”生物单位具有链数相同,但构象不同与非对称单位相比,所述生物单位更有可能是正确的,原因与上述案例中给出的相同。一个例子是第1季度,在示例上文第节。
  • 当REMARK 350中所述的“作者确定”生物单位具有相同数量的链,构象相同作为不对称单位,所述生物单位不太可能是正确的。作者很有可能未能在REMARK 350中陈述已知的生物单位(见以上示例)。
  • 确定生物单位时仅通过软件,这不太可能是正确的。该软件根据蛋白质晶体中接触物的特征进行有根据的猜测,但有时是不正确的。

从REMARK 350生成生物单元模型

以下来源根据REMARK 350生成生物单元模型。请注意,如上所述,备注350可能不正确。

Jmol限制初探

第一眼自动地显示器生物单元1,并使您能够使用FirstGlance中的所有工具进行操作。然而,你无法以PDB格式保存生物单元模型,因为内部JSmol将多字符名称分配给重复的链。例如,使用3液压,链A复制到链A1、A2、A3。这些链名称使许多软件包无法读取从FirstGlance/JSmol保存的伪PDB文件。

MakeMultimer公司

  • 迈克尔·帕尔默(加拿大安大略省滑铁卢大学)开发的MakeMultimer服务器从2010年5月到2021年末退役,在FirstGlance上运行良好。它生成了一个PDB文件,其中每个链都分配了一个独特的单字符名称,所有链都位于一个模型中。第一眼4.0,于2022年8月15日发布,旨在使生物单位PDB文件的外部生成变得不必要。

RCSB公司

  • 生物单位的原子坐标,由已发布结构的作者在REMARK 350中指定PDB文件格式,可从RCSB(美国)获得蛋白质数据库截至2010年4月,“生物组件”位于以下列表的底部下载文件(右上,靠近大PDB代码).
  • RCSB文件的一个技术问题是,当它们包含非对称单元的多个副本时,重复的链都具有相同的名称。RCSB以Jmol格式提供了这些模型的可视化,但通常很难判断生物单元中存在多少链,无论是快照(其中每条链在氨基到羧基末端的光谱序列中被类似地着色)还是Jmol,其中通过链着色无法区分同名链。此外,附加副本位于单独的模型中,这通常会使可视化变得复杂。相比之下,PISA提供的生物单位坐标(见下文)是在一个模型中,每条链都有一个不同的名称。RCSB还提供了一个名为Kiosk的观众,但这似乎并没有显示生物组装。

对于作者指定的生物组装体,在不对称单元发表时,有时不知道特定的低聚物。此外,一些作者可能在已知生物单位的情况下也没有具体说明。指定的生物单位可能很少不正确。出于所有这些原因,建议除了REMARK 350之外,还咨询其他来源。

软件:蛋白质接口、表面和组装服务器(PISA)

这个蛋白质界面、表面和组装服务器与前身PQS相比,欧洲生物信息研究所(PISA)使用改进的方法预测生物单元或可能的四元组合。它检查了用于X射线晶体学.它试图区分晶体触点(结晶产物)和链之间的接触,它们共同进化以维持特定的寡聚物结合。

软件:进化蛋白质-蛋白质界面分类器(EPPIC)

这个进化蛋白质界面分类器服务器(EPPIC)将晶格中的所有蛋白质接触分类为生物相关或晶体接触,并评估生物相关界面如何结合成生物组装体。EPPIC采取了与PISA完全不同的方法,应该被视为PISA的补充。作者建议结合PISA来改进生物组装任务。

软件:蛋白质公共组装数据库(ProtCAD)

这个蛋白质公共组装数据库(ProtCAD)是一个基于蛋白质数据库中相同或同源蛋白质的独立实验结构测定中观察到的结构的蛋白质复合物数据库,通过多次实验进行验证。


另请参阅

网站

文献引用

文献引用可在上述链接的相应服务器上找到。

  1. 1 1.1 1.2 免费提供预印本Xu和Dunbrack于2019年发表的《实验测定蛋白质结构中生物组装的原理和特征》。
  2. 2 2.1 2.2Xu Q,Dunbrack RL Jr.实验测定蛋白质结构中生物组装的原理和特性。当前操作结构生物。2019年4月;55:34-49. doi:10.1016/j.sbi.2019.03.006。Epub,2019年4月6日。PMID:30965224数字对象标识:http://dx.doi.org/10.1016/j.sbi.2019.03.006
个人工具