膜蛋白资源

介绍

什么是膜蛋白?

膜定义了细胞和细胞器的边界,由磷脂双层组成。膜蛋白嵌入磷脂双层或与磷脂双层相关。膜蛋白对细胞生存和跨膜通讯至关重要分子转运体,信号受体,离子通道、和虽然膜蛋白由大约五分之一的人类基因编码,但它们占所有药物靶点的一半。

与可溶性球状蛋白不同,膜蛋白的表面有疏水性氨基酸侧链,因此可以与疏水性磷脂双层结合并嵌入其中。然而,当这些蛋白质从脂质中分离出来时,它们往往会聚集和/或沉淀。因此,实验确定的膜蛋白结构在PDB档案中的代表性不足。然而,最近实验设计的改进(例如冷冻电子显微镜的使用以及洗涤剂、脂质分子、囊泡和纳米盘的加入为膜蛋白结构的测定提供了丰富的新可能性。

为什么了解膜蛋白很重要?

由于膜蛋白的膜相关区域和膜穿越区域具有不同的特性,识别蛋白质中的这些区域可以帮助我们了解膜蛋白的稳定性和功能。例如,了解蛋白质的哪些部分面对细胞溶质,哪些部分是细胞外的,可以帮助我们识别膜受体的配体结合域和信号传递域。一般来说,膜蛋白可以根据其不同的时空特征进行分类:

  • 基于膜结合持续时间的分类:
    • 整合膜蛋白被永久地附着在脂质双层上,或者嵌入膜中或者锚定在膜上。
    • 外周膜蛋白与膜或膜蛋白形成短暂复合物。
  • 基于膜结合模式的分类:
    • 跨膜(或比特)蛋白质至少穿过膜层一次。
    • 单主题膜蛋白附着在脂质双层的单侧。它们可以与脂质分子共价结合,或通过两亲性α螺旋、疏水环或静电相互作用与膜相互作用。

文档

如何在PDB中识别膜蛋白结构?

虽然膜蛋白由螺旋和片状物组成,但它们有一些独特的特征和性质,使其区别于任何其他可溶性蛋白。这些蛋白质的PDB结构通常不包括脂质双层,因此必须由专家手动和/或编程注释膜结合区域。根据膜蛋白注释,这些蛋白质可以根据其膜相关区域以各种方式组织。

四种外部资源用于将PDB档案中的条目注释为膜蛋白:

这些资源中的每一种都使用了各种方法和策略来注释膜蛋白(在Shimuzu,2018年). 一些膜蛋白结构被所有四种外部资源一致注释。根据使用的注释策略,一些膜蛋白结构仅由单个资源注释。例如,OPM覆盖的外周膜蛋白的比例比其他资源中所代表的要高得多。相比之下,MemProtMD专门考虑整体膜蛋白。

不同类型的膜蛋白信息来源于四种资源中的每一种(见表1)。所有四种外膜分类资源都提供了PDB入门级信息。通过与相关UniProt特征或关键字(“跨膜区”、“膜内区”、‘信号肽’、‘转运肽’、“膜”和‘细胞膜’)交叉引用,这些数据映射到这些条目中的单个实体。OPM和mpstruc资源提供了膜蛋白的详细分类,OPM和PDBTM提供了与膜相关的特定序列片段的信息。分类和膜蛋白片段注释都集成到rcsb.org中,可以在那里访问。此外,OPM、PDBTM和MemProtMD提供了它们自己的相对于蛋白质的膜层可视化。

表1:下表总结了OPM、PDBTM、MemProtMD和mpstruc提供的信息类型。

提供的信息 OPM公司 PDBTM公司 MemProtMD公司 mpstruc结构
注释性膜蛋白的详细分类 集成到rcsb.org中;显示为浏览树 集成到rcsb.org中;显示为浏览树
膜相关序列片段 集成到rcsb.org中;显示为实体级信息 集成到rcsb.org中;显示为实体级信息
蛋白质背景下膜层的三维可视化 在外部资源中可用 在外部资源中可用 在外部资源中可用

如何获取膜蛋白信息?

来自外部资源的各种注释和分类可以帮助人们识别PDB中的膜蛋白,了解膜相关序列片段,并在3D中可视化膜相对于蛋白质的位置。

使用高级搜索系统搜索OPM、PDBTM、MemProtMD或mpstruc注释显示所有注释为膜蛋白的条目通过这些资源之一。

浏览膜蛋白树

“浏览注释”功能允许使用来自OPM公司mpstruc结构资源。这两种资源的层次结构也显示在分类膜蛋白的注释页面上。

结构摘要页面上的膜注释

如果条目是膜蛋白,则结构摘要页面包含特殊的“膜蛋白”备注。此链接指向条目的“注释”页面。对于结构中的每个膜蛋白实体,页面的大分子部分都有一个专用的“膜实体”标签。OPM、PDBTM和MemProtMD的外部链接可通过注释页面获得,并提供相应膜蛋白条目的详细信息。

1D序列视图中的膜注释

OPM和PDBTM在序列水平上提供膜相关片段的信息。此信息可在蛋白质特征视图以及UniProt关于跨膜和膜内区域的注释。

如果外部资源使用非标准链标识符,则蛋白质特征视图中可能会缺少注释(就像OPM和PDB ID一样6千33). UniProt、OPM和PDBTM报告的序列位置之间预计存在细微差异。

在3D视图中预测和可视化膜位置(以摩尔*为单位)

膜蛋白的结构摘要页面包含一个链接,链接到一个特殊的Mol*可视化,该可视化显示预测的膜位置和方向,通过ANVIL(脂质双层的赋值和可视化,Postic,2016年)算法。ANVIL是TMDET算法的简化版本(Tusnády,2004年),PDBTM使用的算法。Mol*包含ANVIL算法的实现,该算法将膜模拟为两个半透明圆形平面段之间的空间。值得注意的是,这是一个没有实验数据支持的预测。

ANVIL根据疏水性对20种典型氨基酸进行分类,这决定了它们嵌入膜的倾向。该算法重点关注与溶剂或膜相互作用的“暴露”残留物,根据其溶剂可及表面积进行识别和过滤。最佳膜位置假定为嵌入最大数量的暴露疏水残基,同时排除最大数量的外露亲水残基。基于此假设,ANVIL迭代优化其对膜位置和厚度的预测。

该算法的一个缺点是,它只考虑聚合物残留物,而忽略了结构中建模的脂质,从而导致预测不完美,例如PDB ID的预测2xtv电视ANVIL对NMR测定的蛋白质的预测也有缺陷(例如,PDB ID5x29像素)在这种情况下,切换到不同的核磁共振模型可能会提供更好的结果。另一个有趣的例子是细菌外排泵(例如,5v5秒)可以穿过多个膜(见其着色PDBTM公司条目)。

OPM、PDBTM和MemProtMD资源也提供了自己的膜定向数据和可视化。用户可以访问这些外部资源以获取详细信息。

例子

PDB条目第3页6人类嵌合β的特征2-肾上腺素能受体与G蛋白和纳米体的复合物。受体本身是一种嵌合分子(意味着在N末端有一种细菌蛋白与人类蛋白融合,以增加溶解性和稳定性)。然而,研究(和这里的讨论)的重点是具有跨膜螺旋的人类受体蛋白(见图1)。可以访问与膜关联相关的各种信息:

  • 单击页面顶部膜蛋白行旁边的超链接“是”链接到结构摘要页面的注释选项卡,其中提供了标记的膜相关外部资源的其他详细信息(图3)。单击特定实体的Macromoles部分中的超链接“Yes”也会打开相同的Annotations选项卡(参见图2)。
  • 单击任何带有外部资源名称的橙色框,将打开包含其他信息的特定资源页面。
  • 点击结构图像下方的超链接单词“Predict Membrane”(预测膜)(见图5),打开一个标记了膜位置的专用3D可视化页面(图6)。
图1:PDB ID 3sn6的Structure Summary页面的标题,在红色框中显示了更多有关此结构中膜注释关联的学习选项。
图1:PDB ID 3sn6的Structure Summary页面的标题,在红色框中显示了更多有关此结构中膜注释关联的学习选项。

在结构摘要页面上,受体蛋白为实体4,并显示专用的“膜实体”属性(图2)。这表明该实体被OPM、PDBTM、MemProtMD或mpstruc注释为跨膜或膜相关。

图2:实体4的信息,指示OPM、PDBTM、MemProtMD或mpstruc中的注释的存在,并在Structure Summary页面的annotations选项卡中链接到这些注释。
图2:实体4的信息,指示OPM、PDBTM、MemProtMD或mpstruc中的注释的存在,并在Structure Summary页面的annotations选项卡中链接到这些注释。

单击Structure Summary页面顶部“Membrane Protein”行旁边的超链接“Yes”,指向Structure Summary页面的Annotations选项卡(图3)。该视图提供了当前膜蛋白注释(以及所有其他注释)的详细信息。

图3:注解页面上提供了详细信息。外部链接指向OPM、PDBTM、MemProtMD或mpstruc。OPM和mpstruc有详细的分类。粗体链接启动对具有相同注释的蛋白质的搜索
图3:注解页面上提供了详细信息。外部链接指向OPM、PDBTM、MemProtMD或mpstruc。OPM和mpstruc有详细的分类。粗体链接启动对具有相同注释的蛋白质的搜索

单击“结构摘要”页面上的“序列”选项卡并选择实体4,可以查看该实体的氨基酸序列,以及来自各种资源的残留水平注释。OPM和PDBTM的膜段注释包括分类蛋白质。

图4:(1D)序列注释上的膜蛋白片段注释
图4:(1D)序列注释上的膜蛋白片段注释

任何注释为膜蛋白的条目都包含一个链接,指向一个特殊的Mol*查看器,该查看器可以预测和可视化膜的位置和方向。点击结构缩略图下方的Predict membrane选项,可以可视化膜位置预测(图5)。请注意,链接将特定于所显示的程序集。使用顶部的箭头切换到另一个组件(如果适用)或非对称装置。

图5:可视化膜蛋白实体中预测的膜位置的选项:单击Structure Summary页面上突出显示的按钮。
图5:可视化膜蛋白实体中预测的膜位置的选项:单击Structure Summary页面上突出显示的按钮。

点击“预测膜”按钮打开所选不对称单元或生物组件的Mol*视图,并将ANVIL算法预测的膜方向可视化为两个半透明圆形平面段(见图6)。两个膜平面之间的空间表示膜的位置。氨基酸是根据其疏水性值着色。将鼠标悬停在单个残留物上,会在右下角报告其身份。在3D画布顶部的序列面板中高亮显示它。。单击“膜方向”组件以关注或隐藏膜视觉效果。

值得注意的是,这里显示的膜位置是一个预测,没有实验数据支持。对于不穿过膜层的单主题/外周蛋白和含有少于15个残基的微小结构,没有可用的预测。

图6:Mol*中的专用3D可视化页面,预测的膜位置标记在PDB条目中,由两个透明的圆形平面段显示。可以使用Mol*选项更改视觉参数。
图6:Mol*中的专用3D可视化页面,预测的膜位置标记在PDB条目中,由两个透明的圆形平面段显示。可以使用Mol*选项更改视觉参数。

工具书类

  • Bittrich,S.、Rose,Y.、Segura,J.、Lowe,R.、Westbrook,J.D.、Duarte,J.M.和Burley,S.K.(2021年)。RCSB蛋白质数据库:改进了PDB中存档的膜蛋白结构的注释、搜索和可视化。生物信息学,btab813,doi:10.1093/生物信息学/btab813
  • White,S.H.(2009)。膜蛋白的生物物理分离。《自然》,459.7245,344-346,doi:10.1038/性质08142.
  • Newport,T.D.、Sansom,M.S.P.和Stansfeld,P.J.(2019年)。MemProtMD数据库:膜包埋蛋白质结构及其脂质相互作用的资源。核酸研究,47(D1),D390-D397,doi:10.1093/nar/gky1047.
  • Lomize,M.A.、Pogozheva,I.D.、Joo,H.、Mosberg,H.I.和Lomise,A.L.(2012)。OPM数据库和PPM web服务器:用于定位膜中蛋白质的资源。核酸研究,40(D1),D370-D376,doi:10.1093/nar/gkr703.
  • Kozma,D.、Simon,I.和Tusnady,G.E.(2012年)。PDBTM:8年后跨膜蛋白质的蛋白质数据库。核酸研究,41(D1),D524-D529,doi:10.1093/nar/gks1169.
  • Shimizu,K.、Cao,W.、Saad,G.、Shoji,M.和Terada,T.(2018年)。膜蛋白结构数据库的比较分析。生物化学与生物物理学报(BBA)-生物膜,1860(5),1077-1091,doi:10.1016/j.bbamem.2018.01.005.
  • Postic,G.、Ghouzam,Y.、Guiraud,V.和Gelly,J.C.(2016)。通过二元分类方法对高分辨率和低分辨率蛋白质结构进行膜定位。蛋白质工程,设计与选择,29(3),87-92,doi:10.1093/蛋白质/gzv063.
  • Tusnády,G.E.、Dosztányi,Z.和Simon,I.(2004年)。蛋白质数据库中的跨膜蛋白质:鉴定和分类。生物信息学,20(17),2964-2972,doi:10.1093/生物信息学/bth340.
  • Dobson,L.、Gerdán,C.、Tusnády,S.、Szekeres,L.,Kuffa,K.、Langó,T.…&Tusnády,G.E.(2024年)。UniTmp:跨膜蛋白的统一资源。核酸研究,52(D1),D572-D578,doi:10.1093/nar/gkad897.


请向报告任何遇到的断开链接info@rcsb.org
上次更新时间:2024年2月29日