摘要

动机

膜蛋白由大约五分之一的人类基因编码,但占美国FDA批准的所有药物靶点的一半以上。由于新技术的进步,PDB中保存的膜蛋白数量正在迅速增长。然而,膜蛋白的自动识别或膜位置的推断并不是一项简单的任务。

结果

我们介绍了RCSB蛋白质数据库门户网站(RCSB PDB,rcsb.org网站)提供了丰富的新膜蛋白注释,集成了四种外部资源:OPM、PDBTM、MemProtMD和mpstruc。我们大大增强了膜蛋白数据的呈现。带注释的膜蛋白数量rcsb.org网站增加了~80%。用户可以搜索这些注释,探索相应的树层次结构,在1D氨基酸序列水平显示膜片段,并在3D中可视化膜层的预测位置。

可用性和实施

注释、搜索、树数据和可视化可在我们的rcsb.org网站门户网站。开源Mol*查看器支持薄膜可视化(molstar.org网站github.com/molstar/molstar).

补充信息

补充数据可在生物信息学在线。

1引言

膜定义了细胞和细胞器的边界。它们由磷脂双层组成。膜蛋白嵌入磷脂双层或与磷脂双层相关。膜蛋白是细胞生存和跨膜通讯的关键,充当分子转运体、信号受体、离子通道甚至酶。实验方法的最新改进(例如使用冷冻电子显微镜和包含洗涤剂、脂质分子、囊泡和纳米盘)为膜蛋白结构的测定提供了大量新的可能性

膜蛋白具有不同的时空特征。完整的膜蛋白永久地附着在脂质双层上,而外围蛋白则与膜形成短暂的复合物。跨膜蛋白至少穿过膜双层一次,而单主题膜蛋白附着在脂质双层的单面。由OPM等专用资源提供的膜蛋白信息(洛米兹等。, 2012)、PDBTM(科兹马等。, 2013),MemProtMD公司(纽波特等。, 2019)和mpstruc(怀特,2009年)覆盖范围不同(清水等。, 2018)和可用信息的类型(请参见补充表S1和S2).

从历史上看,这种复杂性使得用户很难探索从蛋白质数据库(PDB)档案中免费获得的大量膜蛋白信息。在此,我们提出了新的功能,通过将来自可信外部来源的信息集成到最近简化的RCSB PDB数据管理和交付架构中,提供一致的方法来搜索、浏览和可视化膜蛋白(伯利牌手表等。, 2021;玫瑰色等。, 2021)强调灵活性、保真度、可维护性和可持续性。

2结果

2021年6月16日,PDB档案保存了10 133个聚合物实体,这些实体被先前整合的mpstruc资源注释为膜蛋白。新整合的可信资源(OPM、PDBTM和MemProtMD)的覆盖率增加了约80%,达到18247(参见补充表S2). rcsb.org网站web门户,用户可以独立于注释来源搜索、浏览和可视化膜蛋白数据。外部数据资源的链接提供了详细信息,如蛋白质分类、氨基酸序列水平数据或精选膜位置(参见补充表S1). 为了帮助PDB数据消费者分析其搜索结果,我们在搜索结果优化面板中显示注释为膜蛋白的点击分布(请参阅补充图S1). 单击膜资源将深入到结果的子集中。膜注释可通过编程方式访问通过RCSB PDB搜索(search.rcsb.org网站),数据(data.rcsb.org(数据.csb.org))和注释API(1d-协调员.rcsb.org).

2.1改进结构总结页

我们已经修改了RCSB PDB结构摘要页面(图1),为每个PDB条目提供摘要信息。PDB条目使用四个字符的字母数字PDB ID(例如3SN6)进行指定,并且包含至少一个聚合物实体,这些聚合物实体指条目中的化学独特分子。有关详细定义,请参阅(伯利牌手表等。, 2021).

RCSB PDB结构摘要页面标题中的选项卡概述了膜蛋白的可用信息。(A) 分子中预测膜方向的可视化。(B) 注释详细信息。(C) 橙色方框提供对集成外部资源的访问。(D) 蛋白质特征视图中膜片段的1D可视化
图1。

RCSB PDB结构摘要页面标题中的选项卡概述了膜蛋白的可用信息。(A类)分子中预测膜方向的可视化。(B类)注释详细信息。(C类)橙色方框提供对集成外部资源的访问。(D类)蛋白质特征视图中膜段的一维可视化

通过外部资源和链接集成的注释,用户可以访问其他详细信息。如果适用,实体被注释为膜蛋白。整个PDB结构被注释为膜蛋白(图1C)如果至少有一个实体被OPM、PDBTM、MemProtMD或mpstruc注释为跨膜或膜相关。蓝色字体的“膜蛋白”链接(图1C)将用户带到结构条目的“注释”选项卡(请参见补充图S3). 除了mpstruc之外,橙色框中的链接指向集成外部资源的特定于结构的页面。

2.2可视化膜在摩尔中的预测位置*

我们贡献了ANVIL算法的新实现(Postic公司等。, 2016)到Mol*包。该算法仅使用3D结构信息来预测膜的位置。ANVIL是TMDET算法的简化版本(图斯纳迪等。, 2004)由PDBTM使用。Mol*3D查看器(泽纳尔等。, 2021)通过一套定制的膜可视化工具进行了扩展(参见补充图S2)显示预测的膜边界。(注意:此可视化与注释来源无关。)RCSB图像库允许访问特定组件或晶体不对称单元的此可视化(图1A). 用户应始终访问外部资源,以获得可靠的膜位置预测。ANVIL实现只是一个可视化工具,可能会输出有缺陷的预测(参见补充表S3例如)。

2.3膜蛋白注释

每个膜蛋白结构的注释页面包含现有注释的摘要(参见补充图S3). OPM和mpstruc提供了详细的层次结构,显示了PDBTM和MemProtMD的通用注释。单击用粗体突出显示的链接将启动对共享此注释的聚合物实体的搜索。所有注释每周更新一次。

2.4浏览膜注释树

用户可以使用上的browse Annotations功能浏览OPM和mpstruc提供的树层次结构rcsb.org网站门户网站。通过单击树的分支,可以获得越来越精细的分类(请参见补充图S4). 每行末尾的链接触发相应的搜索并返回所有匹配的实体。与上描述的所有注释树一样rcsb.org网站,可以单独探索或访问mpstruc和OPM树通过“高级搜索”面板。

2.5在蛋白质特征视图中探索膜片段

OPM和PDBTM资源提供了关于嵌入膜或与膜相关的片段的序列级数据。此信息可以在蛋白质特征视图中显示(塞古拉等。, 2021)它允许探索膜段与其他1D序列特征的关系,如二级结构元素或配体结合位点,或3D结构特征(参见补充图S5).

3结论

我们报告了来自四个可信的膜蛋白数据资源的信息集成。膜蛋白在rcsb.org网站门户网站有了很大的改进,用户现在可以访问膜蛋白的新的1D和3D可视化。最近RCSB PDB领导的创新(玫瑰色等。, 2021;塞古拉等。, 2021)和Mol*3D查看器(泽纳尔等。, 2021)由欧洲蛋白质数据库和RCSB PDB合作开发,可将新功能无缝集成到rcsb.org网站门户网站搜索基础设施。

致谢

作者衷心感谢结构生物信息学蛋白质数据库研究合作实验室过去和现在的所有成员以及我们的全球蛋白质数据库合作伙伴所做的贡献。他们还感谢Alexander S.Rose、David Sehnal和其他Mol*贡献者。

奉献

献给约翰·D·威斯布鲁克。

基金

本研究得到国家科学基金资助[DBI-1832184];美国能源部【DE-SC0019749】;国家癌症研究所、国家过敏和传染病研究所和国家普通医学科学研究所[R01GM133198]。

利益冲突:未声明。

工具书类

伯利牌手表
S.K.公司。
等(
2021
)
RCSB蛋白质数据库:探索生物大分子三维结构的强大新工具,用于基础生物学、生物医学、生物技术、生物工程和能源科学的基础和应用研究与教育
.
核酸研究
.,
49
,
D437号
D451号
.

科兹马
D。
等(
2013
)
PDBTM:8年后跨膜蛋白的蛋白质数据库
.
核酸研究
.,
41
,
D524型
D529型
.

洛米兹
文学硕士。
等(
2012
)
OPM数据库和ppm web服务器:膜中蛋白质定位资源
.
核酸研究
.,
40
,
D370号
D376号
.

纽波特
财政部。
等(
2019
)
memprotmd数据库:膜包埋蛋白结构及其脂质相互作用的资源
.
核酸研究
.,
47
,
D390号
第397页
.

Postic公司
G.公司。
等(
2016
)
基于二元分类方法的高分辨率和低分辨率蛋白质结构的膜定位
.
蛋白质工程设计。选择
.,
29
,
87
92
.

玫瑰色
Y。
等(
2021
)
RCSB蛋白质数据库:集成搜索和高效访问pdb档案中大分子结构数据的架构进展
.
分子生物学杂志
.,
433
,
166704
.

塞古拉
J。
等(
2021
)
RCSB蛋白质数据库1D工具和服务
.
生物信息学
,
36
,
5526
5527
.

泽纳尔
D。
等(
2021
)
分子查看器:用于大型生物分子结构三维可视化和分析的现代网络应用程序
.
核酸研究
.,
49
,
W431号机组
W437型
.

清水
英国。
等(
2018
)
膜蛋白结构数据库的比较分析
.
生物化学。生物物理学。生物膜学报
,
1860
,
1077
1091
.

塔斯纳迪
通用电气公司。
等(
2004
)
蛋白质数据库中的跨膜蛋白:鉴定和分类
.
生物信息学
,
20
,
2964
2972
.

白色
S.H.公司。
(
2009
)
膜蛋白的生物物理学分离
.
自然
,
459
,
344
346
.

作者注释

作者希望大家知道,在他们看来,塞巴斯蒂安·比特里希和亚娜·罗斯应该被视为联合第一作者。

这是一篇根据知识共享署名许可条款发布的开放存取文章(https://creativecommons.org/licenses/by/4.0/)它允许在任何介质中不受限制地重用、分发和复制原始作品,前提是正确引用了原始作品。
副编辑: 阿方索·巴伦西亚
阿方索·巴伦西亚
助理编辑
搜索此作者的其他作品:

补充数据