来自CASP 14的AlphaFold2示例

来自Proteopedia

跳转到:航行,搜索

根据氨基酸序列预测蛋白质结构,理论建模,一直极具挑战性。2020年,AlphaFold2取得了突破性的成功[1],一个项目DeepMind公司.关于这一突破的概述由双年度预测竞赛记录CASP公司,请看2020年:CASP 14以下是该比赛的两个预测示例。

用鼠标拖动结构进行旋转

目录

ORF8侧链精度

AlphaFold2对侧链位置的预测似乎相当好,而第二好预测中的侧链位置似乎很差。这一结论基于三种类型的观察结果:

  1. 表I给出了所有原子的RMSD值,这是侧链精度的一个指示。
  2. 预测盐桥阳离子-π相互作用.
  3. 表面电荷分布的可视化。

盐桥与阳离子-Pi相互作用

  • AlphaFold2的预测是适用于4/5交互,与一个不正确互动。
    • AlphaFold2的预测是两个中的一个正确盐桥,并预测没有不正确的盐桥。
    • AlphaFold2的预测是三选三正确阳离子-π相互作用,但已预测一个不正确互动。
  • 第二好的预测是校正为1/5交互,与2不正确互动。
    • 第二好的预测是两个中的一个正确盐桥,但预测两个不正确盐桥。
    • 第二好预测未能预测任何在三个阳离子-π相互作用中,预测零相互作用。
表三盐桥预测精度
7JX6型第7节阿尔法折叠2第二名
R101:D112(AB)R101:D113(AB)R86:D98R86:D98
R115:D119(AB)R115:D119(AB) 100兰特:E4类
K44:E59(AB) K44:E59(AB) K29:E44
K78:E77型
  • 同一排的桥是相同的(除了红色残留物)。将X射线结构中的序列号减去15,得到预测中的等效序列号。
  • 黑色:最短侧链氮到侧链氧距离≤4.0º。
  • 灰色:最短侧链氮与侧链氧的距离为4.4至4.8Å。
  • –:最短的侧链氮到侧链氧的距离为6到16º。
  • (AB):每个X射线模型中的两条链。
  • 斜体:错误预测。
表四阳离子Pi预测精度
7英寸6英寸第7节阿尔法折叠2第二名
R101:Y46+Y108(AB)R101:Y46+Y108(AB)R86:Y31+Y96
K44:F108(乙)K44:F108(AB)K29:93层
K79:F105
  • 所有列出的交互作用都被认为具有能量重要性CaPTURE服务器.
  • 同一行中的交互是相同的。将X射线结构中的序列号减去15,得到预测中的等效序列号。
  • 斜体:错误预测。
  • 第二好的预测没有阳离子-π相互作用。
  • (AB):每个X射线模型中的两条链。

表面电荷分布的可视化

表面电荷的分布与AlphaFold2的预测和两种晶体结构吻合良好。第二个最佳预测中的分布与其他三个模型存在一些差异。图片:Orf8-casp14-charges.png

GDT_TS计算

预测的GDT_TS值取自CASP 14结果。CASP 14 GDT_TS值的参考结构是7JTL的92个α碳[7],因为CASP 14靶只有92个残基[7].

使用AS2TS服务器亚当·泽姆拉[25]。请参阅说明计算GDT_TS校正了92个残基(而不是104个)的GDT_TS值,因为CASP 14靶只有92个残基团[7].

为了进行比较,CASP 14报告了AlphaFold2预测的GDT_TS 86.96,而AS2TS服务器计算了GDT_TS 85.87对7jx6链A,88.32对7JTL链A(这些结果分别针对90/92和91/92残基进行了校正),CASP-14的GDT_TS计算结果与第计算GDT_TS.

另请参见

参考资料和注释

  1. 高级AW、Evans R、Jumper J、Kirkpatrick J、Sifre L、Green T、Qin C、Zidek A、Nelson AWR、Bridgeland A、Penedones H、Petersen S、Simonyan K、Crossan S、Kohli P、Jones DT、Silver D、Kavukcuoglu K、Hassabis D。利用深度学习潜能改进蛋白质结构预测。自然。2020年1月;577(7792):706-710. doi:10.1038/s41586-019-1923-7。Epub 2020年1月15日。PMID:31942072数字对象标识:http://dx.doi.org/10.1038/s41586-019-1923-7
  2. 2 2.1 2.2Flower TG、Buffalo CZ、Hooy RM、Allaire M、Ren X、Hurley JH。SARS-CoV-2 ORF8的结构,一种快速进化的免疫逃避蛋白。美国国家科学院院刊2021年1月12日;118(2)中。pii:2021785118。doi:,10.1073/pnas.2021785118。PMID:33361333数字对象标识:http://dx.doi.org/10.1073/pnas.2021785118
  3. 对于SARS-CoV-2 ORF8,请访问CASP 14表格浏览器,检查T1064-D1并按下显示结果.
  4. CASP14:谷歌DeepMind的AlphaFold 2真正实现了什么,它对蛋白质折叠、生物学和生物信息学意味着什么Carlos Outeir al-Rubiera于2020年12月3日发表的博客文章。
  5. 5 5.1 5.2 5.3 5.4Drobysheva AV、Panafidina SA、Kolesnik MV、Klimuk EI、Minakhin L、Yakunina MV、Borukhov S、Nilsson E、Holmfeldt K、Yutin N、Makarova KS、Koonin EV、Severinov KV、Leiman PG、Sokolova ML。类crAss噬菌体病毒RNA聚合酶的结构和功能。自然。2020年11月18日。pii:10.1038/s41586-020-2921-5。doi:,10.1038/s41586-020-2921-5。PMID:33208949数字对象标识:http://dx.doi.org/10.1038/s41586-020-2921-5
  6. 对于噬菌体RNA聚合酶靶点CASP 14表格浏览器,检查T1037-D1并按下显示结果.
  7. 7 7.1 7.2 7.3 7.4 7.5 CASP 14领域的总结、定义和分类.
  8. 8 8.1 8.2 8.3 8.4 8.5 8.6Swiss-PdbViewer的叠加迭代魔术拟合这从序列比对引导的结构叠加开始,然后叠加结构子集以最小化RMSD。八个中间结构由Theis Morph服务器通过线性插值。
  9. Cuff AL、Sillitoe I、Lewis T、Clegg AB、Rentzsch R、Furnham N、Pellegrini-Calace M、Jones D、Thornton J、Orengo CA。扩展CATH:增加蛋白质结构宇宙的覆盖范围并将结构与功能联系起来。核酸研究,2011年1月;39(数据库问题):D420-6。doi:10.1093/nar/gkq1001,Epub 2010年11月19日。PMID:21097779数字对象标识:http://dx.doi.org/10.1093/nar/gkq1001
  10. 10 10.1 10.2Holm L.DALI和蛋白质形状的持久性。蛋白质科学。2020年1月;29(1):128-140. doi:10.1002/pro.3749。Epub 2019年11月5日。PMID:31606894数字对象标识:http://dx.doi.org/10.1002/pro.3749
  11. 使用Swiss-PdbViewer根据所选内容调整从每个结构中选择102个残基,然后提高贴合度.
  12. Katoh K,Standley DM。MAFFT多序列比对软件版本7:性能和可用性的改进。分子生物学进化。2013年4月;30(4):772-80. doi:10.1093/molbev/mst010。Epub 2013年1月16日。PMID:23329690数字对象标识:http://dx.doi.org/10.1093/molbev/mst010
  13. Dali的结构叠加。插值由耶鲁Morph2服务器.均质化方法:同源建模。无最小化。这产生了一个9模型文件,其中模型1是7jx6,模型2-9是插值。添加5a2f残基28-133作为模型10(分子场景中为黑色)。
  14. 利莎·霍尔姆(Liisa Holm)善意地证实了达利的结果意味着ORF8没有一个新的折叠,并与埃里克·马茨2021年2月。
  15. 从下载AlphaFold2预测的ORF8结构T1064TS427_1-D1.pdb.
  16. 16 16.1 16.2请参阅#GDT_TS计算.
  17. 请参阅#ORF8不是一个新颖的折叠.
  18. 18 18.1Swiss-PdbViewer的叠加魔术般的配合这是一种序列比对引导的结构叠加。八个中间结构由Theis Morph服务器通过线性插值。
  19. Swiss-PdbViewer的叠加探索Fragment备选配件,它不使用序列信息。八个中间结构由Theis Morph服务器通过线性插值。
  20. 对于CASP 14中的所有目标,排名前两位的服务器是QUARK和Zhang服务器(Z分数之和为62.9时没有显著差异),其次是Zhang CEthreder(55.9)和BAKER-ROSETTASERVER(55.3)。
  21. Johansen JE,Nielsen P,Sjoholm C.《巴尔的摩嗜纤维菌gen.nov.,sp.nov.and Cellulophaga fucicola gen.nov,sp.nov.的描述》,以及《溶菌酶[Cytophaga]重新分类为溶菌酶Cellulochaga lytica gen.nov.,comb》。11月国际系统细菌杂志。1999年7月;第49部分3:1231-40。doi:10.1099/00207713-49-3-1231。PMID:10425785数字对象标识:http://dx.doi.org/10.1099/00207713-49-3-1231
  22. Liisa Holm于2021年3月善意地指出了这些不重叠的核心碎片。
  23. 经Liisa Holm许可引用,2021年3月。
  24. Holm L,Sander C.糖原磷酸化酶和DNA修饰酶之间的进化联系。EMBO J.1995年4月3日;14(7):1287-93. PMID:7729407
  25. Zemla A.LGA:一种在蛋白质结构中发现3D相似性的方法。核酸研究,2003年7月1日;31(13):3370-4. doi:10.1093/nar/gkg571。PMID:12824330数字对象标识:http://dx.doi.org/10.1093/nar/gkg571

Proteopedia页面贡献者和编辑(这是什么?)

埃里克·马茨

个人工具