科学评论\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标结构
生物学
编号:2059-7983

一种新的蛋白质骨架默认约束库凤凰:与构象相关的几何体成为主流

十字标记_颜色_方形_文本.svg

物理生物科学,美国加州伯克利市劳伦斯伯克利国家实验室,邮编:94720,b条俄勒冈州立大学生物化学和生物物理系,美国俄勒冈州科瓦利斯市,邮编97377c(c)美国加州大学伯克利分校生物工程系,伯克利,CA 94720
*通信电子邮件:nwmoriarty@lbl.gov

英国剑桥大学R.J.Read编辑(2015年10月5日收到; 2015年11月23日接受)

化学约束是晶体蛋白质结构的基本部分精细化。针对越来越多的证据表明传统约束有缺点,以前有文献证明,使用依赖于蛋白质骨架构象的骨架约束有助于解决这些缺点并改进改进的性能[Moriarty等。(2014[Moriarty,N.W.,Adams,P.D.和Karplus,P.A.(2014)。计算机。水晶。新闻5,42-49.]),FEBS J公司。 281, 4061–4071]. 重要的是,蛋白质结晶学界的所有人都能获得这些改进。为此,对使用的默认几何图形库进行了更改凤凰此处对其进行了描述。测试表明,在一些验证工具仍然使用传统约束库的过渡期内,这种变化不会在验证期间或在蛋白质数据库中沉积更多的异常值。

自20世纪80年代中期以来(例如,见斯卡斯代尔等。, 1983【Scarsdale,J.N.,Van Alsenoy,C.,Klimkowski,V.J.,Schaefer,L.&Momany,F.A.(1983),《美国化学学会杂志》105,3438-3445。】; Schäfer公司等。1984年【Schäfer,L.,Klimkowski,V.J.,Momany,F.A.,Chuman,H.&Van Alsenoy,C.(1984)。生物聚合物,23,2335-2347。】)量子力学计算表明,二肽模型化合物的主键键角随蛋白质构象变化很大(这个φψ扭转角度)。这后来被证实发生在蛋白质中(Jiang等。, 1995[Jiang,X.,Cao,M.,Teppen,B.J.,Newton,S.Q.&Schäfer,L.(1995),《物理化学杂志》,99,10521-10525.]; Karplus,1996年【Karplus,P.A.(1996),《蛋白质科学》,第5期,1406-1420页。】),但这仍然是一个鲜为人知的事实,直到有人提出,解释这种行为可能会解决关于如何最好地处理蛋白质晶体学精细化的限制的争议(卡普斯等。, 2008【Karplus,P.A.,Shapovalov,M.V.,Dunbark,R.L.&Berkholz,D.S.(2008),《结晶学报》,D64,335-336.】). 此后不久,进行了一项分析,该分析记录了在1º或更高分辨率下求解的一组蛋白质晶体结构中,如何观察到主键长度和角度随构象的变化(Berkholz等。, 2009【Berkholz,D.S.,Shapovalov,M.V.,Dunbark,R.L.Jr&Karplus,P.A.(2009),《结构》,第17期,第1316-1325页。】). 得出的结论是,键角变化的测定是可靠的,且尺寸很大,但键长变化的测定不太可靠,而且也很小,因此对建模精度的影响不大。在随附的一篇精彩文章中(Dauter&Wlodawer,2009【Dauter,Z.&Wlodawer,A.(2009),《结构》,第17期,第1278-1279页。】)有人说,“希望结构生物学界很快会采纳这些想法”。

根据上述结果,为反式-开发了肽骨架约束(Tronrud等。, 2010【Tronrud,D.E.,Berkholz,D.S.&Karplus,P.A.(2010),《结晶学报》D66,834-842。】)并进行了蛋白质晶体学测试精炼使用TNT公司(特隆鲁德等。, 1987【Tronrud,D.E.,Ten Eyck,L.F.&Matthews,B.W.(1987),《结晶学报》A43,489-501。】)和SHELXL公司(Sheldrick,2008年[Sheldrick,G.M.(2008),《水晶学报》,A64112-122。])精炼程序。对于所研究的测试用例结构,这些测试表明使用CDL(v.1.2)而不是通用的传统约束库(Engh&Huber,2001[Engh,R.A.&Huber,R.(2001),《国际晶体图表》,第F卷,M.G.Rossmann&E.Arnold编辑,第382-392页。多德雷赫特:Kluwer学术出版社。])导致键角残差低得多R(右)因素(特隆鲁德等。, 2010【Tronrud,D.E.,Berkholz,D.S.&Karplus,P.A.(2010),《结晶学报》D66,834-842。】; Tronrud&Karplus,2011年【Tronrud,D.E.&Karplus,P.A.(2011),《结晶学报》,D67,699-706。】). 测试还揭示了超高分辨率结构的惊人结果,即使是使用传统约束库作为目标值进行优化的结构,其键角也与CDL更为接近。由于超高分辨率分析允许最准确的键角测定,这为CDL的更高精度提供了有力的验证。

将CDL v.1.2纳入凤凰(亚当斯等。, 2010【Adams,P.D.等人(2010),《水晶学报》,D66,213-221。】)允许在重新定义整个蛋白质数据库时对其进行测试(Moriarty,Tronrud等。2014年【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。联邦公报281,4061-4071。】). 这不仅证实了CDL一贯提供了更好的键角理想,而且还表明平均而言,在R(右)因素:略微降低R(右)自由的再加上R(右)工作(参见图2B中的插图,位于特隆鲁德的莫里亚蒂等。2014年【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。联邦公报281,4061-4071。】). 这项研究还表明,在分辨率高于2º左右的结构中,CDL的固有精度更高,此时主键键角开始与CDL的一致性更好,而不是与它们所受约束的传统库的一致性(见图2B,Moriarty,Tronrud等。2014年【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。联邦公报281,4061-4071。】). 对于N-Cα-C键角,交叉点以更显著的~3Å分辨率出现。一般来说,使用CDL v.1.2在所有分辨率下将总骨架键角残差减少了约30%,并降低了N-Cα-C键角残差约50%(Moriarty,Tronrud等。2014年【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。联邦公报281,4061-4071。】).

CDL在中的实施细节凤凰在特隆鲁德的莫里亚蒂展出等。(2014【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。联邦公报281,4061-4071。】),但在这里,我们发现简单地注意几点很有用。首先,使用的约束可以在Python字典对象中进行检查,并按照Pythons程序的简单示例合并到其他应用程序中mmtbx.cdl查找(亚当斯·莫里亚蒂等。2014年【Moriarty,N.W.,Adams,P.D.&Karplus,P.A.(2014),《计算机晶体》,新闻5,42-49。】)在开源中cctbx公司(格罗斯·昆斯特里夫等。, 2002【Grosse-Kunstleve,R.W.,Sauter,N.K.,Moriarty,N.W.&Adams,P.D.(2002),《应用结晶杂志》第35期,第126-136页。】)这将显示对三重氨基酸和一对骨架角的限制。其次,由于约束条件与构象有关,因此每个宏循环都会基于新的坐标更新目标值,并特别考虑备选位置。第三,权重的确定与中使用的任何其他库一样凤凰:目标标准偏差为每个约束提供了唯一的权重,这些约束的最佳总权重由以下公式自动确定凤凰使用复杂算法(Afonine等。, 2011【Afonine,P.V.,Echols,N.,Grosse-Kunstleve,R.W.,Moriarty,N.W.&Adams,P.D.(2011),《计算机结晶》,新闻2,99-103.】). 此外,与其他约束库一样,用户可以覆盖自动确定的总重量。

尽管主干CDL v.1.2具有出色的性能,但在将其作为默认值之前凤凰我们决定,重要的是验证通过针对CDL精炼蛋白质,然后针对目前大多数标准验证工具中使用的传统文库对其进行验证,不会引起重大问题。在从标准约束库验证到CDL库的过渡期内,如果在菲尼克斯定义(黄嘌呤等。, 2012[Afonine,P.V.、Grosse Kunstleve,R.W.、Echols,N.、Headd,J.J.、Moriarty,N.W.、Mustyakimov,M.、Terwilliger,T.C.、Urzhumtsev,A.、Zwart,P.H.和Adams,P.D.(2012)。晶体学报,D68,352-367。])在蛋白质数据库中沉积期间,被标记为立体化学质量较差。因此,我们采用了我们之前用CDL(Moriarty,Tronrud)改进的~23000个结构等。2014年【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。联邦公报281,4061-4071。】)并使用摩尔概率(陈)等。, 2010【Chen,V.B.、Arendall,W.B.、Headd,J.J.、Keedy,D.A.、Immormino,R.M.、Kapral,G.J.,Murray,L.W.、Richardson,J.S.和Richardsson,D.C.(2010),《晶体学报》,D66,12-21。】). 像所有基于cctbx公司(格罗斯·昆斯特里夫等。, 2002【Grosse-Kunstleve,R.W.,Sauter,N.K.,Moriarty,N.W.&Adams,P.D.(2002),《应用结晶杂志》第35期,第126-136页。】),摩尔概率很容易加载CDL目标,因此基于CDL的键和角残差的r.m.s.d.计算可以直接与基于Engh和Huber单值库(SVL;构象相关)中默认的约束摩尔概率PDB验证软件也使用。应该注意的是,即将发布的摩尔概率web服务和中的所有程序凤凰使用模型(包括几何理想化)的结构将能够利用CDL约束,以针对CDL进行优化。

正如预期的那样,在这一头对头验证比较中,当根据Engh和Huber约束而不是CDL约束来验证CDL优化结构时,整体键角r.m.s.d.值稍高(图1[链接]). 令人鼓舞的是,以相对独立于分辨率的方式,仅在0.3–0.4°范围内增加。此外,CDL值足够低,相对于Engh和Huber约束,更高的r.m.s.d.值仍然具有相当可接受的~1.7°或更低的整体值,因此不会引起验证方面的担忧。更令人鼓舞的是,对主干键角的分析(两个库中具有不同目标的角度子集)表明,基于CDL的残差更低,与Engh和Huber目标的偏差保持在1.25°以下(图1中的实线[链接]). 我们还评估了键长r.m.s.d.值的差异,如预期的那样,几乎没有差异(图1[链接]b条). 对于键角,为了确定异常值是否会导致问题,即使总体偏差不会,我们分析了单个6σ异常值。如图1所示[链接](c(c))和1[链接](d日),6点变化很小σ与CDL验证相比,使用SVL值验证CDL优化结构时的键角或键长异常值。值得注意的是,由于这是一组未过滤的PDB条目,因此一些结构的模型区域拟合不良,实际上应该是离群值。

[图1]
图1
基于CDL或Engh和Huber SVL约束,对~23000个重新定义的PDB条目的验证结果进行比较。对应于0.6、0.7、3.4、3.5和3.6Å的Bins的观测值小于50。()键角r.m.s.d.值作为使用CDL v.1.2优化的结构分辨率的函数,并根据常规SVL(蓝线)或CDL(红线)进行验证。虚线是整个蛋白质的值,而实线仅基于CDL特有的主干键角。(b条)与相同()但对于键的长度。(c(c))每个结构的平均粘结角数与分辨率的关系大于6σ基于使用传统SVL(蓝线)或CDL(红线)的验证,远离约束目标值。(d日)与相同(c(c))但对于键的长度。在(c(c))和(d日)蓝线不可见时,它们位于红线下方。

主干CDL提供的改进的几何结构,再加上我们验证分析的积极结果,导致我们将CDL v.1.2作为凤凰从版本v.1.10-2155开始。我们提醒用户,该库仅为以下链接的残基定义构象相关的目标主干值反式-肽键,使残基通过顺式-肽键和侧链键的长度和角度没有变化,仍然基于Engh&Huber(2001[Engh,R.A.&Huber,R.(2001),《国际晶体图表》,第F卷,M.G.Rossmann&E.Arnold编辑,第382-392页。多德雷赫特:Kluwer学术出版社。]). 对于希望使用Engh和Huber库而不是CDL的用户cdl=错误选项可用。

中默认库中的此更改凤凰使主干CDL进入蛋白质建模主流。这一步代表着对概念障碍的突破,因为它将激励人们超越“单一理想价值”范式的思维模式,转向更一般的“情境依赖”理想价值范式,其中主干构象只是可能影响几何的情境的一个例子。这一步骤还通过展示如何调整现有软件框架以适应更复杂的“上下文相关”范式,代表了对实际障碍的突破。显然,更新验证工具以使用这些更准确的目标值是继续过渡的下一个关键步骤,我们希望将CDL并入其他晶体学精炼随后将进行蛋白质建模程序,以便他们能够从这一进展中获得有益的结构。CDL在提高模型质量方面的成功也应激励人们进一步创建经验构象依赖性库,以解释罕见但仍然重要的顺式-肽键,也解释了侧链几何形状的变化,这无疑是作为主链和侧链构象的函数存在的。我们已经开始为顺式-肽,以及可获得的观察结果更少的事实,提出了必须解决的独特挑战。

致谢

这项工作得到了国家卫生研究院(NIH)拨款R01-GM083136(给PAK)、NIH项目1P01 GM063210(给PDA)和Phenix工业联合会的部分支持。根据合同号DE-AC02-05CH11231,这项工作得到了美国能源部的部分支持。NWM、DET、PDA和PAK计划了实验并分析了数据,NWM进行了实验,而NWM和PAK使用DET和PDA的输入编写了论文。

工具书类

第一次引用P.D.亚当斯。等。(2010).《水晶学报》。D类66, 213–221. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Afonine,P.V.、Grosse-Kunstleve,R.W.、Echols,N.、Headd,J.J.、Moriarty,N.W.、Mustakimov,M.、Terwilliger,T.C.、Urzhumtsev,A.、Zwart,P.H.和Adams,P.D.(2012)。《水晶学报》。D类68, 352–367. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Afonine,P.V.、Echols,N.、Grosse-Kunstleve,R.W.、Moriarty,N.W.和Adams,P.D.(2011)。计算。Crystallogr公司。新闻。 2,99–103谷歌学者
第一次引用Berkholz,D.S.、Shapovalov,M.V.、Dunbark,R.L.Jr和Karplus,P.A.(2009年)。结构,17, 1316–1325. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Chen,V.B.、Arendall,W.B.、Headd,J.J.、Keedy,D.A.、Immormino,R.M.、Kapral,G.J.,Murray,L.W.、Richardson,J.S.和Richardsson,D.C.(2010)。《水晶学报》。D类66, 12–21. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Dauter,Z.和Wlodawer,A.(2009年)。结构,17,1278–1279页科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Engh,R.A.和Huber,R.(2001)。国际结晶图表,卷。F类由M.G.Rossmann和E.Arnold编辑,第382-392页。多德雷赫特:Kluwer学术出版社。 谷歌学者
第一次引用Grosse-Kunstleve,R.W.,Sauter,N.K.,Moriarty,N.W.和Adams,P.D.(2002)。J.应用。克里斯特。 35, 126–136. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Jiang,X.,Cao,M.,Teppen,B.J.,Newton,S.Q.&Schäfer,L.(1995)。《物理学杂志》。化学,99, 10521–10525. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Karplus,P.A.(1996年)。蛋白质科学。 5,1406-1420交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Karplus,P.A.、Shapovalov,M.V.、Dunbark,R.L.和Berkholz,D.S.(2008)。《水晶学报》。D类64, 335–336. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Moriarty,N.W.,Adams,P.D.&Karplus,P.A.(2014)。计算。Crystallogr公司。新闻。 5, 42–49. 谷歌学者
第一次引用Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。FEBS J公司。 281, 4061–4071. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Scarsdale,J.N.,Van Alsenoy,C.,Klimkowski,V.J.,Schaefer,L.&Momany,F.A.(1983年)。美国化学杂志。Soc公司。 105, 3438–3445. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Schäfer,L.、Klimkowski,V.J.、Momany,F.A.、Chuman,H.和Van Alsenoy,C.(1984)。生物聚合物,23, 2335–2347. 谷歌学者
第一次引用Sheldrick,G.M.(2008)。《水晶学报》。A类64, 112–122. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Tronrud,D.E.,Berkholz,D.S.&Karplus,P.A.(2010年)。《水晶学报》。D类66, 834–842. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Tronrud,D.E.&Karplus,P.A.(2011年)。《水晶学报》。D类67, 699–706. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Tronrud,D.E.、Ten Eyck,L.F.和Matthews,B.W.(1987)。《水晶学报》。A类43, 489–501. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标结构
生物学
编号:2059-7983