研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标结构性的
生物学
国际标准编号:2059-7983

改进晶体的化学约束精炼通过将琥珀色力场集成到凤凰

十字标记_颜色_方形_文本.svg

分子生物科学与综合生物成像,美国加州伯克利市劳伦斯伯克利国家实验室,邮编:94720-8235,b条美国新泽西州皮斯卡塔韦罗格斯大学化学与化学生物学系,邮编:08854,c(c)美国北卡罗来纳州达勒姆杜克大学生物化学系,邮编:27710d日美国加州大学伯克利分校生物工程系
*通信电子邮件:nwmoriarty@lbl.gov

美国橡树岭国家实验室P.Langan编辑(2019年7月31日收到; 2019年11月8日接受)

这个精炼生物分子晶体学模型依赖于几何约束来帮助解决这些实验中典型实验数据的不足。这些约束中的限制可能会降低生成的原子模型的质量。这里,将全原子琥珀分子动力学力场集成到凤凰结晶学的精炼这使得生物分子化学的建模更加完整。力场的优点包括一组精心推导的扭角势、一组广泛而灵活的原子类型、Lennard–Jones对非键相互作用的处理以及对晶体静电的全面处理。新的组合方法针对超过22000个蛋白质结构的传统几何约束进行了测试。使用新方法改进的结构显示模型质量显著提高。平均而言,拉马钱德兰和罗塔默的分数稍好一些,clashscores和摩尔概率分数得到了显著的提高,静电学的建模使结构比那些使用传统几何约束优化的结构表现出更多、更正确的氢键。通常,我们发现在较低的分辨率下,模型改进效果最好,这促使计划添加琥珀色目标函数到实际空间精炼用于电子冷冻显微镜。这项工作为未来开发更高级的应用程序打开了大门,例如琥珀色-基于集合精细化,活性中心的量子力学表示和模拟退火的改进几何约束。

1.简介

准确的结构知识是我们理解生物分子功能和蛋白质相互作用的核心核酸。蛋白质数据库中有近90%的结构(伯曼等。2000年[Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。核酸研究28,235-242。])通过X射线衍射方法解决,结晶学是目前测定生物分子结构的最杰出方法。晶体结构 精炼是一种计算技术,在实验后数据解释中起着关键作用。这个精炼原子坐标的变化需要解决一个优化问题,以最小化实验和模型结构因子振幅之间的剩余差异(Jack&Levit,1978【Jack,A.和Levit,M.(1978),《水晶学报》,A34,931-935。】; 阿加瓦尔,1978年[阿加瓦尔,R.C.(1978),《水晶学报》,A34,791-809。]; 穆尔舒多夫等。, 1997【Murshudov,G.N.,Vagin,A.A.&Dodson,E.J.(1997),《结晶学报》D53,240-255。】). 然而,由于固有的实验局限性和通常较低的数据参数比,使用附加约束(通常称为几何约束或空间约束)是结构成功的关键精炼(瓦瑟,1963年【Waser,J.(1963),《水晶学报》,第16期,1091-1094页。】). 这些约束可以被认为是贝叶斯意义上的先验约束,可以在优化目标中提供额外的观测值,并减少过拟合的危险。它们的使用导致了更高质量、更精确的化学模型。

最新精炼程序(Afonine等。, 2012[Afonine,P.V.、Grosse Kunstleve,R.W.、Echols,N.、Headd,J.J.、Moriarty,N.W.、Mustyakimov,M.、Terwilliger,T.C.、Urzhumtsev,A.、Zwart,P.H.和Adams,P.D.(2012)。晶体学报,D68,352-367。]; 穆尔舒多夫等。, 2011【Murshudov,G.N.,Skubák,P.,Lebedev,A.A.,Pannu,N.S.,Steiner,R.A.,Nicholls,R.A..,Winn,M.D.,Long,F.&Vagin,A.A..(2011),《晶体学报》,D67,355-367。】; 谢尔德里克,2015年[Sheldrick,G.M.(2015),《晶体学报》,C71,3-8。]; 布里科涅等。, 2011【Bricogne,G.、Blanc,E.、Brandl,M.、Flensburg,C.、Keller,P.、Paciorek,W.、Roversi,P.和Sharff,A.、Smart,O.S.、Vonrhein,C.和Womack,­-T.O.(2011)。BUSTER.英国剑桥全球阶段化。】)采用Engh和Huber于1991年首次提出的一组共价几何约束,后来在2001年进行了扩充和改进(Engh和Huber,1991【Engh,R.A.&Huber,R.(1991),《结晶学报》A47,392-400。】, 2001[Engh,R.A.&Huber,R.(2001),《国际晶体图表》,第F卷,M.G.Rossmann&E.Arnold编辑,第382-392页。多德雷赫特:克鲁沃学术出版社。]). 这组限制基于剑桥结构数据库(Groom等。, 2016【Groom,C.R.,Bruno,I.J.,Lightfoot,M.P.和Ward,S.C.(2016)。晶体学报B72,171-179。】)包括对原子间键长、键角和ω扭转角度。此外,还添加了参数以强制执行适当的手性平面性、主链和侧链扭转角的多微靶,以及防止原子间空间重叠的排斥项。这些术语是从小分子和高分辨率大分子中定义的晶体结构数据和交互特定的范德瓦尔斯半径。它们非常相似,但不完全相同精炼程序。

Engh和Huber约束的功能相当好,虽然附加条款已逐步改进,但多年来已确定了一些限制。其中一些限制包括缺乏对局部构象,质子化和氢键及其变化精细化,配体、碳水合物和共价修饰的原子类型和参数不完整或不准确,仅使用排斥性和非吸引性立体项,忽略显式H原子及其相互作用,实验平均伪影导致的误导性目标,不准确的二面体约束,以及缺乏对静电和量子色散相互作用的认识,从而缺乏对氢键合作性的解释(Priestle,2003【Priestle,J.P.(2003),《应用结晶杂志》,第36卷,第34-42页。】; Touw&Vriend,2010年【Touw,W.G.和Vriend,G.(2010),《水晶学报》,D661341-1350。】; 戴维斯等。, 2003[Davis,A.M.,Teague,S.J.和Kleywegt,G.J.(2003)。Angew.Chem.Int.Ed.第42版,2718-2736页。]; 莫里亚蒂等。, 2014【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。联邦公报281,4061-4071。】; Tronrud公司等。, 2010【Tronrud,D.E.,Berkholz,D.S.&Karplus,P.A.(2010),《结晶学报》D66,834-842。】).

凤凰(利布施内尔等。, 2019[Liebschner,D.,Afonine,P.V.,Baker,M.L.,Bunkóczi,G.,Chen,V.B.,Croll,T.I.,Hintze,B.,Hung,L.-W.,Jain,S.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.D.,Poon,B.K.,Prisant,M.G.,Read,R.J.,Richardson,J.S.,Ricchardson,D.C.,Sammito,M.D.,Sobolev,O.V.,Stockwell,D.H.,Terwilliger,T.C.,Urzhumtsev,A.G.,Videau,L。L.、Williams、C.J.和Adams,P.D.(2019年)。《水晶学报》。D75,861-877。])包括用于定义配体参数的内置系统(莫里亚蒂等。, 2009【Moriarty,N.W.,Grosse-Kunstleve,R.W.&Adams,P.D.(2009),《结晶学报》D651074-1080。】)默认情况下,X射线晶体学在电子云中心位置限制显式氢原子,中子晶体学也可以选择在核位置(Williams,Headd等。, 2018【Williams,C.J.,Head,J.J.,Moriarty,N.W.,Prisant,M.G.,Videau,L.L.,Deis,L.N.,Verma,V.,Keedy,D.A.,Hintze,B.J.,Chen,V.B.,Jain,S.,Lewis,S.M.,Arendall,W.B.III,Snoeyink,J.,Adams,P.D.,Lovell,S.C.,Richardson,J.S.&Richardsen,D.C.(2018),《蛋白质科学》27,293-315.】). 添加构象依赖库(CDL;Moriarty等。, 2014【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2014)。联邦公报281,4061-4071。】)这使得主干键的长度和角度取决于φ,ψ值,改进了从精炼所有分辨率,因此是凤凰 精炼(莫里亚蒂等。, 2016【Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2016),《结晶学报》第72期,第176-179页。】). 同样,凤凰对RNA(Jain)使用核糖折叠和碱基依赖型扭转约束等。, 2015【Jain,S.、Richardson,D.C.和Richardsson,J.S.(2015)。《酶学方法》558、181-212。】). 对于键的长度和角度,蛋白质侧链继续使用标准的Engh和Huber限制,而RNA/DNA使用早期值(帕金森等。, 1996[帕金森,G.、沃伊特科夫斯基,J.、克洛尼,L.、布伦格,A.T.和伯曼,H.M.(1996)。《水晶学报》D52,57-64。])进行了一些修改。此处将组合约束的使用称为CDL/E&H。

另一种方法是使用基于用于分子动力学研究的全原子力场的几何约束。这不是一个新颖的想法。事实上精炼采用分子机械力场的程序(Jack&Levit,1978【Jack,A.和Levit,M.(1978),《水晶学报》,A34,931-935。】; 布伦格尔等。, 1987【Brünger,A.T.,Kuriyan,J.&Karplus,M.(1987),《科学》,235,458-460。】, 1989【Brünger,A.T.,Karplus,M.&Petsko,G.A.(1989),《水晶学报》A45,50-61。】). 然而,当时,从理想碎片的坐标得出的约束(Tronrud等。, 1987【Tronrud,D.E.,Ten Eyck,L.F.&Matthews,B.W.(1987),《结晶学报》A43,489-501。】; 亨德里克森和康奈特,1980年[Hendrickson,W.A.和Konnert,J.H.(1980),《晶体学中的计算》,R.Diamond、S.Ramaseshan和K.Venkatesan编辑,第13.01-13.26页。班加罗尔:印度科学院。])被发现提供更好的精炼结果。基于分子力学的约束的不足主要归因于两个因素:由于原子类型太少导致化学空间的不准确表示,以及由于非屏蔽静电相互作用导致构象采样的偏差。然而,随后分子动力学相应的力场也有了显著的发展和改进。当前力场包含更多原子类型,并且可以根据需要轻松调整。它们通常根据精确的量子力学计算进行参数化,这在几年前还不可行,并且使用了更具代表性的实验结果。重要的方法学进展,例如粒子网格Ewald方法的发展(约克等。1993年【约克·D·M、达顿·T·A·和佩德森·L·G(1993),《化学物理杂志》第99期,第8345-8348页。】; 达顿等。1993年【Darden,T.、York,D.M.和Pedersen,L.(1993),《化学物理杂志》98,10089-10092。】)对于晶体静电的精确计算以及改进的温度和压力控制算法,都大大提高了精度。现代力场已被证明与实验数据吻合良好(扎格罗维奇等。, 2008[Zagrovic,B.,Gattin,Z.,Lau,J.K.-C.,Huber,M.&van Gunsteren,W.F.(2008).《欧洲生物物理学杂志》37,903-912.]; 范甘斯特伦等。, 2008【Gunsteren,W.F.van,Dolenc,J.&Mark,A.E.(2008),《当前操作结构生物学》第18期,第149-153页。】; Showalter&Brüschweiler,2007年[Showalter,S.A.和Brüschweiler,R.(2007)。《化学理论计算杂志》第3期,961-975页。]; 格林顿等。, 2004【Grindon,C.,Harris,S.,Evans,T.,Novik,K.,Coveney,P.&Laughton,C.(2004),《哲学翻译》R.Soc.Lond.A Math.Phys.Eng.Sci.3621373-1386.】; 鲍曼等。, 2011【Bowman,G.R.,Voelz,V.A.和Pande,V.S.(2011),美国化学学会杂志,133664-667。】),包括晶体衍射数据(Cerutti等。, 2008【Cerutti,D.S.,Le Trong,I.,Stenkamp,R.E.&Lybrand,T.P.(2008).生物化学,47,12065-12077.】, 2009【Cerutti,D.S.,Le Trong,I.,Stenkamp,R.E.&Lybrand,T.P.(2009),《物理化学杂志》,第113期,第6971-6985页。】; 诺夫斯基等。, 2013【Janowski,P.A.,Cerutti,D.S.,Holton,J.M.&Case,D.A.(2013),《美国化学学会杂志》135,7938-7948。】, 2015【Janowski,P.A.,Liu,C.,Deckman,J.&Case,D.A.(2015),《蛋白质科学》25,87-102。】; 线路接口单元等。, 2015[Liu,C.,Janowski,P.A.&Case,D.A.(2015).生物化学.生物物理学报,1850,1059-1071.]).

我们已经使使用琥珀分子机械力场作为几何约束的替代源成为可能,而不是CDL/E&H凤凰晶体图形软件包精细化, 菲尼克斯定义(黄嘌呤等。, 2012[Afonine,P.V.、Grosse Kunstleve,R.W.、Echols,N.、Headd,J.J.、Moriarty,N.W.、Mustyakimov,M.、Terwilliger,T.C.、Urzhumtsev,A.、Zwart,P.H.和Adams,P.D.(2012)。晶体学报,D68,352-367。])、和琥珀色软件包(案例等。, 2018[凯斯·D.A.、本·萨洛姆·I.Y.、布罗泽尔·S.R.、塞鲁蒂·D.S.、契坦·T.E.III、克鲁塞罗·V.W.D.、达顿·T.A.、杜克·R.E.、戈里什·D.、吉尔森·M.K.、高尔克·H.、戈茨·A.W.、格林·D.、哈里斯·R.、霍梅耶·N.、伊扎迪·S.、科瓦伦科·A.、库兹曼·T.、李·T。S.、LeGrand、S.、Li、P.、Lin、C.、Liu、J.、Luchko、T.、Luo、R.、Mermelstein、D.J.、Merz、K.M.、Miao、Y.、Monard、G.、Nguyen、C.、Nguien、H.、Omelyan、I.、Onufriev、A.、Pan、F.、Qi、R.,Roe、D.R.、Roitberg、A.、Sagui、C.、Schott-Verdugo、S.,Shen、J.,Simmerling、C.L.、Smith、J、Salomon-Ferrer,R.、Swails,J.、Walker、R.C.、Wang、J.和Wei、H、。,Wolf,R.M.、Wu,X.、Xiao,L.、York,D.M.和Kollman,P.A.(2018年)。Amber18.旧金山加利福尼亚大学)的分子动力学。我们给出了22 544个结构的成对优化结果,并进行了比较琥珀色用传统的精炼在模型质量、化学准确度以及与实验数据的一致性方面,对总体统计数据和代表性个别示例进行了研究。我们还描述了实现并讨论了未来的方向。

2.方法

2.1. 代码编制

集成琥珀色编码到菲尼克斯定义使用瘦客户端。琥珀色为其提供了Python API砂光机模块,因此一个简单的“import sander”Python命令允许凤凰通过方法调用获取Amber能量和力。坐标的每一步精细化, 凤凰展开不对称单元完全坐标单位电池(根据要求砂光机),组合从琥珀色(代替其内部几何约束程序中的)X射线目标函数的梯度,并使用这些力更新坐标。替代异构体可以利用“局部增强采样”(LES)设施砂光机:单构象区中的原子通过平均相互作用能量与多拷贝区相互作用,而同一基团的不同拷贝之间不相互作用(Roitberg&Elber,1991【Roitberg,A.&Elber,R.(1991),《化学物理杂志》,第95期,第9277-9287页。】; Simmerling公司等。, 1998【Simmerling,C.,Fox,T.&Kollman,P.A.(1998),《美国化学学会杂志》,第120期,第5771-5782页。】).

这个琥珀色所需文件由初步琥珀色准备以PDB文件作为输入的程序。它创建了一个参数拓扑(prmtop)文件,用于琥珀色以及一个新的PDB文件,其中包含执行力场计算所需的一整套原子(包括氢和任何缺失的原子)。如果需要,可以将输入PDB文件中的替代构象转换为砂光机LES格式。在大多数情况下,琥珀色准备不需要用户有任何经验琥珀色或分子力学;不太常见的情况(在支持信息)需要一些熟悉琥珀色。两个琥珀色准备菲尼克斯定义步骤包含在当前的主要版本v.1.16-3549和后续的夜间构建中凤凰.

2.2. 结构选择和总体精炼协议

使用比较细化琥珀色与CDL/E&H限制的传统改良相比,结构是从蛋白质数据库(PDB)中选择的;伯利等。, 2019[伯利·S·K·、伯曼·H·M·、比·C·、陈·L·、科斯坦佐·L·D·、克里斯蒂·C·、杜阿尔特·J·M·,杜塔·S·、冯·Z·、戈什·S·,古德塞尔·D·S··、格林·R·K·,古拉诺维奇·V·、古岑科·D·,哈德森·B·。P.、Liang、Y.、Lowe、R.、Peisach、E.、Periskova、I.、Randle、C.、Rose、A.、Sekharan、M.、Shao、C.、Tao、Y.-P、Valasatava、Y.Voigt、M.,Westbrook、J.、Young、J.,Zardecki、C.、Zhuravleva、M.和Kurisu、G.、Nakamura、H.、Kengaku、Y.,Cho、H.和Sato,J.、Kim、J.J.、铃木、H.、。,岩田、T.、横滨、M.、小林、N.、藤原、T.阿福塞,T.,普拉夫达,L。,Salih,O.,Sehnal,D.,Varadi,M.,Vařeková,R.,Markley,J.L.,Hoch,J.C.,Romero,P.R.,Baskaran,K.,Maziuk,D.,Ulrich,E.L.,Wedell,J.R.,Yao,H.,Livny,M.&Ioanidis,Y.E.(2019年)。核酸研究47,D520-D528。])使用以下标准。参赛作品必须有未经筛选的实验数据,至少完成90%。对于每个条目,R(右)自由的限制在最高35%,R(右)工作至30%,以及R(右)Δ(R(右)自由的R(右)工作)至少1.5%。最低分辨率设置为3.65º。条目包含核酸类被排除在外。

坐标和实验数据文件直接从PDB获得,输入通过自动琥珀色准备程序(参见第2.1节[链接]). 如果文件准备程序包含含有复杂配体的条目琥珀色准备能够自动生成并包含配体几何数据;这通常不包括与蛋白质或金属原子具有共价连接的配体。内部构件详图琥珀色准备将在其他地方进行描述。分辨率箱(设置为0.1°)小于10精炼为了减少有限的统计数据带来的噪音,对数据进行了消除。完整的图表包含在支持信息得到的22000+个结构的实验数据分辨率在0.8到3.6º之间,大多数结构在1.2到3.0º范围内(见图1[链接]).

[图1]
图1
在分辨率箱中分布优化的结构。

然后对每个模型进行10个大环精炼在中使用默认策略菲尼克斯定义用于倒数空间坐标精细化,除了真实空间精炼已关闭。默认情况下,第一个宏循环使用最小二乘目标函数,其余使用最大可能性。适用于CDL/E&H和琥珀色改进包括优化实验数据和几何约束之间的权重。该协议并行执行,一次使用CDL/E&H,另一次使用琥珀色几何约束。此外,Cβ约束模型中不包括伪扭转约束。显式参数设置包含在支持信息。最初只考虑每个替代构象的一个副本(备选位置A)。联系相应的作者即可获得最终文件。

结果模型的质量通过以下方法进行了数值评估摩尔概率(威廉姆斯,海德等。, 2018【Williams,C.J.,Head,J.J.,Moriarty,N.W.,Prisant,M.G.,Videau,L.L.,Deis,L.N.,Verma,V.,Keedy,D.A.,Hintze,B.J.,Chen,V.B.,Jain,S.,Lewis,S.M.,Arendall,W.B.III,Snoeyink,J.,Adams,P.D.,Lovell,S.C.,Richardson,J.S.&Richardsen,D.C.(2018),《蛋白质科学》27,293-315.】)在中可用凤凰(亚当斯等。, 2010【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】),由cpptraj公司(Roe&Cheatham,2013年【Roe,D.R.和Cheatham,T.E.(2013),《化学理论计算杂志》,第9期,第3084-3095页。】)在中可用琥珀色工具(案例等。, 2018[凯斯·D.A.、本·萨洛姆·I.Y.、布罗泽尔·S.R.、塞鲁蒂·D.S.、契坦·T.E.III、克鲁塞罗·V.W.D.、达顿·T.A.、杜克·R.E.、戈里什·D.、吉尔森·M.K.、高尔克·H.、戈茨·A.W.、格林·D.、哈里斯·R.、霍梅耶·N.、伊扎迪·S.、科瓦伦科·A.、库兹曼·T.、李·T。S.、LeGrand、S.、Li、P.、Lin、C.、Liu、J.、Luchko、T.、Luo、R.、Mermelstein、D.J.、Merz、K.M.、Miao、Y.、Monard、G.、Nguyen、C.、Nguien、H.、Omelyan、I.、Onufriev、A.、Pan、F.、Qi、R.,Roe、D.R.、Roitberg、A.、Sagui、C.、Schott-Verdugo、S.,Shen、J.,Simmerling、C.L.、Smith、J、Salomon-Ferrer,R.、Swails,J.、Walker、R.C.、Wang、J.和Wei、H、。,Wolf,R.M.、Wu,X.、Xiao,L.、York,D.M.和Kollman,P.A.(2018年)。Amber18.旧金山加利福尼亚大学)并通过电子密度和验证标记进行目视检查(陈)等。, 2009[Chen,V.B.,Davis,I.W.和Richardson,D.C.(2009)。蛋白质科学182403-2409。]). 图10中的所有原子点均计入法师(理查德森和理查德森,2001年【Richardson,D.C.&Richardsson,J.S.(2001),《国际结晶学表》,第F卷,M.G.Rossmann&E.Arnold编辑,第727-730页。多特雷赫特:克鲁沃学术出版社。])图5-9是在年制作的为了避免印刷歧义,除L之外的所有字母都以小写形式给出了PDB代码(例如1个nL; 莫里亚蒂,2015【Moriarty,N.W.(2015),《计算机结晶器》,新闻6,26。】).

2.3. 重量系数详细信息

在中优化的目标函数菲尼克斯定义倒数空间原子坐标精炼是一般形式

[T_{xyz}=w*T_{exp}+T_{xyz{rm约束}},\eqno(1)]

其中所有项都是原子坐标的函数,T型xyz公司是要最小化的目标残差,T型经验是观测和模型结构因子之间的残差,并量化了与实验数据的一致性,T型xyz公司_限制是与几何约束一致的残差w个是调整实验和几何约束项之间相对权重的比例因子。在传统精炼 T型xyz公司_限制使用CDL/E&H约束装置进行计算,

[T_{xyz}=w*T_{rm-exp}+T_{rm-CDL/E\&H}.\eqno(2)]

实施凤凰琥珀色我们用势能使用琥珀色力场进行计算,

[T_{xyz}=w*T_{rm经验}+E_{rm琥珀}\eqno(3)]

其中琥珀色术语现在有意用E类强调我们直接将势能函数计算单位琥珀色使用ff14SB力场(迈尔等。, 2015【Maier,J.A.,Martinez,C.,Kasavajhala,K.,Wickstrom,L.,Hauser,K.E.&Simmerling,C.(2015),《化学理论计算杂志》,第11期,第3696-3713页。】).

在标准默认值中凤凰 精细化,重量w个是基于梯度范数比率的值的组合(Brünger等。, 1989【Brünger,A.T.,Karplus,M.&Petsko,G.A.(1989),《水晶学报》A45,50-61。】; 亚当斯等。, 1997【Adams,P.D.,Pannu,N.S.,Read,R.J.&Brünger,A.T.(1997)。美国国家科学院院刊,945018-5023。】)以及默认为0.5的缩放因子。可以使用前面描述的程序(Afonine)优化初始重量等。, 2011【Afonine,P.V.,Echols,N.,Grosse-Kunstleve,R.W.,Moriarty,N.W.&Adams,P.D.(2011),《计算机结晶》,新闻2,99-103.】). 该程序使用了十次细化的结果,并选择了权重,考虑到键和角度r.m.s.dR(右)因素和验证统计数据,以确定特定精炼在十个宏观周期中的每一个。使用相同的程序来估计凤凰琥珀色改进。(如果需要更快的固定权重细化,我们发现缩放因子为0.2而不是0.5可以缩放琥珀色梯度应接近CDL/E&H限制的梯度,允许在菲尼克斯定义待使用。)

3.结果

3.1. 全数据评分比较

平均而言凤凰琥珀色组合略高R(右)工作R(右)自由的值(图2[链接])但质量更高的模型(图3[链接]). 增加R(右)因子在1.8–2.8º范围内最为显著。这是由于重量优化程序在此分辨率范围内具有不同的最佳重量限制。增幅较小R(右)自由的R(右)工作,因此R(右)Δ较少用于使用琥珀色梯度。不确定性R(右)自由的使用Tickle方程(13)计算95%的细化等。(2000【Tickle,I.J.,Laskowski,R.A.&Moss,D.S.(2000),《水晶学报》D56,442-450。】)小于0.032。在2Å分辨率下,这相当于0.7%的不确定性,这与平均值的差异大致相同R(右)自由的23.0%和23.6%的值凤凰凤凰琥珀色分别是。

[图2]
图2
R(右)优化权重细化的因素和R(右)自由的R(右)工作(R(右)Δ)与分辨率(每个分辨率箱中的平均值)。垂直轴以%为单位R(右)Δ轴位于左侧。E&H/CDL值以深蓝色绘制琥珀色烧成橙色。
[图3]
图3
模型质量度量与分辨率的比较图琥珀色(烧成橙色)与CDL/E&H(深蓝色)细化,误差条描述平均值标准误差的95%置信水平。这个摩尔概率分数是全原子碎屑核和拉马钱德兰偏爱和旋转体离群值的组合,加权以接近结构分辨率下的预期分数。氢键分数的计算方法如下cpptraj公司模型中每1000个原子。对于所有六个地块,琥珀色(焦橙色)方向不同。

这个凤凰琥珀色改进(降低)摩尔概率分数,原子间的碰撞更少。图中显示了0.1°分辨率箱中数值的平均值以及平均值标准误差(SEM)的95%置信水平。这个摩尔概率碎屑特别引人注目:精炼使用CDL/E&H约束,随着分辨率的恶化,碎屑核不断增加,常常导致大量的空间碰撞。另一方面,平均值为琥珀色约束似乎几乎与分辨率无关,并且在所有分辨率仓中保持一致,约为每1000个原子2.5次碰撞。SEM范围在低于1º时没有重叠,表明琥珀力场在中低分辨率下产生了更好的几何结构。有更多受欢迎的Ramachandran点(主干φ,ψ)和更少的Ramachandran异常值凤凰琥珀色改进。这种差异在分辨率低于2º时最为显著。凤凰琥珀色 精炼还改善(降低)了轮调异构体异常值的数量,但不能通过SEM进行区分,并增加了氢键的比例。虽然转子流量计的异常值结果保持相似,但氢键合结果在劣于2℃时有很大差异,导致3℃附近的键几乎加倍。所有曲线图都有一个接近2°的变化,其中CDL/E&H和琥珀色 精炼在一定程度上放宽了几何约束的权重,以便在数据能够明确显示的分辨率上允许更多偏差。由于力场没有理想的参数化值和比较凤凰琥珀色具有CDL/E&H值的键和角不是通用度量。好奇者可以看到补充图S1总体而言琥珀色在较低分辨率的优化中是非常重要的。

一个更糟糕的验证指标凤凰琥珀色细化是C的异常值数量β位置。平均值和扫描电镜均显示出明显的差异。C类β偏差(Cβd) 是模型C之间的距离β和理想Cβ,这是C周围四面体变形的综合度量α原子。通过平均N-C-C计算理想位置α-C类β和C-N-Cα-C类β不正确的二面体和修正键长,这允许非理想效应τ角度(洛弗尔等。, 2003【Lovell,S.C.,Davis,I.W.,Arendall,W.B.III,de Bakker,P.I.W..,Word,J.M.,Prisant,M.G.,Richardson,J.S.&Richardsson,D.C.(2003)。蛋白质,50,437-450。】). 在传统E&H约束下,Cβd对骨架构象和侧链构象之间的不相容性非常敏感。然而,对于CDL/E&H改进,C的百分比β对于低分辨率和中等分辨率,d离群值(>0.25°)可以忽略不计,在较高分辨率下仅增加到0.2%(见图4[链接]). 这与CDL/E&H一致,为C提供了严密的几何约束β在大多数分辨率下,但在优于2Å的分辨率下有所松动,因为那里有足够的实验信息来偏离理想的角度。注意,显式Cβ所有的约束都被关闭了凤凰细化,琥珀色力场没有显式的Cβ术语;然而,如果围绕C的所有角度α原子保持理想,则Cβ即使它在结构中的位置不正确,位置也会很理想。下一节分析了具体的本地示例,其中输出结构显示了总体比较中看到的积极或消极趋势的差异,以了解其性质、原因和跨分辨率范围的含义。

[图4]
图4
C的分数β每C的偏差(%)βCDL/E&H(深蓝色)和琥珀色(焦橙色)精制。数值在每个分辨率中平均,误差条显示平均值标准误差的95%置信水平。

3.2. 个别例子的审查

如上所述,与CDL/E&H约束改进相比凤凰琥珀色精制后C的百分比要高得多β偏差异常值,在低分辨率端增加到C的1%以上β原子。琥珀色 精炼也有更多的键长和角度异常值。以下分析了高、中、低分辨率的示例,以了解启动模式的特征和精炼产生这些差异的行为。

3.2.1. 高分辨率:waters、alternates、Cβd个离群值和错误峰值中的原子

在高分辨率范围内(优于1.7°),似乎最常见的问题不容易通过精炼是由于将错误的原子建模为密度峰值,或者是由于错误的建模、标记或截断交替构象所致。此类问题通常在验证中通过全原子碰撞或C标记β偏差,有时由于粘结长度和角度不好。(对于这里描述的高分辨率示例,我们使用上面概述的LES程序对凤凰琥珀色改进。)

图5[链接]()显示了一个例子,其中一个水分子被模拟成一个电子密度峰,该峰实际上应该是精氨酸胍的一个N原子。CDL/E&H公司精炼(图5[链接]b条)以将胍进一步移出密度为代价,修正了糟糕的几何形状;琥珀色 精炼改变了胍的取向,但没有得到全面改善(图5[链接]c(c)); 这三个版本都有严重冲突。如果水被删除,则精炼这种方法无疑会做得很好(图5[链接]d日). 这类问题在低分辨率时不存在,在低分辨率中,水没有建模,但对于Ile C,其他支链在高分辨率和中分辨率下经常出现δ(例如,PDB条目中的Ile1953个js8)甚至偶尔用于Trp(例如,PDB条目中的TrpB1701个工作周9).

[图5]
图5
CDL/E&H与琥珀色 精炼水与精氨酸残基中的侧链N原子不匹配。这里的两个结果都不可接受,但如果删除了不正确的水(d日)然后这两种方法都能很好地将胍正确地移回其密度。摩尔概率图5-10的标记:粉红色尖峰的簇代表碰撞,绿色圆点的枕头代表氢键,红色或蓝色弹簧或扇形代表较大或较小的键长或角度异常值,洋红色球体代表Cβ偏差,金色侧链表示转子分离器异常值,绿色Cα–Cα线代表Ramachandran离群值,洋红线沿CO–CO二面体代表CaBLAM公司异常值。用红色或蓝色球体强调相对运动的O或N原子。

C类β偏差异常值(≥0.25°)通常由C值相差很大的侧链交替产生β位置,但是没有沿着主干定义相关联的替代物。因为围绕C的四面体α应该是近乎理想的,这种处理几乎保证了糟糕的几何。相当简单的解决方案,在中实现凤凰是为所有原子定义替代,直到+1和-1摄氏度α原子,如在“反摩擦”运动中(戴维斯等。, 2006【Davis,I.W.,Arendall,W.B.III,Richardson,D.C.&Richardsson,J.S.(2006),《结构》,第14期,第265-274页。】). PDB条目第1天5,1千瓦1个nL每种情况都有很多这样的情况。图6[链接]()和6[链接](b条)在PDB条目中显示Ser2151个nL,最初为异常值Cβd、 两个C之间的距离为0.49ºβ原子和单个Cα原子。CDL/E&H公司精炼拉动Cβ原子间距只有0.23度,避免了Cβd与密度的拟合稍差;琥珀色降低Cβd只是一点点,但它确实保留了这个潜在问题的标记。当为主干定义备用时肽,这两个系统都有所改进。

[图6]
图6
在高分辨率下,Cβ偏差异常值通常是由于交替构象的问题造成的。()琥珀色 精炼在PDB条目中使用原始Ser215替代项1个nL,其中C的位置相差很大β但只有一个Cα原子。(b条)琥珀色 精炼在替代品的定义被扩展到包括C之后α并且两者相邻肽。(c(c))琥珀色 精炼PDB条目的原始Thr1961个nL备用B安装在后面;有糟糕的共价几何和巨大的Cβ0.88º的d(未显示球体)。(d日)好的琥珀色结果:将替代品B重新安装到正确的转子分离器中,使所有原子的密度匹配。

更糟糕的情况是,一个或两个备选方案安装不正确,并且没有沿着主干适当扩展。图6[链接](c(c))显示Thr196,带有一个巨大的Cβd为0.88º(未显示球体),几何结构非常差,因为备用B安装不正确(就像备用a的移位,而不是作为新的转子分离器)。这次甚至包括CDL/E&H精炼产生Cβd个异常值,但小于琥珀色.图6[链接](d日)显示出优秀琥珀色结果替代品B的误配得到近似纠正。

3.2.2. 中等分辨率:反向侧链和罕见构象

在高分辨率和中分辨率下,一个更常见的情况是在密度峰值中安装了错误的原子,这是一个后向填充的Cβ-支链残基,PDB条目中一个非常清晰的Thr示例很好地说明了这一点1亿千瓦分辨率为1.1º(图7[链接]). Thr101是正则表达式上的旋转异构体异常值(黄金)α-带C的螺旋线βd为0.63º。沉积的Thr101的键角偏差也为13.5σ,在C区发生冲突γ甲基,其Cβ密度不足,Oγ处于较低峰值,Cγ处于较高的峰值。如图7所示[链接]带1.6σ和4σ2百万英尺o个DF公司c(c)轮廓(但不带Cβ为了清晰起见,偏差和角度标记)。这个错误并不明显,因为各向异性B类在建模中过早使用因子,导致Thr Cβ被细化为6:1的各向异性轴比,该各向异性轴比覆盖了建模的原子和实际位置。图中显示了按各向同性计算的密度B类因素。

[图7]
图7
摆脱C的不可接受方式β没有解决实际问题的偏差。()PDB条目中的Thr1011亿千瓦存放时,带有一个巨大的Cβd为0.63º(未显示为球体,因为它遮挡了侧链)、碰撞、转子流量计异常值、较重的Oγ低电子密度峰中的分支和Cβ密度不足,所有这些都是由侧链建模引起的χ1向后180°。(b条)CDL/E&H使几何形状完美,但将Oγ远远超出密度。(c(c))琥珀色通过使手性在Cβ不正确。(d日)对正确的旋转加速器进行改装,以氢键取代碰撞,没有异常值,并将每个原子置于正确的密度峰值。

考虑到这一自动化难题精细化,这两个目标函数的反应都非常不同。这两种改进仍具有Cγ甲基与高密度的螺旋骨架CO发生碰撞,这非常能诊断C的问题γ原子。正如相对峰高所示,这确实是一个错误的原子。CDL/E&H精炼(图7[链接]b条)实现紧密的几何结构和良好的旋转器,移动Cβ原子进入其正确的密度峰值,但为没有通过摆动O来纠正潜在问题而付出代价γ原子密度不足。这个琥珀色 精炼(图7[链接]c(c))在三个侧链密度峰值中的每一个峰值中都获得一个原子,但由于没有纠正潜在问题而付出了代价手性在Cβ原子。它仍然有键角异常值,这可能是未覆盖精细化的迹象。

原始PDB条目、CDL/E&H精炼琥珀色 精炼Thr101的结构都大错特错,但每一种都是完全不同的。沉积模型,PDB条目1亿千瓦,通过传统模型验证看起来很差,但考虑到极度各向异性的Cβ B类因素。除冲突外,CDL/E&H输出在传统验证中看起来非常好,并且显示出较低但仍然合理的密度相关性;然而,在人工检查中,这是最明显的错误。这个琥珀色输出有冲突,目前有适度的键角异常值,但它与密度非常接近,因此很难通过目视检查确定是否不正确。通过一个简单的手性检查。如图7所示[链接](d日),Thr101于年迅速重建使用第页转子和一个小的反摩擦运动。要么凤凰–CDL/E&H或凤凰琥珀色 精炼如果能把正确的原子放在正确的位置附近,这样的粗略改装会做得很好。

在中等分辨率下,也有其他旋转异构体和主干构象被安装到错误的局部极小值中,因此很难通过最小化进行纠正精炼方法,但并不总是由C标记β偏差或其他异常值。其中一些,例如顺式-非脯氨酸肽类(维多·威廉姆斯等。, 2018[Williams,C.J.,Videau,L.L.,Hintze,B.J.,Richardson,D.C.&Richardsson,J.S.(2018).生物研究,324517.])或非常罕见的旋转体(Hintze等。, 2016【Hintze,B.J.,Lewis,S.M.,Richardson,J.S.&Richardsson,D.C.(2016年)。蛋白质,84,1177-1189。】),可以通过考虑其高度不有利的先验概率来避免。另一些则需要对多个最小值进行显式采样。

3.2.3. 低分辨率:肽定向CaBLAM公司和Cβd个离群值

在低分辨率(2.5–4º)下,没有水或替代物建模。所有其他问题仍在继续,但由于宽电子密度与显著不同的模型兼容,出现了另一组常见的局部不匹配。PDB条目1个3.5º分辨率是在这个范围内进行测试的一个很好的例子,因为它是用PDB代码独立于1.75º分辨率结构进行求解的1个:相同的分子在不同的空间组。CDL/E&H公司精炼显示无Cβd个异常值,但琥珀色 精炼显示了六个。与PDB条目的比较1个显示了每个Cβd残基的侧链、主链或两者都处于不正确的局部最小构象中,无法通过最小化进行校正精炼方法(理查森和理查森,2018[理查德森·J·S·理查森和理查德森·D·C·C·理查逊(2018),《计算机晶体》,《新闻》第9期,第21-24页。]). 例如,图8[链接]显示螺旋上的Leu253,带有Cβd来自琥珀色(图8[链接]c(c))以及不同的正确PDB条目1克Leu旋转异构体(图8[链接]d日). 这些Cβ因此,d个离群值是琥珀色:它们具有标记真正的配件问题的设计验证功能。然而,缺乏C语言βCDL/E&H中的d个异常值精炼这也不是一个缺陷,因为紧凑的CDL/E&H几何结构在低分辨率下通常非常有用。

[图8]
图8
A和Cβ偏差琥珀色结果为3.5º分辨率,但不是原始结果或CDL/E&H结果。()PDB条目中的Leu2531个go在一个扭曲的螺旋线上,有许多冲突和一个Ramachandran异常值;如PDB代码结构所示,Leu旋转异构体不正确1个分辨率为1.75Å。(b条)CDL/E&H公司精炼修复了碰撞,但不修复旋转仪或Ramachandran异常值或螺旋扭曲。(c(c))琥珀色 精炼修复冲突和Ramachandran异常值,用C标记不正确的Leu转子相机βd离群值,使螺旋构象更接近理想。(d日)PDB条目中的Leu2531个分辨率为1.75º,在理想螺旋线上有一个清晰正确的转子流量计,除了一次碰撞外没有异常值。

这个1个go1个比较还说明了其中的许多方法琥珀色 精炼在低分辨率下更出色。在图8中[链接],琥珀色修正了螺旋中的Ramachandran异常值,并显示出更接近PDB入口理想几何形状的螺旋主干形状1个与存放或CDL/E&H版本相比。

由于在低分辨率下看不到主干CO方向,因此最常见的局部错配是一个定向错误的肽(理查森等。, 2018【Richardson,J.S.,Williams,C.J.,Videau,L.L.,Chen,V.B.&Richardsson,D.C.(2018),《生物结构杂志》204,301-312。】). 这些可以通过新的摩尔概率已调用验证CaBLAM公司,测试相邻CO方向是否与本地C兼容α主干构造(Williams,Headd等。, 2018【Williams,C.J.,Head,J.J.,Moriarty,N.W.,Prisant,M.G.,Videau,L.L.,Deis,L.N.,Verma,V.,Keedy,D.A.,Hintze,B.J.,Chen,V.B.,Jain,S.,Lewis,S.M.,Arendall,W.B.III,Snoeyink,J.,Adams,P.D.,Lovell,S.C.,Richardson,J.S.&Richardsen,D.C.(2018),《蛋白质科学》27,293-315.】). PDB条目中发现了10例此类病例1个go用于隔离的单或双CaBLAM公司PDB条目中判断的由正确结构包围的异常值1个在这十种情况中,有六种既不是CDL/E&H也不是琥珀色 精炼纠正了问题(His62、Thr70、Gly163、Gly193、Ala217和Glu286;参见补充图S2). 在两种情况下,CDL/E&H的其他异常值少于琥珀色 精细化,但实际上并没有重新定位CO(Gly193和Gly163案例如图所示补充图S3). 十个案例中有三个琥珀色执行了完全修复,而CDL/E&H没有提供任何改进(Asp88、Gly125和Pro266)。例如,在图9中[链接],PDB条目的残留物86–911个go(图9[链接])有一个CaBLAM公司CDL/E&H未修正的异常值(品红色线)精炼(图9[链接]b条). 然而,琥珀色 精炼(图9[链接]c(c))设法以适当的量(红色球体)改变几个CO方向,这足以修复CaBLAM公司离群值并匹配PDB入口的更好主干构造1个非常接近(图9[链接]d日). Gly125示例如所示补充图S4最后,在一个特别有趣的案例中(Lys22)琥珀色将CO调到了应有的一半,而CDL/E&H没有任何改进。这个琥珀色模型仍然存在几何异常值,进一步运行将CO向上移动了大部分,并删除了这些异常值,表明琥珀色 精炼尚未在十个宏循环中完全收敛(参见支持信息补充图S5).

[图9]
图9
PDB进入中的两个错误定向肽1个go,由Ramachandran和CaBLAM公司异常值(CO虚拟二面体上的洋红色轮廓)。()PDB代码沉积结构中的残留物86–911个. (b)CDL/E&H结果,构象和异常值不变。(c(c))琥珀色结果,几个肽的方向发生了适度的变化(CO上的红色球体),去除了主链的异常值,并与PDB进入的构象非常匹配1个如所示(d日).

琥珀色 精炼特别擅长优化氢器皿全原子立体结构,计算公式如下探查(Word、Lovell、LaBean等。, 1999【Word,J.M.,Lovell,S.C.,LaBean,T.H.,Taylor,H.C.,Zalis,M.E.,Presley,B.K.,Richardson,J.S.&Richardsson,D.C.(1999),《分子生物学杂志》2851711-1733。】)添加并优化H原子减少(Word,Lovell,Richardson)等。, 1999【Word,J.M.,Lovell,S.C.,Richardson,J.S.&Richardsson,D.C.(1999),《分子生物学杂志》2851735-1747。】). 如图10所示[链接]用于PDB条目3克8升分辨率为2.5º。Asn182螺旋N帽区域的沉积结构,有许多各种异常值(图10[链接])CDL/E&H对其进行了大量改进精炼(图10[链接]b条). 然而琥珀色 精炼(图10[链接]c(c))明显更好,氢键更多,范德瓦尔斯接触更好,冲突更少。图11定量地绘制了这些改进[链接]通过减少不利的碰撞尖峰(红色)和小重叠(橙色),增加有利的氢键(绿色)和范德瓦尔斯接触(蓝色)来衡量。

[图10]
图10
琥珀色 精炼产生更好的氢键和范德瓦尔斯接触,并消除更多的空间位阻。()PDB入口的Asn182螺旋帽区域3克8升分辨率为2.5º,有许多冲突和其他异常值。(b条)CDL/E&H公司精炼进行了很大的改进,删除了大多数冲突和所有其他异常值。(c(c))琥珀色 精炼更好的是,消除所有冲突和大多数小重叠(黄色),并优化以产生更多氢键和有利的范德瓦尔斯接触(绿色和蓝色圆点)。
[图11]
图11
CDL/E&H与琥珀色PDB进入中螺旋帽空间接触的改进3克8升,通过测量的全原子接触点或尖峰计数进行量化法师(理查德森和理查德森,2001年【Richardson,D.C.&Richardsson,J.S.(2001),《国际结晶学表》,第F卷,M.G.Rossmann&E.Arnold编辑,第727-730页。多特雷赫特:克鲁沃学术出版社。]),使用PDB代码对沉积结构中的计数进行归一化3克8升.琥珀色对于所有四种接触类型,在正确的方向上变化最远。

4.讨论

将分子力学力场纳入晶体学精细化的想法并不新鲜,其先例可追溯到Jack&Levit(1978)的早期工作[Jack,A.和Levitt,M.(1978),《水晶学报》,A341931-935.])和X-PLOR公司计划(Brünger和Karplus,1991年【Brünger,A.T.和Karplus,M.(1991),《化学研究报告》24,54-61。】)发展于20世纪80年代。力场可以(至少在原则上)编码关于蛋白质结构的“先验知识”这一概念仍然具有强烈的吸引力,并努力取代非常局部和不相关的传统“几何约束”,随着对结构质量进行更全面的评估,人们不断探索(例如,见穆里尼尔等。, 2003【Moulinier,L.,Case,D.A.&Simonson,T.(2003),《结晶学报》D59,2094-2103。】; 施尼德斯等。, 2009【Schnieders,M.J.,Fenn,T.D.,Pande,V.S.&Brunger,A.T.(2009),《水晶学报》,D65,952-965。】). 当前实现的显著特点包括自动制备多种生物分子、配体和溶剂组分的力场,以及与凤凰,一个成熟且广泛使用的平台精细化。这使得对PDB中超过22000个蛋白质条目进行并行优化成为可能,并允许晶体学家在自己的系统上通过简单地将标记添加到现有的菲尼克斯定义命令行或通过凤凰图形用户界面。事实上,我们希望大多数用户“打开”琥珀色执行更常规的精炼自行判断出现的结构差异的重要性和正确性。如第3.2节所述[链接],一个琥珀色 精炼将经常以与更传统的细化所提供的线索互补的方式标记需要手动重新装配的残留物。

此处显示的结果表明,局部质量得到改善的结构(由摩尔概率标准和氢键分析)可以通过简单的能量最小化获得,在与实验结构因子一致的情况下,退化最小,并且当前生成的蛋白质力场没有变化。然而,人们应该记住琥珀色-这里获得的精细结构与使用更传统的结构没有太大区别精细化。这两种方法都要求提前纠正大多数局部不匹配。希望无论是对明确的替代方案进行采样,还是使用更积极的构象搜索进行优化,例如模拟退火或扭角动力学,都可以找到与实验数据非常一致的正确低能结构。

进一步探索“X射线”和“能量”术语之间的相对权重(超出此处采用的现有和启发式权重优化程序),甚至在能量术语内,可能会变得很重要。原则上,最大化“先验知识”产生的联合概率[使用波尔兹曼分布,exp(−E类琥珀色FF/k个B类T型),对于某些有效温度]和最大似然目标函数(基于给定模型和观测数据)是一种很有吸引力的方法,可以有效地建立适当的相对权重。需要进行更多的研究,以了解这在实践中的效果,尤其是考虑到当前力场不可避免的局限性。

琥珀色力场集成到凤凰结晶学软件也为开发更复杂的应用程序铺平了道路。通过使用局部增强采样(LES)方法,力场可以适应交替的构象(Roitberg&Elber,1991【Roitberg,A.&Elber,R.(1991),《化学物理杂志》,第95期,第9277-9287页。】; Simmerling公司等。, 1998【Simmerling,C.,Fox,T.&Kollman,P.A.(1998),《美国化学学会杂志》,第120期,第5771-5782页。】); 这里讨论了几个示例,而其他地方将提供详细信息。合奏精炼(伯恩利等。, 2012[Burnley,B.T.,Afonine,P.V.,Adams,P.D.&Gros,P.(2012).电子生活,1,e00311.])现在可以使用完整的分子动力学力场来执行,从而避免集成中质量较差的单个模型。类似地,模拟退火现在可以用改进的基于物理的势来进行。将提出的想法扩展到实际空间精炼在内部凤凰这为低温电子显微镜和低分辨率X射线结构的新应用开辟了道路。这些发展都将对大分子晶体学的未来做出重大贡献,加强从单一静态结构主导的晶体观到动力学和结构集成在描述分子功能中发挥核心重要作用的晶体观的转变(Furnham等。, 2006【Furnham,N.、Blundell,T.L.、DePristo,M.A.和Terwilliger,T.C.(2006),《自然结构分子生物学》,第13期,第184-185页。】; van den Bedem&Fraser,2015年【Bedem,H.van den&Fraser,J.S.(2015),《自然方法》,第12卷,第307-318页。】; 墙壁等。, 2014【Wall,M.E.,Adams,P.D.,Fraser,J.S.和Sauter,N.K.(2014)。结构,22182-184。】).

5.结论

我们已经介绍了精炼通过积分获得的结果凤凰使用琥珀色的软件包分子动力学。我们对22000多个晶体结构的改进表明精炼使用琥珀色全原子分子力学力场优于CDL/E&H约束精炼在许多方面。绝大多数琥珀色-改进后的模型显示模型质量显著提高。模型质量的大多数指标都有所改善,包括原子之间的碰撞、侧链旋转体和肽-背骨扭转角。特别地,凤凰琥珀色始终优于标准凤凰 精炼在碎屑核中,每1000个原子的氢键数量和摩尔概率分数。它也始终优于标准精炼对于低分辨率下的Ramachandran和转子流量计统计,在高分辨率(优于2.0°)下获得近似相等的结果。琥珀色确实运行得比较慢(通常需要20-40%的时间),并且可能需要更多的周期局部构象如果正在进行较大的局部更改,则完全收敛(请参阅标题补充图S5). 应注意,标准精炼持续表现优异凤凰琥珀色消除Cβ所有分辨率的偏差和其他共价几何异常值,但在大多数情况下琥珀色离群值用于标记模型中的实际问题。

由于实验数据的质量随着分辨率的降低而降低,使用琥珀色与CDL/E&H约束相比,增加了。这种改进在碎屑岩芯的情况下尤其显著,碎屑岩芯似乎与实验数据的分辨率几乎无关琥珀色改进。静电相互作用、氢键和范德瓦尔斯接触的建模也有了进一步的改进,而这些目前被传统约束所忽略。改进低分辨率结构非常重要,因为它们包括大部分最令人兴奋和生物重要的当前结构,例如大型动态分子机器的蛋白质/核酸复合物。

无最小化精炼方法,包括CDL/E&H和琥珀色通常可以纠正在不正确的局部最小构象中建模的局部不匹配,特别是在相对较高的分辨率下。在分辨率较低、屏障较软的情况下,琥珀色有时可以管理这样的变化,而CDL/E&H仍然不能。因此,重要的是,强烈建议在开始自动循环之前,咨询初始模型的验证标志,并尽可能修复最坏的情况精炼与任一目标。

6.软件分发

琥珀色于实现菲尼克斯定义并在v.1.16-3549中提供凤凰以及稍后。使用说明菲尼克斯定义 琥珀色在发行版提供的特定于版本的文档中提供了实现。这个琥珀色代码包含在凤凰根据GNU较低通用公共许可证(LGPL)的条款进行分配。

7.相关文献

以下参考文献引用于支持信息本文作者:Jorgensen等。(1983【Jorgensen,W.L.,Chandrasekhar,J.,Madura,J.D.,Impey,R.W.&Klein,M.L.(1983),《化学物理杂志》79,926-935。】)、Joung&Cheatham(2009年【Joung,I.S.&Cheatham,T.E.(2009),《物理化学杂志》,第113期,第13279-13290页。】)塔希洛夫等。(1998年【Tahirov,T.H.、Oki,H.、Tsukihara,T.、Ogasara,K.、Yutani,K.,Ogata,K.和Izu,Y.、Tsunasawa,S.和Kato,I.(1998),《分子生物学杂志》284、101-124。】)和Wang等。(2004【Wang,J.,Wolf,R.M.,Caldwell,J.W.,Kollman,P.A.&Case,D.A.(2004),《计算化学杂志》第25期,第1157-1174页。】, 2006[Wang,J.,Wang,W.,Kollman,P.A.和Case,D.A.(2006)。分子图模型。25247-260。]).

支持信息


脚注

目前在微软。

致谢

JSR感谢David Richardson在个别示例分析的某些方面提供的帮助。内容完全由作者负责,不一定代表美国国立卫生研究院、NIGMS或DOE的官方观点。

资金筹措信息

以下资金已获认可:国家卫生研究院(授予David A.Case第GM122086号;授予Paul D.Adams、Jane S.Richardson第P01GM063210号);能源部(授予劳伦斯伯克利国家实验室DE-AC02-05CH11231号);凤凰工业联合会。

工具书类

第一次引用Adams,P.D.、Afonine,P.V.、Bunkóczi,G.、Chen,V.B.、Davis,I.W.、Echols,N.、Headd,J.J.、Hung,L.-W.、Kapral,G.J.、Grosse-Kunstleve,R.W.、McCoy,A.J.、Moriarty,N.W.、Oeffner,R.、Read,R.J.、Richardson,D.C.、Richards,J.S.、Terwilliger,T.C.和Zwart,P.H.(2010)。《水晶学报》。D类66, 213–221. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Adams,P.D.,Pannu,N.S.,Read,R.J.&Brünger,A.T.(1997)。程序。美国国家科学院。科学。美国,94, 5018–5023. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Afonine,P.V.、Echols,N.、Grosse-Kunstleve,R.W.、Moriarty,N.W.和Adams,P.D.(2011)。计算。Crystallogr公司。新闻。 2, 99–103. 谷歌学者
第一次引用Afonine,P.V.、Grosse-Kunstleve,R.W.、Echols,N.、Headd,J.J.、Moriarty,N.W.、Mustakimov,M.、Terwilliger,T.C.、Urzhumtsev,A.、Zwart,P.H.和Adams,P.D.(2012)。《水晶学报》。D类68, 352–367. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用阿加瓦尔,R.C.(1978)。《水晶学报》。A类34, 791–809. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Bedem,H.van den&Fraser,J.S.(2015)。自然方法,12, 307–318. 科学网 公共医学 谷歌学者
第一次引用Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。核酸研究。 28, 235–242. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Bowman,G.R.、Voelz,V.A.和Pande,V.S.(2011年)。美国化学杂志。Soc公司。 133, 664–667. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Bricogne,G.、Blanc,E.、Brandl,M.、Flensburg,C.、Keller,P.、Paciorek,W.、Roversi,P.和Sharff,A.、Smart,O.S.、Vonrhein,C.和Womack,?T。O.(2011年)。巴斯特《全球阶段化》,英国剑桥谷歌学者
第一次引用Brünger,A.T.和Karplus,M.(1991)。Acc.Chem.化学。物件。 24, 54–61. 谷歌学者
第一次引用Brünger,A.T.、Karplus,M.和Petsko,G.A.(1989)。《水晶学报》。A类45, 50–61. 交叉参考 科学网 IUCr日志 谷歌学者
第一次引用Brünger,A.T.,Kuriyan,J.&Karplus,M.(1987)。科学,235, 458–460. 公共医学 科学网 谷歌学者
第一次引用Burley,S.K.、Berman,H.M.、Bhikadiya,C.、Bi,C.,Chen,L.、Costanzo,L.D.、Christie,C.、Duarte,J.M.,Dutta,S.、Feng,Z.、Ghosh,S.,Goodsell,D.S.、Green、R.、Guranovic,V.、Guzenko,D.、Hudson,B.P.、Liang,Y.、Lowe,R.、Peisach,E.、Periskova,I.、Randle,C.和Rose,A.、Sekharan,M.、Shao,C.、Tao,Y.-P.、Valasatava,Y.Voigt,M.、。,Westbrook,J.、Young,J.和Zardecki,C.、Zhuravleva,M.、Kurisu,G.、Nakamura,H.、Kengaku,Y.、Cho,H.和Sato,J.,Kim,J.。福特、J.M.、康罗伊、,M.J.、Dana、J.M.、Deshpande、M.、Gane、P.、Gáborová、R.、Gupta、D.、Gutmanas、A.、Koć、J.、Mak、L.、Mir、S.、Mukhopadhyay、A.、Nadzirin、N.、Nair、S.,Patwardhan、A.、Paysan-Lafosse、T.、Pravda、L.,Salih、O.、Sehnal、D.、Varadi、M.,Vařeková、R、Markley、J.L.、Hoch、J.C.、Romero、P.R.、Baskaran、K.、Maziuk、D.、Ulrich、E.L.、Wedell、,J.R.、Yao,H.、Livny,M.和Ioanidis,Y.E.(2019年)。核酸研究。 47,D520–D528交叉参考 公共医学 谷歌学者
第一次引用Burnley,B.T.,Afonine,P.V.,Adams,P.D.&Gros,P.(2012年)。电子生活,1,e00311科学网 交叉参考 公共医学 谷歌学者
第一次引用Case,D.A.,Ben-Shalom,I.Y.,Brozell,S.R.,Cerutti,D.S.,Cheatham,T.E.III,Cruzeiro,V.W.D.,Darden,T.A.,Duke,R.E.,Ghoreishi,D.,Gilson,M.K.,Gohlke,H.,Goetz,A.W.,Greene,D.,Harris,R.,Homeyer,N.,Izadi,S.,Kovalenko,A.,Kurtzman,T.,Lee,S,D.J.、Merz、K.M.、Miao、Y.、Monard、G.、Nguyen、C.、Nguien、H.、Omelyan、I.、Onufriev、A.、Pan、F.、Qi、R.、Roe、D.R.、Loitberg、A.、Sagui、C.、Schott-Verdugo、S.、Shen、J.、Simmerling、C.、Smith、J.,Salomon-Ferrer、R.,Swails,J.、Walker、R.C.、Wang、J.和Wei、H.,Wolf、R.M.、Wu、X.、Xo、L.、York、D.M.和Kollman,P.A.(2018年)。琥珀色18.加州大学旧金山分校。 谷歌学者
第一次引用Cerutti,D.S.、Le Trong,I.、Stenkamp,R.E.和Lybrand,T.P.(2008)。生物化学,47, 12065–12077. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Cerutti,D.S.、Le Trong,I.、Stenkamp,R.E.和Lybrand,T.P.(2009)。《物理学杂志》。化学。B类,113, 6971–6985. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Chen,V.B.、Davis,I.W.和Richardson,D.C.(2009年)。蛋白质科学。 18, 2403–2409. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Darden,T.、York,D.M.和Pedersen,L.(1993)。化学杂志。物理学。 98, 10089–10092. 交叉参考 中国科学院 谷歌学者
第一次引用Davis,A.M.、Teague,S.J.和Kleywegt,G.J.(2003年)。安圭。化学。国际编辑。 42, 2718–2736. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Davis,I.W.,Arendall,W.B.III,Richardson,D.C.&Richardson.J.S.(2006)。结构,14, 265–274. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Engh,R.A.和Huber,R.(1991)。《水晶学报》。A类47, 392–400. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Engh,R.A.和Huber,R.(2001)。国际结晶图表,卷。F类,由M.G.Rossmann和E.Arnold编辑,第382–392页。多德雷赫特:克鲁沃学术出版社。 谷歌学者
第一次引用Furnham,N.、Blundell,T.L.、DePristo,M.A.和Terwilliger,T.C.(2006)。自然结构。分子生物学。 13, 184–185. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Grindon,C.、Harris,S.、Evans,T.、Novik,K.、Coveney,P.和Laughton,C.(2004)。菲洛斯。事务处理。R.Soc.伦敦。数学。物理学。工程科学。 362, 1373–1386. 交叉参考 谷歌学者
第一次引用Groom,C.R.,Bruno,I.J.,Lightfoot,M.P.&Ward,S.C.(2016)。《水晶学报》。B类72, 171–179. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Gunsteren,W.F.van,Dolenc,J.&Mark,A.E.(2008)。货币。操作。结构。生物。 18,149–153公共医学 谷歌学者
第一次引用Hendrickson,W.A.和Konnert,J.H.(1980)。晶体学中的计算由R.Diamond、S.Ramaseshan和K.Venkatesan编辑,第13.01–13.26页。班加罗尔:印度科学院。 谷歌学者
第一次引用Hintze,B.J.、Lewis,S.M.、Richardson,J.S.和Richardsson,D.C.(2016)。蛋白质,84, 1177–1189. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Jack,A.和Levit,M.(1978年)。《水晶学报》。A类34, 931–935. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Jain,S.、Richardson,D.C.和Richardsen,J.S.(2015)。方法酶制剂。 558, 181–212. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Janowski,P.A.,Cerutti,D.S.,Holton,J.M.&Case,D.A.(2013年)。美国化学杂志。Soc公司。 135, 7938–7948. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Janowski,P.A.、Liu,C.、Deckman,J.&Case,D.A.(2015)。蛋白质科学。 25, 87–102. 交叉参考 公共医学 谷歌学者
第一次引用Jorgensen,W.L.、Chandrasekhar,J.、Madura,J.D.、Impey,R.W.和Klein,M.L.(1983年)。化学杂志。物理学。 79, 926–935. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Joung,I.S.&Cheatham,T.E.(2009年)。《物理学杂志》。化学。B类,113, 13279–13290. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Liebschner,D.,Afonine,P.V.,Baker,M.L.,Bunkóczi,G.,Chen,V.B.,Croll,T.I.,Hintze,B.,Hung,L.-W.,Jain,S.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.D.,Poon,B.K.,Prisant,M.G.,Read,R.J.,Richardson,J.S.,Richadson,D.C.,Sammito,M.D.,Sobolev,O.V.,Stockwell,D.H.,Terwilliger,T.C.,Urzhumtsev,A.G.,Videau,L。L.、Williams、C.J.和Adams,P.D.(2019年)。《水晶学报》。D类75, 861–877. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Liu,C.,Janowski,P.A.&Case,D.A.(2015)。生物化学。生物物理学。学报,1850, 1059–1071. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Lovell,S.C.、Davis,I.W.、Arendall,W.B.III、de Bakker,P.I.W.、Word,J.M.、Prisant,M.G.、Richardson,J.S.和Richardson,D.C.(2003年)。蛋白质,50, 437–450. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Maier,J.A.、Martinez,C.、Kasavajhala,K.、Wickstrom,L.、Hauser,K.E.和Simmerling,C.(2015)。化学杂志。理论计算。 11, 3696–3713. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Moriarty,N.W.(2015)。计算。结晶器。新闻。 6, 26. 谷歌学者
第一次引用Moriarty,N.W.、Grosse-Kunstleve,R.W.和Adams,P.D.(2009年)。《水晶学报》。D类65, 1074–1080. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Moriarty,N.W.、Tronrud,D.E.、Adams,P.D.和Karplus,P.A.(2014)。FEBS J公司。 281, 4061–4071. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Moriarty,N.W.,Tronrud,D.E.,Adams,P.D.&Karplus,P.A.(2016)。《水晶学报》。D类72, 176–179. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Moulinier,L.、Case,D.A.和Simonson,T.(2003)。《水晶学报》。D类59, 2094–2103. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Murshudov,G.N.、Skubák,P.、Lebedev,A.A.、Pannu,N.S.、Steiner,R.A.、Nicholls,R.A、Winn,M.D.、Long,F.&Vagin,A.(2011)。《水晶学报》。D类67, 355–367. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Murshudov,G.N.、Vagin,A.A.和Dodson,E.J.(1997)。《水晶学报》。D类53, 240–255. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Parkinson,G.、Vojtechovsky,J.、Clowney,L.、Brünger,A.T.和Berman,H.M.(1996)。《水晶学报》。D类52, 57–64. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Priestle,J.P.(2003)。J.应用。克里斯特。 36,34–42科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用理查德森·D.C.和理查德森·J.S.(2001)。国际结晶学表,卷。F类由M.G.Rossmann和E.Arnold编辑,第727-730页。多特雷赫特:克鲁沃学术出版社。 谷歌学者
第一次引用Richardson,J.S.&Richardsen,D.C.(2018年)。计算。结晶器。新闻。 9, 21–24. 谷歌学者
第一次引用Richardson,J.S.、Williams,C.J.、Videau,L.L.、Chen,V.B.和Richardsson,D.C.(2018)。J.结构。生物。 204, 301–312. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Roe,D.R.和Cheatham,T.E.(2013)。化学杂志。理论计算。 9, 3084–3095. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Roitberg,A.和Elber,R.(1991)。化学杂志。物理学。 95,9277–9287交叉参考 中国科学院 谷歌学者
第一次引用Schnieders,M.J.、Fenn,T.D.、Pande,V.S.和Brunger,A.T.(2009)。《水晶学报》。D类65, 952–965. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.(2015)。《水晶学报》。C类71, 3–8. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Showalter,S.A.和Brüschweiler,R.(2007年)。化学杂志。理论计算。 , 961–975. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Simmerling,C.,Fox,T.&Kollman,P.A.(1998年)。美国化学杂志。Soc公司。 120,5771–5782交叉参考 中国科学院 谷歌学者
第一次引用Tahirov,T.H.、Oki,H.、Tsukihara,T.、Ogasara,K.、Yutani,K.,Ogata,K.和Izu,Y.、Tsunasawa,S.和Kato,I.(1998年)。分子生物学杂志。 284, 101–124. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Tickle,I.J.、Laskowski,R.A.和Moss,D.S.(2000年)。《水晶学报》。D类56, 442–450. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Touw,W.G.和Vriend,G.(2010年)。《水晶学报》。D类66,1341–1350科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Tronrud,D.E.,Berkholz,D.S.&Karplus,P.A.(2010年)。《水晶学报》。D类66, 834–842. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Tronrud,D.E.、Ten Eyck,L.F.和Matthews,B.W.(1987)。《水晶学报》。A类43, 489–501. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Wall,M.E.,Adams,P.D.,Fraser,J.S.&Sauter,N.K.(2014)。结构,22, 182–184. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Wang,J.,Wang,W.,Kollman,P.A.&Case,D.A.(2006年)。J.摩尔图。模型。 25, 247–260. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Wang,J.、Wolf,R.M.、Caldwell,J.W.、Kollman,P.A.和Case,D.A.(2004)。J.计算。化学。 25, 1157–1174. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Waser,J.(1963年)。《水晶学报》。 16, 1091–1094. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Williams,C.J.,Head,J.J.,Moriarty,N.W.,Prisant,M.G.,Videau,L.L.,Deis,L.N.,Verma,V.,Keedy,D.A.,Hintze,B.J.,Chen,V.B.,Jain,S.,Lewis,S.M.,Arendall,W.B.III,Snoeyink,J.,Adams,P.D.,Lovell,S.C.,Richardson,J.S.&Richardsson,D.C.(2018)。蛋白质科学。 27, 293–315. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Williams,C.J.、Videau,L.L.、Hintze,B.J.、Richardson,D.C.和Richardsson,J.S.(2018)。生物Rxiv, 324517. 谷歌学者
第一次引用Word,J.M.,Lovell,S.C.,LaBean,T.H.,Taylor,H.C.,Zalis,M.E.,Presley,B.K.,Richardson,J.S.&Richardsson,D.C.(1999)。分子生物学杂志。 285, 1711–1733. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Word,J.M.、Lovell,S.C.、Richardson,J.S.和Richardsson,D.C.(1999)。分子生物学杂志。 285, 1735–1747. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用York,D.M.、Darden,T.A.和Pedersen,L.G.(1993)。化学杂志。物理学。 99, 8345–8348. 交叉参考 中国科学院 谷歌学者
第一次引用Zagrovic,B.,Gattin,Z.,Lau,J.K.-C.,Huber,M.&van Gunsteren,W.F.(2008)。《欧洲生物学》。J。 37, 903–912. 交叉参考 公共医学 中国科学院 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标结构性的
生物学
国际标准编号:2059-7983