2.方法
2.1. 计算单个OMIT区域的迭代构建OMIT映射
获得的单个区域的迭代构建OMIT图非对称单元原则上,对晶体的描述是非常简单的。首先,OMIT区域被定义为表示非对称单元。然后向该区域添加边界(通常为2º厚)。最后,迭代建模,精炼并以标准方式执行密度修改程序(Terwilliger,2003),但位于OMIT或边界区域内的任何原子在所有计算中都被赋予零占有率。我们将这整个过程称为“迭代构建的OMIT过程”。在此过程中,OMIT区域中的所有原子都包含在几何约束计算中,并包含在所有重建步骤中。这样就保留了模型的几何图形。然而,由于其零占据值,OMIT区域中的原子不参与结构因子计算。这可以防止直接的模型偏差。该程序还防止了OMIT区域内计算的密度中的间接模型偏差,因为OMIT区域外原子的参数从未调整过,以补偿OMIT或边界区域内原子的电子密度。
为了确保模型偏差不会通过NCS的应用间接引入RESOLVE(解决)密度修改步骤没有基于NCS的目标电子密度转移到OMIT或边界区域。这是通过定义OMIT区域的边界并指定不向该区域传输NCS信息来实现的。由于NCS的密度修改是逐点进行的,使用来自N个−1份副本作为剩余副本密度修改的目标(Terwilliger,2002年),可以直接省略OMIT区域中所有点的NCS信息。一旦从迭代构建的OMIT过程中获得最终的电子密度图,OMIT区域(但不是边界区域或图的其他部分)基本上不会因原子模型的结构因子贡献而产生偏差。随着描述NCS关系的参数的细化,原则上有可能在NCS区域之间传输模型信息。如刚体情况精炼然而,对于MR模型而言,不太可能通过本步骤中精炼的极少数参数来传输有关地图中特定位置密度的重要信息。在标准中菲尼克斯在NCS存在的情况下,模型构建过程中,所有副本的所有构建都是独立进行的,在特定步骤中,每个NCS副本的结构都会进行转换,以相互匹配,并保留每个NCS拷贝中结构的最佳部分。在构建OMIT图时,不会执行此步骤,因此NCS副本之间不会传输有关OMIT区域内结构的信息。NCS约束在使用OMIT程序建立模型期间应用。其结果是,由于来自OMIT区域外副本的NCS限制,OMIT区域中的(零电荷)原子可能被放置在错误的位置。
模型偏差的其他潜在来源是体积-固体修正和几何约束。在这里执行的程序中,整体溶剂模型和几何约束始终适用,因为不应用它们会导致OMIT边界外区域的原子模型较差,因此会导致OMIT图具有更大的伪影和更少的实用性。
我们注意到,在某些情况下,OMIT区域内的密度可能会受到OMIT区域中模型中原子位置的影响。例如,OMIT区域内的原子可以与OMIT区域外的原子键合,以便位置相关。类似地,原子在OMIT区域内的位置可能会影响溶剂分子在OMIT区域外的位置或OMIT区域外侧链的允许构象。此外,在自动建模过程中,可以根据OMIT区域内外的密度放置大型单元(螺旋或股)。然而,在所有这些情况下,OMIT区域内外原子之间的这种耦合不太可能导致OMIT区域内原子位置处的密度。因此,在生成的地图中不太可能存在任何模型偏差(由于模型中存在这些原子,所以模型中原子坐标处的密度)。
在我们的过程中,OMIT区域被构造为平铺以填充非对称单元。通常,大约10–20个OMIT区域用于覆盖非对称单元,但可以选择更多(在我们的测试中多达132个),以便对密度修改程序的影响最小。以这种方式选择OMIT区域的结果是,可能会有一些OMIT区域不包含来自大分子的原子,而其他区域包含许多原子。与原子较少的区域相比,含有许多原子的OMIT区域的电子密度通常较差,因为OMIT区域中原子的密度被排除在密度修改程序之外。通过定义包含更多相等原子数的可变大小的OMIT区域,可以改进程序。
在OMIT区域周围添加边界区域的原因是,根据包含特定原子的模型计算出的电子密度图中的密度峰值在半径内有很大的贡献,这可能取决于数据的分辨率和原子位移因子。根据以前使用合成OMIT图的经验,我们使用2º作为边界区域的厚度中枢神经系统(布伦格等。, 1998).
从不在OMIT区域中包含原子的方法直接适用于在不参考现有模型的情况下构建模型的情况。在以下情况下分子置换如果使用,理想情况下,从程序一开始就应忽略OMIT区域中的原子,以便分子和任何刚性体的位置精炼执行时不受这些原子的原子位置的影响。然而,在实践中,这可能是不必要的,因为在分子放置过程中优化的参数数量太少,以至于几乎无法保留有关OMIT区域中特定原子位置的信息。
我们注意到,这里描述的OMIT程序有一种负模型偏差。在OMIT区域中建立了一个模型,但占用率设置为零。这些原子的位置没有放置溶剂原子,也没有放置体积-固体模型。因此,OMIT区域内模型中原子位置附近的密度较低(零)。通过将这些位置的密度设置为中间值而不是零,似乎可以改进程序。
虽然这个过程在概念上很简单,但由于所有程序都在迭代建模、密度修改和精炼需要跟踪哪些原子在OMIT和边界区域中。这些步骤已在菲尼克斯(亚当斯等。, 2002)自动生成向导通过使用RESOLVE(解决)OMIT盒生成程序,用于指定OMIT区域及其边界,并确定模型中哪些原子位于这些区域内。此外,所有密度修改程序RESOLVE(解决)根据OMIT区域和边界的规范调用,这样就不会通过NCS的应用将基于模型的信息传输到这些区域。迭代模型构建、密度修改和精炼在PHENIX自动生成向导.
2.2. 复合迭代生成的OMIT映射的计算
复合迭代构建OMIT映射可以通过将非对称单元将晶体分为一组OMIT区域,计算上述每个区域及其边界的迭代构建的OMIT映射,然后简单地合并所有迭代构建的OMIT映射的OMIT区域。这种组合OMIT映射的方法与在中创建复合OMIT映射时使用的方法类似中枢神经系统(布伦格等。, 1998). 由此产生的迭代构建复合OMIT映射具有这样的特性,即映射中每个点的密度从未受到该点附近(或任何NCS相关点附近)存在的模型原子的影响。应该注意的是,由于这种地图的构建方式,它可能在OMIT区域之间的边界处存在不连续性,尽管我们在检查过的地图中没有发现任何不连续性。
在1.3b或更高版本的PHENIX自动生成向导(可从以下位置获得https://www.phenix-online.org; 亚当斯等。, 2002).
3.结果和讨论
3.3. 使用迭代构建的OMIT映射消除现有模型偏差
虽然这里描述的迭代构建OMIT过程的主要目的是完全避免模型偏差,但在OMIT区域外重建模型的过程似乎也可能有助于消除现有的模型偏差。特别是,我们预计大规模重建将有效地消除对模型其余部分中原子的调整,以补偿原子位置不正确的情况。为了测试这个想法,我们在PDB中确定了一个条目,其中包含一些可能不正确但仍保留在σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))地图(Read,1986年)计算时间:精炼结构的。PDB条目1禅(库珀等。, 1996)就是这样一种结构(G.Kleywegt,个人沟通)。它的分辨率为2.5º,结构紧密相关1b57号(大厅等。, 1999)之后以2º的分辨率测定,残基6–16的序列寄存器中有一个残基不同。
图3(一)和3(b条)显示σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))重新定义后计算的地图1禅(不省略任何原子)菲尼克斯定义使用沉积的结构因子和再生反射测试集精炼(原始测试集不可用)。决赛R(右)和R(右)自由的之后精炼分别为0.25和0.29。图3(一)显示了来自1禅,以残基Phe6和Lys8为中心,可能被该结构中的一个残基错位。图3(b条)显示了链的残基3–10的图A类来自PDB条目1b57号在从1b57号在结构上1禅最小二乘法。这个σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))map具有与用于生成此map的阶段的结构相同的功能(1禅)以及从更高分辨率模型导出的结构(1b57号),包括地图中显示为模型偏差示例的几个特征。特别是,该图显示了来自1禅结构,尽管可能性更大1b57号这个结构只有一个羰基O原子指向这个位置。总的来说,在残留物5-10的附近1禅,的σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))map与从高分辨率结构计算的模型map更相似1b57号而不是根据1禅这由局部地图相关系数以数字形式表示,表1中对其进行了总结用于此地图和下面讨论的地图。
| 地图相关性†具有 | 地图(全部基于1禅结构,除非另有说明) | 1禅模型 | 1b57号模型 | 首字母σA类地图,无OMIT | 0.68 | 0.75 | σA类“抖动”过程后的映射,无OMIT | 0.67 | 0.74 | σA类“摇晃”、去除水、精炼和挑水后绘制地图,无OMIT | 0.64 | 0.75 | 简单精炼OMIT | 0.63 | 0.71 | 模拟退火OMIT | 0.60 | 0.71 | 迭代构建的OMIT | 0.65 | 0.75 | 1b57号 F类计算地图 | 0.66 | 0.98 | | †地图相关性计算方法为RESOLVE(解决)(特威利格,2000年),包括对应模型中每个原子2°范围内的网格点。残留物3–10来自1禅之所以选择它们,是因为它们主要位于OMIT区域内,并且来自1b57号已选择与1禅碎片。 |
| 图3 σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))和OMIT映射1禅(库珀等。, 1996)与结构相比1禅和链条A类从1b57号(大厅等。, 1999)叠加在结构上1禅。地图的等高线为1σ. (一, b条)σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))地图(Read,1986年)计算时间:精炼的1禅具有的结构菲尼克斯定义(黄嘌呤等。, 2005b条),与结构相比1禅(一)和带链条A类从1b57号(b条). (c(c), d日)如中所示(一)和(b条)除了1禅通过1Ω的r.m.s.距离(“摇晃”程序)随机移动结构,然后用菲尼克斯定义. (e(电子), (f))如中所示(c(c))和(d日),除了在摇动程序和10次循环后去除溶剂水分子精炼包括模拟退火。(克, 小时)如中所示(一)和(b条),除了所示的图是一个简单的OMIT图,通过省略OMIT框中的所有原子来计算,OMIT框的边缘平行于细胞边缘,剩余物5–9中的任何原子为4º1禅(将其占用率设置为零),优化结果结构并计算σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))地图。(我, j个)按中计算的地图(克)和(小时)但该映射是模拟退火OMIT映射,其中精炼介入(c(c))和(d日)被模拟退火取代精炼(布伦格等。, 1998). (k个, 我)迭代构建的OMIT图计算如下(克)和(小时)除了1禅使用PHENIX自动生成向导,在该过程中,始终将OMIT框中所有原子的占用率设置为零。(米, n个)从EDS密度服务器下载的地图(Kleywegt等。, 2004). (米)σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))的地图和模型1禅. (n个)σA类-加权(毫发o个−DF公司c(c))经验(我φc(c))的映射1禅等高线为±2σ坐标为1禅(绿色)和1b57号(蓝色)叠加。 |
模型偏差可能出现在σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))图3所示地图(一)和3(b条)部分原因可能是我们无法访问中使用的原始测试集精细化。为了检验这种可能性,我们进行了第二次精炼其中,结构中的原子通过“震动”程序以1.0°的r.m.s.距离移位(布伦格等。, 1998; 炮车等。, 2000),产生启动R(右)和R(右)自由的分别为0.48和0.47,然后为精炼具有菲尼克斯定义,导致决赛R(右)和R(右)自由的分别为0.25和0.30。产生的结果σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))地图如图3所示(c(c))和3(d日). 它的模型偏差似乎略小于标准后计算的地图精细化,但总的来说,这些地图非常相似。
接下来,我们进行了更广泛的重新定义程序,以减少模型偏差。以上述“摇晃”程序中的部分随机模型为起点,去除所有溶剂分子(水),并进行十个循环精炼进行了两个模拟退火循环的挑水试验。再次启动R(右)和R(右)自由的分别为0.48和0.47,最终R(右)和R(右)自由的分别为0.25和0.30。生成的映射比初始映射具有更小的模型偏差σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))地图(图3e(电子)和3(f))并降低了与1禅模型(表1),但仍然很难确定这两个模型中哪一个是正确的,因为模型偏差显示了Lys8整个侧链的密度1禅结构。
然后使用坐标和结构因子计算三种类型的OMIT图1禅在每种情况下,在初始值之前,将小型OMIT盒内所有原子的占有率设置为零精炼并贯穿整个过程。OMIT盒被定义为一个区域,其边缘平行于细胞边缘,距离最近原子的残基5-9为41禅因此,在这些程序中计算的OMIT图并不是基于残留物5-9中任何原子的密度1禅.
计算出的第一张OMIT图(图3克和3小时)是一个简单的OMIT图,其中1禅以OMIT区域原子的零占有率和σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))计算map。该图仍然显示了模型偏差1禅Lys8侧链处(图3克,表1).
第二张OMIT图是模拟退火OMIT图(布伦格等。, 1998)使用计算菲尼克斯定义(黄嘌呤等。, 2005b条; 图3我和3j个). 在计算此地图时精炼从5000 K的假温度开始,冷却到300 K的最终温度。该图显示出模型偏差较小,但整个段的密度相对较弱,导致与两个模型的密度相关性较低(表1).
第三个OMIT图是一个迭代构建的OMIT图(图3k个和3我). 为了创建此映射,使用菲尼克斯重建局部算法。在这个重建过程中,多肽链是通过反复删除一个片段并追溯该片段的链来重建的。然后将得到的模型中最适合密度修正图的部分进行组合,并将侧链重新填充到密度中。这个迭代构建的OMIT图显示了来自1禅(图3k个)并与中的模型匹配1b57号井(图3我,表1).
我们还测试了σA类-加权(毫发o个−DF公司c(c))经验(我φc(c))根据1禅模型的信息量可能和我们计算的OMIT图一样大。我们下载了σA类-加权(2毫发o个−DF公司c(c))经验(我φc(c))和σA类-加权(毫发o个−DF公司c(c))经验(我φc(c))EDS服务器(Kleywegt)上的地图等。, 2004). 图3(米)显示了(2毫发o个−DF公司c(c))经验(我φc(c))映射,与预期的映射基本相同菲尼克斯定义如图3所示(一). 图3(n个)显示了差异(毫发o个−DF公司c(c))经验(我φc(c))地图;然而,在错位的赖氨酸侧链坐标处没有负(或正)差异密度。
考虑到所有这些地图,以及低分辨率之间的差异1禅和更高的分辨率1b57号模型,对这些结果最简单的解释是,分辨率越高第157页在我们研究的区域中,模型是两个模型中更准确的,并且迭代构建的OMIT图在减少模型偏差方面特别有用,而不会对整体地图质量造成太大成本。
致谢
作者感谢NIH蛋白质结构倡议对菲尼克斯项目(1P01 GM063210)。根据合同号DE-AC02-05CH11231,这项工作得到了美国能源部的部分支持。RJR由Wellcome Trust(英国)的首席研究员提供支持。作者感谢Gerard Kleywegt指出PDB条目之间的差异1禅和1b57号还有一位匿名评论员,他提出了异常广泛且富有洞察力的问题和评论。
工具书类
Adams,P.D.、Grosse-Kunstleve,R.W.、Hung,L.-W.、Ioerger,T.R.、McCoy,A.J.、Moriarty,N.W.,Read,R.J.、Sacchettini,J.C.、Sauter,N.K.和Terwilliger,T.C.(2002年)。《水晶学报》。D类58, 1948–1954. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Adams,P.D.、Pannu,N.S.、Read,R.J.和Brunger,A.T.(1999)。《水晶学报》。D类55, 181–190. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Afonine,P.V.、Grosse-Kunstleve,R.W.和Adams,P.D.(2005)一).《水晶学报》。D类61, 850–855. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Afonine,P.V.、Grosse Kunstleve,R.W.和Adams,P.D.(2005年b条).CCP4新闻稿。 42,贡献8谷歌学者
巴特,T·N(1988)。J.应用。克里斯特。 21, 279–281. 交叉参考 科学网 IUCr日志 谷歌学者
Brünger,A.T.,Adams,P.D.,Clore,G.M.,DeLano,W.L.,Gros,P.,Grosse-Kunstleve,R.W.,Jiang,J.-S.,Kuszewski,J.,Nilges,M.,Pannu,N.S.,Read,R.J.,Rice,L.M.,Simonson,T.&Warren,G.L.(1998)。《水晶学报》。D类54, 905–921. 科学网 交叉参考 IUCr日志 谷歌学者
Cooper,S.J.、Leonard,G.A.、McSweeney,S.M.、Thompson,A.W.、Naismith,J.H.、Qamar,S.、Plater,A.、Berry,A.和Hunter,W.N.(1996年)。结构,4, 1303–1315. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
DePristo,M.A.、de Bakker,P.I.W.、Johnson,R.J.K.和Blundell,T.L.(2005)。结构,13, 1311–1319. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Guncar,G.、Klemenicic,I.、Turk,B.、Tork,V.、Karaoglanovic-Carmona,A.、Juliano,L.和Turk的D.(2000)。结构,8, 305–313. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Hall,D.R.、Leonard,G.A.、Reed,C.D.、Watt,C.I.、Berry,A.和Hunter,W.N.(1999)。分子生物学杂志。 287, 383–394. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Hodel,A.、Kim,S.-H.和Brünger,A.T.(1992年)。《水晶学报》。A类48, 851–858. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
亨特,J.F.和德伊森霍夫,J.(2003)。《水晶学报》。D类59, 214–224. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
James,M.N.G.,Sielecki,A.R.,Brayer,G.D.,Delbaere,L.T.J.&Bauer,C.A.(1980)。分子生物学杂志。 144, 43–88. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Kim,S.、Woo,J.、Seo,E.J.、Yu,M.和Ryu,S.(2001年)。分子生物学杂志。 306, 109–119. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Kleywegt,G.J.(2000)。《水晶学报》。D类56, 249–265. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Kleywegt,G.J.、Harris,M.R.、Zou,J.、Taylor,T.C.、Wählby,A.和Jones,T.A.(2004)。《水晶学报》。D类60, 2240–2249. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Lukacs,C.M.、Rubin,H.和Christianson,D.W.(1998年)。生物化学,37, 3297–3304. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Lunin,V.Y.、Afonine,P.V.和Urzhumtsev,A.G.(2002年)。《水晶学报》。A类58, 270–282. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
McCoy,A.J.、Grosse-Kunstleve,R.W.、Storoni,L.C.和Read,R.J.(2005)。《水晶学报》。D类61, 458–464. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Ondráček,J.(2005)。《水晶学报》。A类61,C163谷歌学者
Pannu,N.S.、Murshudov,G.N.、Dodson,E.J.和Read,R.J.(1998)。《水晶学报》。D类54, 1285–1294. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Pannu,N.S.和Read,R.J.(1996年)。《水晶学报》。A类52, 659–668. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Perrakis,A.、Morris,R.和Lamzin,V.S.(1999)。自然结构。生物。 6, 458–463. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Ramachandran,G.N.和Srinivasan,R.(1961年)。自然(伦敦),190, 159–161. 交叉参考 中国科学院 科学网 谷歌学者
Read,R.J.(1986年)。《水晶学报》。A类42, 140–149. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Read,R.J.(1997)。方法酶制剂。 278,110–128交叉参考 科学网 谷歌学者
Reddy,V.、Swanson,S.M.、Segelke,B.、Kantardjieff,K.A.、Sacchettini,J.C.和Rupp,B.(2003)。《水晶学报》。D类59, 2200–2210. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Rossmann,M.G.(1972年)。分子置换法。纽约:Gordon&Breach。 谷歌学者
Skinner,M.M.、Zhang,H.、Leschnitzer,D.H.、Guan,Y.、Bellamy,H.、Sweet,R.M.、Gray,C.W.、Konings,R.N.H.、Wang,A.H.-J和Terwilliger,T.C.(1994)。程序。美国国家科学院。科学。美国,91, 2071–2075. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Terwilliger,T.C.(2000)。《水晶学报》。D类56,965–972页科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Terwilliger,T.C.(2001)。《水晶学报》。D类57, 1763–1775. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Terwilliger,T.C.(2002)。《水晶学报》。D类58, 2082–2086. 交叉参考 中国科学院 IUCr日志 谷歌学者
Terwilliger,T.C.(2003)。《水晶学报》。D类59, 1174–1182. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Terwilliger,T.C.(2004)。《水晶学报》。D类60, 2144–2149. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Terwilliger,T.C.和Berendzen,J.(1999)。《水晶学报》。D类55, 849–861. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Urzhumtsev,A.G.、Skovoroda,T.P.和Lunin,V.Y.(1996)。J.应用。克里斯特。 29, 741–744. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Zeng,Z.-H.,Castano,A.R.,Segelke,B.W.,Stura,E.A.,Peterson,P.A.&Wilson,I.A.(1997)。科学类,277, 339–345. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
©国际结晶学联合会。如果引用了原作者和来源,则无需事先许可即可复制本文的简短引文、表格和数字。有关详细信息,请单击在这里.
| 生物学的 结晶学 |
国际标准编号:1399-0047