Iterative-build OMIT maps: map improvement by iterative model building and refinement without model bias

Terwilliger, T.C.; Grosse-Kunstleve, R.W.; Afonine, P.V.; Moriarty, N.W.; Adams, P.D.; Read, R.J.; Zwart, P.H.; Hung, L.-W.

doi:10.1107/S0907444908004319

研究论文

生物学的
结晶学

国际标准编号：1399-0047

第64卷| 第5部分| 2008年5月| 第515-524页

doi:10.1107/S0907444908004319

迭代构建的OMIT图：通过迭代建模和精炼无模型偏差

托马斯·特威利格,^一 ^* 拉尔夫·格罗斯·昆斯特利夫,^b条帕维尔·V·阿芬妮,^b条奈杰尔·莫里亚蒂,^b条保罗·D·亚当斯,^b条兰迪·里德,^c（c）彼得·H·兹瓦特 ^b条和李伟雄 ^一

^一洛斯阿拉莫斯国家实验室，洛斯阿拉莫斯，NM 87545，美国，^b条美国加利福尼亚州伯克利市64R0121号楼回旋加速器路一号劳伦斯伯克利国家实验室，邮编：94720^c（c）英国剑桥大学血液学系，剑桥CB2 0XY
^*通信电子邮件：terwilliger@lanl.gov

(收到日期：2007年10月30日； 2008年2月12日接受)

执行迭代模型构建、密度修改和精炼OMIT区域的密度基本上不受原子模型的影响。来自一组重叠OMIT区域的密度可以组合在一起，以创建一个复合的“迭代构建”OMIT图，该图在任何地方都不受原子模型的影响，但也在任何地方都受益于世界其他地方存在的基于模型的信息单位单元格。该程序可以应用于原子模型中特定特征的验证以及整体模型验证。该过程通过分子置换结构和实验阶段结构进行了演示，并且通过从蛋白质数据库中删除结构的模型偏差来演示方法的变化。

关键词：模型建筑;模型验证;大分子模型;蛋白质数据库;精炼;OMIT地图;偏差;结构改进;菲尼克斯.

1.简介

模型偏差是大分子晶体学中一个持续存在的问题。它是使用原子模型计算结晶相的结果，在这种情况下，生成的电子密度图将倾向于具有模型中的特征，即使它们实际上并不存在于结构中（Ramachandran&Srinivasan，1961 ; 里德，1986年 ; Bhat，1988年 ; 霍德尔等。, 1992 ; 亚当斯等。, 1999 ; Kleywegt，2000年 ). 一旦一个原子模型被细化，模型偏差可以是间接的也可以是直接的，因为描述正确放置原子的位置和其他参数在精炼为了补偿不正确放置的原子。因此，即使在计算相位之前从模型中删除了错误放置的原子，也可以保留其位置的记忆，并且生成的贴图可以保留错误的特征。精炼忽略不正确放置的原子的模型应该会减少这种间接偏差，但仍然存在这样一个问题：精炼必须是，才能反转所有补偿调整。模型偏差会使电子密度图的解释变得困难，特别是在以下情况下分子置换（罗斯曼，1972 )用于求解结构。

定义模型偏差的方法有很多种。在这项工作中，模型偏差指的是这样的情况，即贴图具有类似原子密度的密度峰值，这些峰值仅出现在相位调整或密度修改中使用的工作模型中的原子，而不是出现在实际结构中的原子。

已经开发了许多方法来减少模型偏差的影响。这些分为两大类。第一类包括引入模型偏差后消除模型偏差的方法。第二类由一些方法组成，在这些方法中，永远不会在地图的特定位置引入模型，因此在该位置永远不会有任何模型偏差。

使用引入模型偏差然后消除模型偏差的方法的原因是，建立和细化模型的过程大大提高了相位信息的总体精度，而这通常是为了获得结构所必需的。一旦确定了初始结构，就必须知道哪些细节是正确的，消除模型偏差对这一点非常重要。减少模型偏差的一种成熟方法是使用σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)系数（Read，1986; 卢宁等。, 2002 )，通常使用系数米和D类使用反射测试集（Urzhumtsev）计算等。, 1996 ; Pannu&Read，1996年 ). 这个σ_A类过程产生了高质量的地图，但它们可以保留一些模型偏差，因为该过程基于模型中随机误差的假设，而模型后的实际误差精炼通常是相关的（Read，1997 ). 模拟退火OMIT图（Hodel等。, 1992; 布伦格尔等。, 1998 )，“踢”OMIT地图（Guncar等。, 2000 )和随机化模型重建（Zeng等。, 1997 ; 雷迪等。2003年 )可以通过至少在某种程度上去除模型中一些或所有原子的记忆来减少模型偏差。底漆和开关密度修改（Terwilliger，2004 )以不同的方式减少模型偏差的影响。该方法使用一个模型来计算相，得到一个有偏但几乎正确的映射，然后使用该映射的一个与模型相对无关的特性，例如溶剂区域的平坦度，来计算无偏相。尽管这些程序可以减少模型偏差的影响，但它们都有一个缺点，即不可能确切地知道模型偏差已被消除。此外，涉及溶剂掩模的技术可能会产生模型偏差，因为掩模会受到模型的影响。

第二类方法是那些从不引入模型偏差的方法，因此可以对与模型中原子位于同一位置的电子密度产生更高的置信度。这类中最简单的方法是OMIT映射，其中映射的特定区域中的原子从不包括在相位计算或精炼结构中的其他原子（Bhat，1988). 在分子置换中结构确定，在这个过程的早期，当分子被放置在正确的位置后，就可以很容易地计算出这种类型的OMIT图单位电池但在任何原子之前精炼已发生。在这种情况下，省略原子存在的记忆可能是最小的，并且在OMIT区域中得到的映射是无偏的。OMIT地图的缺点是它们通常噪音很大，因此很难解释。此外，一旦结构（含所有原子）得到细化，由于上述间接模型偏差，OMIT图的实用性就会降低。

另一种避免引入模型偏差的方法是执行迭代模型构建和精炼而是为了避免构建模型的特定部分。模型中故意未构建的部分可能是配体、侧链或模型的任何其他部分。这种方法通常用于电子密度图中定义不明确的部分，并在某些情况下专门用于获得无偏信息（James等。, 1980 ). 在模型其余部分的改进足以为这些区域的模型产生清晰的电子密度之前，通常不会解释这些定义不明确的区域。这种方法最近被扩展为一种系统过程（“乒乓细化”），允许将结构的每条侧链构建成无偏密度，同时逐步建立完整的原子模型（Hunt&Deisenhofer，2003）).

在这里，我们结合了OMIT地图和乒乓球的思想精炼在“迭代构建OMIT”过程中，用于获得部分或完整的复合电子密度图，该复合电子密度图基本上没有模型偏差，但受益于迭代模型构建和细化的能力。

2.方法

2.1. 计算单个OMIT区域的迭代构建OMIT映射

获得的单个区域的迭代构建OMIT图非对称单元原则上，对晶体的描述是非常简单的。首先，OMIT区域被定义为表示非对称单元。然后向该区域添加边界（通常为2º厚）。最后，迭代建模，精炼并以标准方式执行密度修改程序（Terwilliger，2003 )，但位于OMIT或边界区域内的任何原子在所有计算中都被赋予零占有率。我们将这整个过程称为“迭代构建的OMIT过程”。在此过程中，OMIT区域中的所有原子都包含在几何约束计算中，并包含在所有重建步骤中。这样就保留了模型的几何图形。然而，由于其零占据值，OMIT区域中的原子不参与结构因子计算。这可以防止直接的模型偏差。该程序还防止了OMIT区域内计算的密度中的间接模型偏差，因为OMIT区域外原子的参数从未调整过，以补偿OMIT或边界区域内原子的电子密度。

为了确保模型偏差不会通过NCS的应用间接引入RESOLVE（解决）密度修改步骤没有基于NCS的目标电子密度转移到OMIT或边界区域。这是通过定义OMIT区域的边界并指定不向该区域传输NCS信息来实现的。由于NCS的密度修改是逐点进行的，使用来自N个−1份副本作为剩余副本密度修改的目标（Terwilliger，2002年 )，可以直接省略OMIT区域中所有点的NCS信息。一旦从迭代构建的OMIT过程中获得最终的电子密度图，OMIT区域（但不是边界区域或图的其他部分）基本上不会因原子模型的结构因子贡献而产生偏差。随着描述NCS关系的参数的细化，原则上有可能在NCS区域之间传输模型信息。如刚体情况精炼然而，对于MR模型而言，不太可能通过本步骤中精炼的极少数参数来传输有关地图中特定位置密度的重要信息。在标准中菲尼克斯在NCS存在的情况下，模型构建过程中，所有副本的所有构建都是独立进行的，在特定步骤中，每个NCS副本的结构都会进行转换，以相互匹配，并保留每个NCS拷贝中结构的最佳部分。在构建OMIT图时，不会执行此步骤，因此NCS副本之间不会传输有关OMIT区域内结构的信息。NCS约束在使用OMIT程序建立模型期间应用。其结果是，由于来自OMIT区域外副本的NCS限制，OMIT区域中的（零电荷）原子可能被放置在错误的位置。

模型偏差的其他潜在来源是体积-固体修正和几何约束。在这里执行的程序中，整体溶剂模型和几何约束始终适用，因为不应用它们会导致OMIT边界外区域的原子模型较差，因此会导致OMIT图具有更大的伪影和更少的实用性。

我们注意到，在某些情况下，OMIT区域内的密度可能会受到OMIT区域中模型中原子位置的影响。例如，OMIT区域内的原子可以与OMIT区域外的原子键合，以便位置相关。类似地，原子在OMIT区域内的位置可能会影响溶剂分子在OMIT区域外的位置或OMIT区域外侧链的允许构象。此外，在自动建模过程中，可以根据OMIT区域内外的密度放置大型单元（螺旋或股）。然而，在所有这些情况下，OMIT区域内外原子之间的这种耦合不太可能导致OMIT区域内原子位置处的密度。因此，在生成的地图中不太可能存在任何模型偏差（由于模型中存在这些原子，所以模型中原子坐标处的密度）。

在我们的过程中，OMIT区域被构造为平铺以填充非对称单元。通常，大约10–20个OMIT区域用于覆盖非对称单元，但可以选择更多（在我们的测试中多达132个），以便对密度修改程序的影响最小。以这种方式选择OMIT区域的结果是，可能会有一些OMIT区域不包含来自大分子的原子，而其他区域包含许多原子。与原子较少的区域相比，含有许多原子的OMIT区域的电子密度通常较差，因为OMIT区域中原子的密度被排除在密度修改程序之外。通过定义包含更多相等原子数的可变大小的OMIT区域，可以改进程序。

在OMIT区域周围添加边界区域的原因是，根据包含特定原子的模型计算出的电子密度图中的密度峰值在半径内有很大的贡献，这可能取决于数据的分辨率和原子位移因子。根据以前使用合成OMIT图的经验，我们使用2º作为边界区域的厚度中枢神经系统（布伦格等。, 1998).

从不在OMIT区域中包含原子的方法直接适用于在不参考现有模型的情况下构建模型的情况。在以下情况下分子置换如果使用，理想情况下，从程序一开始就应忽略OMIT区域中的原子，以便分子和任何刚性体的位置精炼执行时不受这些原子的原子位置的影响。然而，在实践中，这可能是不必要的，因为在分子放置过程中优化的参数数量太少，以至于几乎无法保留有关OMIT区域中特定原子位置的信息。

我们注意到，这里描述的OMIT程序有一种负模型偏差。在OMIT区域中建立了一个模型，但占用率设置为零。这些原子的位置没有放置溶剂原子，也没有放置体积-固体模型。因此，OMIT区域内模型中原子位置附近的密度较低（零）。通过将这些位置的密度设置为中间值而不是零，似乎可以改进程序。

虽然这个过程在概念上很简单，但由于所有程序都在迭代建模、密度修改和精炼需要跟踪哪些原子在OMIT和边界区域中。这些步骤已在菲尼克斯（亚当斯等。, 2002 )自动生成向导通过使用RESOLVE（解决）OMIT盒生成程序，用于指定OMIT区域及其边界，并确定模型中哪些原子位于这些区域内。此外，所有密度修改程序RESOLVE（解决）根据OMIT区域和边界的规范调用，这样就不会通过NCS的应用将基于模型的信息传输到这些区域。迭代模型构建、密度修改和精炼在PHENIX自动生成向导.

2.2. 复合迭代生成的OMIT映射的计算

复合迭代构建OMIT映射可以通过将非对称单元将晶体分为一组OMIT区域，计算上述每个区域及其边界的迭代构建的OMIT映射，然后简单地合并所有迭代构建的OMIT映射的OMIT区域。这种组合OMIT映射的方法与在中创建复合OMIT映射时使用的方法类似中枢神经系统（布伦格等。, 1998). 由此产生的迭代构建复合OMIT映射具有这样的特性，即映射中每个点的密度从未受到该点附近（或任何NCS相关点附近）存在的模型原子的影响。应该注意的是，由于这种地图的构建方式，它可能在OMIT区域之间的边界处存在不连续性，尽管我们在检查过的地图中没有发现任何不连续性。

在1.3b或更高版本的PHENIX自动生成向导（可从以下位置获得https://www.phenix-online.org; 亚当斯等。, 2002).

3.结果和讨论

3.1. 具有分子替换的抗胰蛋白酶迭代合成OMIT图

我们通过应用迭代构建的复合OMIT图来重复抗胰蛋白酶（Kim等。, 2001 ; PDB代码1小时7)由分子置换使用抗糜蛋白酶的结构（PDB代码1个4; 卢卡奇等。, 1998 )作为搜索模型。我们使用了PHENIX AutoMR向导哪一个呼叫相位器（麦考伊等。, 2005 )以获得初始分子置换溶液。这个PHENIX自动生成向导然后用于编辑搜索模型的序列以匹配抗胰蛋白酶的序列，截断C处的侧链^α或C^β如果剩余的原子位置未知，则返回原子。这个自动生成向导然后用于定义128个OMIT区域，覆盖非对称单元水晶的形状。

为了检验OMIT图的特性，然后使用起始分子重新放置模型以两种方式计算电子密度图。首先，将一个OMIT区域中所有原子的占有率设置为零，并使用菲尼克斯 精炼包装菲尼克斯定义（黄嘌呤等。, 2005b条 )无需手动重建或使用RESOLVE（解决）.标准精炼使用的程序包括三个宏循环精炼在体积-固体模型中自动估计参数并放置溶剂分子（Afonine等。, 2005一 )、单个原子坐标位移和各向同性原子位移参数。这个精炼产生了一个R（右）和R（右）_自由的分别为0.41和0.48，以及aσ_A类-加权（2毫发_o个 − DF公司_c（c）)经验(我φ_c（c）)计算了OMIT图（Read，1986). 这个σ_A类-加权OMIT图（图1一)有一些特征对应于省略区域中的螺旋，但很难解释。

图1
分子置换解决方案的迭代构建OMIT和复合迭代构建OMID映射1小时7（金等。, 2001

). 地图轮廓为1σ. (一)OMIT图计算方法σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)系数（Read，1986

)之后精炼删除了一个OMIT区域中的所有原子。图中显示了结构中未省略的原子。(b条)所示区域的迭代构建OMIT图(一)经过十次迭代建模、密度修正和精细化。所示为在OMIT区域之外构建的模型。(c（c）)通过组合获得的所有OMIT区域构建的复合迭代OMIT图，如(b条). 模型与中所示的相同(b条). (d日)合成迭代构建的OMIT映射，如中所示(c（c）)结构精致1小时7叠加。(e（电子）)复合迭代构建OMIT图，如所示(c（c）)和(d日)叠加MR启动模型。(（f）)删除中省略的所有原子后，从MR启动模型开始构建标准迭代构建的密度修改图和模型(一).

计算的第二种地图是迭代构建的OMIT地图（图1b条)其中，同一OMIT区域中所有原子的占有率如图1所示(一)在十个迭代建模、密度修改和精细化。尽管从未使用该区域中任何原子的模型来计算密度，但该图在省略区域中具有非常清晰的螺旋密度特征。图1(c（c）)和1(d日)显示OMIT区域，如图1所示(一)和1(b条)可以结合在一起，形成一个复合迭代构建的OMIT图，该图对大部分结构具有明确的电子密度。图1(e（电子）)显示了叠加在最终合成迭代构建的OMIT映射上的起始模型。如图1所示(e（电子）)起始模型中的螺旋线与螺旋线密度的最终位置偏移约2°。图1(（f）)表明，对于该OMIT区域，也可以通过完全删除OMIT区域中的所有原子，然后执行标准迭代构建过程（无OMIT区域）来获得类似于OMIT图的图。

图1中迭代构建的OMIT图中密度的原因(b条)比图1中的标准OMIT图改进了很多(一)是指经过迭代建模过程后，省略区域外的模型更加准确，并且该模型用作密度修改的信息源。对于所执行的128个OMIT程序R（右）和R（右）_自由的（仅包括忽略区域外的模型部分）分别为0.29和0.34（与起始值相比R（右）和R（右）_自由的分别为0.41和0.48）。范围R（右）因子为0.25～0.38，自由基范围R（右）系数从0.30到0.44（最低R（右）因子与低自由度配对R（右）因素）。两组的范围R（右）因素相当大且较高R（右）因子通常对应于包含更多原子的OMIT区域。

3.2. SAD相基因5蛋白的迭代合成OMIT图

我们还测试了在实验阶段可用的情况下使用迭代构建的复合OMIT图。似乎可以创建一个密度修正图，该图没有可能产生模型偏差，但得益于迭代模型构建、密度修正和精细化。实验阶段使用解决方案SAD阶段化（Terwilliger&Berendzen，1999 )具有单波长反常色散（SAD）。基因5蛋白的结构已由MAD（PDB代码）预先确定1个vqb; 斯金纳等。, 1994 )；在这个测试中，只使用了与峰值波长相对应的数据，只是为了得到较差的初始相位集。

这个自动解决向导用于重新解析基因5蛋白质的结构，生成初始密度修改的SAD相电子密度图相关系数0.71到根据精制基因5结构计算的模型电子密度图（图2一). 这个自动解决向导使用初始密度修改图进行模型构建，不执行迭代模型构建和精细化。它构建了87个蛋白质残基中的64个，并（正确地）将9个残基对接到序列中。这个R（右）和R（右）_自由的该模型的平均值分别为0.46和0.47。这个自动生成向导然后用于计算迭代构建的复合OMIT图（图2b条). 期间精细化，实验阶段被用作约束（潘努等。, 1998 ). 平均值R（右）和R（右）_自由的构建132个OMIT区域的最终模型的值分别为0.26和0.34。复合迭代构建的映射有一个改进相关系数0.82的电子密度图。相对于初始密度修改的SAD相位图而言，这种改进来自于在该OMIT区域的相位计算中包含来自每个OMIT区域外部的模型信息。实际上，图2中的地图(一)以及图2中的地图(b条)可以认为是密度修改的贴图。它们的不同之处在于图2中使用的密度修正(b条)包括模型信息，而图2中的信息(一)不会；两者基本上都没有模型偏差。

图2
RESOLVE（解决）SAD实验阶段解决方案的密度修改和复合迭代构建OMIT图1个vqb（斯金纳等。, 1994

). 地图的等高线为1.5σ. (一)RESOLVE（解决）密度修正的SAD相位图（Terwilliger，2000

). (b条)所示区域的迭代构建OMIT图(一). 显示的模型是1个vqb.

我们注意到，对于自动构建为实验电子密度图的模型，迭代构建的OMIT图通常是不必要的。自动建造中通常使用的程序具有较高的密度截止值，不正确放置的原子通常在随后的循环中被移除，因此原子重复放置在非常不正确的位置是不常见的，这是引入模型偏差所必需的。该结构的地图也可以通过在没有OMIT区域的情况下执行迭代构建程序来计算；此图略优于OMIT图，具有相关系数模型图为0.85。

3.3. 使用迭代构建的OMIT映射消除现有模型偏差

虽然这里描述的迭代构建OMIT过程的主要目的是完全避免模型偏差，但在OMIT区域外重建模型的过程似乎也可能有助于消除现有的模型偏差。特别是，我们预计大规模重建将有效地消除对模型其余部分中原子的调整，以补偿原子位置不正确的情况。为了测试这个想法，我们在PDB中确定了一个条目，其中包含一些可能不正确但仍保留在σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)地图（Read，1986年)计算时间：精炼结构的。PDB条目1禅（库珀等。, 1996 )就是这样一种结构（G.Kleywegt，个人沟通）。它的分辨率为2.5º，结构紧密相关1b57号（大厅等。, 1999 )之后以2º的分辨率测定，残基6–16的序列寄存器中有一个残基不同。

图3(一)和3(b条)显示σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)重新定义后计算的地图1禅（不省略任何原子）菲尼克斯定义使用沉积的结构因子和再生反射测试集精炼（原始测试集不可用）。决赛R（右）和R（右）_自由的之后精炼分别为0.25和0.29。图3(一)显示了来自1禅，以残基Phe6和Lys8为中心，可能被该结构中的一个残基错位。图3(b条)显示了链的残基3–10的图A类来自PDB条目1b57号在从1b57号在结构上1禅最小二乘法。这个σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)map具有与用于生成此map的阶段的结构相同的功能(1禅)以及从更高分辨率模型导出的结构(1b57号)，包括地图中显示为模型偏差示例的几个特征。特别是，该图显示了来自1禅结构，尽管可能性更大1b57号这个结构只有一个羰基O原子指向这个位置。总的来说，在残留物5-10的附近1禅，的σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)map与从高分辨率结构计算的模型map更相似1b57号而不是根据1禅这由局部地图相关系数以数字形式表示，表1中对其进行了总结用于此地图和下面讨论的地图。

表1
映射残差3–10附近的相关系数1禅

	地图相关性†具有
地图（全部基于1禅结构，除非另有说明）	1禅模型	1b57号模型
首字母σ_A类地图，无OMIT	0.68	0.75
σ_A类“抖动”过程后的映射，无OMIT	0.67	0.74
σ_A类“摇晃”、去除水、精炼和挑水后绘制地图，无OMIT	0.64	0.75
简单精炼OMIT	0.63	0.71
模拟退火OMIT	0.60	0.71
迭代构建的OMIT	0.65	0.75
1b57号 F类_计算地图	0.66	0.98

†地图相关性计算方法为RESOLVE（解决）（特威利格，2000年

)，包括对应模型中每个原子2°范围内的网格点。残留物3–10来自1禅之所以选择它们，是因为它们主要位于OMIT区域内，并且来自1b57号已选择与1禅碎片。

图3
σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)和OMIT映射1禅（库珀等。, 1996

)与结构相比1禅和链条A类从1b57号（大厅等。, 1999

)叠加在结构上1禅。地图的等高线为1σ. (一, b条)σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)地图（Read，1986年

)计算时间：精炼的1禅具有的结构菲尼克斯定义（黄嘌呤等。, 2005b条

)，与结构相比1禅(一)和带链条A类从1b57号(b条). (c（c）, d日)如中所示(一)和(b条)除了1禅通过1Ω的r.m.s.距离（“摇晃”程序）随机移动结构，然后用菲尼克斯定义. (e（电子）, （f）)如中所示(c（c）)和(d日)，除了在摇动程序和10次循环后去除溶剂水分子精炼包括模拟退火。(克, 小时)如中所示(一)和(b条)，除了所示的图是一个简单的OMIT图，通过省略OMIT框中的所有原子来计算，OMIT框的边缘平行于细胞边缘，剩余物5–9中的任何原子为4º1禅（将其占用率设置为零），优化结果结构并计算σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)地图。(我, j个)按中计算的地图(克)和(小时)但该映射是模拟退火OMIT映射，其中精炼介入(c（c）)和(d日)被模拟退火取代精炼（布伦格等。, 1998

). (k个, 我)迭代构建的OMIT图计算如下(克)和(小时)除了1禅使用PHENIX自动生成向导，在该过程中，始终将OMIT框中所有原子的占用率设置为零。(米, n个)从EDS密度服务器下载的地图（Kleywegt等。, 2004

). (米)σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)的地图和模型1禅. (n个)σ_A类-加权(毫发_o个−DF公司_c（c）)经验(我φ_c（c）)的映射1禅等高线为±2σ坐标为1禅（绿色）和1b57号（蓝色）叠加。

模型偏差可能出现在σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)图3所示地图(一)和3(b条)部分原因可能是我们无法访问中使用的原始测试集精细化。为了检验这种可能性，我们进行了第二次精炼其中，结构中的原子通过“震动”程序以1.0°的r.m.s.距离移位（布伦格等。, 1998; 炮车等。, 2000)，产生启动R（右）和R（右）_自由的分别为0.48和0.47，然后为精炼具有菲尼克斯定义，导致决赛R（右）和R（右）_自由的分别为0.25和0.30。产生的结果σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)地图如图3所示(c（c）)和3(d日). 它的模型偏差似乎略小于标准后计算的地图精细化，但总的来说，这些地图非常相似。

接下来，我们进行了更广泛的重新定义程序，以减少模型偏差。以上述“摇晃”程序中的部分随机模型为起点，去除所有溶剂分子（水），并进行十个循环精炼进行了两个模拟退火循环的挑水试验。再次启动R（右）和R（右）_自由的分别为0.48和0.47，最终R（右）和R（右）_自由的分别为0.25和0.30。生成的映射比初始映射具有更小的模型偏差σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)地图（图3e（电子）和3（f）)并降低了与1禅模型（表1)，但仍然很难确定这两个模型中哪一个是正确的，因为模型偏差显示了Lys8整个侧链的密度1禅结构。

然后使用坐标和结构因子计算三种类型的OMIT图1禅在每种情况下，在初始值之前，将小型OMIT盒内所有原子的占有率设置为零精炼并贯穿整个过程。OMIT盒被定义为一个区域，其边缘平行于细胞边缘，距离最近原子的残基5-9为41禅因此，在这些程序中计算的OMIT图并不是基于残留物5-9中任何原子的密度1禅.

计算出的第一张OMIT图（图3克和3小时)是一个简单的OMIT图，其中1禅以OMIT区域原子的零占有率和σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)计算map。该图仍然显示了模型偏差1禅Lys8侧链处（图3克，表1).

第二张OMIT图是模拟退火OMIT图（布伦格等。, 1998)使用计算菲尼克斯定义（黄嘌呤等。, 2005b条; 图3我和3j个). 在计算此地图时精炼从5000 K的假温度开始，冷却到300 K的最终温度。该图显示出模型偏差较小，但整个段的密度相对较弱，导致与两个模型的密度相关性较低（表1).

第三个OMIT图是一个迭代构建的OMIT图（图3k个和3我). 为了创建此映射，使用菲尼克斯重建局部算法。在这个重建过程中，多肽链是通过反复删除一个片段并追溯该片段的链来重建的。然后将得到的模型中最适合密度修正图的部分进行组合，并将侧链重新填充到密度中。这个迭代构建的OMIT图显示了来自1禅（图3k个)并与中的模型匹配1b57号井（图3我，表1).

我们还测试了σ_A类-加权(毫发_o个−DF公司_c（c）)经验(我φ_c（c）)根据1禅模型的信息量可能和我们计算的OMIT图一样大。我们下载了σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)和σ_A类-加权(毫发_o个−DF公司_c（c）)经验(我φ_c（c）)EDS服务器（Kleywegt）上的地图等。, 2004 ). 图3(米)显示了（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)映射，与预期的映射基本相同菲尼克斯定义如图3所示(一). 图3(n个)显示了差异(毫发_o个−DF公司_c（c）)经验(我φ_c（c）)地图；然而，在错位的赖氨酸侧链坐标处没有负（或正）差异密度。

考虑到所有这些地图，以及低分辨率之间的差异1禅和更高的分辨率1b57号模型，对这些结果最简单的解释是，分辨率越高第157页在我们研究的区域中，模型是两个模型中更准确的，并且迭代构建的OMIT图在减少模型偏差方面特别有用，而不会对整体地图质量造成太大成本。

4.结论

迭代构建的OMIT过程可以被视为一种密度修改，涉及在OMIT区域之外使用模型。在统计密度修正程序中，模型密度可以用作电子密度的期望值。然后对阶段进行调整，以更好地将地图与预期密度相匹配（Terwilliger，2003). 在迭代构建的OMIT过程中，只要存在模型，就会构建模型，但只有OMIT区域外的模型密度用于密度修改。这样，模型密度可以提高晶体学相的质量，但不会直接偏置OMIT区域的密度。

迭代构建的OMIT过程在分子置换在以下情况下精炼分子置换模型的产率相对较差R（右）因素，但其中迭代模型构建、密度修改和精炼生成了一个大大改进的模型，降低了R（右）因素。在这种情况下σ_A类-加权（2毫发_o个−DF公司_c（c）)经验(我φ_c（c）)初始后计算的OMIT图精炼可能相对来说没有什么信息，因为模型还不够好，无法生成导致清晰地图的阶段(例如图1一). 另一方面，经过迭代建模、密度修正和精细化，在OMIT区域外建立的模型可以足够精确，以产生能够清楚显示OMIT区域内密度的相位(例如图1b条). 例如，在图1所示的情况下开始R（右）之后的系数精炼模型的系数为0.41，但迭代构建过程的结果要低得多R（右）因子（平均值为0.29），并为省略的区域绘制了一张非常清晰的地图。

迭代构建的复合OMIT图的生成需要大量计算，尤其是在迭代建模过程中只有足够的阶段信息来改进初始模型的情况下。在这种情况下，OMIT区域的大小必须非常小或没有阶段改进结果。因此，在某些情况下，必须构造许多OMIT区域，并且必须多次执行整个迭代建模过程（图2所示的情况中，合并了132个OMIT区域b条). 该过程易于并行化，因此，随着高度并行的机器和大型集群变得越来越可用，即使对于非常大的结构，该过程也可能变得实用。目前，当在单个处理器上运行非常大的结构时，该过程可能非常耗时，因为每个OMIT区域可能需要几个CPU日。迭代构建的OMIT程序的一个更快的用法是为电子密度图中的一个小区域构建一个无偏图，例如配体或侧链附近的密度。在这种情况下，通常可以计算单个OMIT映射，将迭代构建过程中包含感兴趣区域的框中所有原子的占用率设置为零。迭代构建的OMIT程序的这种局部应用在检查可能被完整结构中的模型偏差部分掩盖的错误方面也有很大的用处，如图3所示.

合成迭代构建的OMIT图的另一个潜在用途是作为相对无偏相位信息的来源。这些复合地图中每个OMIT区域的密度不会受到该OMIT区域内模型的影响。因此，使用这些图作为密度修改的目标获得的相位信息似乎是可能的（Terwilliger，2001 )可能是高质量的。与直接从模型中获得的偏差相比，它也可能降低了模型偏差。然而，它不一定是完全无偏的，因为傅里叶逆变换将结合来自不同OMIT区域的相位信息，因此，将每个OMIT区域内的模型信息与该区域内的地图分离将不再完整。初步实验表明，与标准密度修改图相比，这些图可以得到改进。

我们最后指出，迭代模型构建、密度修改和精炼（佩拉基斯等。, 1999 ; 特威利格，2003年; 德普里斯托等。, 2005 ; 昂德拉切克，2005年 )有可能将模型偏差的影响和显著误差的发生率降低到非常低的水平，特别是对于实验阶段的结构，因为在自动化建筑的每个周期中都可以很容易地对模型与电子密度图的拟合进行全面检查。如果模型中安装不良的零件被迅速拆除，而不是在精炼在此期间，模型的其余部分将进行调整以补偿构建中的误差，随后的电子密度图将不太可能有实质性的模型偏差。

致谢

作者感谢NIH蛋白质结构倡议对菲尼克斯项目（1P01 GM063210）。根据合同号DE-AC02-05CH11231，这项工作得到了美国能源部的部分支持。RJR由Wellcome Trust（英国）的首席研究员提供支持。作者感谢Gerard Kleywegt指出PDB条目之间的差异1禅和1b57号还有一位匿名评论员，他提出了异常广泛且富有洞察力的问题和评论。

工具书类

Adams，P.D.、Grosse-Kunstleve，R.W.、Hung，L.-W.、Ioerger，T.R.、McCoy，A.J.、Moriarty，N.W.，Read，R.J.、Sacchettini，J.C.、Sauter，N.K.和Terwilliger，T.C.（2002年）。《水晶学报》。D类58, 1948–1954. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Adams，P.D.、Pannu，N.S.、Read，R.J.和Brunger，A.T.（1999）。《水晶学报》。D类55, 181–190. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Afonine，P.V.、Grosse-Kunstleve，R.W.和Adams，P.D.（2005）一).《水晶学报》。D类61, 850–855. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Afonine，P.V.、Grosse Kunstleve，R.W.和Adams，P.D.（2005年b条).CCP4新闻稿。 42，贡献8谷歌学者
 巴特，T·N（1988）。J.应用。克里斯特。 21, 279–281. 交叉参考科学网 IUCr日志谷歌学者
 Brünger，A.T.，Adams，P.D.，Clore，G.M.，DeLano，W.L.，Gros，P.，Grosse-Kunstleve，R.W.，Jiang，J.-S.，Kuszewski，J.，Nilges，M.，Pannu，N.S.，Read，R.J.，Rice，L.M.，Simonson，T.&Warren，G.L.（1998）。《水晶学报》。D类54, 905–921. 科学网交叉参考 IUCr日志谷歌学者
 Cooper，S.J.、Leonard，G.A.、McSweeney，S.M.、Thompson，A.W.、Naismith，J.H.、Qamar，S.、Plater，A.、Berry，A.和Hunter，W.N.（1996年）。结构,4, 1303–1315. 交叉参考中国科学院公共医学科学网谷歌学者
 DePristo，M.A.、de Bakker，P.I.W.、Johnson，R.J.K.和Blundell，T.L.（2005）。结构,13, 1311–1319. 科学网交叉参考公共医学中国科学院谷歌学者
 Guncar，G.、Klemenicic，I.、Turk，B.、Tork，V.、Karaoglanovic-Carmona，A.、Juliano，L.和Turk的D.（2000）。结构,8, 305–313. 科学网交叉参考公共医学中国科学院谷歌学者
 Hall，D.R.、Leonard，G.A.、Reed，C.D.、Watt，C.I.、Berry，A.和Hunter，W.N.（1999）。分子生物学杂志。 287, 383–394. 科学网交叉参考公共医学中国科学院谷歌学者
 Hodel，A.、Kim，S.-H.和Brünger，A.T.（1992年）。《水晶学报》。A类48, 851–858. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 亨特，J.F.和德伊森霍夫，J.（2003）。《水晶学报》。D类59, 214–224. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 James，M.N.G.，Sielecki，A.R.，Brayer，G.D.，Delbaere，L.T.J.&Bauer，C.A.（1980）。分子生物学杂志。 144, 43–88. 交叉参考中国科学院公共医学科学网谷歌学者
 Kim，S.、Woo，J.、Seo，E.J.、Yu，M.和Ryu，S.（2001年）。分子生物学杂志。 306, 109–119. 科学网交叉参考公共医学中国科学院谷歌学者
 Kleywegt，G.J.（2000）。《水晶学报》。D类56, 249–265. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Kleywegt，G.J.、Harris，M.R.、Zou，J.、Taylor，T.C.、Wählby，A.和Jones，T.A.（2004）。《水晶学报》。D类60, 2240–2249. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Lukacs，C.M.、Rubin，H.和Christianson，D.W.（1998年）。生物化学,37, 3297–3304. 科学网交叉参考中国科学院公共医学谷歌学者
 Lunin，V.Y.、Afonine，P.V.和Urzhumtsev，A.G.（2002年）。《水晶学报》。A类58, 270–282. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 McCoy，A.J.、Grosse-Kunstleve，R.W.、Storoni，L.C.和Read，R.J.（2005）。《水晶学报》。D类61, 458–464. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Ondráček，J.（2005）。《水晶学报》。A类61，C163谷歌学者
 Pannu，N.S.、Murshudov，G.N.、Dodson，E.J.和Read，R.J.（1998）。《水晶学报》。D类54, 1285–1294. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Pannu，N.S.和Read，R.J.（1996年）。《水晶学报》。A类52, 659–668. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Perrakis，A.、Morris，R.和Lamzin，V.S.（1999）。自然结构。生物。 6, 458–463. 科学网交叉参考公共医学中国科学院谷歌学者
 Ramachandran，G.N.和Srinivasan，R.（1961年）。自然（伦敦）,190, 159–161. 交叉参考中国科学院科学网谷歌学者
 Read，R.J.（1986年）。《水晶学报》。A类42, 140–149. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Read，R.J.（1997）。方法酶制剂。 278，110–128交叉参考科学网谷歌学者
 Reddy，V.、Swanson，S.M.、Segelke，B.、Kantardjieff，K.A.、Sacchettini，J.C.和Rupp，B.（2003）。《水晶学报》。D类59, 2200–2210. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Rossmann，M.G.（1972年）。分子置换法。纽约：Gordon&Breach。谷歌学者
 Skinner，M.M.、Zhang，H.、Leschnitzer，D.H.、Guan，Y.、Bellamy，H.、Sweet，R.M.、Gray，C.W.、Konings，R.N.H.、Wang，A.H.-J和Terwilliger，T.C.（1994）。程序。美国国家科学院。科学。美国,91, 2071–2075. 交叉参考中国科学院公共医学科学网谷歌学者
 Terwilliger，T.C.（2000）。《水晶学报》。D类56，965–972页科学网交叉参考中国科学院 IUCr日志谷歌学者
 Terwilliger，T.C.（2001）。《水晶学报》。D类57, 1763–1775. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Terwilliger，T.C.（2002）。《水晶学报》。D类58, 2082–2086. 交叉参考中国科学院 IUCr日志谷歌学者
 Terwilliger，T.C.（2003）。《水晶学报》。D类59, 1174–1182. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Terwilliger，T.C.（2004）。《水晶学报》。D类60, 2144–2149. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Terwilliger，T.C.和Berendzen，J.（1999）。《水晶学报》。D类55, 849–861. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Urzhumtsev，A.G.、Skovoroda，T.P.和Lunin，V.Y.（1996）。J.应用。克里斯特。 29, 741–744. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Zeng，Z.-H.，Castano，A.R.，Segelke，B.W.，Stura，E.A.，Peterson，P.A.&Wilson，I.A.（1997）。科学类,277, 339–345. 交叉参考中国科学院公共医学科学网谷歌学者