FEM: feature-enhanced map

Afonine, P.V.; Moriarty, N.W.; Mustyakimov, M.; Sobolev, O.V.; Terwilliger, T.C.; Turk, D.; Urzhumtsev, A.; Adams, P.D.

doi:10.1107/S1399004714028132

研究论文

生物
结晶学

国际标准编号：1399-0047

第71卷| 第3部分| 2015年3月| 第646-666页

doi:10.1107/S1399004714028132

打开

访问

FEM：特征增强地图

^一美国加利福尼亚州伯克利市，邮编94720，MS64R0121，回旋加速器路一号，劳伦斯伯克利国家实验室，物理生物科学部，^b条美国田纳西州37831橡树岭2008号邮政信箱橡树岭国家实验室生物和软物质部，^c（c）洛斯阿拉莫斯国家实验室，邮政信箱M888，洛斯阿拉莫斯，NM 87545，美国，^d日斯洛文尼亚卢布尔雅那SI-1000 Jamova 39，Jozef Stefan Institute，生物化学、分子和结构生物学，^{e（电子）}斯洛文尼亚卢布尔雅那SI-1000 Jamova 39，Jozef Stefan Institute，蛋白质化学和生物学综合方法卓越中心，^（f）综合生物学中心，IGBMC，CNRS–INSERM–UdS，1 Rue Laurent Fries，BP 10142，67404 Illkirch，France，^克法国洛林大学物理与技术学院，54506 Vandouvre-lès-Nancy，以及^小时美国加州伯克利大学生物工程系，伯克利，CA 94720
^*通信电子邮件：pafonine@lbl.gov

(2014年6月10日收到； 2014年12月25日接受；在线2015年2月26日)

提出了一种修改2的方法米F类_{光突发事件}−D类F类_模型 σ_一个-加权映射，这样得到的映射可以增强弱信号（如果存在），并可以减少模型偏差和噪声。该方法包括首先随机化起始映射，并使用多种方法填充缺失的反射。然后，将地图限制在具有令人信服的密度和锐化应用的区域。然后，通过组合一系列具有直方图质量的中间映射来创建最终映射。在所示的测试用例中，发现以这种方式生成的图与开始的2相比，具有更高的可解释性和更低的模型偏差米F类_{光突发事件}−D类F类_模型 σ_一个-加权地图。

关键词：傅里叶映射;地图锐化;地图峰度;模型偏差;地图改进;密度修正;菲尼克斯;cctbx公司;有限元法;特征增强地图;省略.

1.简介

电子（或核）密度图通常是获得原子表示的一个重要步骤晶体结构，或者地图本身可以作为晶体内容的模型。无论哪种情况，贴图的质量都会影响其效用。在这项工作中，我们认为理想的映射是准确表示平均值中实际电子（或核）密度的映射单位电池水晶的形状。至少有三个不同的因素影响晶体学图谱的质量及其解释。

（i）数据中的错误和不完整有限分辨率和测量反射的不完整性以及实验数据和晶体模型参数中的误差是导致地图质量差的主要原因。这些错误可能会模糊或损坏信号，使有意义的解释变得困难甚至不可能。
（ii）信号弱。地图解释的另一个困难来源是，并非地图中显示的所有信号都具有相同的强度。例如，来自重原子衍生物的强信号（图中的高电子密度峰值）可能很容易掩盖来自部分占据的流动配体、残基侧链的替代构象甚至H原子的极弱信号（低电子密度）。通常，这种微弱信号可能接近或低于地图中的感知噪声水平。
（iii）模型偏差结晶图通常使用模型相或模型相与一些实验获得的相信息的组合来计算。原子或非原子（例如散装溶剂）模型中的错误可能会导致地图中的噪声特征与原子特征非常相似，进而可能会被错误地解释为原子特征。

实际上，这三种类型的贴图缺陷可能同时存在。在典型的大分子分辨率约为1–4时，它们使晶体图谱的解释变得模糊、重要或不唯一 Å.

已经开发了大量方法来改进晶体学图谱。这些方法大致可分为四类。

（i）关注各种权重方案选择的人（Luzzati，1953年 ; 伍尔夫森，1956年 ; Sim，1959年 ; Raman，1959年 ; Ramachandran和Raman，1959年 ; 斯里尼瓦桑，1961年 ; Ramachandran&Srinivasan，1961年 , 1970 ; 缅因州，1979年 ; 维贾扬，1980年 ; 乌尔珠姆塞夫等。1996年 ; Vellieux和Dijkstra，1997年 ; 里德，1997年 )，使用最广泛的方法是σ_一个-加权综合（Read，1986 ).
（ii）从扰动模型或结构因子的集合中获得地图（Agarwal和Isaacs，1977年 ; Lunin和Urzhumtsev，1984年 ; 卢宁等。, 1985 ; 贝克等。, 1993 ; 佩拉基斯等。, 1997 ; 大米等。, 1998 ; 雷迪等。, 2003 ; 普拉日·尼卡等。, 2009 ; 冗长的等。, 2014 ).
（iii）各种OMIT地图（Bhat&Cohen，1984）; Bhat，1988年 ; 霍德尔等。, 1992 ; 甘查尔等。, 2000 ; Vellieux&Dijkstra，1997年; 特威利格等。, 2008 ; 普拉日·尼卡等。, 2009; 考坦，2012年 ).
（iv）密度改性技术（审查见Podjarny等。1996年 ; 张等。, 2006 ; 考坦，2010年 ).

所有这些方法都旨在解决与地图质量相关的一个或几个具体问题，但不是全部或同时解决。其中一些计算速度很快(例如 σ_一个或井涌图），同时计算其他(例如OMIT、SA OMIT或迭代构建的OMIT映射）计算量更大，包括更复杂的计算，例如精炼和/或需要特定问题参数化的模型构建。有些可能依赖于需要用户提供或估计的信息，例如F类₀₀₀用于RAPID/END或最大熵图的反射或用于密度修改的溶剂含量。OMIT图试图解决一个问题（模型偏差），同时可能会在图中引入其他扰动。事实上，OMIT图的计算涉及到删除模型的部分，因此人们可能会认为结果图的质量可能比原始图的质量差（尽管模型偏差可能会降低）。密度修改方法通常针对结构测定并且擅长于体映射改进和消除粗略错误，而这些方法可能对微弱的局部信号（例如部分占据的移动配体产生的密度）苛刻。

这份手稿描述了一个提高2米F类_{光突发事件}−D类F类_模型 σ_一个-加权地图（Read，1986). 结果是得到了一个新的地图，它具有降低的噪声和模型偏差水平，并且还显示了弱特征的增强，通常会将它们带到与强特征相同的尺度上。我们称此地图为特征增强地图（FEM）。新地图预计包含更少的噪音，并且具有更容易解释的可用信号，既可用于人类解释，也可用于建模软件。在这项工作中，我们重点关注2米F类_{光突发事件}−D类F类_模型地图，该程序可以扩展到其他类型的地图。当前程序的唯一输入是测量数据(我_{光突发事件}或F类_{光突发事件})，测量不确定性[σ(我_{光突发事件})或σ(F类_{光突发事件})]以及当前的原子模型。可选地，可以以亨德里克森-拉特曼系数的形式使用额外的相位信息。该程序不涉及复杂机械，如模型制作或精细化。具体而言，作为有限元计算程序的一部分实施的新的、新的或重新设计的方法包括以下内容。

（i）用于计算复合剩余OMIT图的协议。
（ii）使用图峭度作为晶体图锐度的度量，并作为以下方面的优化目标B类-因子锐化。
（iii）将直方图均衡化方法应用于晶体学图谱，以改进图谱解释。
（iv）非锐化掩模技术在晶体学图中的应用。
（v）高效的地图随机化、多幅地图的计算机内存高效存储和地图组合。
（vi）填补缺失反射的程序。
（vii）一种基于连通性分析和多重切割地图等高线的低体积密度消除方法。

2.方法

从概念上讲，有限元方法包括三个关键阶段。首先，定义并计算起始映射。在第二步中，以各种不同的方式随机化起始图；这些包括随机化最初计算的映射本身和改变映射的计算方式。此过程生成一个略有不同的贴图集合，然后将这些贴图组合成一个单独的贴图，目的是减少噪声和模型偏移。正如预期的那样，组合贴图往往会模糊密度峰值，因此某种形式的贴图锐化是有帮助的。最后一步涉及地图修改，以均衡整个单位-细胞体积中的信号强度，因此弱特征的大小与强特征的大小大致相同。这一步不是选择性的，可能会增强信号和噪声；因此，必须在前两个步骤中尽可能地消除噪声。

这个概念的实现如图1所示，各个步骤将在下面的部分中进行解释。该协议是经验性的，是使用广泛程序进行实验的结果。

图1
FEM协议。各个步骤在手稿的相应章节中进行了解释。

2.1. 地图的计算

采用以下复数傅里叶系数（以振幅和相位给出）计算FEM程序下的映射，

$[{{\bf F}}_{\rm-map}=\cases{\displaystyle{{w}\over{｛k｝_{\rm总计}}}（2米{F}（F）_{\rm obs}-D{F}（F）_{\rm模型}），\varphi{\rm-model}&偏心反射\cr\显示样式{{w}\以上{｛k｝_{\rm总计}}米{F}（F）_{\rm-obs}，\varphi{\rm-model}&中心反射\cr{F}（F）_{\rm填充}，\varphi_{\rm-fill}否（&N）${F}（F）_{\rm obs}$在$（d_{\rm-min}，\infty）$.}中\等式（1）]$

总模型结构因素，F类_模型=k个_全部的(F类_计算+k个_面具F类_面具)，按照格罗塞·昆斯特里夫的阿芬尼所述进行计算等。(2013 ). 之前F类_模型计算，最大可能公共各向同性B类因素，B类_最大值，从所有原子中减去(B类_最大值定义为在减法后所有原子仍具有非负定B类因素；参见§§2.6.1和3了解更多详细信息）。完成整体缩放后，B类_最大值成为整体各向异性比例因子的一部分k个_全部的（见阿芬妮，格罗斯·昆斯特里夫等。，2013年定义）。划分贴图系数F类_地图通过k个_全部的锐化贴图并移除各向异性。单位重量w个默认情况下使用。对于偏心反射和中心反射（方程式1中的前两行),σ_一个-加权（Read，1986年)对应于测量值的各向异性去除和锐化傅里叶映射系数F类_{光突发事件}已计算。(F类_填满，φ_填满)术语对应于未测量（缺失）反射，而φ_模型是模型阶段（F类_模型)或模型相位与实验相位信息相结合。重量米和D类按照Read（1986）中的描述进行计算)和Urzhumtsev等。(1996).

残差综合的计算方法与（1）类似),

$[{{\bf F}}_{\rm diff}={{1}\以上{｛k｝_{\rm总数}}（m{F}（F）_{\rm obs}-D{F}（F）_{\rm模型}），{\varphi}{\rm-model}。\等式（2）]$

2.2. 建模缺少的反射

让d日_最小值是一组的最高分辨率限制F类_{光突发事件}已经证明，如果对应于未测量反射的术语F类_{光突发事件}在分辨率范围内(d日_最小值，∞），则地图质量降低（Lunin，1988 ; 乌尔珠姆塞夫等。, 1989 ; Lunin和Skovoroda，1991年 ; 特隆鲁，1996年 ; Cowtan，1996年 ; 卢尼娜等。, 2002 ; Urzhumtseva和Urzhum tsev，2011年 ). 为了减轻这种负面影响F类_{光突发事件}用值替换（通常称为“填充”）(F类_填满，φ_填满)（穆尔舒多夫等。, 1997 ; 卢尼娜等。, 2002; 阿尔托马尔等。, 2008 ; 谢尔德里克，2008年 ). 忽略缺失的反射本质上等同于假设它们的值都为零(F类_填满= 0). 我们实现了两种方法来近似对应于缺失项的项F类_{光突发事件}.

第一种方法使用密度修改功能RESOLVE（解决）（特威利格，2003年 ). 密度修改的一个特点是，它可以用于估计缺失反射的振幅和相位。在统计密度修改方法中RESOLVE（解决），这些振幅和相位是基于诸如溶剂的平坦度之类的特征来最大化映射的可能性（合理性）的振幅和相位，非晶体对称性和密度分布（Terwilliger，2003). 使用密度修改来估计缺失振幅包括执行几个密度修改周期，最后使用基于地图的振幅来估计分辨率范围内的缺失反射(d日_最小值, ∞).

估计缺失振幅的第二种方法使用可用的原子模型。第二种方法的一个关键要素是进行原子模型截断，以消除不可靠放置的原子，使其不会通过F类_填满首先，傅里叶映射（1)计算公式为F类_填满全部归零，并根据地图中密度的r.m.s.偏差进行归一化。然后根据这张图和原子中心的平均密度对每个原子进行评分(ρ_大道)注意到。贴图相关性低于0.7或原子中心密度值小于min{½的原子ρ_大道，1}被删除。因为我们考虑的是接近最终结构的情况，所以只有一小部分原子可能被过滤掉。然后使用该截断模型计算F类_模型在分辨率范围内(d日_最小值, ∞). 散装固体对F类_模型按Afonine中所述进行计算等。(2005 )掩码是从截断的原子模型中计算出来的。这允许优化k个_溶胶和B类_溶胶值，以及整体各向异性比例因子。这个F类_模型计算全分辨率范围的值，并计算属于以下部分的缺失反射F类_模型然后分配给F类_填满。我们注意到，使用k个_溶胶和B类_溶胶0.35的 e（电子） Å⁻³和46 Å²分别为（Fokine和Urzhumtsev，2002 )是次优的，偶尔会导致在体积-固体区域出现明显的伪影。

我们发现，以这种方式估计丢失反射的值通常会减少地图噪声。例如，图2显示用（1）计算的地图)使用F类_填满=0以及缺少术语的映射(F类_填满)使用统计密度修正或基于工作模型得出。PDB（伯恩斯坦等。, 1977 ; 伯曼等。, 2000 )条目1氨气在本例中使用了。

图2
PDB条目中缺失数据的影响及其恢复1个2：使用（1）计算的地图(一)F类_填满= 0 (1.0σ), (b条)F类_填满派生自RESOLVE（解决）密度修正图（1.1σ)和(c（c）)F类_填满根据§

2.2 (1.0σ). (d日)分辨率-PDB条目衍射数据的最小完整性1氨气注意，低分辨率下的完整性很差，整体完整性较好，在范围（1.9，∞）内为95%。如格罗塞·库斯特里夫的阿芬尼所述，使用对数刻度箱等。(2013

)，这有效地突出了低分辨率完整性较差的问题。参见§

2.9关于地图控制级别的选择。

2.3. 利用地图随机化和组合去除噪声和模型偏差

地图随机化后结合产生的扰动地图的基本原理是基于这样的假设，即地图伪影和噪声受随机化的影响比地图中的信号更大（Kirillova，2008 ). 通过这种方式，与信号相比，通过对结果映射进行平均或其他统计处理，可以减少伪影和噪声。这种方法也是井涌图（Gunčar）的基础等。, 2000; 土耳其，2013 ).

在这里，我们采取了不同的路线来实现类似的目标。经验上，我们发现在（1）中使用加权方案)例如

$[w=\left（1+\alpha{{|I{\rm-obs}-I{\rm-model}|}\over{|I_{\rm-obs}+I{\orm-model{|}}+\beta{{\sigma{I{\rma-obs}}}\over{{我}_{\rm obs}}\right）^{-1}，\eqno（3）]$

具有比信号更能扰动映射噪声的期望特性。在这里，α和β是为每个反射单独定义的常数，我_{光突发事件}和我_模型分别为观测到的和计算得到的结构因子强度，以及 $[\sigma_{I_{rm obs}}]$ 是测量值的实验不确定度我_{光突发事件}。总和跨越所有反射。如果α和β为每个反射随机选取，然后为每个新的傅里叶映射系数集（1）将有一组独特的权重w个因此将生成唯一的傅里叶映射。我们发现α和β值介于0和5之间，允许生成噪声差异足够大但信号只受到轻微扰动的映射，如图3所示(一), 3(b条)和3(c（c）).

图3
用（1）计算的傅里叶映射：(一)w个= 1 (0.5σ), (b条，c（c）)w个使用（3）计算

(0.45σ), (d日)与…相同(c（c）)但省略了5%的条款。请注意，在所有四种情况下，信号（原子周围的密度）是相似的，而噪声（离原子更远的密度）则被重组。参见§

2.9关于轮廓阈值的选择。

在（3）中使用权重的想法)受到了SHELX公司（谢尔德里克，2008年),

$[w=\left（1+{{\sigma_{I{\rm-obs}}^2}\ over{I{模型}^2{}}+\delta^2{I{\ rm-obs{^2}over{模型{^2{{右）^{-1}，\eqno（4）]$

其中参数δ是一个小数值。通过定义δ每次反射类似于（3）也可以扰动地图。然而，我们注意到δ(0 <δ<1）与使用单位权重相比，不要明显改变地图w个，使用时δ>如图4所示，1导致严重的模型偏倚地图.

图4
正确的残基Lys107（链L（左）)PDB条目的1f8吨（左侧的转子流量计）显示为使用（1）和w个= 1. 相同的残余物侧链切换到不正确的旋转异构体（右）显示为使用（1）计算的黑色图谱，权重从（3）开始

具有δ= 1.5. 两个贴图的等高线均为1σ很明显，黑色地图是基于模型的，因为它遵循错误的侧链方向，否则与正确的（蓝色）地图重合。

在我们的方法中，傅立叶映射系数的集合是通过重复(N个时间）使用方程（1）计算单独的映射系数集)和（3)带有F类_填满按照§2.2.

由于傅里叶映射的集合（1）生成，这提供了一个随机生成F类_填满每次计算新地图时。这是通过随机移除额外10%的原子并随机绘制来实现的k个_溶胶和B类_溶胶分布值（0，0.01，…，0.4）和（20，25，…，80），目的是F类_填满计算（§2.2).

然后通过以下方式获得组合傅里叶图（图1中的步骤3a). 首先，N个傅里叶映射系数的计算集被拆分为n个每个组包含N个/n个映射系数集。然后对每组中的贴图系数进行平均，从每个平均系数集中随机移除5%的贴图系数（反射），并使用剩余反射计算傅里叶贴图。对于每组映射系数重复此操作，结果是n个傅里叶映射（每个映射随机移除5%的反射），然后在实际空间中平均以生成单个映射。图3说明了随机权重的使用（3）在使用（1）计算地图时.

如上所述的映射平均过程减少甚至完全消除了大量的噪声峰值，但并非全部。可能会保留一些持续的噪声，以及一些非常低的贴图值（例如，峰值小于ρ_切= 0.5σ)也将始终出现在平均地图中。由于FEM过程的后续步骤包括映射值的非选择性均衡，其中噪声和信号可以被增强，因此在很大程度上消除这些不希望的映射值是至关重要的。这可以通过以下两个步骤实现。一步可以在选定的截断处截断低贴图值。另一种是识别电子密度图的连接区域（称为斑点），这些区域的体积小于某个阈值水平上可靠放置的原子的典型体积t吨₁这可以被认为是噪声并且被考虑用于消除。此外，我们不仅要消除在阈值处显示的那些斑点t吨₁，但我们还想删除它们的“根”：这些相同的斑点出现在较低的阈值上t吨₂=t吨₁−δ。将阈值降低到t吨₂可能会导致最初确定要消除的某些blob与未考虑消除的blob合并。这样的blob会被保留。示意图如图5所示.图5(一)显示阈值级别编号为0、1、2、3的blobt吨₁，其中根据斑点1、2和3的体积选择斑点1、2和3进行消除。图5(b条)与图5相同(一)但在一个门槛处轮廓分明t吨₂。在这里，我们将删除blob 2和3，但blob 1将被保留，因为它与未选择要删除的blob 0合并。Lunina描述了用于识别斑点的map-connectivity分析算法等。(2003 ).

图5
消除噪声峰值的示意图。(一)在阈值级别绘制等高线贴图t吨₁：选择blob 1、2和3进行消除，而保留blob 0。(b条)在阈值级别绘制等高线贴图t吨₂=t吨₁−δ。我们注意到blob 1与blob 0合并，因此被保留，而较大的blob 2和3被删除。

2.4. 综合残差OMIT图

FEM程序中的一个重要元素是将最终地图限制在有令人信服的密度证据的区域。这是通过使用复合OMIT图实现的。与计算复合OMIT图的经典方法不同（Bhat&Cohen，1984; Bhat，1988年)，我们实施了一个与Cowtan（2012）描述的类似的程序). 与现有方法的主要区别在于，我们没有在每个省略框中省略实际原子，而是将F类_模型每个盒子中的合成（忽略原子和散装固体的贡献）并计算修正值 $[{\波浪线{\bf F}}_{\rm模型}]$ 它的结构因子反过来用于通过计算剩余合成来恢复盒子中的密度（2）。所有地图都是在非对称单元（格罗斯·昆斯特里夫等。, 2011 ).

我们将OMIT映射用作过滤器：OMIT映射中值低于某个阈值的所有网格节点都设置为零，其余节点设置为一。FEM程序的中间图乘以二值化OMIT图（图1). 用于将OMIT映射二值化的阈值是该过程的参数，默认值为1σ.

用于计算OMIT图的程序包括三个主要阶段（图6). 程序的输入是观察到的结构因子(F类_{光突发事件})以及原子模型。首先，从原子模型计算采样模型密度图和块状固体掩模。在此阶段，定义了一个空（用零初始化）映射。计算结束时，该图将成为合成OMIT图。接下来，模型密度和体积-固体掩模是傅立叶变换的，产生结构因子F类_计算和F类_面具和计算所需的刻度F类_模型，k个_全部的和k个_面具然后按照格罗塞·昆斯特里夫（Grosse-Kunstleve）的阿芬妮（Afonine）所述获得等。(2013). 最后一个阶段由覆盖整个不对称单元。对于每个长方体，一个较大的长方体（宽长方体）是通过将原始长方体在每个方向上扩展一个网格节点来定义的（Bhat，1988年的“中性”体积); 然后，将模型图中宽框内的相应体积和散装固体掩码设置为零。使用修改后的模型图和散装固体掩模计算相应的结构因子F类_{计算_忽略}和F类_{掩码限制（_O）}反过来，这些结构因素和先前计算的比例k个_全部的和k个_面具用于计算F类_{模型_限制}，系数米和D类和剩余的傅里叶映射系数F类_差异（2），然后傅立叶变换为剩余合成。最后，从该合成中提取出与宽框相对应的较小框，并将其放入初始清空的OMIT图结果中。在完成所有框的迭代后，将获得最终的复合剩余OMIT图。

图6
综合剩余OMIT图计算工作流。参见§

2.4了解详情。

为了检验该程序的有效性，我们进行了以下数值实验。首先，我们创建了一个生成基于模型的地图的示例，如图7所示然后，我们应用了上述OMIT程序。程序的输入是结构因素的振幅F类_B类以及包含这两个残基的模型1。当地地图相关系数残留物2为0.99，使用（F_B类，φ_一个)合成，OMIT图小于0.01。这表明OMIT图中没有明显的残基2信息。

图7
测试OMIT地图计算程序的性能。模型1由放置在P（P）1个框，用于计算(F类_一个，φ_一个)合成(一). 模型2由一个残基1组成（否则与模型1相同），用于计算(F类_B类，φ_B类)合成(b条). 振幅F类_B类和相位φ_一个用于计算合成(c（c）). 所有合成物的轮廓均为3σ.残留物2周围的正映射(c（c）)纯粹是模型偏差。

2.5. 地图组合

此步骤的目标是将一系列N个以初始条件的变化形式获得的映射。特别是，对应于同一结构和同一晶体的映射是在同一网格上计算的，傅里叶系数不同，但没有本质上的不同。通常情况下N个顺序为8-16。对每个栅格节点单独执行组合。需要解决两个问题：（i）如何存储所有N个以节省内存的方式同时映射，以及（ii）使用什么统计程序从中提取“信号”N个映射给定网格节点中的值（具有N个映射意味着每个网格节点都有N个值）。

通常，映射值存储为一组四字节或八字节的实值（cctbx公司; 格罗斯·昆斯特里夫和亚当斯，2002年 ; 格罗斯·昆斯特里夫等。, 2002 )，这意味着内存中同时存在一个或两个以上的映射可能是禁止的。为了解决这个问题，我们提出了一种将实值映射转换为单字节整数值映射的方法（Fortran中的integer*1或C++中的uint8_t或unsigned char）。反过来，这也为八个整值映射提供了可能，它们占用的内存与一个八字节的实值映射一样多。假设两个实值映射是可以同时保存在内存中的最大值，那么我们得到了将要使用的最大整值映射数为16。

首先，我们以分位数等级缩放这些映射（与下面应用直方图均衡化时使用的步骤相同；参见§2.7）。生成的贴图从0到1不等。如果原始贴图被截断为平坦（设置为零），低于某个阈值(σ₀)，那么新地图将平放在一些q个₀<1值。然后，我们将这些映射转换为（0255）范围内的整数，如下所示：

$[{\rm整数}\，\，j=\cases{0&if$q\le{q}_{0}$\cr\min\left[\显示样式{256（q-{q}_{0}）}\在{1上-{q}_{0}}，255\right]&如果$q\，\，\gt\，{q}_{0}$.} \等式（5）]$

注意，用256而不是255相乘计算速度更快。

现在，对于每个网格节点，我们都有N个整数值j个₁，j个₂…，j个_N个范围（0255），其中N个如上所述，为16。有许多选项可以分析数组N个值。由于离群值可能会影响平均值，我们决定使用最频繁的值（模式），这是给定节点中最持久的值。考虑到分布在范围（0，255）上的数据点16的集合很小，16个数字很可能都不会完全一致，因此无法计算模式。为了克服这个问题，我们一次使用一个网格节点，将其16个整数值转换为一个长度为256的实值数组，

$[f（j）={\textstyle\sum\limits_{n=1}^n}\exp\left[{{（j-j_n）^2}\over{2b^2}}\right]，j=0，1，\ldots，255。\等式（6）]$

这里，16个值中的每个值j个_n个被高斯模糊。通过反复试验，我们发现b条2到5之间是这种模糊的最佳值。然后我们搜索参数j个_最大值函数全局最大值的（f）(j个); 注意（f）(j个)是一个整数实值函数。最后，我们构造了一个二次插值（f）(j个_最大值− 1),（f）(j个_最大值),（f）(j个_最大值+1）并进行真正的论证x个_最大值该插值的最大值作为最终值，在输出组合图中分配给该网格节点。显然，生成的映射可以按分位数秩或均方根偏差再次缩放。

分别考虑两种特殊情况。第一个是当所有值j个₁，j个₂…，j个_N个非常不同，功能也不同（f）(j个)有N个等高的峰（等于一或稍高）。我们认为合成在这个节点中没有任何信息，我们给它赋值最小，即零。这意味着由这些点组成的地图区域在任何截止水平上都不会显示出结构特征。

其次，函数可能有几个（至少两个）高度大致相等的强峰值，即价值观j个₁，j个₂…，j个_N个形成几个小组（集群）。默认情况下，我们取参数最小的峰值，换言之，我们在可能丢失或减少信号的风险下生成噪声最小的合成；我们称这种合成为最小合成。或者，可以生成“最大综合”，取而代之的是具有最大参数的峰值。此合成包含最大信号，但可能会突出显示某些噪声。

2.6. 通过地图锐化增强信号

将多个图谱组合成一个图谱可能会导致结构中原子对应的峰被涂抹。此外，由于热无序或静态无序，以及由于低完整性或低分辨率，密度可能较弱。例如，如果数据分辨率相对较低或/并且相应的原子具有较大的原子位移参数，则相邻的两个大分子链对应的密度可能会合并为连续密度。在FEM程序中，我们使用两种地图锐化方法来提高地图的可解释性：指数(B类-因子）锐化和反锐化掩蔽。

2.6.1. 全球地图锐化：B类-因子（指数）锐化

B类-图的因子锐化包括将（1）中的傅里叶图系数相乘通过分辨率exp的指数函数（−B类_锋利的|秒|²/4），其中秒是一个倒数空间向量B类_锋利的是磨刀B类值。该技术已被证明有助于提高低分辨率地图的可解释性（参见Brunger等。, 2009 以及其中的参考）。获得最佳B类_锋利的值不是直接的，因为没有可用的数学标准将地图改进量化为选择的函数B类_锋利的值。通常，最佳B类_锋利的是通过一种试错法发现的，该方法包括系统地对一系列似是而非的数据进行采样B类_锋利的值。最佳值在信号改善和增加的噪声之间提供了合理的折衷，这通常是通过眼睛来判断的。存在其他实证方法（DeLaBarre&Brunger，2006 ). 这里，我们使用峰度（Abramowitz&Stegun，1972）)以量化地图特征的清晰度（“峰值”），从而确定最佳值B类_锋利的，

$[\kappa=N\textstyle\sum（\varrho-\langle\varrho\rangle）^4/\left[\textstyle\sum$

其中总和跨越所有地图网格点，N个是网格点的数量 $[\langle\varrho\rangle]$ 是平均密度。的值B类_锋利的在定义的范围内进行测试，并选择最大化地图峰度的值。其他人也指出峰度可用于描述晶体图的特征（例如，参见Lamzin&Wilson，1993 ; 派等。, 2006 ).

下面，我们提供了确定地图峰度作为选择指标的基础B类_锋利的。我们检查了数据和模型属性，例如分辨率和B类因子，与地图峰度有关，以及为什么它可能是一个很好的选择方法B类_锋利的为此，我们使用了两个原子Mg和O的测试示例，放置在一个10×5×5的 Au框输入空间组 P（P）大约3时为1 彼此之间的距离。每个原子都有单位占有率。图8(一)显示1.5的分布 Å分辨率沿着Mg-O矢量的傅立叶合成值，对应于所有原子具有B类等于10、30和50的因数 Å²分别为。正如预期的那样B类因子越是模糊的峰值。采样较大B类-因子范围，我们绘制了作为函数的地图峰度B类（图8b条). 我们观察到B类因子会使峰值更加模糊，并减小地图峰度。在下一次测试中，我们改变了合成的分辨率B类系数固定为10 Å².图8(c（c）)显示了沿对应于1、2和3的Mg-O矢量的傅里叶综合值分别为？分辨率。我们还绘制了作为分辨率函数的地图峰度（图8d日). 我们观察到，降低分辨率会弄脏峰值，也会降低图的峰度。

图8
地图峰度与模型的关系B类因子和数据分辨率。(一)分辨率为1.5的傅里叶图值沿着Mg-O键为三个选定的B类-因子值：10、30和50 Å²(b条)图中峰度显示为B类因素。(c（c）)分辨率1、2和3的傅里叶映射值沿着Mg-O键。(d日)地图峰度显示为分辨率的函数。

从上述两个数值实验中，我们推测，地图峰度不仅可以很好地测量地图的锐度，还可以测量地图中峰值的高度。图9使用四种场景说明峰度：一个尖峰（图9一)相同的尖峰和一些噪声（图9b条)，涂抹峰（图9c（c）)尖峰和较强的噪声（图9d日). 显然，峰的加宽降低了峰度，也增加了噪声。此示例还说明了B类-因子锐化及其与峰度的关系。事实上，B类-因子锐化增强了信号和噪声。

图9
四种不同函数的峰度图示。

为了进一步探索这一点，我们使用了与上面相同的两个原子构造进行了另一个测试。首先，我们设置B类两个原子的因子为25 Å²并计算出1.5 光学分辨率合成。然后我们对锐化进行采样B类因素，B类_锋利的，在（−100，100 Å²)范围，B类_锋利的如本节开头所述，缩放每次试验的map系数，并计算相应合成的峰度。图10(一)显示应用四个选定项的结果B类_锋利的值和图10(b条)显示了地图峰度的依赖性B类_锋利的我们注意到B类导致最大峰值增强但噪声增加最小的值是抵消有效值的值B类两个原子的零因子：锐化B类值为25 Å²该值也对应于图10所示的地图峰度峰值(b条).

图10
左图，分辨率为1.5的傅里叶图值分布沿着Mg-O键的Au对应于不同的锐化B类因素(B类_锋利的). 右，将峰度映射为的函数B类_锋利的.

由此，我们得出结论，地图峰度可能是一个很好的地图锐化度量，可以用于获得最佳的B类_锋利的值。经验性地，我们注意到，如果在之前降低贴图噪声，则最有效B类-通过密度修改或如上所述的图组合来锐化因子。§3提供了更多使用实验数据的示例。

2.6.2。局部贴图锐化：取消锐化遮罩

非锐化遮蔽（例如，参见McHugh，2005 )是一种数字图像处理技术，我们在FEM程序中使用它来锐化地图。计算包括两个步骤。首先，局部平均映射(M（M）_大道)通过替换原始地图中的每个栅格点值来计算(M（M）_原始)计算所有27个相邻网格点的平均值。然后将锐化的贴图计算为最大值(M（M）_原始−M（M）_大道, 0). 这种类型的锐化具有放大贴图中的高频分量的效果，有助于提高图像的清晰度，尽管锐化的图像也可能具有不需要的边缘效果。我们注意到应用反锐化遮罩（UM）会增加贴图峰度。

为了说明指数掩蔽和非锐化掩蔽这两种映射增强选项的效果，我们考虑了一个与前一节中使用的类似的测试示例：C和N原子放置在P（P）1个盒子，距离约1.45 分开。每个原子都有单位占有率和固定的B类系数为15 Å².图11显示了五条曲线：蓝色是使用高斯近似公式计算的精确电子密度分布[例如，参见Afonine&Urzhumtsev（2004）中的公式12 )按照Grosse-Kunstleve所述实施等。(2004 )]红色是在1.5下计算的傅立叶图像奥分辨率。指数蒙版（绿色）和非锐化蒙版（紫色）在一起应用时，会以类似的方式锐化贴图（黑色）。

图11
使用非锐化掩蔽和指数的地图锐化效果(B类-因子）锐化方法。参见§

2.6.2了解详情。为了便于比较，所有贴图都进行了缩放，使其最大值等于1。

2.7. 均衡信号：直方图均衡（分位数秩缩放）

这一步的目标是使地图中的强信号和弱信号在强度上相似。事实上，在解释地图时，强信号的强度往往不那么重要，只要它的强度足以与噪声进行可靠区分，并根据原子模型进行解释。因此，假设在前一步中噪声已被有效抑制，则可以合理地期望跨单位-细胞体积均衡映射值将产生更容易解释的映射。

直方图均衡（HE）方法（例如，参见Hummel，1975 , 1977 )用于在整个单元-单元体积上转换贴图值，以生成贴图值的均匀分布。该方法对图像值进行非线性（但单调）变换以增强对比度，是数字图像处理领域的常规工具。图12说明了HE在照片上的二维应用效果。当应用于傅里叶映射时，该方法在三维中的工作原理类似。将HE应用于晶体学图后，强峰和弱峰变得更加相等（图13). 显然，噪音也得到了均衡（对比图14一和14b条)因此，在应用HE之前，必须将其最大限度地去除。图15提供了HE对1 使用放置在P（P）1盒。这三个原子是专门选择的，以产生高度不同的图峰。

图12
直方图均衡说明。一张曝光不足的夜间照片（上图）及其直方图合格版本（下图）（照片由第一作者拍摄）。尽管高等教育的前景不切实际(即它给人的印象是白天）它确实比原始图像显示了更多的细节。

图13
直方图均衡化的图示。链中Lys83残基的弱侧链密度一个PDB条目的1ssw（1ssw）（1）中的合成

在1时绘制轮廓σ(一)和0.4σ(b条). (c（c）)HE图等值于1级σ.蓝色，仅密度在1.5以内显示了原子周围的φ半径；灰色，与蓝色地图相同，但显示在5内原子周围的半径。蓝色地图显示在灰色地图的顶部。

图14
PDB条目的直方图均衡化说明2磅第一行，（1）的原始地图在1.3处绘制等高线σ（左）和HE图（右）位于同一等高线水平。第二行，直方图和累积直方图的合成值：左，原始图；右，HE地图。

图15
沿Mg-O-H线的傅里叶图分布（蓝色）及其直方图均衡版本（红色）。左，原始地图；右，地图被截断ρ_截断=0，如果ρ< 0.05. 请注意，由于应用HE（左，红线），噪声峰值增强。

直方图均衡化过程包括两个步骤。首先，计算地图的累积直方图。然后，将地图的每个像素替换为从累积直方图中获取的相应值。这相当于按Urzhumtsev描述的分位数等级重新缩放地图等。(2014 ). 结果图的累积直方图是一条直线，它是（0，1）框的对角线（图14d日). 请注意，HE图可以按r.m.s.偏差进行缩放：因为这是一个线性变换，所以它不会修改HE图的特征。

2.8. 在FEM计算过程中可能有用的其他工具

作为FEM方法开发的一部分，我们还探索了信号均衡或增强以及降噪的其他替代方案。它们不是FEM程序当前实施的一部分，为了完整起见，如下所示。

我们开发并尝试了一种程序，用于组合两张地图，以增强两张地图中的特征。该程序与Patterson图分析中常用的最小函数有关（Buerger，1970 ; 特威利格等。, 1987 ). 本程序分析了两张地图，假设它们的比例尺相同。对于以下范围内的每个阈值秒₁到秒₂对于特定的步骤，如果两个映射中的值同时高于或低于秒₁+台阶水平；否则，它们被设置为零。最终贴图是两个修改贴图的平均值。阈值的实际值秒₁和秒₂取决于地图的缩放方式。例如，如果两个映射都是直方图（参见§2.7）然后秒₁和秒₂分别等于0和1，例如，步长可以为0.1。我们在这种方法中遇到的问题是，如果两个值都不相交，而周围的所有栅格节点都不同于零，那么最终会在设置为零的贴图中创建“洞”。它还可能导致在贴图中创建锐利的边，如果这样的贴图经过傅里叶变换，可能会导致强烈的傅里叶涟漪。最后，合并一次考虑两个地图的地图不如同时分析所有可用地图的功能强大。

我们尝试了其他B类-因子或非锐化掩蔽）锐化技术，如Kuwahara滤波器（一种中值滤波器；Kuwaharo等。, 1976 )如之前报道的（迪亚科努等。, 2005 )用于解释低分辨率电子显微镜图。然而，这种方法在我们的测试中并不成功。

对于地图均衡，另一种方法是将整个非对称单元在方框中，计算每个方框中地图的均方根偏差，然后用它单独缩放每个方框中的地图值。这种方法需要分别处理大分子和溶剂区域，这并不总是方便或直接的，还需要了解溶剂掩模。

一种可能增强地图中微弱信号并抑制噪声的方法是应用多项式密度修正（Hoppe&Gassmann，1968 ; 柯林斯，1975年 ; Raghavan&Tulinsky，1979年 ). 我们的经验是，这在许多情况下都很有效，但也有一些警告。首先，必须截断并重新缩放密度图，使其值介于0和1之间，这显然需要应用一些截止值，其中的选择可能并不总是显而易见的（尤其是在软件中自动）。其次，变换函数在0.5处有一个拐点，这意味着0.5以下的值被抑制，0.5以上的值被增强。显然，这意味着一种任意假设，即所有低于0.5的峰值都是噪声，否则就是信号。

因此，我们更喜欢直方图均衡化方法，因为它可以有效地均衡对比度，而不需要特别的要定义的参数。

2.9. 关于地图比较的注释

在下面的示例中，我们显示了通过一种或另一种操作获得的贴图。当显示多个地图时，通常需要以等效的轮廓级别显示它们。通常，这是通过在r.m.s.偏差中选择轮廓阈值来实现的(σ)并将其用于所有需要比较的地图。正如Urzhumtsev指出的那样等。(2014)这充其量是次优的，最坏是误导性的，因为即使在相同的均方根偏差阈值下绘制等高线的地图也可能不具有可比性。一种更好的方法是使用选择等量图的阈值，这可能与用r.m.s.偏差表示的相同阈值（Urzhumtsev等。, 2014). 在本工作中的情况下，如果一个图形显示了多个地图，则选择轮廓级别，使其包含地图的相同体积。在实践中，通过以下方式获得以均方根偏差表示的等效轮廓水平。首先，从这两个图中计算出两个累积分布函数（CDF）。然后，给定第一个贴图的选定轮廓级别，获得相应的CDF值，并使用该值获得第二个贴图的CDF的相应参数，即所需的阈值（见图16). 这可以使用phenix.map比较工具，实现Urzhumtsev中描述的方法等。(2014).

图16
选择等效地图控制阈值的示意图。红色和蓝色曲线是与所讨论的两个均方根偏差标度图相对应的累积分布函数（CDF）。给定地图1的轮廓阈值(σ₁)，首先需要找到CDF的相应值。接下来，查找贴图2的轮廓阈值(σ₂)对应于与地图1相同的CDF值。轮廓阈值σ₁和σ₂包含两个映射的等效分数。

3.结果

与密度修改（经典或统计）不同，FEM不是一个迭代的阶段改进程序，通常不会显示（1）中原始地图中尚未出现的特征相反，它通过抑制噪声并使弱信号的幅度与强信号的幅度相等，使可用信号更加明显。

FEM程序可应用于X射线和核密度图，并已在高分辨率（1 奥）至低（约4 Å). 当噪声通常小于信号时，FEM协议针对对应于近终模型的映射进行了设计和优化。对于初始和中间情况，噪声的数量和幅度可能与信号相当，因此很难有效抑制噪声。在这种情况下，应小心使用FEM图。然而，由于FEM图是由复合剩余OMIT图过滤的，因此预计与初始图相比，FEM图的建模偏差较小。

保存图15记住，我们注意到FEM图在广泛的等高线水平上保持相似。如果FEM按r.m.s.偏差缩放[这可能是许多分子粒度工具中的默认值，例如库特（埃姆斯利等。, 2010 )和主要（土耳其，2013年)]，然后是介于0和1之间的阈值σ通常是可取的。此外，重要的是要注意合成（1）在相同的轮廓水平下，FEM的可比性可能较差（§2.9）。

下面，我们提供了一些将FEM应用于选定结构的示例，这些示例说明了该过程的典型结果。在大多数情况下，FEM图显示了之前侧链的缺失密度、无序环和交替构象的增强密度。FEM图通常整体更干净，在散装固体区域更平坦。它们也是真实空间细化的更好目标。

3.1. PDB条目1f8吨：更好的侧链密度

图17显示无密度（高于1σ阈值）用于Arg74的侧链（链L（左）)在（1）的地图中。同时，根据§2.4显示了1.5级的侧链密度σ.FEM显示了整个残留物在相当于1的水平上的密度σ为了进行比较，我们计算了RESOLVE（解决）密度修正图，未显示任何密度高于0.8σ级别。

图17
PDB条目的映射1f8吨残渣Arg74（链条L（左）). (一)从（1）映射到1.0σ(b条)1.5时（2）的综合剩余OMIT图σ按照§

2.4. (c（c）)FEM轮廓为1.1σ.（d）RESOLVE（解决）0.8处的密度修正图σ.

3.2. PDB条目1氨气：清理整体噪波贴图

（1）中的地图异常嘈杂，且因该结构而臭名昭著。图18显示了整个模型中典型地图改进的示例。图19提供了大分子-溶剂界面的整体视图，并显示了应用有限元法后，体积-固体区域的噪音显著降低。

图18
PDB条目的映射1氨气(一)从（1）映射到1.0σ(b条)FEM等高线等于1.0σ.链的剩余物3-5B类如图所示。

图19
PDB入口高分子和散装固体区域视图1氨气。来自（1）的地图(一)和FEM(b条)轮廓为1.0σ显示了大分子和块状固体界面。

3.3. PDB条目2月24日：用中子数据获得的醛糖还原酶的结构

我们已经检查了从PDB中选择的大约十几个中子结构的有限元计算结果。X射线结构的一般观察结果也适用于根据中子数据改进的结构。图20说明了有限元法在中子结构中的应用。在本例中，在计算FEM后，（1）中有点破碎的配体密度图得到改善。

图20
醛糖还原酶的中子结构（PDB入口第2季度24). 显示了核图中NAP配体的片段。(一)是来自（1）的地图(b条)是FEM；两者的轮廓均为1σ.

3.4. PDB条目第二代38：高度各向异性的数据集

这是一个典型的具有严重各向异性的数据示例，并作为各向异性校正服务器（强大等。, 2006 ). 原始衍射数据由作者迈克尔·萨瓦亚（Michael Sawaya）提供，因为相应的PDB条目仅包含测量强度的各向异性校正版本。图21显示了三个图：（1）中的原始图、FEM和密度修改图RESOLVE（解决）地图。后两幅地图显示各向异性效应显著降低（地图轮廓沿垂直方向的延伸）。

图21
(一)来自（1）的原始地图(b条)FEM和(c（c）)一个RESOLVE（解决）PDB入口密度修改图第二代38，其中已知数据受严重各向异性的影响。注意，在FEM和RESOLVE（解决）地图。

3.5. PDB条目第1页6：配体放置错误

波扎尔斯基等。(2013 )在这篇文章中指出了一个错误配体。虽然（1）中的傅里叶图没有清楚地识别1处的配体σ（图22一)，使用（图22）计算的特征增强地图b条)和不带（图22c（c）)输入模型文件中的配体可以更好地识别配体。此外，使用（图22）计算的复合剩余OMIT图d日)和不带（图22e（电子）)配体都明确地证实了其身份。一个RESOLVE（解决）密度修正图几乎不能显示配体密度。根据剩余的OMIT或FEM图以及随后的一轮精炼从（1）中得到清晰的配体省略傅立叶图。

图22
PDB条目中错误配体的示例第1页6(一)地图（1）中显示的拟合不正确。FEM计算如下(b条)和没有(c（c）)计算中包含了不正确的配体。合成剩余OMIT图如下所示(d日)和没有(e（电子）)计算中包含了不正确的配体。(（f）)RESOLVE（解决）密度修正图。(克)校正配体拟合后，通过一轮精细化。所有地图均显示在1处σ或同等产品。

3.6. PDB条目2伏和2磅/平方英寸：地图锐化的重要性

图23中的两个示例说明使用地图锐化的重要性。通常，锐化会消除图像的模糊，使特征更加鲜明，并且通常会显示出其他方式看不到的特征，例如残留侧链。正如预期的那样，锐化确实会增加贴图噪声；然而，当作为FEM协议的一部分应用时，锐化产生的噪声基本上被消除了。

图23
无锐化的特征增强地图（FEM）(一，c（c）)和磨刀(b条，d日). (一，b条)PDB模型2伏，链的残基123-140B类(c（c），d日)PDB模型2磅/平方英寸，链的残余物32–43一个。所有地图的等高线均为1σ.

3.7. PDB条目第三季度：FEM作为真实空间细化的更好目标

为了进一步说明FEM程序，我们进行了以下测试。我们选择了PDB条目第3季度（数据分辨率1.45 ？），我们使用重新定义菲尼克斯定义（黄嘌呤等。, 2012 ). 使用该模型，我们计算了两个映射：FEM和（1）中的常用映射（图24一和24b条). 因为我们想比较原始的σ_一个地图（Read，1986年)利用有限元法，未对缺失反射、各向异性校正或锐化进行建模。该结构值得注意的是，（1）中的地图非常差，可能是因为低分辨率区域的完整性较差（17.49–6.58中的完整性为50% 奥区）。然后，我们从模型中删除了除大分子以外的所有内容，并使用以下方法对该模型进行了1000次独立的分子动力学（MD）模拟运行菲尼克斯动力学，每次运行持续到启动和当前模型之间的平方根偏差（r.m.s.d.）超过3 Å. 如图25所示，这产生了1000个不同的结构组合接下来，来自集合的每个模型都要经历十个真实空间的宏循环精炼使用菲尼克斯·real_space_refine（黄嘌呤，头等。，2013年 )与FEM和（1）中的图相对应。每个精炼包含宏循环的模型变形（Terwilliger等。, 2012 )，模拟退火，慢冷却协议从5000开始 K和局部和整体梯度驱动最小化（Afonine等。, 2012). 这个精炼通过计算我们认为是最佳可用模型的未扰动模型（MD之前）和真实空间之后的模型之间的r.m.s偏差来量化成功精细化。图26显示了精炼FEM的结果和（1）中的图。显然，在大多数情况下精炼与标准地图相比，经过特征增强的地图产生了更接近真实结构的细化模型。

图24
(一)映射自（1）和(b条)PDB入口的FEM第三季度，轮廓均为1σ.

图25
1000个MD生成模型集合中的前100个模型，说明了真实空间优化起点的多样性（参见§

3.7）。主干原子以黑色显示。

图26
真实空间细化模型和最佳可用模型之间的均方根误差分布：针对FEM（蓝色）和针对图（1）（红色）的细化。显然，当将FEM用作目标图时，大多数结构都更接近真实结构。

4.结论

由于实验数据和结构模型参数的误差，通常用于晶体结构求解的傅里叶映射永远都不是完美的。各种地图错误可能会阻碍结构的求解和完成，或导致错误的地图解释，从而导致错误的原子模型。

几十年来，人们在改进晶体学图谱的方法方面付出了巨大的努力。然而，大多数现有方法一次只能解决一个或几个与地图质量相关的问题。此外，一些旨在解决一个问题的现有方法可能会使其他问题变得更糟。更彻底和有效的方法通常计算成本很高（计算可能需要数小时或数天），并且在使用时可能需要特定于实例的参数化精炼或模型建筑。

在这份手稿中，我们提出了一种新的晶体学图修改方法，它同时结合了几个理想的图，需要最少的输入(即当前的原子模型和衍射数据），不需要耗时的计算（例如精炼或建模），计算速度相对较快（从不到一分钟到几分钟）。我们将由此获得的地图称为特征增强地图（FEM）。

FEM计算中使用的所有关键工具（包括FEM协议本身）均作为cctbx公司。OMIT映射的计算可用作命令行工具，称为菲尼克斯公司posite_omit_map（Echols&Afonine，2014年 ). 此处显示的FEM计算可在菲尼克斯（亚当斯等。, 2010 )从命令行的dev-1832版本开始(菲尼克斯有限元法)和在菲尼克斯图形用户界面。用于获取本手稿中数字的数据和脚本可从以下网址获得：https://phenix-online.org/phenix数据/.

致谢

这项工作得到了NIH（项目1P01 GM063210）和Phenix工业联合会的支持。根据合同号DE-AC02-05CH11231，这项工作得到了美国能源部的部分支持。非盟感谢法国集成结构生物学基础设施（FRISBI）ANR-10-INSB-05-01和Instruct，后者是欧洲研究基础设施战略论坛（ESFRI）的一部分。DT感谢斯洛文尼亚研究机构结构生物学P0048拨款的支持。

工具书类

Abramowitz，M.和Stegun，I.A.（1972年）。带公式、图形和数学表的数学函数手册第928页。纽约：多佛。谷歌学者
 P.D.亚当斯。等。(2010).《水晶学报》。D类66, 213–221. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Afonine，P.V.、Grosse-Kunstleve，R.W.和Adams，P.D.（2005）。《水晶学报》.D型61, 850–855. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Afonine，P.V.、Grosse-Kunstleve，R.W.、Adams，P.D.和Urzhumtsev，A.（2013）。《水晶学报》。D类69, 625–634. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Afonine，P.V.、Grosse Kunstleve，R.W.、Echols，N.、Headd，J.J.、Moriarty，N.W.、Mustyakimov，M.、Terwilliger，T.C.、Urzhumtsev，A.、Zwart，P.H.和Adams，P.D.（2012）。《水晶学报》。D类68, 352–367. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Afonine，P.V.、Headd，J.J.、Terwilliger，T.C.和Adams，P.D.（2013）。计算。结晶器。新闻。 4, 43–44.https://phenix-online.org/newsletter/CCN_2013_07.pdf. 谷歌学者
 Afonine，P.V.和Urzhumtsev，A.（2004）。《水晶学报》。一个60, 19–32. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Agarwal，R.C.和Isaacs，N.W.（1977年）。程序。美国国家科学院。科学。美国，74, 2835–2839. 交叉参考中国科学院公共医学科学网谷歌学者
 Altomare，A.、Cuocci，C.、Giacovazzo，C.、Kamel，G.S.、Moliterni，A.和Rizzi，R.（2008）。《水晶学报》。一个64, 326–336. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Baker，D.、Bystroff，C.、Fletterick，R.J.和Agard，D.A.（1993年）。《水晶学报》。D类49, 429–439. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Berman，H.M.、Westbrook，J.、Feng，Z.、Gilliland，G.、Bhat，T.N.、Weissig，H.、Shindyalov，I.N.和Bourne，P.E.（2000）。核酸研究。 28, 235–242. 科学网交叉参考公共医学中国科学院谷歌学者
 Bernstein，F.C.，Koetzle，T.F.，Williams，G.J.，Meyer，E.F.Jr，Brice，M.D.，Rodgers，J.R.，Kennard，O.，Shimanouchi，T.&Tasumi，M.（1977年）。分子生物学杂志。 112, 535–542. 交叉参考中国科学院公共医学科学网谷歌学者
 Bhat，T.N.（1988）。J.应用。克里斯特。 21, 279–281. 交叉参考科学网 IUCr日志谷歌学者
 Bhat，T.N.和Cohen，G.H.（1984年）。J.应用。克里斯特。 17, 244–248. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Brunger，A.T.、DeLaBarre，B.、Davies，J.M.和Weis，W.I.（2009年）。《水晶学报》。D类65, 128–133. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Buerger，M.J.（1970年）。当代晶体学纽约：McGraw–Hill。谷歌学者
 Collins，D.M.（1975）。《水晶学报》。一个31, 388–389. 交叉参考 IUCr日志谷歌学者
 考坦，K.D.（1996）。CCP4研究周末会议记录。高分子精制由E.Dodson、M.Moore、A.Ralph和S.Bailey编辑，第23-28页。沃灵顿：达斯伯里实验室。谷歌学者
 Cowtan，K.（2010年）。《水晶学报》。D类66, 470–478. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Cowtan，K.（2012年）。CCP4新闻。蛋白质结晶仪。 48，贡献5谷歌学者
 DeLaBarre，B.&Brunger，A.T.（2006年）。《水晶学报》。D类62, 923–932. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Diaconu，M.、Kothe，U.、Schlünzen，F.、Fischer，N.、Harms，J.M.、Tonevitsky，A.G.、Stark，H.、Rodnina，M.V.和Wahl，M.C.（2005年）。单元格，121, 991–1004. 科学网交叉参考公共医学中国科学院谷歌学者
 Echols，N.和Afonine，P.V.（2014）。计算。结晶器。新闻。 5, 1.https://www.phenix-online.org/newsletter/CCN_2014_01.pdf. 谷歌学者
 Emsley，P.、Lohkamp，B.、Scott，W.G.和Cowtan，K.（2010年）。《水晶学报》。D类66, 486–501. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Fokine，A.和Urzhumtsev，A.（2002）。《水晶学报》。D类58, 1387–1392. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Grosse-Kunstleve，R.W.和Adams，P.D.（2002年）。J.应用。克里斯特。 35, 477–480. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Grosse-Kunstleve，R.W.、Sauter，N.K.和Adams，P.D.（2004）。IUCr计算。通讯新闻。 三, 22–31. 谷歌学者
 Grosse-Kunstleve，R.W.，Sauter，N.K.，Moriarty，N.W.和Adams，P.D.（2002）。J.应用。克里斯特。 35, 126–136. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Grosse-Kunstleve，R.W.，Wong，B.，Mustakimov，M.&Adams，P.D.（2011年）。《水晶学报》。一个67, 269–275. 科学网交叉参考 IUCr日志谷歌学者
 Gunčar，G.，Klemenčić，i.，Turk，B.，Turk.，V.，Karaoglanovic-Carmona，A.，Juliano，L.&Turk（2000）。结构，8, 305–313. 公共医学谷歌学者
 Hodel，A.、Kim，S.-H.和Brünger，A.T.（1992年）。《水晶学报》。一个48, 851–858. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Hoppe，W.和Gassmann，J.（1968）。《水晶学报》。B类24, 97–107. 交叉参考中国科学院 IUCr日志科学网谷歌学者
 Hummel，R.A.（1975年）。计算。图表。图像处理。 4, 209–224. 交叉参考谷歌学者
 Hummel，R.A.（1977年）。计算。图表。图像处理。 6, 184–195. 交叉参考谷歌学者
 Kirillova，O.（2008）。J.应用。克里斯特。 41, 31–37. 交叉参考中国科学院 IUCr日志谷歌学者
 Kuwahara，M.、Hachimura，K.、Eiho，S.和Kinoshita，M.（1976年）。生物医学图像的数字处理第187-203页。纽约：Plenum出版社。谷歌学者
 Lamzin，V.S.&Wilson，K.S.（1993年）。《水晶学报》。D类49, 129–147. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Lang，P.T.、Holton，J.M.、Fraser，J.S.和Alber，T.（2014）。程序。美国国家科学院。科学。美国，111, 237–242. 交叉参考中国科学院公共医学谷歌学者
 Lunin，V.Y.（1988）。《水晶学报》。一个44, 144–150. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Lunina，N.L.、Lunin，V.Y.和Podjarny，A.D.（2002年）。CCP4新闻。蛋白质结晶仪。 41，贡献10谷歌学者
 Lunina，N.、Lunin，V.和Urzhumtsev，A.（2003）。《水晶学报》。D类59, 1702–1715. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Lunin，V.Y.和Skovoroda，T.P.（1991）。《水晶学报》。一个47，45–52交叉参考中国科学院科学网 IUCr日志谷歌学者
 Lunin，V.Y.和Urzhumtsev，A.G.（1984）。《水晶学报》。一个40, 269–277. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Lunin，V.Y.、Urzhumtsev，A.G.、Vernoslova，E.A.、Chirgadze，Y.N.、Neveskaya，N.A.和Fomenkova，N..P.（1985年）。《水晶学报》。一个41, 166–171. 交叉参考中国科学院 IUCr日志谷歌学者
 Luzzati，V.（1953年）。《水晶学报》。 6, 142–152. 交叉参考中国科学院 IUCr日志科学网谷歌学者
 Main，P.（1979）。《水晶学报》。一个35, 779–785. 交叉参考 IUCr日志科学网谷歌学者
 McHugh，S.（2005）。数字摄影教程。 https://www.cambridgeincolour.com/tutorials.htm. 谷歌学者
 Murshudov，G.N.、Vagin，A.A.和Dodson，E.J.（1997）。《水晶学报》。D类53, 240–255. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Pai，R.、Sacchettini，J.和Ioerger，T.（2006）。《水晶学报》。D类62, 1012–1021. 交叉参考中国科学院 IUCr日志谷歌学者
 Perrakis，A.、Sixma，T.K.、Wilson，K.S.和Lamzin，V.S.（1997）。《水晶学报》。D类53, 448–455. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Podjarny，A.D.、Rees，B.和Urzhumtsev，A.G.（1996）。方法分子生物学。 56, 205–226. 中国科学院公共医学谷歌学者
 Pozharski，E.、Weichenberger，C.X.和Rupp，B.（2013）。《水晶学报》。D类69, 150–167. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Praínikar，J.、Afonine，P.V.、Gunčar，G.、Adams，P.D.和Turk，D.（2009年）。《水晶学报》。D类65, 921–931. 科学网交叉参考 IUCr日志谷歌学者
 Raghavan，N.V.和Tulinsky，A.（1979年）。《水晶学报》。B类35, 1776–1785. 交叉参考中国科学院 IUCr日志谷歌学者
 Ramachandran，G.N.和Raman，S.（1959年）。《水晶学报》。 12, 957–964. 交叉参考中国科学院 IUCr日志科学网谷歌学者
 Ramachandran，G.N.和Srinivasan，R.（1961年）。自然（伦敦），190, 159–161. 交叉参考中国科学院科学网谷歌学者
 Ramachandran，G.N.和Srinivasan，R.（1970年）。晶体学中的傅里叶方法。纽约：Wiley。谷歌学者
 拉曼，S.（1959）。《水晶学报》。 12, 964–975. 交叉参考中国科学院 IUCr日志科学网谷歌学者
 里德，R.J.（1986）。《水晶学报》。一个42, 140–149. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Read，R.J.（1997）。方法酶制剂。 278, 110–128. 交叉参考科学网谷歌学者
 Reddy，V.、Swanson，S.M.、Segelke，B.、Kantardjieff，K.A.、Sacchettini，J.C.和Rupp，B.（2003）。《水晶学报》。D类59, 2200–2210. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Rice，L.M.、Shamoo，Y.和Brünger，A.T.（1998）。J.应用。克里斯特。 31, 798–805. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Sheldrick，G.M.（2008）。《水晶学报》。一个64，112–122科学网交叉参考中国科学院 IUCr日志谷歌学者
 Sim，G.A.（1959年）。《水晶学报》。 12，813–815交叉参考 IUCr日志科学网谷歌学者
 Srinivasan，R.（1961年）。程序。印度科学院。科学。一个，53, 252–264. 谷歌学者
 Strong，M.、Sawaya，M.R.、Wang，S.、Phillips，M.和Cascio，D.&Eisenberg，D.（2006年）。程序。美国国家科学院。科学。美国，103, 8060–8065. 科学网交叉参考公共医学中国科学院谷歌学者
 Terwilliger，T.C.（2003）。《水晶学报》。D类59, 1688–1701. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Terwilliger，T.C.、Grosse-Kunstleve，R.W.、Afonine，P.V.、Moriarty，N.W.，Zwart，P.H.、Hung，L.-W.、Read，R.J.和Adams，P.D.（2008）。《水晶学报》。D类64, 61–69. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Terwilliger，T.C.、Kim，S.-H.和Eisenberg，D.（1987年）。《水晶学报》。一个43, 1–5. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Terwilliger，T.C.、Read，R.J.、Adams，P.D.、Brunger，A.T.、Afonine，P.V.、Grosse-Kunstleve，R.W.和Hung，L.W.（2012）。《水晶学报》。D类68, 861–870. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Tronrud，D.W.（1996）。CCP4研究周末会议记录。高分子精制由E.Dodson、M.Moore、A.Ralph和S.Bailey编辑，第1-10页。沃灵顿：达斯伯里实验室。谷歌学者
 Turk，D.（2013）。《水晶学报》。D类69, 1342–1357. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Urzhumtsev，A.，Afonine，P.V.，Lunin，V.Y.，Terwilliger，T.C.&Adams，P.D.（2014）。《水晶学报》。D类70, 2593–2606. 交叉参考 IUCr日志谷歌学者
 Urzhumtsev，A.G.、Lunin，V.Y.和Luzianina，T.B.（1989）。《水晶学报》。一个45, 34–39. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Urzhumtsev，A.G.、Skovoroda，T.P.和Lunin，V.Y.（1996）。J.应用。克里斯特。 29, 741–744. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Urzhumtseva，L.和Urzhum tsev，A.（2011年）。J.应用。克里斯特。 44, 865–872. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Vellieux，F.M.D.和Dijkstra，B.W.（1997）。J.应用。克里斯特。 30, 396–399. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Vijayan，M.（1980年）。《水晶学报》。一个36, 295–298. 交叉参考中国科学院 IUCr日志科学网谷歌学者
 Woolfson，M.M.（1956年）。《水晶学报》。 9, 804–810. 交叉参考中国科学院 IUCr日志科学网谷歌学者
 Zhang，K.Y.J.，Cowtan，K.&Main，P.（2006）。国际结晶学表，体积。F类第1在线版，由M.G.Rossman和E.Arnold编辑，第311-324页。切斯特：国际结晶学联合会。谷歌学者

这是一篇根据知识共享署名（CC-BY）许可它允许在任何介质中不受限制地使用、分发和复制，前提是引用了原始作者和来源。