Autoindexing diffraction images with iMosflm

Powell, H.R.; Johnson, O.; Leslie, A.G.W.

doi:10.1107/S0907444912048524

研究论文

生物
结晶学

国际标准编号：1399-0047

第69卷| 第7部分| 2013年7月| 第1195-1203页

doi:10.1107/S0907444912048524

打开

访问

自动索引衍射图像iMosflm公司

哈罗德·鲍威尔,^一欧文·约翰逊 ^一和安德鲁·G·W·莱斯利 ^一 ^*

^一英国剑桥CB2 0QH希尔斯路MRC分子生物学实验室
^*通信电子邮件：安德鲁@mrc-lmb.cam.ac.uk

(收到日期：2012年9月12日； 2012年11月26日接受； 2013年6月13日在线)

综述了基于一维快速傅里叶变换的衍射图像自动标引技术。算法在中的实现莫斯弗姆/iMosflm公司对程序集进行了描述，讨论了可能出现的实际问题以及评估程序成功或失败的方法。最近的发展允许对显示多个晶格的图像进行索引，几个示例证明了这种方法在实际案例中的成功。

关键词：自动索引;多重格子;莫斯弗姆;数据处理.

1.简介

索引是使用现代软件套件处理大分子衍射数据的重要第一步。过去已经实施了一种替代方法，即先整合衍射图像，然后在后期尝试索引（Kabsch，1977）)，但由于难以获得弱反射强度的准确估计值，证明其明显较差。索引需要一个或多个衍射图像和实验条件的基本描述（晶体到探测器的距离、辐射波长、探测器方向和直射光束的位置）。如果使用两个或多个图像，则需要晶体的相对取向。索引提供了晶体单位-细胞参数的描述以及晶体相对于实验室框架的方向。根据形状导出单位细胞，可能提出晶体的劳厄对称性（作为初始假设）。

所谓“自动标引”程序的出现，在这种程序中，可以使用一个（或多个）衍射图像进行标引，而无需事先了解单元胞参数或晶体取向(例如从其形态来看）是自动化或半自动化数据处理软件开发的一大进步。历史上，第一个自动索引算法确实需要了解（近似的）单元间参数（Vriend&Rossmann，1987）; 卡布施，1988年 )，但在不需要的情况下，这些被改进的程序迅速取代（Kim，1989 ; 东芝，1990年 ; 卡布施，1993年 ; Steller公司等。, 1997 ; 索特等。, 2004 ). 这些改进的算法构成了所有现代软件套件中自动索引的基础。然而，采用了两种不同的方法。两者都依赖于衍射图像中的光斑位置到互易空间（参见§2). 在XDS公司程序集，从这些倒数空间向量导出的差分向量用于索引（Kabsch，1993)而其他广泛使用的软件套件使用基于三维倒数空间矢量的快速傅里叶变换（FFT）的方法（Campbell，1998 ; Otwinowski&Minor，2001年 )或一维（Steller等。, 1997). 中使用的差分向量方法XDS公司已详细描述，此处不再讨论。基于差分向量和基于FFT的程序都非常强大，没有明确证据表明这两种方法在本质上优于另一种方法。还描述了用伪平移处理晶体衍射图像或允许对异常值进行稳健识别的增强功能（Sauter&Zwart，2009）; Sauter&Poon，2010年 ).

本文描述了基于一维FFT的自动索引的一般原理，特别是在莫斯弗姆（鲍威尔，1999年 )和iMosflm公司（巴蒂等。, 2011 ). 描述了评估索引成功与否的方法，并讨论了可能影响索引成功与失败的一些实际问题。最后，介绍了最近针对显示多个晶格的衍射图像进行索引的工作结果。

2.基于一维FFT的索引

所有索引程序都依赖于使用振荡方法记录的衍射图像这一事实（Arndt&Wonacott，1977 )是的扭曲投影互易空间（进动相机的机制使它们能够产生不失真的投影，但由于它们依赖于精确定向的晶体，所以现在很少使用它们）。The geometry of the埃瓦尔德球体可以使用构造将测得的点坐标映射回产生该点的倒格子点（rlp）的坐标（图1).

图1
Ewald球体构造。晶体位于Ewald球体的中心(O（运行）)，X射线束沿着X（X）轴和原点倒易点阵(问)位于X射线束离开埃瓦尔德球体。实验室坐标系由表示的正交轴组定义X（X）,年,Z轴主轴平行于Z轴.位于平行于YZ公司平面显示为位于埃瓦尔德球体，产生一组衍射光束（虚线），在平面探测器上形成一组圆圈上的斑点。X（X）_d日,年_d日定义探测器坐标系。其中一个倒数晶格点的散射矢量显示为粗线。

只有当rlp正好位于埃瓦尔德球体。实际上，各种效果（晶体镶嵌、，波长色散，光束发散）导致rlp具有有限的尺寸，因此当rlp的（中心）明显远离埃瓦尔德球体。原则上，通过测定实验值可以将这些误差降至最低φ质心（其中φ表示主轴旋转角度），但实际上很少执行此操作（尽管随着快速读出检测器的出现，这现在完全可行）。

真实中的不确定性φ斑点的值会导致计算的散射矢量中出现误差，误差的大小主要取决于晶体的镶嵌性和图像的振荡角度。这反过来又会影响索引的稳健性，尤其是对于高度镶嵌的晶体或结合大单位-细胞参数的中度镶嵌。在这两种情况下，相邻的新月会在衍射图像中重叠，从而导致索引的模糊性。

基于一维FFT的索引算法在其他地方有详细描述（Steller等。, 1997; 鲍威尔，1999年)，但此处概述了所涉及的一般原则。使用的几何图形埃瓦尔德球体构造时，将点坐标（相对于直接光束位置）转换为无量纲倒格子散射矢量(秒)使用

$[{\bfs}=\left（\matrix{D/r-1\cr Y_{\rm D}/r\cr X_{\rma D}/r}\right），\eqno（1）]$

$[r=（X_{\rm d}^{2}+Y_{\rmad}^{2}+d^{2）^{1/2}，\eqno（2）]$

哪里X（X）_d日,年_d日是探测器坐标系中测得的点坐标，以及D类是晶体到探测器的距离。这个埃瓦尔德球体在无量纲倒数格子中工作时，半径是一个单位。如前所述φ点的值未知，因此假设φ所有点的值对应于振荡范围的中点。如果使用两个或多个图像，则散射矢量必须参考公共φ原点使用

$[{\bfs}'=[{\boldPhi}]^{-1}{\bf s}，\eqno（3）]$

其中矩阵[Φ]对应于绕主轴旋转一个角度φ.

为了说明基于一维FFT的索引的基本原理，请考虑图2中所示的衍射模式(一)，其中晶体已定向，使其中一个晶体轴沿X射线束方向对齐（X（X）实验室框架的轴线）。由此产生的衍射图案由一系列圆月组成，圆月中心位于直边位置。当从点位置导出的散射矢量投影到X（X）轴上，与位于同一个圆月内的点相对应的所有投影散射矢量将具有相同的长度（在实验误差范围内）。因此，所有斑点的投影散射矢量将沿X（X）轴。由于这些簇的周期性，这些投影散射矢量的傅立叶变换将给出一系列大峰值（图2b条). 傅里叶变换还提供了互易空间（对应于投影散射矢量）到实际空间，第一个（非原点）峰值将出现在提供平行于X射线束的晶体轴长度的间距处。

图2
一维FFT索引。(一)定向核糖体晶体的衍射。晶体的定向使实际空间轴沿着X射线束，因此衍射图样显示出位于一系列圆月上的斑点，圆月中心位于直射位置。(b条)沿实际空间轴方向投影的散射矢量的傅里叶变换示例。在此示例中，轴向长度为～62º。

现在考虑将散射矢量投影到与X（X）轴。在这种情况下，位于同一圆月上的点将产生不同长度的投影散射矢量，因此投影散射矢量的分布将趋向于连续分布，而不是规则重复的簇。在这种情况下，投影散射矢量的一维FFT不会产生任何显著高度的峰值，因为没有潜在的周期性。

这一结果使我们能够确定晶体在任意方向上（低阶）实际空间轴的方向，而不是上述特定方向。投影散射矢量的一维FFT是在投影轴的整个方向范围内进行的，对整个半球进行采样。然后，已知在一维FFT中产生大峰值的方向对应于实际空间轴的方向，第一个非原点峰值的位置给出了实际空间轴长度。实际上，在方向的第一次粗采样中定位出重要的FFT峰值后，使用步长依次较小的方向网格搜索来准确确定实际空间轴方向（Powell，1999). 然后给出了下一步中使用的一系列实际空间向量。在莫斯弗姆默认情况下，会选择FFT峰值最大的30个向量（如果向量共线，则会删除较长的向量）。从该列表中选择三个矢量并用于导出方向矩阵[一]，然后使用

$[{\bf h}'=[{\bf A}]^{-1}{\bf-s}，\eqno（4）]$

其中，包括小时'通常不是整数。三个派生索引中任意一个的反射数(小时,k个或我)确定与整数的偏差小于阈值（0.3）。对所有可能的矢量组合重复该过程[一]产生最小拒绝次数而没有明显更大拒绝次数的矩阵单位电池被选为最佳解决方案。

一旦确定了最佳解决方案还原电池是经过计算的（Kim，1989)并用于使用表中列出的44个晶格字符的变换来确定来自较高对称晶格的失真惩罚国际晶体学表体积一（见附录一). 对于畸变惩罚小于50的所有晶格，根据观察到的点位置，对单元胞参数、直射束位置和晶体到探测器的距离进行细化，并在精细化，并确定观测点位置和计算点位置之间的均方根误差（r.m.s.d.）。精炼晶体到探测器的距离通常仅适用于高分辨率数据（>2º），因为它与单位-细胞参数高度相关。格子如表所示（图3)该程序将突出基于失真惩罚和r.m.s.d.值的最可能解决方案。

图3
索引结果如所示iMosflm公司。对于每个解决方案，都会列出晶格类型、畸变惩罚和单位-细胞参数（单位为Ω和度）。对于惩罚小于50的溶液，点位置的均方根误差[表示σ(x个,年)，单位mm]和inφ[表示σ(φ)，单位为度]和直梁位置的位移[表示δ（梁），单位：mm]。最可能的解决方案以灰色突出显示。

重要的是要注意，由于索引完全基于点位置，因此只有关于单位电池获得；真正的对称性只能通过强度来确定（例如，通过使用程序无意义; 埃文斯，2011年 )目前还没有可靠的强度估计值。因此，伪对称很容易被误导：例如，具有β≃90°或具有两个相似单位-细胞边缘的正交细胞。r.m.s.d.值可用于帮助识别伪对称性，经验表明，如果惩罚较低的溶液的r.m.s.d大于1.3×r.m.s.d。^对1（其中r.m.s.d。^对1是三斜解的r.m.s.d.值），则可能是一个伪对称解。

3.成功的要求

从探测器坐标到倒置晶格点的映射依赖于波长、晶体到探测器距离以及最重要的直接光束位置的精确值。实际上，最后一个很可能是不准确的。索引可以成功，只有30个点，但几百个是理想的。即使包含由冰、锌块或热像素衍射产生的相对较少的“假”斑点，也会影响索引，因此，应根据斑点大小、强度和分辨率采取措施排除可能的假斑点，通常只使用强斑点。在φ（90°是理想的）可以显著提高在困难情况下的成功率，并且在所有情况下，都将导致更好地确定单位-细胞参数作为更广泛的部分互易空间正在进行采样。

如前所述，如果大晶体镶嵌导致月牙重叠，也会导致问题。未完全解决的斑点可能会导致斑点查找问题，导致斑点位置不准确。虽然通过基于局部最大值的点定位可以将这些误差降至最低，但可能有必要针对具有挑战性的情况调整点定位参数。

最后，在图像中存在多个晶格的情况下，通过仅选择最强点进行索引，通常可以成功索引最强的晶格。索引多重格的最新发展在§6

4.判断索引的成功

目视检查是评估索引是否正确的最佳方法。假设马赛克扩散为零，并不是所有的斑点都可以预测，但月亮的形状应该匹配。通过模式匹配估计马赛克扩散通常会使比较更容易，但需要谨慎，因为如果预测错误，则估计的马赛克传播可能太大。

当目视检查预测时，重要的是检查所选单元格是否不是真实单元格的子倍数。例如，如果伪平移对称导致交替的强衍射和弱衍射，则如果仅在索引中使用强点，则相应的单位-细胞参数可能会是其正确值的一半。

正确的解决方案应该具有较低的惩罚（通常小于20）。r.m.s.d.值也是一个很好的指标，尽管其实际值取决于许多参数。对于形状良好的衍射点，值在0.05 mm之间（镶嵌度和光束发散度低，探测器像素尺寸小，例如同步加速器光束线上的CCD）和0.2 mm（高光束发散度和/或大像素尺寸，例如实验室光源上的图像板）是典型的。然而，对于由于分裂晶体或非常高的马赛克扩散而导致的不良斑点形状，对于正确的解决方案，r.m.s.d.可能超过1.0 mm，而对于良好的斑点形状，这样高的残余几乎肯定表示索引不正确。这有助于强调目视检查的重要性。

5.使用索引时的实际问题iMosflm公司

成功的索引取决于获得可靠的点列表，因此值得检查要使用的点。这些在图像显示中显示为用于索引的反射的红色十字，而黄色十字表示低于电流的斑点我/σ(我)阈值。对于衍射强的图像，阈值自动设置为20，对于衍射弱的图像，则阈值降低为10或5。如果斑点分辨率较差或由多个成分组成（由于晶体分裂），则可能需要调整斑点填充参数以获得最佳斑点位置。在分离斑点的情况下，最有用的调整参数是最小斑点间距，应将其设置为近似斑点尺寸（单位：毫米）。

5.1. 选择要索引的图像

默认情况下，两幅图像用于索引，在φ尽可能地。值得检查第二张图像的质量，尤其是在完整数据集末尾收集的图像，因为辐射损伤可能导致光斑形状很差或衍射很弱，这两种情况都可能导致索引困难。在某些情况下，晶体缺陷(例如无序或多格子）将仅在两个图像中的一个中可见，并且在使用这两个图像都失败时，仅选择更好的图像可以获得成功的索引。然而，使用两幅图像通常是有益的，因为它提高了索引的成功率，并将产生更准确的单位-细胞参数。对于低对称性空间群（单斜或三斜），使用单个图像进行索引可能会产生模糊的结果，不同的单位-细胞参数对该图像的预测同样好；如果使用额外的图像，这种模糊性通常会得到解决。目前，没有尝试改进对φ质心（当在相邻的两幅图像上的同一位置发现衍射点时）φ，当使用多个图像进行索引时，建议在φ.

5.2. 直臂位置

当图像本身质量良好时，不准确的直尺坐标是索引失败的最常见原因。直拍位置可以显示在图像上（作为绿色十字），因此检查它是否处于合理位置很容易，即大约位于直达停车阴影的中央。如有必要，可将直射光束拖动到合理的起始位置，并进行二维搜索，在该搜索中尝试在位置网格上进行索引（默认情况下，距离起始位置0.5 mm±2步）。给出了一个汇总索引结果的表格，其中正确的解决方案通常是给出最小r.m.s.d.误差的解决方案。当使用两幅图像（理想情况下相隔90°）时，此搜索通常更具辨别力。在选择正确的解决方案时，有必要拒绝那些单位-细胞参数比其他解决方案大得多的解决方案，因为即使对于错误的解决方案来说，这些解决方案也会产生较低的r.m.s.d.值。如果多个起始直边坐标产生相同的细化值，这是成功的良好指标，但与标准分度程序一样，目视检查提供了识别正确解决方案的最佳方法。当单位电池较大时，可能存在多个具有非常相似r.m.s.d.值的解决方案，对应于沿长轴的分度变化±1或甚至±2。在这些情况下，假设预测看起来很好，可能需要整合一些数据，然后运行程序无意义（埃文斯，2011年)根据R（右）因子或相关系数。

5.3. 主轴旋转方向

分度失败的另一个可能原因是主轴旋转方向与大多数光束线上使用的方向相反。这是伦德MAX-lab、阿贡国家实验室先进光子源、上海同步辐射设施和墨尔本澳大利亚同步加速器的一些束线的情况。这种情况的一个有用指标是，使用单个图像进行索引是成功的，但使用两个或多个图像时会失败。此外，成功索引单个图像后，相邻图像的预测（Inφ)将不匹配。通过选择“实验设置”选项卡中的“主轴旋转反向”复选框，可以纠正此问题。

5.4. 带有大马赛克扩散的晶体图像

具有较大马赛克扩散的晶体（或具有较大旋转角的图像）的衍射图像可能存在困难，因为这会导致在从光斑位置映射到倒数空间矢量时出现重大错误，因为假设φ每个点的值是振荡范围的中点。在某些情况下，如果已经收集了完整的数据集，那么可能会有一些图像中的月球被更清楚地分离，并且使用这些图像进行索引可能是成功的。如果只有两个参考图像可用，则值得在中间收集更多图像φ角度和可能使用较小的振荡角度。另一种通常成功的方法是设置我/σ(我)阈值设置为50–100范围内的非常大的值，假设这仍然提供了合理数量的可用点。这一点的基础是，平均而言，最强的点是那些真实的φ这些值最接近图像振荡范围的中点，并且在假定的φ值。

5.5. 当一切都失败时

在其他索引失败的情况下，值得尝试使用我/σ(我)阈值，低于或高于默认值，或包括在φ.

6.存在多个格时进行索引

由于具有相同单位-细胞参数但方向不同的不同晶体的衍射，衍射图像中出现多个不同的晶格并不罕见。不同取向的范围可能会有很大差异，最常见的情况是分裂晶体引起的1-2°的微小差异，但也可能出现几十度的较大差异。当使用非常小（～10µm或更小）的晶体时，可能会出现后一种情况，并且X射线束中存在多个晶体。

文献中已经描述了使用多个格子索引图像的方法。在采用的方法中标签（Sauter&Poon，2010年)，尽管存在来自多个晶格的点，但假定初始索引成功地建立了完整的点列表。然后根据其计算位置和观测位置之间的差异来识别点列表中的异常值。然后根据在第一次扫描中被识别为异常值的点执行第二次索引扫描。基本上相同的方法（但使用不同的异常值识别算法）可以用于XDS公司集成程序(https://strucbio.biologie.uni-konstanz.de/xdswiki/index.php/索引). 在寓言软件包(https://sourceforge.net/apps/trac/fable)，索引基于基于单位-细胞参数和晶格类型（Paithanhar等。, 2011 ). Anduleit和Stuart（D.I.Stuart，个人通信）编写的软件也采用了类似的方法。

6.1. 中的多个晶格索引莫斯弗姆

最近在莫斯弗姆/iMosflm公司程序套件。此实现类似于标签并且还依赖于使用完整的spot列表进行成功的索引。虽然原则上这是该方法的固有弱点，但实际上（参见§6.3）证明该程序非常成功。在困难的情况下，将用于索引的矢量数量从30个增加可能是值得的（现在可以从iMosflm公司GUI），但§6.3. 研究了识别异常值的两个标准。第一个是观察到的和计算出的点位置之间的差异（如在标签). 第二种是基于使用从索引中获得的方向矩阵分配给点的索引。由于从点位置导出的倒数空间矢量中的误差（通常主要是由于真实值的不确定性φ坐标），计算的指数通常不是精确的整数。指数积分值的偏差被用作识别异常值的一种方法。在显示多个晶格的各种图像的测试中（见§6.3）与积分指数的偏差(Δ香港特别行政区)事实证明，与点位置偏差相比，它能够更成功地对附加格进行索引，这被用作默认标准。

莫斯弗姆应用最大偏差Δ香港特别行政区对于传统索引（对于单个晶格），积分指数为0.3，但为了识别多个晶格aΔ香港特别行政区值0.2大大提高了性能（尽管在具有挑战性的单格情况下，此值有时会导致索引失败）。基于该标准的异常值被移动到“拒绝”列表，并使用“接受”点的列表进行第二次索引。发现的任何其他异常值都会添加到被拒绝列表中。然后将被拒绝列表用作新索引过程的输入，并重复整个过程，直到被拒绝列表包含的点少于找到的总点数的固定百分比（10%）（图4).

图4
索引多个晶格的流程图莫斯弗姆。有关详细信息，请参阅文本。

6.2. 实施

多个晶格索引已作为下拉菜单上的一个选项引入iMosflm公司接口。如上所述进行索引，结果显示在窗格的下部，每个网格都有一个单独的选项卡（图5). 在下面的窗格中，列出了每个找到的晶格的“最佳”解决方案的晶格类型、单位-细胞参数和位置残差，以及与第一个晶格的方向差异。在这一阶段，没有尝试对不同晶格实施相同的单元-单元参数，尽管这可以在集成之前实施。高亮显示这些解决方案中的任何一个都将导致该晶格的可能解决方案的完整列表显示在窗格的上部，并且还将更新“图像”窗口中显示的预测反射。也可以更改预测反射的显示通过图像显示中的“晶格选择器”，使检查找到的每个不同晶格变得非常简单。对于，值为0.2Δ香港特别行政区通过测试实例给出了最佳性能，但此参数也可以由用户调整。

图5
索引窗格位于iMosflm公司显示了多重格索引的结果。每个检测到的晶格的完整解决方案集显示在标题为“晶格1，晶格2”的选项卡中等。位于窗格的上部。下半部分显示了所有检测到的晶格的“最佳”解决方案。最后一列将显示与第一个晶格（尚未实现）方向的角度差异。选择其中一个解决方案将导致该解决方案的预测反射显示在“图像”窗口中。

6.3. 结果

下面给出了显示多个晶格的几个衍射图案的索引示例。在某些情况下，有必要选择两幅最清晰地显示不同格子的图像，而不是使用第一幅图像和第二幅图像的默认过程，这两幅图像在φ。所有图像都是在100 K下从低温冷却晶体中收集的。在这些示例中，根据溶液预测索引图像和其他图像上出现的大多数反射的能力来评估溶液的正确性φ值。全面评估需要成功整合不同格，这是软件持续开发的目标。

6.3.1. 三临床单位电池，存在两个格子

使用ADSC Q4R CCD探测器在欧洲同步辐射设施（ESRF）的光束线ID14-4上以0.35°的振荡角记录图像。使用默认参数值识别出两个方向相差很大的三斜晶格，并在φ=0°或φ=90°（图6一和6b条). 在本例中，将两个图像索引在一起时，只找到一个晶格。0.25的值Δ香港特别行政区也给出了两个格（当使用单个图像时），但当Δ香港特别行政区增加到0.3。

图6
成功索引显示多个晶格的图像的示例。对于每个示例，显示原始图像(一,c（c）,e（电子）,克)和叠加了预测反射（以方框表示）的相同图像(b条,d日,（f）,小时). 不同格子的预测框以不同的颜色显示。未对完全记录、部分记录或重叠反射或具有φ宽度大于5°（对于单个晶格，通常是着色的基础）。在所有情况下，马赛克扩散都被设置为0.5°，并且没有尝试对此进行优化。有关更多详细信息，请参阅文本。

6.3.2. 正交的单位电池具有较大的单元-单元参数

使用Rayonix MX300 CCD探测器在金刚石光源（DLS）的光束线I24上收集衍射数据，该光束线来自具有正交对称性和单位-细胞参数的晶体一= 118,b条= 182,c（c）= 188 Å. 振荡角度为0.5°。在这种情况下，选择了一幅显示不同晶格最清晰分离的图像进行索引，并识别出三个不同晶格（图6c（c）和6d日). 第二个和第三个晶格与第一个晶格的旋转角度分别为1.8°和3.5°，代表“分裂晶体”情况Δ香港特别行政区增加到0.25。一些斑点并没有被发现的任何晶格所预测，因此可能存在其他晶格。

6.3.3. 单斜晶胞

使用ADSC Q4R探测器在ESRF波束线ID14-4上以1.0°振荡角收集数据。在处使用两个图像进行索引φ=0°和φ=90°使用所有默认参数值给出了两个方向非常不同的晶格（图6e（电子）和6（f）). 用单个图像索引也很成功。增加的Δ香港特别行政区当两个图像都被使用时，0.25或0.3也导致两个晶格。

6.3.4. 单斜的单位电池和四个格子

由于存在大量晶格，这是最具挑战性的例子。使用振荡角为2.0°的ADSC Q315R探测器在DLS的束线I04上采集图像。必须选择用于索引的图像，以显示晶格的最清晰分离，因为某些图像上的点重叠在点查找步骤中效果不佳。无法从单个图像中对晶格进行索引，但可以从两个相隔40°的图像中进行索引φ使用默认参数值成功建立索引（图6克和6小时). 不同晶格的旋转范围为0.8°至9.4°。增加的Δ香港特别行政区到0.25时，只发现了两个晶格。

6.4. 讨论

尽管所采用的方法简单明了，但事实证明，多重格索引对于一系列不同的实际示例来说非常强大。为了提高成功的机会，在某些情况下可能需要选择在目视检查中最清楚地显示不同格子的图像，并且Δ香港特别行政区可能需要在0.2–0.3范围内调整参数。当前方法最大的弱点可能是它依赖于能够使用完整的点列表执行初始索引步骤。然而，实际上，即使存在四个不同的晶格，散射矢量的一维FFT也显示出明显的峰值，表明实际空间的晶格矢量。在非常具有挑战性的情况下，在计算一维FFT之前，可以对投影的散射矢量应用过滤器，消除那些不属于明显簇的散射矢量；这可能会进一步提高成功率。

识别不同晶格的能力在很大程度上取决于它们在方向上的分离。如果这仅为1–2°（对应于分裂晶体情况），则很难确定属于不同晶格的斑点的真实斑点质心，因为它们可能部分重叠，尤其是在低分辨率下。这可以解释为什么在§6.3.2. 在这种情况下，需要进一步努力找到最佳方法。

即使正确识别了多个晶格，但在适当考虑所有晶格的情况下对图像进行后续整合也是一项挑战。目前正在进行将多个晶格数据与莫斯弗姆/iMosflm公司.

7.项目可用性

的多晶格索引版本莫斯弗姆该套件目前由作者以beta版本提供。该程序的下一个主要版本将包括多个晶格索引选项，也可以从中央对手方清算所4个网站(网址：https://www.cp4.ac.uk).

附录A

畸变惩罚的计算

失真惩罚的计算方法如下DPS（分布式电源系统）程序（Steller等。, 1997)，但为了完整性，下面将详细描述。推导来源于对44个晶格特征的分析（参见Wolff，2006 ).

对于还原电池由向量定义一,b条,c（c），根据表示的“goodness-of-fit”参数计算结果自动索引表中显示的不同格数的惩罚Ω_总数它由三个部分组成，

$[\Omega_{\rm-tot}=\Omega{\rm-general}+\Omeca{\rm group}+\O mega{\rm lattice\_number}]$

第一个可以写成

$[\Omega_{\rm-general}=\Omega{\rm gen1}+\Omeca{\rm-gen2}，]$

哪里

$[\eqalign{\Omega_{\rm gen1}&=\max（0，{\bfa}\cdot{\bf-a}-{\bfb}\cdot{\bf b}）+\max bf-b}）+\max（0,2|{\bf-a}\cdot{\bfc}|-{\bfa}\cdot{\bf a}）\cr&\\quad+\\max$

Ω_第2代取决于单元类型，而单元类型又由T型，其中

$[T=（{\bfa}\cdot{\bfb}）$

对于T型>0（I型）

$[\Omega_{\rm gen2}=-[\min（0，{\bf-b}\cdot{\bf c}）+\min$

和用于T型≤0（II型）

$[\eqalign{\Omega_{\rm gen2}=\&\max（0，{\bf-b}\cdot{\bf c}）+\max cdot{\bf-b}|）-（{\bfa}\cdot{\ bfa}+{\bfb}\cdot{\bf b}）].}]$

Ω_组根据特征晶格所属的四组中的哪一组进行计算。这些组对应于一 = B类=C类（第1组），一=B类（第2组），B类=C类（第3组）或无条件（第4组），其中

$[\eqalign{A&={\bfa}\cdot{\bf-A}，\cr B&={bf-B}\cdot{\bf B}，\ cr C&={\bf-C}\cdote{\bfc}.}]$

对于第1组，

$[\Omega_{\rm group}=|{\bfa}\cdot{\bf-a}-{\bfb}\cdot{\bf b}|+|{\Bfb}\ cdot{\bf b}-{\ bf c}\cdote{\bfc}|]$

对于第2组，

$[\Omega_｛\rm group｝=|｛\bf a｝\cdot｛\bf a｝-｛\bf b｝\cdot｛\bf b｝|。]$

对于第3组，

$[\Omega_{\rm group}=|{\bf-b}\cdot{\bf b}-{\bf-c}\cdot{\bfc}|.]$

对于第4组，

$[\Omega_{\rm组}=0.]$

最终分量取决于晶格数，由下式给出

$[\Omega_{\rm lattice\_number}=|{\bf-b}\cdot{\bf c}-d|+|{\bf a}\cdot{\bv c}-e|+|}\bf a}\ cdot{\ bf b}-f|，]$

哪里d日是列标题下对应格数的参数D类在表9.2.5.1中国际晶体学表体积一,e（电子）是列下的参数电子和（f）是列下的参数F类.

的值Ω_总数对于不同的格，将其归一化为最大值999。

致谢

作者希望感谢菲尔·埃文斯对手稿的批判性评论，以及文基·拉马克里希南、尤金·瓦尔科夫和布鲁诺·克拉霍尔茨提供的图像。这项工作得到了CCP4、医学研究委员会（U105184325）和BBSRC（BB/F020384/1）的支持。

工具书类

Arndt，U.W.&Wonacott，A.J.（1977年）。编辑。晶体学中的旋转方法。阿姆斯特丹：北荷兰。谷歌学者
 Battye，T.G.G.、Kontogiannis，L.、Johnson，O.、Powell，H.R.和Leslie，A.G.W.（2011）。《水晶学报》。D类67, 271–281. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Campbell，J.W.（1998）。J.应用。克里斯特。 31, 407–413. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Evans，P.R.（2011）。《水晶学报》。D类67, 282–292. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Higashi，T.（1990年）。J.应用。克里斯特。 23, 253–257. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Kabsch，W.（1977年）。J.应用。克里斯特。 10, 426–429. 交叉参考 IUCr日记账科学网谷歌学者
 Kabsch，W.（1988年）。J.应用。克里斯特。 21, 67–71. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Kabsch，W.（1993）。J.应用。克里斯特。 26, 795–800. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Kim，S.（1989年）。J.应用。克里斯特。 22, 53–60. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Otwinowski，Z.&Minor，W.（2001）。国际晶体学表，卷。F类由M.G.Rossmann和E.Arnold编辑，第226-235页。多德雷赫特：Kluwer学术出版社。谷歌学者
 Paithanhar，K.S.、Sörensen，H.O.、Wright，J.P.、Schmidt，S.、Poulsen，H·F.和Garman，E.F.（2011）。《水晶学报》。D类67, 608–618. 科学网交叉参考中国科学院 IUCr日记账谷歌学者
 Powell，H.R.（1999）。《水晶学报》。D类55, 1690–1695. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Sauter，N.K.、Grosse-Kunstleve，R.W.和Adams，P.D.（2004）。J.应用。克里斯特。 37, 399–409. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Sauter，N.K.和Poon，B.K.（2010年）。J.应用。克里斯特。 43, 611–616. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Sauter，N.K.和Zwart，P.H.（2009）。《水晶学报》。D类65, 553–559. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Steller，I.、Bolotovsky，R.和Rossmann，M.G.（1997年）。J.应用。克里斯特。 30, 1036–1040. 科学网交叉参考中国科学院 IUCr日志谷歌学者
 Vriend，G.和Rossmann，M.G.（1987）。J.应用。克里斯特。 20, 338–343. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Wolff，P.M.de（2006）。国际晶体学表，卷。一由T.Hahn编辑，第750–755页。多德雷赫特：Kluwer学术出版社。谷歌学者

这是一篇根据知识共享署名（CC-BY）许可证，允许在任何媒体上不受限制地使用、分发和复制，前提是引用原始作者和来源。

生物学的
结晶学