2.基于一维FFT的索引
所有索引程序都依赖于使用振荡方法记录的衍射图像这一事实(Arndt&Wonacott,1977
)是的扭曲投影互易空间(进动相机的机制使它们能够产生不失真的投影,但由于它们依赖于精确定向的晶体,所以现在很少使用它们)。The geometry of the埃瓦尔德球体可以使用构造将测得的点坐标映射回产生该点的倒格子点(rlp)的坐标(图1
).
| 图1 Ewald球体构造。晶体位于Ewald球体的中心(O(运行)),X射线束沿着X(X)轴和原点倒易点阵(问)位于X射线束离开埃瓦尔德球体。实验室坐标系由表示的正交轴组定义X(X),年,Z轴主轴平行于Z轴.位于平行于YZ公司平面显示为位于埃瓦尔德球体,产生一组衍射光束(虚线),在平面探测器上形成一组圆圈上的斑点。X(X)d日,年d日定义探测器坐标系。其中一个倒数晶格点的散射矢量显示为粗线。 |
只有当rlp正好位于埃瓦尔德球体。实际上,各种效果(晶体镶嵌、,波长色散,光束发散)导致rlp具有有限的尺寸,因此当rlp的(中心)明显远离埃瓦尔德球体。原则上,通过测定实验值可以将这些误差降至最低φ质心(其中φ表示主轴旋转角度),但实际上很少执行此操作(尽管随着快速读出检测器的出现,这现在完全可行)。
真实中的不确定性φ斑点的值会导致计算的散射矢量中出现误差,误差的大小主要取决于晶体的镶嵌性和图像的振荡角度。这反过来又会影响索引的稳健性,尤其是对于高度镶嵌的晶体或结合大单位-细胞参数的中度镶嵌。在这两种情况下,相邻的新月会在衍射图像中重叠,从而导致索引的模糊性。
基于一维FFT的索引算法在其他地方有详细描述(Steller等。, 1997
; 鲍威尔,1999年
),但此处概述了所涉及的一般原则。使用的几何图形埃瓦尔德球体构造时,将点坐标(相对于直接光束位置)转换为无量纲倒格子散射矢量(秒)使用
哪里X(X)d日,年d日是探测器坐标系中测得的点坐标,以及D类是晶体到探测器的距离。这个埃瓦尔德球体在无量纲倒数格子中工作时,半径是一个单位。如前所述φ点的值未知,因此假设φ所有点的值对应于振荡范围的中点。如果使用两个或多个图像,则散射矢量必须参考公共φ原点使用
其中矩阵[Φ]对应于绕主轴旋转一个角度φ.
为了说明基于一维FFT的索引的基本原理,请考虑图2中所示的衍射模式
(一),其中晶体已定向,使其中一个晶体轴沿X射线束方向对齐(X(X)实验室框架的轴线)。由此产生的衍射图案由一系列圆月组成,圆月中心位于直边位置。当从点位置导出的散射矢量投影到X(X)轴上,与位于同一个圆月内的点相对应的所有投影散射矢量将具有相同的长度(在实验误差范围内)。因此,所有斑点的投影散射矢量将沿X(X)轴。由于这些簇的周期性,这些投影散射矢量的傅立叶变换将给出一系列大峰值(图2
b条). 傅里叶变换还提供了互易空间(对应于投影散射矢量)到实际空间,第一个(非原点)峰值将出现在提供平行于X射线束的晶体轴长度的间距处。
| 图2 一维FFT索引。(一)定向核糖体晶体的衍射。晶体的定向使实际空间轴沿着X射线束,因此衍射图样显示出位于一系列圆月上的斑点,圆月中心位于直射位置。(b条)沿实际空间轴方向投影的散射矢量的傅里叶变换示例。在此示例中,轴向长度为~62º。 |
现在考虑将散射矢量投影到与X(X)轴。在这种情况下,位于同一圆月上的点将产生不同长度的投影散射矢量,因此投影散射矢量的分布将趋向于连续分布,而不是规则重复的簇。在这种情况下,投影散射矢量的一维FFT不会产生任何显著高度的峰值,因为没有潜在的周期性。
这一结果使我们能够确定晶体在任意方向上(低阶)实际空间轴的方向,而不是上述特定方向。投影散射矢量的一维FFT是在投影轴的整个方向范围内进行的,对整个半球进行采样。然后,已知在一维FFT中产生大峰值的方向对应于实际空间轴的方向,第一个非原点峰值的位置给出了实际空间轴长度。实际上,在方向的第一次粗采样中定位出重要的FFT峰值后,使用步长依次较小的方向网格搜索来准确确定实际空间轴方向(Powell,1999
). 然后给出了下一步中使用的一系列实际空间向量。在莫斯弗姆默认情况下,会选择FFT峰值最大的30个向量(如果向量共线,则会删除较长的向量)。从该列表中选择三个矢量并用于导出方向矩阵[一],然后使用
其中,包括小时'通常不是整数。三个派生索引中任意一个的反射数(小时,k个或我)确定与整数的偏差小于阈值(0.3)。对所有可能的矢量组合重复该过程[一]产生最小拒绝次数而没有明显更大拒绝次数的矩阵单位电池被选为最佳解决方案。
一旦确定了最佳解决方案还原电池是经过计算的(Kim,1989
)并用于使用表中列出的44个晶格字符的变换来确定来自较高对称晶格的失真惩罚国际晶体学表体积一(见附录一
). 对于畸变惩罚小于50的所有晶格,根据观察到的点位置,对单元胞参数、直射束位置和晶体到探测器的距离进行细化,并在精细化,并确定观测点位置和计算点位置之间的均方根误差(r.m.s.d.)。精炼晶体到探测器的距离通常仅适用于高分辨率数据(>2º),因为它与单位-细胞参数高度相关。格子如表所示(图3
)该程序将突出基于失真惩罚和r.m.s.d.值的最可能解决方案。
| 图3 索引结果如所示iMosflm公司。对于每个解决方案,都会列出晶格类型、畸变惩罚和单位-细胞参数(单位为Ω和度)。对于惩罚小于50的溶液,点位置的均方根误差[表示σ(x个,年),单位mm]和inφ[表示σ(φ),单位为度]和直梁位置的位移[表示δ(梁),单位:mm]。最可能的解决方案以灰色突出显示。 |
重要的是要注意,由于索引完全基于点位置,因此只有关于单位电池获得;真正的对称性只能通过强度来确定(例如,通过使用程序无意义; 埃文斯,2011年
)目前还没有可靠的强度估计值。因此,伪对称很容易被误导:例如,具有β≃90°或具有两个相似单位-细胞边缘的正交细胞。r.m.s.d.值可用于帮助识别伪对称性,经验表明,如果惩罚较低的溶液的r.m.s.d大于1.3×r.m.s.d。对1(其中r.m.s.d。对1是三斜解的r.m.s.d.值),则可能是一个伪对称解。
3.成功的要求
从探测器坐标到倒置晶格点的映射依赖于波长、晶体到探测器距离以及最重要的直接光束位置的精确值。实际上,最后一个很可能是不准确的。索引可以成功,只有30个点,但几百个是理想的。即使包含由冰、锌块或热像素衍射产生的相对较少的“假”斑点,也会影响索引,因此,应根据斑点大小、强度和分辨率采取措施排除可能的假斑点,通常只使用强斑点。在φ(90°是理想的)可以显著提高在困难情况下的成功率,并且在所有情况下,都将导致更好地确定单位-细胞参数作为更广泛的部分互易空间正在进行采样。
如前所述,如果大晶体镶嵌导致月牙重叠,也会导致问题。未完全解决的斑点可能会导致斑点查找问题,导致斑点位置不准确。虽然通过基于局部最大值的点定位可以将这些误差降至最低,但可能有必要针对具有挑战性的情况调整点定位参数。
最后,在图像中存在多个晶格的情况下,通过仅选择最强点进行索引,通常可以成功索引最强的晶格。索引多重格的最新发展在§
6
4.判断索引的成功
目视检查是评估索引是否正确的最佳方法。假设马赛克扩散为零,并不是所有的斑点都可以预测,但月亮的形状应该匹配。通过模式匹配估计马赛克扩散通常会使比较更容易,但需要谨慎,因为如果预测错误,则估计的马赛克传播可能太大。
当目视检查预测时,重要的是检查所选单元格是否不是真实单元格的子倍数。例如,如果伪平移对称导致交替的强衍射和弱衍射,则如果仅在索引中使用强点,则相应的单位-细胞参数可能会是其正确值的一半。
正确的解决方案应该具有较低的惩罚(通常小于20)。r.m.s.d.值也是一个很好的指标,尽管其实际值取决于许多参数。对于形状良好的衍射点,值在0.05 mm之间(镶嵌度和光束发散度低,探测器像素尺寸小,例如同步加速器光束线上的CCD)和0.2 mm(高光束发散度和/或大像素尺寸,例如实验室光源上的图像板)是典型的。然而,对于由于分裂晶体或非常高的马赛克扩散而导致的不良斑点形状,对于正确的解决方案,r.m.s.d.可能超过1.0 mm,而对于良好的斑点形状,这样高的残余几乎肯定表示索引不正确。这有助于强调目视检查的重要性。
5.使用索引时的实际问题iMosflm公司
成功的索引取决于获得可靠的点列表,因此值得检查要使用的点。这些在图像显示中显示为用于索引的反射的红色十字,而黄色十字表示低于电流的斑点我/σ(我)阈值。对于衍射强的图像,阈值自动设置为20,对于衍射弱的图像,则阈值降低为10或5。如果斑点分辨率较差或由多个成分组成(由于晶体分裂),则可能需要调整斑点填充参数以获得最佳斑点位置。在分离斑点的情况下,最有用的调整参数是最小斑点间距,应将其设置为近似斑点尺寸(单位:毫米)。
5.1. 选择要索引的图像
默认情况下,两幅图像用于索引,在φ尽可能地。值得检查第二张图像的质量,尤其是在完整数据集末尾收集的图像,因为辐射损伤可能导致光斑形状很差或衍射很弱,这两种情况都可能导致索引困难。在某些情况下,晶体缺陷(例如无序或多格子)将仅在两个图像中的一个中可见,并且在使用这两个图像都失败时,仅选择更好的图像可以获得成功的索引。然而,使用两幅图像通常是有益的,因为它提高了索引的成功率,并将产生更准确的单位-细胞参数。对于低对称性空间群(单斜或三斜),使用单个图像进行索引可能会产生模糊的结果,不同的单位-细胞参数对该图像的预测同样好;如果使用额外的图像,这种模糊性通常会得到解决。目前,没有尝试改进对φ质心(当在相邻的两幅图像上的同一位置发现衍射点时)φ,当使用多个图像进行索引时,建议在φ.
5.2. 直臂位置
当图像本身质量良好时,不准确的直尺坐标是索引失败的最常见原因。直拍位置可以显示在图像上(作为绿色十字),因此检查它是否处于合理位置很容易,即大约位于直达停车阴影的中央。如有必要,可将直射光束拖动到合理的起始位置,并进行二维搜索,在该搜索中尝试在位置网格上进行索引(默认情况下,距离起始位置0.5 mm±2步)。给出了一个汇总索引结果的表格,其中正确的解决方案通常是给出最小r.m.s.d.误差的解决方案。当使用两幅图像(理想情况下相隔90°)时,此搜索通常更具辨别力。在选择正确的解决方案时,有必要拒绝那些单位-细胞参数比其他解决方案大得多的解决方案,因为即使对于错误的解决方案来说,这些解决方案也会产生较低的r.m.s.d.值。如果多个起始直边坐标产生相同的细化值,这是成功的良好指标,但与标准分度程序一样,目视检查提供了识别正确解决方案的最佳方法。当单位电池较大时,可能存在多个具有非常相似r.m.s.d.值的解决方案,对应于沿长轴的分度变化±1或甚至±2。在这些情况下,假设预测看起来很好,可能需要整合一些数据,然后运行程序无意义(埃文斯,2011年
)根据R(右)因子或相关系数。
5.3. 主轴旋转方向
分度失败的另一个可能原因是主轴旋转方向与大多数光束线上使用的方向相反。这是伦德MAX-lab、阿贡国家实验室先进光子源、上海同步辐射设施和墨尔本澳大利亚同步加速器的一些束线的情况。这种情况的一个有用指标是,使用单个图像进行索引是成功的,但使用两个或多个图像时会失败。此外,成功索引单个图像后,相邻图像的预测(Inφ)将不匹配。通过选择“实验设置”选项卡中的“主轴旋转反向”复选框,可以纠正此问题。
5.4. 带有大马赛克扩散的晶体图像
具有较大马赛克扩散的晶体(或具有较大旋转角的图像)的衍射图像可能存在困难,因为这会导致在从光斑位置映射到倒数空间矢量时出现重大错误,因为假设φ每个点的值是振荡范围的中点。在某些情况下,如果已经收集了完整的数据集,那么可能会有一些图像中的月球被更清楚地分离,并且使用这些图像进行索引可能是成功的。如果只有两个参考图像可用,则值得在中间收集更多图像φ角度和可能使用较小的振荡角度。另一种通常成功的方法是设置我/σ(我)阈值设置为50–100范围内的非常大的值,假设这仍然提供了合理数量的可用点。这一点的基础是,平均而言,最强的点是那些真实的φ这些值最接近图像振荡范围的中点,并且在假定的φ值。
5.5. 当一切都失败时
在其他索引失败的情况下,值得尝试使用我/σ(我)阈值,低于或高于默认值,或包括在φ.
6.存在多个格时进行索引
由于具有相同单位-细胞参数但方向不同的不同晶体的衍射,衍射图像中出现多个不同的晶格并不罕见。不同取向的范围可能会有很大差异,最常见的情况是分裂晶体引起的1-2°的微小差异,但也可能出现几十度的较大差异。当使用非常小(~10µm或更小)的晶体时,可能会出现后一种情况,并且X射线束中存在多个晶体。
文献中已经描述了使用多个格子索引图像的方法。在采用的方法中标签(Sauter&Poon,2010年
),尽管存在来自多个晶格的点,但假定初始索引成功地建立了完整的点列表。然后根据其计算位置和观测位置之间的差异来识别点列表中的异常值。然后根据在第一次扫描中被识别为异常值的点执行第二次索引扫描。基本上相同的方法(但使用不同的异常值识别算法)可以用于XDS公司集成程序(https://strucbio.biologie.uni-konstanz.de/xdswiki/index.php/索引). 在寓言软件包(https://sourceforge.net/apps/trac/fable),索引基于基于单位-细胞参数和晶格类型(Paithanhar等。, 2011
). Anduleit和Stuart(D.I.Stuart,个人通信)编写的软件也采用了类似的方法。
6.2. 实施
多个晶格索引已作为下拉菜单上的一个选项引入iMosflm公司接口。如上所述进行索引,结果显示在窗格的下部,每个网格都有一个单独的选项卡(图5
). 在下面的窗格中,列出了每个找到的晶格的“最佳”解决方案的晶格类型、单位-细胞参数和位置残差,以及与第一个晶格的方向差异。在这一阶段,没有尝试对不同晶格实施相同的单元-单元参数,尽管这可以在集成之前实施。高亮显示这些解决方案中的任何一个都将导致该晶格的可能解决方案的完整列表显示在窗格的上部,并且还将更新“图像”窗口中显示的预测反射。也可以更改预测反射的显示通过图像显示中的“晶格选择器”,使检查找到的每个不同晶格变得非常简单。对于,值为0.2Δ香港特别行政区通过测试实例给出了最佳性能,但此参数也可以由用户调整。
| 图5 索引窗格位于iMosflm公司显示了多重格索引的结果。每个检测到的晶格的完整解决方案集显示在标题为“晶格1,晶格2”的选项卡中等。位于窗格的上部。下半部分显示了所有检测到的晶格的“最佳”解决方案。最后一列将显示与第一个晶格(尚未实现)方向的角度差异。选择其中一个解决方案将导致该解决方案的预测反射显示在“图像”窗口中。 |
6.3. 结果
下面给出了显示多个晶格的几个衍射图案的索引示例。在某些情况下,有必要选择两幅最清晰地显示不同格子的图像,而不是使用第一幅图像和第二幅图像的默认过程,这两幅图像在φ。所有图像都是在100 K下从低温冷却晶体中收集的。在这些示例中,根据溶液预测索引图像和其他图像上出现的大多数反射的能力来评估溶液的正确性φ值。全面评估需要成功整合不同格,这是软件持续开发的目标。
6.3.2. 正交的单位电池具有较大的单元-单元参数
使用Rayonix MX300 CCD探测器在金刚石光源(DLS)的光束线I24上收集衍射数据,该光束线来自具有正交对称性和单位-细胞参数的晶体一= 118,b条= 182,c(c)= 188 Å. 振荡角度为0.5°。在这种情况下,选择了一幅显示不同晶格最清晰分离的图像进行索引,并识别出三个不同晶格(图6
c(c)和6
d日). 第二个和第三个晶格与第一个晶格的旋转角度分别为1.8°和3.5°,代表“分裂晶体”情况Δ香港特别行政区增加到0.25。一些斑点并没有被发现的任何晶格所预测,因此可能存在其他晶格。
6.3.3. 单斜晶胞
使用ADSC Q4R探测器在ESRF波束线ID14-4上以1.0°振荡角收集数据。在处使用两个图像进行索引φ=0°和φ=90°使用所有默认参数值给出了两个方向非常不同的晶格(图6
e(电子)和6
(f)). 用单个图像索引也很成功。增加的Δ香港特别行政区当两个图像都被使用时,0.25或0.3也导致两个晶格。
6.3.4. 单斜的单位电池和四个格子
由于存在大量晶格,这是最具挑战性的例子。使用振荡角为2.0°的ADSC Q315R探测器在DLS的束线I04上采集图像。必须选择用于索引的图像,以显示晶格的最清晰分离,因为某些图像上的点重叠在点查找步骤中效果不佳。无法从单个图像中对晶格进行索引,但可以从两个相隔40°的图像中进行索引φ使用默认参数值成功建立索引(图6
克和6
小时). 不同晶格的旋转范围为0.8°至9.4°。增加的Δ香港特别行政区到0.25时,只发现了两个晶格。
6.4. 讨论
尽管所采用的方法简单明了,但事实证明,多重格索引对于一系列不同的实际示例来说非常强大。为了提高成功的机会,在某些情况下可能需要选择在目视检查中最清楚地显示不同格子的图像,并且Δ香港特别行政区可能需要在0.2–0.3范围内调整参数。当前方法最大的弱点可能是它依赖于能够使用完整的点列表执行初始索引步骤。然而,实际上,即使存在四个不同的晶格,散射矢量的一维FFT也显示出明显的峰值,表明实际空间的晶格矢量。在非常具有挑战性的情况下,在计算一维FFT之前,可以对投影的散射矢量应用过滤器,消除那些不属于明显簇的散射矢量;这可能会进一步提高成功率。
识别不同晶格的能力在很大程度上取决于它们在方向上的分离。如果这仅为1–2°(对应于分裂晶体情况),则很难确定属于不同晶格的斑点的真实斑点质心,因为它们可能部分重叠,尤其是在低分辨率下。这可以解释为什么在§
6.3.2. 在这种情况下,需要进一步努力找到最佳方法。
即使正确识别了多个晶格,但在适当考虑所有晶格的情况下对图像进行后续整合也是一项挑战。目前正在进行将多个晶格数据与莫斯弗姆/iMosflm公司.
附录A
畸变惩罚的计算
失真惩罚的计算方法如下DPS(分布式电源系统)程序(Steller等。, 1997
),但为了完整性,下面将详细描述。推导来源于对44个晶格特征的分析(参见Wolff,2006
).
对于还原电池由向量定义一,b条,c(c),根据表示的“goodness-of-fit”参数计算结果自动索引表中显示的不同格数的惩罚Ω总数它由三个部分组成,
第一个可以写成
哪里
Ω第2代取决于单元类型,而单元类型又由T型,其中
对于T型>0(I型)
和用于T型≤0(II型)
Ω组根据特征晶格所属的四组中的哪一组进行计算。这些组对应于一 = B类=C类(第1组),一=B类(第2组),B类=C类(第3组)或无条件(第4组),其中
对于第1组,
对于第2组,
对于第3组,
对于第4组,
最终分量取决于晶格数,由下式给出
哪里d日是列标题下对应格数的参数D类在表9.2.5.1中国际晶体学表体积一,e(电子)是列下的参数电子和(f)是列下的参数F类.
的值Ω总数对于不同的格,将其归一化为最大值999。