2.一般缩放方法
这里提出的方法是缩放方法的推广,其中应用了参数化缩放校正,例如,使用每批数据的缩放和温度因子(Fox&Holmes,1966; 斯图亚特和沃克,1979年; 埃文斯,1993年). 该方法将指数模型的概念(Della-Pietra等。, 1997). 使用一组参数计算单个测量的比例因子第页我:
(f)我是给定观测的实验条件的预定义建模函数第页我指定先验的未知参数。这个我是层次索引的缩写,它在这里描述了给定物理效果的校正类型和描述此校正的函数的参数索引。一些功能(f)我在(6)可以直接从特定物理效应的描述中得出,例如多读出通道CCD探测器中单个放大器增益的误差(参见§2.1.2). 表示未知但平滑的函数,例如描述晶体中吸收的函数(参见§2.1.3),基本函数的组合(f)我并且可以使用一组参数。平滑函数的值,而不是第页我系数可以用物理术语解释。
指数建模方法的优点是在处理参数之间的相关性时具有灵活性,并且可以统一描述各种缩放模型的参数优化过程。
2.1. 参数化
比例因子用于描述晶体衍射、实验系统,并校正积分步骤中的潜在近似误差。
在晶体衍射层面上,主要问题是衍射前后晶体中的吸收(Kopfmann&Huber,1968); Huber&Kopfmann,1969年; 斯图亚特和沃克,1979年; Schutt&Evans,1985年).
典型的仪器问题是:光束波动(Stupakov&Heifets,2002); 旋转轴位置误差;探测器校准误差(泰特等。, 2000); 导致非均匀晶体旋转和快门错误的机械问题(Evans,1993).
积分程序对衍射光斑的形状和大小进行了一定的假设。由于反射尾延伸超过假定形状,晶体镶嵌和改变光斑形状可能导致衍射强度的系统低估。不完善的轮廓形状预测也会导致系统效应(Diamond,1969; 莱斯利,1999).
用比例因子描述的特定效应源的参数化,在描述其他物理现象或近似误差时可能非常有效,因此,参数的精确值可能没有简单的物理解释。例如,光束强度校正也可以校正晶体曝光体积的变化。
2.1.1。洛伦兹因子误差
应用建模函数的一个示例是校正晶体旋转轴的实际方向和假设方向之间的微小差异。不准确会导致洛伦兹因子的计算值出现错误。可以使用参数描述校正此错误的比例因子第页我,其值表示较小的角度误差,相应的函数为
2.1.2. 取决于探测器上Bragg-peak位置的修正
特定于探测器的校正对于测量非常微弱的相位信号非常重要。一个非常小的修正(大约1%的量级)对于弱异常散射体的相位调整至关重要。即使探测器灵敏度已正确校准,它也可能会随着时间而改变。对于具有多通道读出的探测器,上述问题最可能的根源是放大器增益的相对变化。放大器校正由与单独通道读出的CCD区域相对应的特征函数表示:
参数第页d日一,j个是放大器增益相对变化的对数。
其他检测器校正需要一个平滑函数,该函数可以用一系列基函数来描述。一种可能性是使用二维傅里叶-贝塞尔级数(Weissman,1982); 或者,可以使用二维切比雪夫多项式或二维余弦(Boyd,1991). 最后一个选项转换检测器坐标(x个,年)在广场上。对于坐标转换值,建模函数为
哪里d日,n个,米是层次索引的组件我来自(6).
上述功能已用于有效校正成像板读出过程中的信号衰减。为了校正两个印版扫描仪中印版之间的差异,需要一个额外的索引来描述单个印版的单独校正。
取决于光点位置的平滑函数也可以校正其他现象,例如吸收的非旋转分量、不正确的极化和积分的系统误差。在从镶嵌晶体收集到的振荡范围较大的衍射数据中,沿旋转轴衍射的反射具有畸变的光斑形状。这种点状变化导致积分误差,积分误差随着旋转轴投影到探测器上的距离而减小。在纠正这种影响时,发现一个有用的函数是
哪里(f)我是描述洛伦兹因子误差的函数[方程式(7)]和一是一个稳定因素(合理值一 = 5).
在各向异性镶嵌的情况下,可以对符号进行不对称校正(f)我(水平旋转轴的左/右区分)。这可以通过使用两个函数而不是(10)中的函数来实现:
哪里步是一个阶跃函数,负参数为零值,正参数为一。
2.1.4. 每批数据的总体规模
这个比例因子描述了不同物理效应的产物:光束强度、照明晶体体积和平均吸收。它具有简单的建模功能:
参数第页秒j个 是批次比例因子的对数j个.
2.1.5. 衰变描述为B类因素
分辨率相关的晶体衰变可以用温度因子来描述,温度因子是累积辐射剂量的函数。这种依赖性可以明确表述:
哪里(f)第页b条对于n个=1描述了一种线性相关性,可以添加高阶项来描述更复杂的辐射衰减行为。或者,传统方法是对批量数据分别应用温度系数:
参数第页b条j个 是批次的温度系数j个.
2.1.6. 晶体旋转和/或曝光不均匀
旋转法(Arndt&Wonacott,1977))假设曝光在角度范围内是恒定的。导致曝光不均匀的因素有:晶体测角仪中的齿轮错位、光束波动和X射线快门定时误差。不均匀曝光可以在图像之间重现,也可能具有随机成分。曝光波动可再现部分的校正是确定的,其描述需要相对较少的参数。由于描述随机成分需要大量参数,因此对随机成分的校正可能存在问题。应消除随机波动,而不是通过缩放进行校正。校正随机变化的主要价值可能在于它作为一种强大的诊断工具,可以检测出未被识别的仪器问题。
不均匀曝光可以用基于测角仪角度正弦和余弦的函数序列来描述对应于布拉格峰中心的衍射条件。不均匀曝光的校正必须对特定反射衍射的角度范围内的曝光变化进行平均。角度范围不仅取决于镶嵌性,还取决于穿过Ewald球体的反射的几何形状。
由机械间隙或快门误差引起的曝光的可再现不均匀性可以用一系列频率来描述克=n个t吨,其中和是旋转范围。对于特定周期克,建模功能为:
哪里
对于高斯镶嵌轮廓,平均因子A类应为取决于系数的高斯函数c。的表达式A类有效地近似高斯函数,但也可以近似其他镶嵌形状的平均值。镶嵌形状函数的平均值由两个参数描述,一和b条,其值往往分别接近1和0。对于不寻常的强度曲线形状,一和b条可能需要进行优化。要描述随机波动,可以使用以下术语,其中克=n个t吨/2和n个从1变为最大值。参数第页u个,克,c,j个对每个数据帧都是独立的j个.对应的术语n个= 0与每批数据的比例因子相同(见§2.1.4).
平均曝光变化的结果是降低了高频波动的影响。例如,步进电机产生的波动与电机步长除以齿轮比(通常为0.01°或更小)相对应。对于典型镶嵌的晶体,这种高频波动的后果可以忽略不计。极低频的波动通过每批的比例因数进行校正j个中间角标度的波动受(16)影响最大.
3.比例因子优化
缩放程序确定参数第页我[方程式(6)]通过一种方法,其中-类目标函数被最小化。目标函数描述了由测量误差预期加权的对称相关反射之间的一致性。根据是比较强度还是对数,可以生成两个类似的目标函数。
3.1、。产生完全线性方程的对数目标函数
通过比较标度测量值的对数(Rae,1965),可以得到一个在实践中运行良好且其优化总是在一个周期内收敛的函数). 首先,我们定义第页作为未知比例因子的对数k秒:
然后P(P)米是测量强度的对数我米对于给定的观察:
哪里P(P)秒是缩放观测值的对数。
强度误差估计可用于计算强度对数和相应权重的误差估计u个用最小二乘法:
对称相关观测的几何平均值的对数P(P)平均值[方程式(20)]是
哪里n个是唯一的对称性相关观测值的指数香港特别行政区在目标函数中,我们最小化了对称相关测量的标度强度对数和标度几何平均值之间的平方差:
利用多元牛顿法可以求出目标函数的极小值。一阶和二阶导数很容易计算。一阶导数的计算依据为第页然后,使用链式法则,求出关于参数的导数第页我计算如下:
关于的二阶导数第页是
因为第页是未知参数的线性函数第页我:
目标函数关于的一阶导数第页我是
值得注意的是,关于第页我因为对数目标函数是常数,与参数无关第页我[方程式(23)和(25)]. 在这种情况下,解由单个矩阵方程给出,无需对参数值进行初始猜测。
3.2. 备选方案精炼比例因子
寻找比例因子的传统方法是基于一个等式,在该等式中,比例因子的倒数而不是对数出现,并且我们使用算术而不是强度的几何平均值:
哪里k秒是比例因子,是估计误差我米和是给定反射的平均强度香港特别行政区.
关于的一阶导数和二阶导数的计算k秒遵循与对数函数相同的逻辑。一阶导数:
和二阶导数:
哪里.
然而,公式
当在牛顿法中用作二阶导数时,由于它在目标函数的最小值处更好地逼近二阶导数,因此具有更好的收敛性。
因为在这种情况下,二阶导数对于k秒牛顿法必须迭代使用。
目前尚不清楚由对数或传统方法确定的比例因子是否或何时更好,但即使在人们更喜欢传统方法的情况下,由于对数函数具有优越的收敛性,因此最好使用对数函数运行第一个循环。
3.3. 基于修正量先验知识的稳定性描述
对于没有冗余的反射,比例因子是从其他测量中推断出来的。通常,如果没有额外的限制,对于高度相关的参数,外推是不稳定的。在本文提出的方法中,约束可以从关于细化参数合理大小的先验知识中获得。它背后的逻辑与原子中约束背后的逻辑相同精细化。例如,可以假设标度因数的对数的波动通常不超过w个秒帧之间,其中预期w个秒是数据采集稳定性的函数(光束稳定性、测角仪和/或晶体振动)。通过向正在优化的函数添加惩罚项来描述此知识:
哪里第页秒j个 是批次比例因子的对数j个.
我们可以类似地处理关于吸收系数大小的期望。对于高阶球面谐波的平滑吸收,期望参数的大小减小[方程(21)]],将合理的惩罚项添加到目标函数中[方程式(21)]]是
如果我们不想对高阶术语进行更多处罚,我们可以使用以下术语:
以类似的方式,可以创建惩罚项并用于约束所有其他缩放参数。
4.讨论
4.1. 成功标准
缩放有效性的主要标准来自分析的后续阶段:合并、分阶段等.,在别处描述。在缩放过程中,我们只能判断目标函数的收敛性和值-整体.
上述基于对数目标函数的方法总是在一个周期内收敛。因此,下一步——合并——总是可以完成的,即使是有问题的数据。整体价值较高其本身并不能区分是由于异常信号、低质量数据还是不合理的误差模型。通过比较缩放对称性相关数据,可以计算各种统计数据,以确定数据质量的潜在问题,以及误差模型或衍射中存在的非同构现象。
合并分析可能会分离出由于异常和色散效应、辐射引起的变化、晶体之间的非同构性以及伪对称。在结构因子不恒定的情况下,通常最好在确定比例因子时忽略这种可变性,并对反射进行缩放,但在合并时将其分离(Evans,1993; Otwinowski&Minor,2000年). 错误模型的重新确定、后求精和异常值的拒绝可能会影响对要缩放的数据的假设,因此在执行这些步骤后可能值得重新缩放。
在下面的示例中,结构因子是稳定的,测量误差低于大多数实验中的测量误差。使用每批数据的尺度和温度因子进行传统缩放,得到了优于平均值的合并统计数据,但对于反常散射来自固有硫。应用上述缩放校正改善了合并统计数据,并导致中等分辨率的显著异常信号(表1).
| 传统的缩放 | 更正后 | 分辨率外壳(Å) | R(右)米M(M) | χ2M(M) | R(右)米U型 | χ2U型 | AS公司 | R(右)米M(M) | χ2M(M) | R(右)米U型 | χ2U型 | AS公司 | 20.00–4.33 | 0.014 | 3.75 | 0.017 | 2.71 | 1.38 | 0.010 | 2.57 | 0.006 | 0.97 | 2.65 | 4.33–3.44 | 0.019 | 4.20 | 0.020 | 4.42 | 0.95 | 0.009 | 1.60 | 0.006 | 0.94 | 1.71 | 3.44–3.01 | 0.024 | 3.26 | 0.025 | 3.74 | 0.87 | 0.012 | 1.47 | 0.009 | 1.05 | 1.39 | 3.01–2.73 | 0.028 | 2.57 | 0.030 | 2.88 | 0.89 | 0.017 | 1.36 | 0.013 | 0.98 | 1.39 | 总体 | 0.023 | 1.98 | 0.027 | 1.98 | – | 0.017 | 1.39 | 0.012 | 1.03 | – | | |
4.2. 全局和局部缩放
全局缩放之后可以进行局部缩放(Matthews&Czerwinski,1975). 局部缩放主要用于计算相位信号的差异,其中假设一组测量值,例如在互易空间或在探测器空间内,应具有类似的比例。指数建模的灵活参数化可以很好地描述各种平滑修正。就校正的平滑变化类型而言,局部缩放的限制要大得多,因此不太可能为此处描述的一般缩放方法提供额外的好处。
4.3. 乘法缩放无法纠正的相关问题
基本方程(1)假设一个晶体的缺陷程度可以忽略不计。更完美的晶体需要对消光进行非线性校正。然而,晶体通常不仅仅是“理想的不完美”(吉尼尔,1994年). 偏离结晶度可能会导致扩散散射、额外调制(不公度结构)、堆叠紊乱、产生斑点重叠的大镶嵌,孪生 等样品也可能被其他晶体或冰污染。这些问题可能需要使用已经缩放的数据进行进一步分析,但结果可能会影响关于要缩放的数据的假设。在误差模型发生变化或异常值被拒绝的情况下,可能需要迭代。
缩放的目的之一是校正测量系统中的合理程度的缺陷。这样的程序还可以尝试纠正导致确定的比例因子表现不明显的严重问题。例如,对光束光阑的描述不正确或缺失,会产生类似于以下区域中非常大的吸收的效果倒易空间。平滑变化的吸收校正将不仅对波束阻挡器后面的区域,而且对距离波束阻挡器一定距离处的反射产生较高的吸收估计。这些问题不应通过缩放来纠正,而应通过应用适当的实验程序来纠正。
4.4. 探测器校准
刻度测定的目的可以是校准仪器,而不是结构确定。为此,人们可以使用高质量晶体的衍射图案,但使用人造图案更好。特别是,网格掩模不仅可以用于畸变校准,还可以用于除洪水场法之外的探测器灵敏度校准。灵敏度校准也可以定义为寻找乘法尺度函数的问题,因此可以如上所述以类似的方式对其进行参数化和确定。这可能有助于解决文献(Tate等。, 2000).
致谢
这项工作得到了美国国立卫生研究院GM53163拨款的支持。作者感谢珍妮特·史密斯(Janet Smith)和明孙·李松(MinSun LeeSong)提供了这里呈现的衍射数据,感谢哈尔什卡·沙诺科卡(Halszka Czarnocka)帮助编写手稿,感谢米沙·马基乌斯(Mischa Machius)的广泛评论和激励性讨论。
工具书类
Arndt,U.W.&Wonacott,A.J.(1977年)。晶体学中的旋转方法阿姆斯特丹:北荷兰。 谷歌学者
Azároff,L.(1955)。《水晶学报》。 8, 701–704. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
《祝福》,R.H.(1995)。《水晶学报》。A类51, 33–38. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Boyd,J.P.(1991)。切比雪夫和傅里叶谱方法。纽约州米诺拉市:多佛。 谷歌学者
Della-Pietra,S.、Della-Peetra,V.和Lafferty,J.(1997)。IEEE传输。模式分析.19, 380–393. 交叉参考 科学网 谷歌学者
Diamond,R.(1969年)。《水晶学报》。A类25, 43–55. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
Evans,P.R.(1993年)。数据缩减:数据收集和处理,由L.Sawyer、N.Isaacs和S.Bailey编辑。《达累斯伯里CCP4研究周末会议录》,第114-123页。达斯伯里实验室,英国沃灵顿。 谷歌学者
Fox,G.C.和Holmes,K.C.(1966年)。《水晶学报》。 20, 886–891. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
Guinier,A.(1994)。晶体、缺陷晶体和非晶体的X射线衍射。纽约:多佛。 谷歌学者
Huber,R.和Kopfmann,G.(1969年)。《水晶学报》。A类25, 143–152. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
Katayama,C.(1986年)。《水晶学报》。A类42, 19–23. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Kopfmann,G.&Huber,R.(1968年)。《水晶学报》。A类24, 348–351. 交叉参考 IUCr日志 科学网 谷歌学者
Leesong,M.、Henderson,B.S.、Gillig,J.R.、Schwab,J.M.和Smith,J.L.(1996)。结构,4, 253–264. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Leslie,A.G.W.(1999)。《水晶学报》。D类55,1696年至1702年科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Matthews,B.W.和Czerwinski,E.W.(1975)。《水晶学报》.A31, 480–487. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
Otwinowski,Z.&Minor,W.(1997年)。振荡模式下X射线衍射数据的处理.英寸酶学方法第276卷,由J.C.W.Carter和R.M.Sweet编辑。纽约:学术出版社。 谷歌学者
Otwinowski,Z.和Minor,W.(2000年)。Denzo和Scalepack.英寸国际结晶学表第F卷,M.G.Rossman&E.Arnold编辑。多德雷赫特:克鲁沃。 谷歌学者
Rae,A.(1965年)。《水晶学报》。 19, 683–684. 交叉参考 IUCr日志 科学网 谷歌学者
Rossmann,M.G.,Leslie,A.G.W.,Abdel Meguid,S.S.和Tsukihara,T.(1979年)。J.应用。克里斯特。 12, 570–581. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
Schutt,C.E.和Evans,P.R.(1985年)。《水晶学报》。A类41, 568–570. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Stuart,D.&Walker,N.(1979年)。《水晶学报》。A类35, 925–933. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
Stupakov,G.和Heifets,S.(2002年)。物理学。修订规范顶部。Ac.5,编号054402谷歌学者
Tate,M.W.、Eikenberry,E.F.和Gruner,S.M.(2000)。CCD探测器.英寸国际结晶学表第F卷,M.G.Rossman&E.Arnold编辑。多德雷赫特:克鲁沃。 谷歌学者
Weissman,L.(1982)。提取异形和异常信号的策略。计算晶体学由D.Sayre编辑。牛津:克拉伦登出版社。 谷歌学者
©国际结晶学联合会。如果引用了原文作者和来源,则无需事先获得许可即可复制本文中的简短引文、表格和数字。有关详细信息,请单击在这里.
| 基础 进展 |
国际标准编号:2053-2733