研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标生物
结晶学
国际标准编号:1399-0047

我的数据有多好,分辨率是什么?

十字标记_颜色_方形_文本.svg

英国剑桥CB2 0QH希尔斯路MRC分子生物学实验室
*通信电子邮件:pre@mrc-lmb.cam.ac.uk

(收到日期:2012年9月7日; 2013年1月2日接受; 2013年6月13日在线)

在对观测到的衍射点进行积分后,“数据还原”过程最初旨在确定数据的点群对称性和可能的空间组。这可以通过程序执行无意义然后,缩放程序将所有测量值放在一个通用的刻度上,对对称相关反射的测量值进行平均(使用之前确定的对称性),并生成许多统计数据,这些统计数据提供了数据质量的第一个重要测量值。一个新的缩放程序,无AIMLESS,实现与中类似的缩放模型SCALA公司但添加了一些额外的分析。从分析中,可以对数据的质量以及是否应放弃某些测量做出一些决定。数据集的有效“分辨率”是一个困难且可能有争议的问题(尤其是对于论文的审稿人),这是根据数据处理统计数据与试验数据的比较来讨论的精炼根据观测和模拟数据,自动建模并比较不同分辨率极限下计算的地图。这些试验表明,添加超出常用限制的弱高分辨率数据可能会有所改善,而且不会造成任何危害。

1.简介

在对一组X射线衍射图像上的斑点进行积分以生成反射强度列表后,对数据执行一系列操作,通常称为“数据缩减”。这些过程包括确定点编组如果可能的话空间组,检查存在替代项的一致索引,将所有数据放在一个公共尺度上,决定是拒绝部分收集的数据还是降低分辨率,并估计结构振幅|F类|强度。关于数据内部一致性的统计数据也很好地表明了数据集的总体质量。数据简化的算法和方法在许多论文中都有很好的记录(例如福克斯与福尔摩斯出版社,1966年[Fox,G.C.&Holmes,K.C.(1966),《水晶学报》,第20期,第886-891页。]; 奥特温诺夫斯基等。, 2003[Otwinowski,Z.,Borek,D.,Majewski,W.&Minor,W.(2003),《结晶学报》A59,228-234.]; 埃文斯,2006【Evans,P.(2006),《水晶学报》,D62,72-82。】, 2011【Evans,P.R.(2011),《水晶学报》,D67,282-292。】; 卡布施,2010年【Kabsch,W.(2010)《晶体学报》D663133-144。】)这里不再赘述细节。缩放尝试校正数据采集过程中变化的实验条件对测量强度的贡献,例如入射光束强度的变化、被照明晶体的体积、主光束或次光束的吸收以及平均辐射损伤。这是通过尝试使反射强度的所有对称相关或复制的测量相等来执行的,使数据尽可能保持内部一致。

本文介绍了一种新的数据缩放程序,无AIMLESS,并讨论了确定测量数据集“分辨率”的标准。中央对手方清算所4背景(Winn等。, 2011【Winn,M.D.等人(2011),《结晶学报》,D67,235-242。】),无AIMLESS在程序后立即使用无意义,这决定了点编组并且可能空间组,以及有选择地组合来自多个文件的数据,每个文件都包含“扫描”数据,并在必要时将其放在通用索引系统中(Evans,2011【Evans,P.R.(2011),《水晶学报》,D67,282-292。】).1 无AIMLESS然后是CTRUNCATE公司,用于计算结构振幅|F类|从强度和输出的各种强度统计数据主要用于检测孪生。

2.缩放程序无AIMLESS

无AIMLESS是一种经典缩放方法的C++新实现,旨在方便添加新的缩放模型和算法。它是较早的中央对手方清算所4程序SCALA公司(埃文斯,2006年【Evans,P.(2006),《水晶学报》,D62,72-82。】, 2011【Evans,P.R.(2011),《水晶学报》,D67,282-292。】)目前使用的是非常相似的比例模型。最小化的功能是

[\textstyle\sum\limits_{\bf h}\textstyle\sum\limits\{l}{w}_{{\bfh}l}(I_{\bf h}l}-g_{\bf h}l}\langle I_{\ff h}\rangle)^{2}+{\rm参数\,\,约束\,项},eqno(1)]

哪里小时反射观测小时,小时是其相关的反比例,小时= 1/σ2(小时)和〈小时〉是所有观测值的加权平均强度反射的小时或其对称性匹配。反比例小时来自精细比例模型,是晶体旋转角度的函数φ作为主光束方向的代理1以及辐射剂量(或时间)和次光束方向2: = 初级的(φ)经验[−2B类(φ)罪2θ/λ2]第二的(2). 亲属B类-因子项主要是平均辐射损伤修正。平滑的主比例因子初级的(φ)和相对B类因素B类(φ)以适当的间隔确定φ和使用高斯权重进行插值。次光束校正第二的(2)确定为球谐项之和。参数约束项(ties)包括第二的(2),将所有球谐系数归零,并在相邻主尺度和相对尺度之间建立可选关系B类因素。

无AIMLESS迭代缩放步骤,优化每个观测值的标准误差估计σ(小时)和异常拒绝。请注意,缩放过程通常被严重高估(观测值远多于参数,例如30个参数的45000个观测值),并且弱强度不包含关于尺度的很多有用信息,因此可以通过使用选定的强反射子集来加快缩放速度(大致呈线性)。该过程中的主要步骤(在当前版本中)如下。

  • (i) 将所有观察结果读入反射列表对象(SCALA公司不存储观测值,但为每个缩放周期重新读取它们等。,因为在以下情况下存储大型数据集是不可行的SCALA公司已编写)。如有必要,将与对称性相关的观察结果和部分观察结果分类。

  • (ii)根据存在的数据和明确的用户提供的控制指令(如果有)建立缩放模型。对于平稳变化的比例和B类因子,根据扫描的总长度和默认值或指定值,为连续图像的每次“运行”或“扫描”决定合适的缩放间隔。

  • (iii)从平均强度中获得初步的粗略尺度估计。

  • (iv)用数千个强反射样品进行第一轮缩放/σ()大于合适的最小值。在这个阶段σ()从集成程序中读取的估计值可能不太准确,但足以用于此选择。

  • (v) 使用与Evans(2006)§A5中描述的算法类似的算法进行第一次异常值剔除【Evans,P.(2006),《水晶学报》,D62,72-82。】).

  • (vi)对于来自MOSFLM公司,输出每个强度的两个估计值,优化强度级别中间在使用轮廓填充值之间切换(平滑)的位置公共关系基金用于弱数据和求和集成总和对于强大的数据,

    [I=w{我}_{\rm prf}+(1-w){我}_{\rm和}\semi\quad w=1/[1+(I'/I_{\rm-mid})^{3}],\eqno(2)]

    哪里′是应用洛伦兹和偏振校正。这个的确切形式加权平均数并不重要,因为理想情况下这两个估计值是相同的。

  • (vii)首次优化σ()估计(参见§[链接]2.1).

  • (viii)在归一化强度上选择具有强反射的主缩放E类2(通常只选择0.8的观测值<E类2< 5). 这给出了分布在所有分辨率范围内的数据子集。

  • (ix)第二次异常值拒绝。

  • (x) 的最终优化σ()和之前一样进行估算。

  • (xi)如前所述的最终异常值拒绝。

  • (xii)累计并打印统计数据。

  • (xiii)将合并或未合并的反射列表输出到文件。

2.1. 标准误差估计

每个强度观测标准误差的初步估计,σ(小时),通常被所有集成程序低估,因此无AIMLESS,喜欢SCALA公司,更新σ()试图使平均标准误差与仅作为强度函数的观测值的平均散布相匹配的估计。不匹配的部分原因是探测器的未知“增益”(每个光子的探测器单位),用于衡量泊松统计误差估计值(以及校正探测器点扩散函数),部分来自各种仪器不稳定性,这些不稳定性会导致误差随强度增加而增加。如果误差估计在解释数据集中观察到的差异时是正确的,那么标准化偏差

[{\delta}_{{\bfh}l}=\左({{{无}_{\bfh}-1}\以上{{无}_{{\bfh}}}\右)^{1/2}({我}_{\bf h}l}-\langle{我}_{{\bfh}}范围)/\sigma'({我}_{{\bfh}l})\eqno(3)]

(其中n个小时是反射的观测次数小时还有这里小时是比例校正值, 小时/小时)平均值为0.0,标准偏差为1.0。2然后将标准误差估计值调整为

[\sigma'(I_{\bfh}l})={\rm Sdfac}\,[\simma

优化“校正”因子SdFac、SdB和SdAdd的值,以产生方差(δ小时)在所有强度范围内等于1.0。平方根内的项值(任意)设置为最小值0.1σ(小时)2避免可能的负值(这种可能性很小)。为每个“运行”确定一组单独的校正系数(通常,尽管可以选择对所有运行使用相同的值),并分别为完全记录和部分记录的观测值确定校正系数(如果相关)。这是通过最小化[\textstyle\sum(文本样式)_{i} 周_{i} [1-{\rm变量}(\delta_{\bfh}l})]^{2}]所有强度范围的总和,目前权重相等对每个强度箱和SdB参数放松限制,以避免极端值。方差的最终值(δ小时)作为每次运行强度的函数,在程序输出中绘制,以指示此“校正”的成功(或其他)。Sdfac主要可以通过探测器增益的不确定性来确定,Sdadd具有一般不稳定因素,这些不稳定因素会导致与强度成比例的误差(例如,参见Diederichs,2010【Diederichs,K.(2010),《水晶学报》,D66733-740。】),但SbB没有明显的物理解释。然而,该因素有助于使方差图(δ小时)并可作为经验“修正”系数。应当指出,对误差估计值的这种“修正”是一种相当粗略的近似,因为它假定没有重大的剩余系统误差(例如,由辐射损伤引起的误差),并且修正可以纯粹根据强度进行参数化。

3.数据质量分析

一旦我们有了一组比例因子,将所有强度放在一个共同的尺度上,并改进了对每个强度的误差估计,那么我们就可以分析数据的内部一致性和信噪比。我们可以将其作为图像编号的函数(相当于时间或晶体旋转)来检测辐射损伤和数据的薄弱或不一致区域,并根据分辨率来决定高分辨率截止(参见§4[链接]). 请注意,内部一致性度量可能低估了真实误差,因为与对称性相关的观测可能会遭受相同的系统误差。

传统上,内部一致性的衡量标准是R(右)与个人观察相关的因素小时(缩放后)到唯一反射的所有对称相关或重复观测的(加权)平均值小时, 〈小时〉. 加权乘数R(右)测量是比R(右)合并,因为它对数据多样性相对不敏感(Diederichs&Karplus,1997【Diederichs,K.&Karplus,P.A.(1997),《自然结构生物学》,第4期,第269-275页。】; Weiss&Hilgenfeld,1997年【Weiss,M.S.和Hilgenfeld,R.(1997),《应用结晶杂志》,第30期,203-205页。】; Weiss,2001年【Weiss,M.S.(2001),《应用结晶杂志》,第34期,第130-135页。】),而R(右)合并尽管平均强度正在提高,但随着多重性的增加,其趋于增加。R(右)下午。提供合并多个观测值后的数据质量估计。

[R_{\rm merge}=\textstyle\sum\limits_{\bf h}\sum\limits_{i}|i_{\bf h}i}-\langle i_{\bf h}\rangle |/\textstyle\sum\limits_{\bf h}\sum\limits_{i}\langle i_{\bf h}\rangle。\eqno(5)]

[R_{\rm meas}=R_{\rm R.i.m.}={\textstyle\sum\limits_{\bf h}\sum\limits_{i}}\左({n_{\bof h}}\上{n_}\bf h}-1}}\右)^{1/2}|i_{{\bf-h}i}-\langle i_{\baf h}\rangle|/{\textstyle\sum\ limits_a{\bfh}\sum{i}}语言i_{bfh}等级.\eqno(6)]

[R_{\rm p.i.m.}={\textstyle\sum\limits_{\bf h}\sum\limits_{i}}\左({{1}\在{n_{\bof h}-1}}\右)^{1/2}|i_{{\bf-h}i}-\langle i_{\baf h}\rangle|/{\textstyle\sum\ limits_{\bfh}\sam\limits范围(7)]

另一种测量分辨率分析内部一致性的方法是将观测值随机分成两半,然后计算线性相关系数在两半之间。这可以说是最可靠的衡量标准,下文将对此进行进一步讨论。

3.1. 根据“批次”或图像编号进行分析

对作为批次或图像编号函数的各种参数进行分析,作为晶体旋转、时间或辐射剂量的代理,有助于确定晶体是否受到过多的辐射损伤,或是否存在应丢弃的数据的任何其他部分。无AIMLESS绘制类似的图形R(右)合并规模和相对B类生产要素SCALA公司(例如,参见Evans,2011年的图2【Evans,P.R.(2011),《水晶学报》,D67,282-292。】). 增加相对值的负值B类因子是剂量恶化的指标,尽管B类除辐射损伤外,因子还受其他因素的影响。无AIMLESS根据批号添加两个新图:每个图像最大分辨率的粗略估计和累积完整性(对于所有数据和异常对,见图1[链接]). “最大分辨率”是从〈/σ()〉每批低于1.0:注意/σ()\9002;没有对多个测量值求平均值(通常不会出现在同一图像上),因此将小于\9001/σ平均后(§[链接]3.2.1). 该图显示了每个批次的噪声值,以及通常在5°范围内平均的平滑图。这只是对解决方案的粗略估计(见§[链接]4) ,但可以用来说明任何趋势。累积完整性图有助于确定由于辐射损伤而从末尾削减数据是否会损害完整性。如果数据是从多个“扫描”或多个晶体中测量的,那么这样的决定就更加复杂。

[图1]
图1
来自的新图形无AIMLESS根据“批次”或图像编号。(,c(c))标称分辨率估计为〈/σ()〉降至1.0以下,显示出随着辐射损伤的增加分辨率降低的趋势,单个批次的值和值在5°范围内平滑。(b条,d日)所有数据和异常差异的累积完整性。()和(b条)表明在这种良好的情况下,可以安全地丢弃扫描最后三分之一中损坏的数据,而不会降低完整性。(c(c))和(d日)显示来自两个晶体的较差且不完整数据集的图形。在本次数据收集结束时,异常数据仍然非常不完整。x个轴将两个晶体分开。

3.2. 针对解决方案的分析

为了估计数据的有用“分辨率”,在不丢失重要信息的情况下截断数据的分辨率,无AIMLESS根据分辨率绘制各种信噪比和内部一致性度量。目前,对于解释这些曲线的最佳标准,以及如何估计增加额外高分辨率数据不会增加任何有用信息的程度,还没有达成普遍共识:数据集的真正“分辨率”常常是论文参考者争论的焦点。

3.2.1. 信噪比

判断数据重要性的一个明显方法是根据合并强度的平均信噪比作为分辨率的函数。计算公式如下

[\langle I/\sigma\rangle=\langle\langle I_{h}\rangle/\sigma’(\langle I _{h{rangle)\rangle\eqno(8)]

[在“更正”σ′(小时)估算;§[链接]2.1],对于每个反射小时对称配对的平均强度小时〉除以其估计误差σ(〈小时〉),该比率在分辨率箱中平均[在程序输出中报告为Mn(I/sd)]。常用分辨率-截止水平通常在1–2范围内:即使在分辨率箱中使用〈/σ〉=1有一部分强度明显高于噪音水平[~5–7%> 3σ,~20–25%阴性]/σ是分辨率截止的一个很好的标准,但它在估计σ()整合计划中的不足和必要σ()“更正”(参见§[链接]2.1;伊恩·蒂克尔(Ian Tickle)在一次私人通信中指出,主要修正适用于大强度,因此不会影响与确定分辨率截止值相关的弱高分辨率数据)。应该注意的是/σ〉不独立于内部一致性度量,因为σ′()进行调整以匹配观测值的散布。因此,σ′()估计值仍然可能低估了真实的标准偏差。

3.2.2. 内部一致性度量

传统的R(右)衡量内部一致性的因素,R(右)合并或更好R(右)测量(§[链接]3) ,不是设置分辨率截止值的合适措施(Evans,2011【Evans,P.R.(2011),《水晶学报》,D67,282-292。】; Karplus&Diederichs,2012年【Karplus,P.A.&Diederichs,K.(2012),《科学》,3361030-1033。】)尽管他们在裁判中很受欢迎。正如Karplus和Diederichs所指出的R(右)因素无法与R(右)中的因子精细化,自从R(右)合并R(右)测量当数据变弱时,两者都趋于无穷大,而R(右)晶体(或R(右)工作R(右)自由的)趋于常数(见附录A类1[链接]和卢扎蒂,1953年[卢扎蒂五世(1953),《结晶学报》,第6期,第142-152页。]). 这意味着没有合理的方法来设置最大可接受水平。请注意,这是R(右)强度因子,可以测量为零或负,以及R(右)振幅系数|F类|,它不能是负的,并且将被偏置为正,例如,如果截断French&Wilson(1978)的程序【French,S.&Wilson,K.(1978),《结晶学报》,A34,517-525。】)已应用(或任何将负值设置为正值的协议)。R(右)合并R(右)测量是监控批次变化的有用指标(§[链接]3.1),它们对于最强强度(最高强度或低分辨率)的值是整体数据质量的良好指标。A大型R(右)强劲数据的因素可能表明存在问题[如果R(右)合并(强)>0.10;理想情况下,它应该<0.05],但它们不是弱数据的良好指标。一般来说,因为R(右)因素取决于数据的分布(例如,参见Murshudov,2011【Murshudov,G.N.(2011),《应用计算数学》,第10期,第250-261页。】)它们不是模型质量或内部一致性的良好指标,而相关系数是数据集之间线性相关性程度的指标,对数据分布的依赖性较小,因此它们可能是更好的指标(见附录A类1[链接]).

评估数据集“分辨率”的更好方法是相关系数在随机半数据集之间,CC1/2(在旧版本的中标记为“CC_Imean”SCALA公司; 埃文斯,2006【Evans,P.(2006),《水晶学报》,D62,72-82。】, 2011【Evans,P.R.(2011),《水晶学报》,D67,282-292。】; Karplus&Diederichs,2012年【Karplus,P.A.&Diederichs,K.(2012),《科学》,3361030-1033。】). 此统计数据是根据两种分辨率绘制的SCALA公司无AIMLESS(图2[链接]). 自20世纪80年代初以来,相关统计数据,即傅里叶壳相关性,一直用于评估电子显微镜重建的分辨率(例如,参见Rosenthal&Henderson,2003【Rosenthal,P.B.&Henderson,R.(2003),《分子生物学杂志》333721-745。】; 亨德森等。, 2012[Henderson,R.等人(2012),《结构》,第20期,第205-214页。]). The advantage of a相关系数它有一个明确的范围:良好相关性为+1.0,无相关性为0。立方厘米1/2在低分辨率下通常接近1,在高分辨率下随着强度变弱急剧下降至接近零(图2[链接]).

[图2]
图2
根据分辨率绘制数据处理和细化统计图。在(), (b条), (电子)和((f)),抄送1/2显示为红色虚线和〉/σ(〈以淡蓝色虚线(右侧轴)表示。(), (b条), (c(c))和(d日)来自实施例1(电子)来自示例4和((f))来自实施例5。()数据处理统计和R(右)自由的用于观测数据(黑色);预期模拟数据的分辨率超过2.4º|F类|(蓝色);以及|F类|两组或三组随机强度(绿色)。(b条)各向异性三个主要方向周围圆锥体的相似统计第1天(红色),第2天(=b条*,黑色)和第3天(蓝色),省略F类(随机)值。(c(c))R(右)自由的(F类)的值精炼测量和随机模拟强度。(d日)ML刻度,表示这些反射对电子密度计算的贡献。(电子)作为()但例如4。((f))相同的示例5
3.2.3. 各向异性

大多数数据集在某种程度上是各向异性的,这使分析和决策变得复杂。数据的各向异性分析如下无AIMLESS使用两个CC1/2和〈/σ〉. 各向异性的两个或三个正交主方向受晶格对称性的约束:立方对称无各向异性,两个主方向,唯一c(c)(c(c)*)轴和ab公司平面,用于正方、六角形和三角,三个正交轴用于正交b条(b条*)轴和中的两个正交轴交流电单斜平面和三斜系统的三个一般正交轴。三斜和单斜的一般方向交流电平面由拟合的各向异性比例因子的特征向量确定。然后,在主轴周围的圆锥体(默认半角20°)中,在主平面的相同角度内,或作为两个或三个主方向上的投影,分析各向异性。在前一种情况下,使用余弦权重对观测值进行加权,余弦权重从沿主方向的1降至区域边缘的0。CC图1/2和〈/σ然后允许以与整体分辨率相同的方式,以相同的困难评估不同方向的分辨率。

4.分辨率截止测试

我们如何决定在何处应用分辨率截止?一方面,使用弱到微不足道的高分辨率数据不会增加任何有用的东西,可能会给地图增加不必要的噪音,并可能导致我们对模型的质量过于自信(尽管数据质量和模型质量之间的关系尚不清楚)。另一方面,我们不想排除可能有助于构造解决方案和改进最终模型的有用数据。数据中的各向异性使这一决定复杂化,因为不清楚是否最好包括基于最佳方向、最差方向或介于两者之间的数据。各向异性截断在地图计算中可能会导致人为现象。各向异性数据问题及其处理精炼地图计算是一个悬而未决的问题,未来的工作需要解决这个问题,目标是开发清晰的协议。

为了检验这些问题,使用表1中列出的示例数据集,使用超出通常认为可接受范围的数据进行了一些测试[链接].

表1
测试中使用的示例数据集的详细信息

`“分辨率”是用于集成的最大分辨率。

例子 PDB代码 分辨率(Ω) 残留物数量 “空间”组 单位-细胞参数(Ω,°)
1 3个zym 1.83 3 × 310 C类2 = 161.1,b条= 100.3,c(c)= 104.0,β= 118.9
2 未发布 2.3 211 41212 =b条= 60.8,c(c)= 144.1
未发布 2.57 2 × 595 + 91 4212 =b条= 128.8,c(c)= 267.4
4 3锆5 1.8 656+7 NAG公司 R(右)32:H(H) =b条= 249.9,c(c)= 77.8,γ= 120
5 3zyl公司 1.45 2 × 271 C类2 = 95.6,b条= 121.1,c(c)= 62.5,β= 110.7

4.1. 与模拟数据的比较

通过比较精炼根据测量数据精炼根据模拟数据,我们可以判断测量数据不优于模拟数据的分辨率点,并将其与数据处理统计数据进行比较。图2[链接]()–2[链接](d日)显示了各种分析,例如示例1,其中模拟数据以多种方式生成,分辨率超过2.4º,模拟基于观察到的强度分布,而非结构本身(见附录A类2[链接]有关模拟的详细信息):(i)|F类|在每个反射的分辨率和各向异性位置,全部|F类|在中靠得很近互易空间相同(表示F类预期),(ii)在预期强度周围具有随机强度的多个数据集,其分布与相同分辨率下的测量强度相同。将这些模拟强度转换为振幅(表示为F类随机的,随机的)使用中央对手方清算所4程序CTRUNCATE公司使用与实验数据相同的程序(French&Wilson,1978【French,S.&Wilson,K.(1978),《结晶学报》,A34,517-525。】).

然后使用REFMAC公司(穆尔舒多夫等。, 2011【Murshudov,G.N.,Skubák,P.,Lebedev,A.A.,Pannu,N.S.,Steiner,R.A.,Nicholls,R.A..,Winn,M.D.,Long,F.&Vagin,A.A..(2011),《晶体学报》,D67,355-367。】)相对于观测数据,分辨率达到1.83Å(F类光突发事件)以及各种模拟数据集。如图2所示[链接](),R(右)自由的值(和R(右)工作; 未显示)对于实验数据,随着预期分辨率的增加而增加,而对于模拟数据,分辨率在2.4º时突然增加,其中精炼从实验数据切换,但分辨率超过约1.95ºR(右)自由的对于F类光突发事件不比这更好F类预期,同时精炼针对随机数据集(具有不同的错误)给出R(右)自由的向以下值收敛的值F类光突发事件F类预期分辨率更高,大约为R(右)=0.42,预期值(见附录A类1[链接]). 我们可以由此得出结论,包括分辨率超过1.95º左右的数据没有任何益处,此时CC1/2为0.27且〈/σ〉为0.9:〈处更为传统的截止点/σ在2.06Å的分辨率下,Å=2.0。该数据集具有明显的各向异性,沿第1天= 0.97小时+ 0.23,第2天=k个,第3天= −0.75小时+ 0.67,决议/σ〉=2.0沿第1天,第2天第3天分别为2.23、1.98和2.05º(图2[链接]b条). 分析R(右)以同样的方式(§[链接]3.2.3和图2[链接]b条)显示了与整体值相似的模式,收敛值为R(右)不利因素F类光突发事件F类预期在2.08–1.91°范围内。

这个截断推断程序|F类|根据实验测量对弱强度产生正偏差,这使与模拟数据的比较变得复杂。为了测试其效果,精炼也根据观察和模拟强度而不是振幅进行:R(右)自由的与之前一样,模拟数据的值从2.4º分辨率开始变大,但收敛到了~1.98º分辨率(图2[链接]c(c)). 以下精炼针对强度,REFMAC公司计算R(右)以模仿的方式R(右)上的因素F类(穆尔舒多夫等。, 2011【Murshudov,G.N.,Skubák,P.,Lebedev,A.A.,Pannu,N.S.,Steiner,R.A.,Nicholls,R.A..,Winn,M.D.,Long,F.&Vagin,A.A..(2011),《晶体学报》,D67,355-367。】),但是这些R(右)因子随分辨率急剧上升(最终达到无穷大),而不是像那些|F类|.

[\eqalignno{R(F,\,&{rm from}\,\,I)\cr&={textstyle\sum}\left|{max(-3\sigma,{我}_{\rm o})-{我}_{\rm c}}\在{[\max\left(0.01\sigma,{我}_{\rmo}\right)]}^{1/2}+{I}^{1/2}_{\rmc}}\right|\big/{{\textstyle\sum}}[\max(0.01\sigma,{我}_{\rmo})]^{1/2},\cr&\quad{\rm where}\,\,\sigma=\sigma\left({我}_{\rm o}\right)\cr&\simeq{\textstyle\sum}{{|I_{\rmo}-I_{\rmac}|}\在{F_{\ormo}+F_{\rmc}}/{\texttyle\sum}F_{\ rmo}={\ textstyle\sum}|F_{\\rmo}-F_{\RMc}|/\textstyle\sum F_{\frmo}\cr&\ quad{\rm-if}\,\,\,{我}_{\rm o}\,\gt\,0\,\,{\rm-和}\,\,{F}(F)_{\rm o}={我}_{\rm o}^{1/2}。&(9)}]

数据重要性的另一个估计值显示为最大似然比例因数D类.最佳电子密度精炼使用系数2计算毫发o个 − DF公司c(c),其中依赖于D类。的值D类分辨率范围内的外壳表示这些反射对电子密度的贡献程度,接近零的值表示这些反射几乎没有贡献。图2[链接](d日)显示(例如1)D类随着分辨率下降,但仍大于模拟数据的值,即使在分辨率边缘。

对示例4和5进行了类似的测试(见图2[链接]电子和2[链接](f))得出了与CC时类似的结论1/2已降至0.2-0.4左右,或〈/σ〉约为0.5-1.5,几乎没有剩余信息,但很难制定明确的规则。随着分辨率的增加R(右)因素和D类实验数据的值收敛于模拟数据的值,但它们相对于数据处理分数的合并点在不同的分数和不同的数据集之间有所不同。

4.2. 自动化模型构建测试

有传闻称,将分辨率扩展到包含弱数据可能有助于自动化建模过程。不幸的是,这很难证明:这里尝试的例子要么对所有决议都有效,要么在所有决议中基本上都失败了。示例2用于测试从具有实验阶段的较差地图到2.5º分辨率的模型构建,以及使用海盗/REFMAC公司管道(Cowtan,2012【Cowtan,K.(2012),《水晶学报》,D68,328-335。】)以2.3、2.4、2.5和2.6º的分辨率进行测试。在所有这些分辨率下建立的模型都有一些正确的和一些错误的部分,分配的序列很大程度上是错误的,但在不同分辨率下,在构建的残基数量或序列分配或模型的正确性方面没有一致的模式。对实施例3(2:1复合物)进行了另一项测试,从两个大分子(每个595个残基)的分子再置换模型开始,构建较小的91残基分子。在这种情况下,较小的组件在2.57到3.3º之间的任何分辨率下都或多或少保持一致,尽管在2.7到3.1º之间,远离这些极端值的误差可能较小。示例4获得了类似的结果,省略了最后一个结构域(207个残基):在1.8到2.8º之间的分辨率下,可以或多或少成功地重建,但在更高的分辨率下可能会稍微正确一些。然而,延长该决议似乎至少没有害处。这可能表明海盗/REFMAC公司建模管道至少更依赖于相位误差,而不是结构系数振幅的质量(以及分辨率)。在困难的情况下,可能值得尝试使用不同分辨率的数据建立模型。

4.3. OMIT图中的电子密度

在模型中未包含的区域上测试分辨率对差异图视觉外观的影响精致。这在人工建造和完成结构时非常重要。省略了结构的一部分,其余坐标被高达0.3º的随机位移扰动,以减少模型偏差,结构在REFMAC公司具有不同的分辨率截止值。图3[链接]显示了以下两个示例最大似然示例4和1的不同分辨率的差异图。尽管示例1(图3)中的锐度可能略有提高,但地图之间没有太大差异[链接]b条)将分辨率从2.4Ω扩展到2.0Ω,与精炼§中的结果[链接]4.1(图2[链接]). 同样,对于自动化模型构建(§[链接]4.2),延长决议似乎至少没有害处。

[图3]
图3
OMIT差异图(毫发o个负极DF公司c(c))在不同分辨率下,以及针对分辨率绘制的数据处理统计数据。()示例4中的糖(NAG)链。(b条)示例1中省略的残留物。

5.讨论

程序无AIMLESS执行的任务与SCALA公司并给出了类似的结果。然而,它的速度要快得多(大约是原来的三倍),是添加新的缩放模型和分析的更好的框架。在适当的时候,这三个项目无意义,无AIMLESSCTRUNCATE公司可以合并为一个。

无AIMLESSSCALA公司,因此用户的问题和决定如Evans(2011)所述【Evans,P.R.(2011),《水晶学报》,D67,282-292。】):(i)什么是点编组(劳厄集团)?(二)什么是空间小组?(iii)是否存在辐射损伤,是否应排除数据中损伤最严重的区域?(iv)应采用何种分辨率截止值(见下文)?(v) 是否有可检测的异常信号?(vi)数据是否成对?(vii)该数据集是否优于先前收集的数据集?

关于最后一点,改善弱数据或不完整数据的一种传统方法是合并来自不同晶体的数据,前提是它们是同晶的。随着冷冻冷却技术的出现,除了最绝望的情况外,这已经过时了,但亨德里克森团队最近的工作(刘等。, 2012[刘,Q.,Dahmane,T.,Zhang,Z.,Assur,Z,Brasch,J.,Shapiro,L.,Mancia,F.&Hendrickson,W.A.(2012).科学,336,1033-1037.], 2013[刘,Q,刘,Q&亨德里克森,W.Q.(2013).《水晶学报》D691314-1332.])这为合并来自多个晶体的数据以增强来自硫的非常微弱的异常信号提供了一个很好的例子。目前用于检查晶体间同构的工具还相当落后,但这项技术正在改进(参见佐丹奴等。, 2012[佐丹奴·R、利尔·R·M·F、伯伦科夫·G·P、麦克斯威尼·S·波波夫·A·N(2012),《结晶学报》D68、649-658。]). 随着现代同步加速器上的快速数据采集,通常会采集多个或多个无阶等效数据集,合并它们可能比只选择最佳数据集要好。最后,模型质量取决于数据质量,合并许多数据集通常会提高数据中的信噪比;然而,当存在严重的非同构或辐射损伤时,如何合并数据尚不清楚。盲目合并数据可能弊大于利。有必要分析所有数据集的联合分布,并使用这种分布进行合并。在理想情况下,所有数据集都将在不合并的情况下使用,从而确保从数据中提取信息在结构分析的所有阶段都是最佳的:数据的分布和每个分析阶段可用的信息量将确定需要使用什么。

用户犹豫不决和与期刊审稿人冲突的一个主要原因是决议截止。我们无法为此制定明确的规则,因为这取决于数据的用途。因此,在数据还原阶段过早地应用严格的截止值是错误的:数据总是可以在以后被排除。还不清楚如何最好地处理各向异性:你是选择最好的方向还是最坏的方向?最好是在最佳方向上尽可能地包含数据。此处进行的测试将分辨率统计数据与最终模型构建和精炼确实建议将数据扩展到一些传统限制之外,例如〈/σ〉=2可能改善结构测定,正如Karplus和Diederichs(2012)的“成对细化”测试一样【Karplus,P.A.&Diederichs,K.(2012),《科学》,3361030-1033。】). 至少,添加这些弱数据似乎不会对自动或手动模型构建造成损害。主要问题是,我们已经习惯于使用标称分辨率作为模型质量的指标,而它不是一个好的指标,特别是因为结构的重要生物和化学结论往往取决于局部而非全局的正确性。事实上,任何全局评分都不能表明任何局部结构特征的正确性。显然,分辨率为1.5º的精确测量数据比分辨率为3.5º的数据集包含更多信息,因此可能会产生更正确的结构,但标称分辨率本身只是告诉我们使用了多少反射,而不是它们的质量。从我们这里有限的测试来看,似乎在相当大的范围内改变分辨率截止值(例如从2.2到1.9º)之间的差异很小,因此准确的截止点不是一个令人烦恼的问题,但设置一个宽泛的限制似乎是明智的,这样就不会排除包含真实(如果较弱)信息的数据。没有理由认为降低数据的分辨率会改进模型。这些测试是用当前程序进行的,我们在所有阶段的当前程序都可以改进,以从弱噪声数据中提取最大信息。

附录A

统计方法

A1.结晶行为R(右)

晶体学的R(右)使用以下公式计算系数

[R={{\textstyle\sum\big||F_{\rmo}|-|F_}\rmc}|\big|1}\over{\texttyle\sum|F{\rmo}|}},\eqno(10)]

当总和超过用于计算R(右)值(如果孪晶对该公式进行了推广;例如,参见Murshudov,2011【Murshudov,G.N.(2011),《应用计算数学》,第10期,第250-261页。】). 显然,这种统计的行为取决于结构因素的统计特性。因此,可以预计模型、晶体和观测数据的属性,例如(i)噪声数据,(ii)孪生,(iii)晶体中的调制和(iv)模型误差将影响R(右)值。卢扎提(1953年[卢扎蒂五世(1953),《结晶学报》,第6期,第142-152页。])分析了模型误差对R(右)并得出结论:R(右)对于无中心反射,根据随机原子计算的结构因子的计算值约为0.58。穆尔舒多夫(2011)【Murshudov,G.N.(2011),《应用计算数学》,第10期,第250-261页。】)对半面体病例进行了类似分析孪晶并证明了R(右)半面体情况下的值孪晶系统地低于单晶。在这里,我们分析了用于估计振幅的程序的效果|F类|根据测量的强度当数据非常嘈杂时。由于弱强度可以测量为负值,而真实振幅|F类|不能为负数|F类|通常使用截断程序(French&Wilson,1978【French,S.&Wilson,K.(1978),《结晶学报》,A34,517-525。】). 假设真正的结构因子来自一个充满原子的晶体,原子随机分布在单位电池实验强度中的噪声呈正态分布截断程序使用贝叶斯估计和公式估计结构因素的振幅

[E(|F|)=\textstyle\int\limits_{0}^{\infty}J^{1/2}P(J\semi-I_{\rmo},{\rm晶体})\,{\RMd}J,\eqno(11)]

哪里(J型o个,晶体)是结构因子理想强度的条件分布(J型)当观察到强度时(o个)已知,并且已知数据来自晶体。注意到|F类| =J型1/2,并使用(J型 o个,crystal),条件分布|F类|可以写入

[P(|F|J\semi-I_{\rmo},{\rm crystal})={{|F|\exp\left[-{{(I_{\ormo}-|F|^{2})^{2{}}\ over{2\sigma^{2neneneep}\ right]\exp\ left(-{{|F |^{2}}\ ever{varepsilon\sigma}\ right)}\ over{textstyle\int\limits_{0}^{\infty}|F |\exp\left[-{{(I_{\rmo}-|F|^{2})^{2{}\ over{2\sigma^{2neneneep}\right]\exp\leaft(-{{|F||^{2}}\over{\varepsilon\sigma}}\right)\,{\rmd}|F|}},\eqno(12)]

哪里Σ=E类(|F类|2),的预期值|F类|2,使用分辨率箱中的数据进行估计,o个是实验观测强度σ是其标准偏差。因此,使用以下公式估算结构系数振幅的预期值

[E(|F|)={{\textstyle\int\limits_{0}^{\infty}|F|^{2}\exp\left[-{{(I_{\rmo}-|F||^{2])^{2{}\ over{2\sigma^2}}\right]\exp\leaft(-{{|F|${2}\ over{\varepsilon\sigma}\right)\,{\rmd}|F|}\over{\texttyleft int\limits_{0}^{\infty}|F|\exp\left[-{{(I_{\rmo}-|F|^{2})^{2{}\ over{2\sigma^{2neneneep}}\right]\exp\leaft(-{{|F||^{2]}\在{\varepsilon\Sigma}}\right)\,{\rm d}|F|}}上。\等式(13)]

尽管这些年来,这一配方为社区提供了良好的服务,但也存在一些问题。这些问题包括以下方面。(i) 假设Σ是一种平滑的分辨率功能,在假翻译、DNA/RNA螺旋存在时分解等。(ii)假设数据来自单晶。在以下情况下孪晶虽然如果孪晶分数已知,并且没有平行于孪晶算符的非晶体旋转,那么很容易解释结对。然而,通常并不是所有晶体/数据的属性都已知或可能建模。(iii)假设观测数据具有正态分布。这种假设可能会被打破,特别是对于弱反射而言,其中邻近点的剖面用于积分。

当数据非常嘈杂时(观测的标准偏差变得非常大)这一过程产生了威尔逊分布的期望值(威尔逊,1949【Wilson,A.J.C.(1949),《结晶学报》,第2期,第318-321页。】),

[\eqaligno{E(|F|)_{\sigma\rightarrow\infty}&=\lim_{\sigma\rightarrow \infty}{{\textstyle\int\limits_{0}^{\infty}|F|^{2}\exp\left[-{{(I_{\rmo}-|F||^{2])^{2{}\over{2\sigma^2}}}\right]\exp\eleft varepsilon\sigma}}\right),{\rm d}|F|}\over{\textstyle\int\limits_{0}^{\infty}|F| \exp\left[-{{(I_{\rmo}-|F|^{2})^{2{}\在{2\sigma^{2}}\right]\exp\left(-{{|F|^{2{}\ over{\varepsilon\sigma}}\ right)上epsilon\sigma}}\right),{\rm d}|F|={{(\pi\varepsilon\ sigma)^{1/2}}\ over 2}.&(14)}]

因此,在极限情况下,如果所有参数的估计都顺利进行,并且没有晶体生长特性,那么截断程序将给出威尔逊分布的预期值。分析晶体结构很有趣R(右)这些情况下的值。让我们假设R(右)值是在分辨率仓中计算的,其中Σ是估计的。然后,在噪声数据的极限情况下R(右)值将具有以下形式(这里,我们假设倒数空间点足够密集,并且总和可以用积分代替),

[\eqaligno{E(R)&={{\textstyle\sum\left|F_{\rm c}-E(|F|)\right|}\ over{\texttyle\sum-E(| F|)}}\cr&={N\textstyle\int\limits_{0}^{\infty}\left| F_{\srm c{-E(|1F|)\ right|P 0}^{\infty}E(|F|)P(|F|\semi{\rm晶体})\,{\rmd}|F|}}\cr&={E\left[\big||F_{\rmc}|-E(|F|)\big|\right]}\在{E(|F|])}}.&上(15)}]

现在如果我们使用以下事实|F类c(c)|与|F类|,即Wilson分布,并表示μ=E类(|F类|) =E类(|F类c(c)|),然后在对积分进行一些操作之后,我们可以导出

[\eqalignno{\mu&={{(\pi\varepsilon\Sigma)^{1/2}}\over 2}\cr R&=2{\rm erfc}\left[{\mu}\over{(\ varepsilen\Sigma)^{1/2}}\right]=2{\R erfc}\ left({\pi^{1/2}}\verf{2}\right)\simeq 0.42,&(16)}]

其中erfc是互补误差函数,

[{\rm erfc}(x)={2\over{\pi^{1/2}}}\textstyle\int\limits_{0}^{\infty}\exp(-t^{2})\,{\rmd}t.\eqno(17)]

因此,我们可以看到,如果结构因子被Wilson分布的预期值所取代,那么可以预计计算出的R(右)值将在0.42左右。这正是从截断当实验强度的误差变得非常大时。应该注意的是R(右)值是单晶数据的属性,没有其他特性。

注意,对于完美的半面体孪晶

[\eqaligno{P(F\semi\Sigma)&={8|F|^{2}}\ over{(\varepsilon\Sigma-)^{2{}}\exp\left(-2{{|F||^{2]}\ over{varepsiron\Sigma}}\ right),\cr\mu&={3(2\pi)^}\over 8}\varepsion\Sigma.&(18)}]

如果完美孪晶假设用于截断然后,对于非常嘈杂的数据,我们可以获得

[\eqaligno{E(R)&={{8\ over{(\varepsilon\Sigma)^{2}}}\textstyle\int\limits_{0}^{\infty}|F-\mu||F|^{3}\exp\ left(-2{{|F||^{2{}}\over{\varepsion\Sigma}}\right)\,{\rm d}F}\over{\mu}}\cr&=\exp[-2(\mu/\varepsilon \西格玛)^{2}]+2{\rm erfc}(2^{1/2}\mu/\varepsilon\Sigma)\cr&\simeq 0.291.&(19)}]

A2.高斯随机强度的生成χ2分布

假设“真实”结构因子来自具有Wilson分布的人群,实验强度具有正态分布,平均值等于“真实”强度,实验不确定性等于σ,可以写出观测强度的分布

[P(I_{\rmo}\semi\Sigma)={1\over{(2\pi)^{1/2}\Sigma\Sigma}}{\textstyle\int\limits_0^\infty}\exp\left[-{{(I{\rmo}-I)^2}\over{2{\Sigma ^2}}\right]\exp\leaft(-{I\over\Sigma-}\right),{\rmd}I.\eqno(20)]

要使用此公式生成随机强度,必须估计未知参数(Σ). 如果我们想生成超出观测数据分辨率的“数据”,我们需要参数化Σ作为分辨率的平滑函数。我们使用参数化

[\Sigma=k\exp(-B|s|^{2}/4)\ exp(-s^{T} 我们)f(|s|),\eqno(21)]

哪里k个是总体规模,B类是整体各向同性温度系数,(f)()是Popov和Bourenkov(2003)设计的经验强度曲线[Popov,A.N.&Bourenkov,G.P.(2003),《结晶学报》,第59期,第1145-1153页。]),是一个倒数空间向量||是倒数空间矢量的长度U型是整体各向异性U型具有属性的值

[\eqalignno{{rm tr}(U)&=0,\cr R_{rm sym}^{T} UR(欧元)_{\rm符号}&=U,&(22)}]

其中tr是轨迹,R(右)sym(对称)是对称算子的旋转部分(这里,我们使用对称算子的正交版本)和上标T型表示运算符的转置。(22)中的第二个条件[链接])适用于晶体的所有对称算符。自(21[链接])是的连续函数Σ,它可以用于任何分辨率,包括超出观测分辨率的分辨率。

参数估计和随机强度生成的程序如下。

  • (i) 使用E类(o个) =Σ,var(变量)(o个) = (Σ)2,建立观测强度分布的高斯近似,并估计Σ如(21)所定义[链接]).

  • (ii)使用分布(20[链接]),建立似然函数并改进参数的估计Σ使用最大似然估计。

  • (iii)使用公式生成规定分辨率内反射的结构系数振幅的预期值E类(|F类|) = (πΣ)1/2/2.

  • (iv)根据分布(20[链接]). 为此,采用两阶段程序:()根据具有平均值的指数分布生成一个随机数Σ并表示出来经验和(b条)根据具有均值的正态分布生成随机数经验和标准偏差σ.Σ外推到给定的分辨率σ取自观测数据或定义的信噪比。

  • (v) 使用参数Wilson分布从总体中生成随机数Σ.

脚注

1用于程序命名无意义无AIMLESS见吉本斯(1932【Gibbons,S.(1932),《冷舒适农场》(Cold Comfort Farm),伦敦:Longmans出版社。】).

2请注意(正如裁判所指出的),只有在计算〈小时相等:这需要进一步研究,尽管使用不同加权方案(包括相等的单位权重)的一些初步测试显示只有很小的差异。

鸣谢

我们要感谢斯蒂芬·格雷厄姆(Stephen Graham)和珍妮特·迪恩(Janet Deane)提供的测试数据集,以及安德鲁·莱斯利(Andrew Leslie)阅读手稿。PRE由MRC拨款U105178845支持,GNM由MRC赠款MC_UP_A025_1012支持。

工具书类

第一次引用Cowtan,K.(2012年)。《水晶学报》。D类68, 328–335. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Diederichs,K.(2010年)。《水晶学报》。D类66, 733–740. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Diederichs,K.&Karplus,P.A.(1997年)。自然结构。生物。 4, 269–275. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Evans,P.(2006)。《水晶学报》。D类62, 72–82. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Evans,P.R.(2011)。《水晶学报》。D类67, 282–292. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Fox,G.C.和Holmes,K.C.(1966年)。《水晶学报》。 20, 886–891. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用French,S.和Wilson,K.(1978年)。《水晶学报》。A类34, 517–525. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Gibbons,S.(1932年)。Cold Comfort农场。伦敦:Longmans。 谷歌学者
第一次引用Giordano,R.,Leal,R.M.F.,Bourenkov,G.P.,McSweeney,S.&Popov,A.N.(2012年)。《水晶学报》。D类68, 649–658. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用亨德森,R。等。(2012).结构,20, 205–214. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Kabsch,W.(2010年)。《水晶学报》。D类66, 133–144. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Karplus,P.A.&Diederichs,K.(2012年)。科学类,336, 1030–1033. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Liu,Q.、Dahmane,T.、Zhang,Z.、Assur,Z.、Brasch,J.、Shapiro,L.、Mancia,F.和Hendrickson,W.A.(2012)。科学类,336,1033–1037科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Liu,Q.,Liu,Q&Hendrickson,W.Q.(2013)。《水晶学报》。D类69,1314–1332交叉参考 IUCr日志 谷歌学者
第一次引用Luzzati,V.(1953年)。《水晶学报》。 6, 142–152. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Murshudov,G.N.(2011)。申请。计算。数学。 10, 250–261. 谷歌学者
第一次引用Murshudov,G.N.、Skubák,P.、Lebedev,A.A.、Pannu,N.S.、Steiner,R.A.、Nicholls,R.A.、Winn,M.D.、Long,F.和Vagin,A.A.(2011年)。《水晶学报》。D类67, 355–367. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Otwinowski,Z.、Borek,D.、Majewski,W.和Minor,W.(2003)。《水晶学报》。A类59, 228–234. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Popov,A.N.和Bourenkov,G.P.(2003)。《水晶学报》。D类59, 1145–1153. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Rosenthal,P.B.&Henderson,R.(2003)。分子生物学杂志。 333, 721–745. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Weiss,M.S.(2001)。J.应用。克里斯特。 34,130–135科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Weiss,M.S.和Hilgenfeld,R.(1997)。J.应用。克里斯特。 30, 203–205. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Wilson,A.J.C.(1949年)。《水晶学报》。 2, 318–321. 交叉参考 IUCr日志 科学网 谷歌学者
第一次引用医学博士温恩。等。(2011).《水晶学报》。D类67, 235–242. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标生物
结晶学
国际标准编号:1399-0047