研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标结构
生物学
编号:2059-7983

多个样本数据的有效合并以确定异常子结构

十字标记_颜色_方形_文本.svg

密歇根大学生命科学研究所,地址:美国密歇根州安阿伯市沃什瑙大道210号,邮编:48109-2216b条美国新墨西哥州洛斯阿拉莫斯市M888信箱洛斯阿拉莫斯国家实验室生物科学部,邮编87545
*通信电子邮件:janetsmith@umich.edu

(2015年4月22日收到; 2015年11月17日接受; 2016年3月1日在线)

多晶体数据的合并已被证明对异常散射原子的测定是有用的下部结构对于具有弱反常散射体的晶体(例如S和P)和/或衍射不良。合并来自多个样本的数据的策略需要评估样本同构,它依赖于单元间参数的可变性、异常信号相关性和总体数据相似性的度量。局部缩放、异常信号优化和数据集加权,在中实现菲尼克斯scale_and_merge,提供了一个有效的协议来合并来自多个样本的数据。蛋白质NS1用于一系列试验,从28个样品中收集数据,通过天然S原子的单波长异常衍射进行相位调整。与标准全局尺度协议相比,局部尺度异常优化协议生成的合并数据集具有更高的异常信号质量指标。本地规模的数据在下部结构决心。对数据集的合并数据质量进行了评估,其中多重性通过以下两种方式之一减少:从单个晶体中排除数据(以减少因非同构造成的错误),或从每个晶体中排除最近记录的数据段(以将辐射损伤的影响降到最低)。异常信号在两个程序的等效多重性下是等效的,结构确定成功与异常信号度量相关。异常信号的质量与12倍至150倍的数据多重性密切相关。对于NS1数据,局部尺度和异常优化协议同样能够很好地处理样品的非同构和辐射诱导衰变。

1.简介

使用来自多个样本的高多重性Bijvoet数据已被证明在确定异常方面是有效的下部结构在困难情况下(Akey、Brown、Dutta等。2014年【Akey,D.L.、Brown,W.C.、Dutta,S.、Konwerski,J.、Jose,J.,Jurkow,T.J.、DelProposto,J.和Ogata,C.M.、Skiniotis,G.、Kuhn,R.J.和Smith,J.L.(2014)。科学,343,881-885。】; 线路接口单元等。, 2012[刘,Q.,Dahmane,T.,Zhang,Z.,Assur,Z,Brasch,J.,Shapiro,L.,Mancia,F.&Hendrickson,W.A.(2012).科学,336,1033-1037.]). 这些困难的情况包括具有弱或很少异常散射体的晶体、衍射不良的晶体和/或远离峰值吸收能量收集的数据。虽然原则上增加合并数据集的多样性可以提高数据质量,但当合并多个样本的数据时,会出现非同构现象,而当从单晶中收集更多数据时,则会出现辐射损伤。在合并多个样本的数据时,通过识别和排除异常晶体或从辐射损坏的数据集中删除后期衍射图像来剔除数据可能是有效的。选择数据集的“最佳”组合需要对单个数据集进行评估,如果怀疑存在辐射损伤,则需要决定每个样本中包含多少数据。兼容的数据集可以通过各种指标选择,包括单元间的变化(Foadi等。, 2013【Foadi,J.,Aller,P.,Alguel,Y.,Cameron,A.,Axford,D.,Owen,R.L.,Armour,W.,Waterman,D.G.,Iwata,S.&Evans,G.(2013),《结晶学报》D69,1617-1632。】; 线路接口单元等。, 2012[刘,Q.,Dahmane,T.,Zhang,Z.,Assur,Z,Brasch,J.,Shapiro,L.,Mancia,F.&Hendrickson,W.A.(2012).科学,336,1033-1037.], 2013[刘,Q,刘,Q&亨德里克森,W.A.(2013),《水晶学报》D691314-1332。])异常差异和/或强度相关系数(Akey、Brown、Konwerski等。2014年【Akey,D.L.,Brown,W.C.,Konwerski,J.R.,Ogata,C.M.&Smith,J.L.(2014),《结晶学报》第70期,第2719-2729页。】; 佐丹奴等。, 2012[佐丹奴·R、利尔·R·M·F、伯伦科夫·G·P、麦克斯威尼·S·波波夫·A·N(2012),《结晶学报》D68、649-658。]; 线路接口单元等。, 2012[刘,Q.,Dahmane,T.,Zhang,Z.,Assur,Z,Brasch,J.,Shapiro,L.,Mancia,F.&Hendrickson,W.A.(2012).科学,336,1033-1037.], 2013[刘,Q,刘,Q&亨德里克森,W.A.(2013),《水晶学报》D691314-1332。]; 洪·特威利格等。, 2016【Terwilliger,T.C.,Bunkóczi,G.,Hung,L.-W.,Zwart,P.H.,Smith,J.L.,Akey,D.L.&Adams,P.D.(2016),《结晶学报》第72期,第359-374页。】; 本科奇·特威利格等。, 2016【Terwilliger,T.C.,Bunkóczi,G.,Hung,L.-W.,Zwart,P.H.,Smith,J.L.,Akey,D.L.&Adams,P.D.(2016),《结晶学报》第72期,第346-358页。】; 埃文斯,2006【Evans,P.(2006),《水晶学报》,D62,72-82。】)、和合并因素(Evans,2006【Evans,P.(2006),《水晶学报》,D62,72-82。】).

对数据合并策略进行了修改,该策略依赖于合并前数据集的权重菲尼克斯scale_and_merge作为的一部分菲尼克斯软件套件(Terwilliger,Hung等。, 2016【Terwilliger,T.C.,Bunkóczi,G.,Hung,L.-W.,Zwart,P.H.,Smith,J.L.,Akey,D.L.&Adams,P.D.(2016),《结晶学报》第72期,第359-374页。】).凤凰scale_and_merge使用多部分策略优化合并数据集中异常差异的准确性。该策略结合了局部缩放算法的使用、数据各向异性的校正以及最重要的是,基于异常差异与平均数据的相关性为每个数据集确定权重。原则上,局部缩放可以改善辐射损伤的影响,与数据剔除相比,加权单个数据集允许在最终合并数据中包含更多样本。While期间菲尼克斯缩放和合并尝试使用尽可能多的样本,识别并排除异常数据集。

在这里,我们评估了局部缩放和数据集加权的策略,并与使用全局缩放协议处理数据进行了比较。该系统是黄病毒NS1蛋白,为此我们解决了晶体结构来自反常散射硫(Akey、Brown、Dutta等。2014年【Akey,D.L.、Brown,W.C.、Dutta,S.、Konwerski,J.、Jose,J.,Jurkow,T.J.、DelProposto,J.和Ogata,C.M.、Skiniotis,G.、Kuhn,R.J.和Smith,J.L.(2014)。科学,343,881-885。】). S-SAD数据非常适合于本实验,因为完整的数据记录了24个晶体中每一个的六倍Bijvoet对多重性,而其他四个晶体中的每一个具有三倍多重性。此前,我们报告称,在某些情况下下部结构排除“离群值”数据集(Akey、Brown、Konwerski等。2014年【Akey,D.L.,Brown,W.C.,Konwerski,J.R.,Ogata,C.M.&Smith,J.L.(2014),《结晶学报》第70期,第2719-2729页。】). 当添加数据(从最好到最坏)以创建合并数据集时,这一点得到了确认(特威利格,洪等。, 2016【Terwilliger,T.C.,Bunkóczi,G.,Hung,L.-W.,Zwart,P.H.,Smith,J.L.,Akey,D.L.&Adams,P.D.(2016),《结晶学报》第72期,第359-374页。】). 在没有考虑数据间差异的情况下,添加“最差”数据集会降低异常差异的准确性(Terwilliger,Hung等。, 2016【Terwilliger,T.C.,Bunkóczi,G.,Hung,L.-W.,Zwart,P.H.,Smith,J.L.,Akey,D.L.&Adams,P.D.(2016),《结晶学报》第72期,第359-374页。】). 异常晶体的识别可能很繁琐,并且可能因使用的度量标准而异。我们测试了数据集权重是否在菲尼克斯scale_and_merge将淡化轻微非同晶晶体的有害影响,并消除手动从异常晶体中排除数据的需要。

我们解决了晶体结构黄病毒NS1蛋白的天然硫SAD相位在低分辨率下使用多晶体数据进行,然后相位扩展到3.0º分辨率,得到了高质量的电子密度图(Akey、Brown、Dutta等。2014年【Akey,D.L.、Brown,W.C.、Dutta,S.、Konwerski,J.、Jose,J.,Jurkow,T.J.、DelProposto,J.和Ogata,C.M.、Skiniotis,G.、Kuhn,R.J.和Smith,J.L.(2014)。科学,343,881-885。】; Akey、Brown、Konwerski等。2014年【Akey,D.L.,Brown,W.C.,Konwerski,J.R.,Ogata,C.M.&Smith,J.L.(2014),《结晶学报》第70期,第2719-2729页。】). 共收集了28个数据集,其中18个数据集合并为原始结构解。在这里,我们研究了一种局部缩放和异常优化策略,用于将单个数据集加权并组合为最终的高多重性合并数据集。由于重点是优化异常的确定下部结构,数据分析仅限于检测到异常信号(4.0º)的低分辨率壳体中的异常信号质量指示器。评估合并数据质量的指标是相关性(CC阿诺)观测到的异常差异(ΔF类)对于来自原子模型或参考数据集的数据,异常差异与总差异的比率结构振幅(〈|ΔF类|/F类〉)和异常的质量下部结构使用从合并的数据集确定SHELXD公司(谢尔德里克,2010年[Sheldrick,G.M.(2010),《水晶学报》,D66479-485.]; 发现的站点数量和CFOM)|ΔF类|/F类\9002;是一个有用的指标,因为它可以在没有结构信息的情况下计算,它似乎是异常信号质量的敏感指标,并且不依赖于误差估计。而异常差异的信噪比估计[|ΔF类|/σΔ(F类)〉]也可以使用,sigma值随用于估计它们的方法而变化,特别是对于小差异和弱差异F类,它们可能是评估不同合并策略的不可靠指标。

2.方法

2.1. 数据收集和处理

如前所述(Akey、Brown、Konwerski等。2014年【Akey,D.L.,Brown,W.C.,Konwerski,J.R.,Ogata,C.M.&Smith,J.L.(2014),《结晶学报》第70期,第2719-2729页。】; 阿基、布朗、杜塔等。2014年【Akey,D.L.、Brown,W.C.、Dutta,S.、Konwerski,J.、Jose,J.,Jurkow,T.J.、DelProposto,J.和Ogata,C.M.、Skiniotis,G.、Kuhn,R.J.和Smith,J.L.(2014)。科学,343,881-885。】),数据来自阿贡国家实验室先进光子源(APS)光束线23ID-D(GM/CA)上的28个单个晶体。作为最小化样品X射线吸收和最大化硫异常信号强度之间的折衷方案,收集的数据为7.1 keV(Liu等。, 2012[刘,Q.,Dahmane,T.,Zhang,Z.,Assur,Z,Brasch,J.,Shapiro,L.,Mancia,F.&Hendrickson,W.A.(2012).科学,336,1033-1037.]),其中理论(f)′为0.365 e和理论(f)〃为0.703 e。在此能量下,估计的异常信号约为1.5%(|ΔF类|/F类)基于硫含量(352个氨基酸中的6个二硫化物和5个蛋氨酸)。为了获得完整的异常数据,并将辐射损伤引起的异常差异中的系统误差降至最低,所有数据均以倒置的几何图形(5°楔形)记录,以便及时记录真实的Friedel对。每个晶体都采集了2×90°的数据(测角仪设置为0至90°的“正向”数据和测角仪在5°交错楔形中设置为180至270°的“反向”数据),但两个样品(编号152和155)除外,其中仅采集了45°×2。数据处理使用XDS公司达到极限(d日最小值)此处报告的所有试验均为2.9Ω(Kabsch,2010【Kabsch,W.(2010a),《结晶学报》,D66,125-132。】,b条【Kabsch,W.(2010b),《结晶学报》,D66,133-144。】). 对于每个晶体,正向和反向过程分别进行处理,但具有共同的晶体取向参数。分配了一个参考数据集,以确保使用相同的轴约定(空间组)索引所有数据P(P)321). 按比例缩放每个晶体的正向和反向过程XDS公司和输出而不合并。

2.1.1. 评估单个晶体数据

对于当前的分析,来自单个晶体的28个数据集与菲尼克斯缩放和合并(使用默认设置和optimize_anomalous=真). 相关系数(CC阿诺)每个晶体的观察到的异常差异,以及完全合并的数据集的异常差异(包括所有晶体的所有数据),作为分辨率的函数进行了计算(图1[链接]). 根据CC对单个数据集进行聚类阿诺,但仅收集了45°数据的两个样品除外(编号152和155)。振幅的成对相关性(F类)计算了所有可能的晶体对(图1[链接]b条). 该分析确定了三个样本(编号117、119和233),它们似乎是异常值。有趣的是,这三种晶体集中在单元-细胞参数的窄分布中。

[图1]
图1
()抄送阿诺28个晶体的单个数据集与参考28个晶体合并数据的比较。D类阿诺将每个样本的合并和缩放数据(正向和反向)与D类阿诺来自完整的本地28晶体数据集。两个数据集(红色记录道;样本编号152和155)是离群值。(b条)相关系数(累积到d日最小值3.5º)的结构系数振幅(F类)根据每个晶体的缩放和合并数据(正楔和反楔组合),针对每个成对组合的样本。从蓝色(最低相关性)到红色(最高相关性),数据按百分位数进行着色(百分位数排名和相关性值显示在键中)。粗体线将14、18、23和28晶体数据集的晶体分开。该图与对角线对称。
2.1.2. 局部缩放与全局缩放的比较

对28、23、18和14个晶体的数据进行缩放,并使用这两种方法进行合并无AIMLESS全球扩展(Evans&Murshudov,2013【Evans,P.R.和Murshudov,G.N.(2013),《结晶学报》D691204-1214。】)以及菲尼克斯scale_and_merge用于局部缩放(Terwilliger,Hung等。, 2016【Terwilliger,T.C.,Bunkóczi,G.,Hung,L.-W.,Zwart,P.H.,Smith,J.L.,Akey,D.L.&Adams,P.D.(2016),《结晶学报》第72期,第359-374页。】). 与合并的数据无AIMLESS使用scale关键字constant、bfactor on和brotation 20确保这些试验的真正全局缩放。如前所述,选择晶体较少的组(Akey、Brown、Konwerski等。2014年【Akey,D.L.,Brown,W.C.,Konwerski,J.R.,Ogata,C.M.&Smith,J.L.(2014),《结晶学报》第70期,第2719-2729页。】). 简而言之,28个样本之间的成对相关性确定了18个被认为是相容的,最初用于解决NS1结构。回顾性分析包括测试18个样本的所有子集,其中4个似乎与下部结构识别。消除这四个因素后,得到了14个样本数据集。对最初的十个离群值样本进行重新处理,纠正了最初处理中的错误,并使另外五个样本“符合”。使用原来的18,这些组成了23个样本数据集。剩下的五个异常值要么只收集了45°的数据(编号152和155;图1[链接])或相关性较差(F类)剩余样品(编号117、119和233;图1[链接]b条). 所有样本的单位-细胞参数都相似,在1%以内,与平均值偏差最大的样本在精细探测器距离上存在相关偏差。因此,在这种情况下,单位间的差异并不是数据集簇的有用决定因素。

将合并数据集中观察到的异常差异与使用〈|ΔF类|/F类\9002;(Dauter和Adamiak,2001【Dauter,Z.和Adamiak,D.A.(2001),《晶体学报》,D57,990-995。】; 亨德里克森等。1985年[Hendrickson,W.A.、Smith,J.L.和Sheriff,S.(1985)。《酶学方法》。115,41-55。]; Smith&Hendrickson,2001年[Smith,J.L.&Hendrickson,W.A.(2001),《国际结晶学表格》,第F卷,M.G.Rossmann&E.Arnold编辑,第299-303页。Dordecht:Kluwer学术出版社。])和CC阿诺,其中CC阿诺在观测到的异常差异和基于精细模型计算出的异常差异之间进行了计算(菲力芬使用PDB条目4吨/升和显性硫(f)'和(f)“”值)。对于这两个指标,与全球尺度数据相比,本地尺度的异常优化数据与计算的异常差异更为一致(图2[链接]和2[链接]b条). 平均值〈|ΔF类计算|/F类计算〉(图2[链接],红色曲线)说明了与〈相比,单个S原子未被解析的数据中,来自二硫化物散射的异常信号增加(实心红色曲线)|ΔF类计算|/F类计算〉来自一个模型,在该模型中,通过半胱氨酸侧链扭转(红色虚线曲线)的旋转,二硫化物被人为打破。在所有情况下|ΔF类光突发事件|/F类光突发事件相对于全球尺度的数据,〉更接近于对局部尺度的异常优化数据的预期(固体黑色、橙色、绿色和蓝色虚线曲线),与本地刻度数据的异常信号中的低噪声水平一致。虽然违反直觉,但〈值很低|ΔF类光突发事件|/F类光突发事件〉对于来自弱晶体的数据集反常散射表示比高值更有用的异常差异,因为高值反映测量误差|ΔF类光突发事件|(Dauter和Adamiak,2001年[Dauter,Z.&Adamiak,D.A.(2001)《晶体学报》D571999-995。]; 亨德里克森和绪方,1997年[Hendrickson,W.A.和Ogata,C.M.(1997)。《酶学方法》。276494-523。]). CC公司阿诺最低分辨率外壳中的值小于下一个最低分辨率外壳(图2[链接]b条). 我们推测,这是由于难以建模散装固体对整体结构因素的贡献,这种影响在低分辨率下影响最大。或者,测量极低分辨率数据时的系统误差可能会造成影响。当使用局部尺度和异常优化或全局尺度的协议时,添加14到18和23晶体数据集的数据会在模型异常差异的一致性方面产生增量改进(图2[链接]b条). 然而,包含“离群值”数据集(从23到28个数据集)对本地尺度数据的影响很小,但严重降低了全球尺度数据的异常信号。在较高的分辨率下,局部缩放数据与模型阶段的一致性稍好。下部结构标识(使用搁架)当使用局部尺度和异常优化数据时,对于14和18数据集组合更稳健,相关系数更高(CFOM;图2[链接]c(c)). 对于23个数据集,局部和全局缩放协议工作得同样好,但当包含“离群值”数据集时SHELXD公司未能为全球范围的数据找到任何解决方案。我们怀疑异常优化协议中的数据集权重,而不是局部缩放就其本身而言,减轻了组合数据集的毒性。

[图2]
图2
本地尺度、异常优化数据与全球尺度数据的比较。()平均分数异常差[〈|ΔF类|/F类〉]28-晶体(黑色)、23-晶体(橙色)、18-晶体(绿色)和14-晶体(蓝色)数据集的分辨率与菲尼克斯scale_and_merge(实线)或无AIMLESS(虚线)|ΔF类计算|/F类计算\9002;来自改进模型(PDB条目4吨/升)带有完整的二硫化物(实线红线)和人工破碎的二硫化物。(b条)累计CC阿诺之间ΔF类光突发事件对于合并数据和ΔF类计算从改进的模型。(c(c))首席财务官(CC全部的+抄送虚弱的)10000中的最佳解决方案SHELXD公司在每个极限分辨率下进行试验。没有全球28晶体数据的绘图,因为SHELXD公司未能找到任何解决方案。
2.1.3. 合并数据质量与多样性密切相关

来自28、23、18和14个晶体的合并数据集具有异常高的异常差异多重性(78倍至150倍)。我们将分析扩展到具有12倍到45倍的更典型多重性的合并数据集。合并的数据集由八个、六个、四个和两个晶体生成,这些晶体是根据ΔF类28晶体参考数据集(图1[链接]). 正如预期的那样,异常信号质量随着多重性的降低而稳定下降(图3[链接]). 此外,使用少于14个晶体的数据组合在异常情况下失败下部结构用确定搁架(表1[链接]).

表1
发现正确的硫位置(23个可能位置中:12个S–S、10个Met和1个SO42−)带有SHELXD公司

多重性(异常) 缩放协议 晶体数量 每块晶体的数据(°) 找到的网站
150 本地 28 90 20
150 全球的 28 90 失败
129 本地 23 90 20
129 全球的 23 90 20
128 本地 28 75 21
105 本地 28 60 19
100 本地 18 90 20
100 全球的 18 90 20
80 本地 28 45 19
78 本地 14 90 19
78 全球的 14 90 16
45 本地 8 90 失败
[图3]
图3
来自不同数量晶体的合并数据集的异常信号度量。() 〈|ΔF类|/F类〉对于来自两个(11.5倍多重性)、四个(23.0倍)、六个(34.5倍)、八个(45.5倍)、14个(77.5倍),18个(100.2倍)、23个(128.8倍)和28个(150.0倍)晶体的合并数据集的本地尺度异常优化数据,其多重性如图例所示。(b条)抄送阿诺(ΔF类光突发事件与…相比ΔF类计算)按分辨率外壳作为增加多重性的函数,显示为单个分辨率容器。(c(c))累计CC阿诺对于可变多重性的数据集。
2.1.4. 辐射损伤和非同构的局部尺度处理

非同构和辐射损伤都会对多晶体数据集准确估计异常差异的能力产生不利影响。预计这些影响的大小会有所不同,并取决于数据收集的细节和晶体。因此,当重数减少时对信号质量的影响可能取决于是通过限制晶体数量还是通过限制每个晶体的实验观察次数来实现减少。在NS1的情况下,从几乎所有晶体中总共记录了180°的数据(每个正向和反向过程为90°,记录在交错的5°楔子中)。28个晶体中每个晶体数据采集结束时的衍射图像显示衍射极限明显降低,在数据采集开始时达到2.9º,到数据采集结束后通常降低0.5–0.8º。因此,我们预计,排除受辐射损伤影响最大的数据,数据采集中最后记录的正向和反向图像可能会改善相对于数据集的异常信号,其中通过排除晶体实现了等效的多重性。通过排除最近记录的15°、30°或45°数据,我们为所有28个晶体创建了“损伤最小化”数据集,然后将这些数据与局部缩放合并。每个“损伤最小化”合并数据集都与一个具有相似多重性的数据集进行了比较,该数据集包括来自较少晶体的完整90°反向光束数据[来自28个晶体的前75°数据(多重性的127.5倍)来自23个晶体的数据为90°(多重性的128.8倍),来自28个晶体的前60°数据为104.6倍来自18个晶体的90°数据(多重性的100.2倍),来自28个晶体的前45°数据(重性的80.2倍)来自14个晶体的90°数据(77.5倍多重性)]。28个晶体的完整90°数据集具有150.0倍的异常对多重性。在等效多重性下,异常信号度量对于最小损伤和晶体还原数据集大致等效(图4[链接],表1[链接]). 这表明,对于第一近似,在NS1数据的情况下,由于非同构引起的差异和由于辐射损伤引起的差异通过局部缩放协议处理得同样好。然而,我们注意到|ΔF类|/F类和CC阿诺与具有匹配多重性的受损最小化数据集相比,还原晶体数据集的度量稍好一些,但始终更好。

[图4]
图4
损伤最小化和晶体诱导多晶体数据集的比较。() 〈|ΔF类|/F类28、23、18和14晶体数据集(实线)的分辨率,以及匹配多重性的75、60或45°数据集(虚线)的损伤最小化。红色为〈的计算值|ΔF类|/F类〉来自改进模型。(b条)累计CC阿诺比较ΔF类用于合并数据与从优化模型计算的数据。(c(c))首席财务官(CC全部的+抄送虚弱的)从10000中选出最佳解决方案SHELXD公司在每个极限分辨率下进行试验。

3.总结

原则上,局部标度将更好地解释辐射损伤或样品吸收建模错误引起的强度差异。在这里,对几个晶体中的每个晶体的数据进行局部缩放,并通过异常优化合并单个晶体数据集。这种缩放和合并过程产生了一个合并的多晶体数据集,其异常差异中的噪声低于对相同多晶体数据进行全局缩放和合并而未进行异常优化时观察到的噪声。局部缩放可以更准确地估计数据多重性较低时的异常差异,而数据集加权可以优化向下加权的可疑数据的异常差异(23-28个晶体数据集),从而最小化从组合的元数据集中挑选数据的需要。本地扩展和数据集加权都有助于在下部结构决心。

我们调查的最显著结果是,对于相同多重性的数据集,异常差异的总体质量是相似的,无论是通过排除晶体还是通过排除每个晶体中受辐射破坏最严重的数据段来减少数据多重性。对于所测试的三种多重性(128倍、100倍和80倍)中的每一种,根据标准〈,晶体还原数据略优于损伤最小化数据|ΔF类|/F类〉和与计算出的异常差异的相关性。我们的预期正好相反:排除数据以最小化辐射损伤的影响将导致异常差异质量的显著改善。两个影响可能有助于发现使用更少的晶体比使用更少的每个晶体的数据实现给定的多重性稍微好一些。NS1晶体衍射至~3º分辨率,但我们仅分析了最强的数据(至4.0º分辨率),因为超出此极限的异常差异没有用处。预计最低分辨率的数据受辐射损伤的影响最小,因此,尽管在每个晶体的数据采集90°(×2)期间在~3°极限处出现了可见损伤,但仍可以保持4.0°分辨率的异常差异。第二个影响是,对于损伤最小化的数据集,每个晶体中观察到的异常差异的多样性减少了(从完整的90°数据集的六倍减少到45°数据集中的三倍)。对于低分辨率下的微弱异常差异(估计为1.5%F类对于NS1;图4中的红色实心曲线[链接])在分辨率为4.0º及以下时,更大的多重性明显优于避免明显适度的辐射损伤影响。这在成对CC中也很清楚阿诺值,其中记录了45°(×2)数据的两个晶体数据中的异常差异与其他晶体的异常差异的相关性要差得多,即使振幅(F类)相关性良好。

异常子结构的确定几乎完全依赖于低分辨率、通常是高强度的数据,我们已经看到局部缩放和异常优化提高了多晶体数据集中异常差异的质量。这可能不是生成晶体衍射极限的结构因子振幅的最佳方法,因为高分辨率壳体中的局部比例因子仅使用最弱的数据生成。更全局的方案可能更适合为模型准备多晶体数据集精细化。局部缩放和异常优化的组合似乎为组合来自许多晶体的数据提供了一种稳健而有效的方法,以在困难的问题中最大限度地提高异常信号的质量。

致谢

这项工作得到了美国国立卫生研究院(P01AI055672至JLS,P01GM063210至TCT)、美国能源部(合同DE-AC02-05CH11231)至TCT以及Martha L.Ludwig蛋白质结构与功能教授至JLS的资助。通用汽车的光束线/CA@APS得到了国家普通医学科学研究所(“GM”;Y1-GM-1104)和国家癌症研究院(“CA”;Y1-CO-1020)的支持。

工具书类

第一次引用Akey,D.L.、Brown,W.C.、Dutta,S.、Konwerski,J.、Jose,J.,Jurkow,T.J.、DelProposto,J.和Ogata,C.M.、Skiniotis,G.、Kuhn,R.J.和Smith,J.L.(2014)。科学类,343, 881–885. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Akey,D.L.、Brown,W.C.、Konwerski,J.R.、Ogata,C.M.和Smith,J.L.(2014)。《水晶学报》。D类70, 2719–2729. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Dauter,Z.和Adamiak,D.A.(2001年)。《水晶学报》。D类57, 990–995. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Evans,P.(2006)。《水晶学报》。D类62, 72–82. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Evans,P.R.和Murshudov,G.N.(2013)。《水晶学报》。D类69, 1204–1214. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Foadi,J.、Aller,P.、Alguel,Y.、Cameron,A.、Axford,D.、Owen,R.L.、Armour,W.、Waterman,D.G.、Iwata,S.和Evans,G.(2013年)。《水晶学报》。D类69,1617-1632年科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Giordano,R.,Leal,R.M.F.,Bourenkov,G.P.,McSweeney,S.&Popov,A.N.(2012年)。《水晶学报》。D类68, 649–658. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Hendrickson,W.A.和Ogata,C.M.(1997)。方法酶制剂。 276, 494–523.  交叉参考 谷歌学者
第一次引用Hendrickson,W.A.、Smith,J.L.和Sheriff,S.(1985年)。方法酶制剂。 115, 41–55. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Kabsch,W.(2010年).《水晶学报》。D类66,125–132科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Kabsch,W.(2010年b条).《水晶学报》。D类66, 133–144. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Liu,Q.、Dahmane,T.、Z.、Assur,Z.、Brasch,J.、Shapiro,L.、Mancia,F.和Hendrickson,W.A.(2012)。科学类,336, 1033–1037. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Liu,Q.,Liu,Q.&Hendrickson,W.A.(2013)。《水晶学报》。D类69, 1314–1332. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.(2010年)。《水晶学报》。D类66, 479–485. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Smith,J.L.和Hendrickson,W.A.(2001年)。国际结晶学表,卷。F类,由M.G.Rossmann和E.Arnold编辑,第299–303页。Dordecht:Kluwer学术出版社。 谷歌学者
第一次引用Terwilliger,T.C.、Bunkóczi,G.、Hung,L.-W.、Zwart,P.H.、Smith,J.L.、Akey,D.L.和Adams,P.D.(2016)。《水晶学报》。D类72, 346–358. 交叉参考 IUCr日志 谷歌学者
第一次引用Terwilliger,T.C.、Bunkóczi,G.、Hung,L.-W.、Zwart,P.H.、Smith,J.L.、Akey,D.L.和Adams,P.D.(2016)。《水晶学报》。D类72, 359–374. 交叉参考 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标结构
生物学
编号:2059-7983