1.简介
使用来自多个样本的高多重性Bijvoet数据已被证明在确定异常方面是有效的下部结构在困难情况下(Akey、Brown、Dutta等。2014年
; 线路接口单元等。, 2012
). 这些困难的情况包括具有弱或很少异常散射体的晶体、衍射不良的晶体和/或远离峰值吸收能量收集的数据。虽然原则上增加合并数据集的多样性可以提高数据质量,但当合并多个样本的数据时,会出现非同构现象,而当从单晶中收集更多数据时,则会出现辐射损伤。在合并多个样本的数据时,通过识别和排除异常晶体或从辐射损坏的数据集中删除后期衍射图像来剔除数据可能是有效的。选择数据集的“最佳”组合需要对单个数据集进行评估,如果怀疑存在辐射损伤,则需要决定每个样本中包含多少数据。兼容的数据集可以通过各种指标选择,包括单元间的变化(Foadi等。, 2013
; 线路接口单元等。, 2012
, 2013
)异常差异和/或强度相关系数(Akey、Brown、Konwerski等。2014年
; 佐丹奴等。, 2012
; 线路接口单元等。, 2012
, 2013
; 洪·特威利格等。, 2016
; 本科奇·特威利格等。, 2016
; 埃文斯,2006
)、和合并对因素(Evans,2006
).
对数据合并策略进行了修改,该策略依赖于合并前数据集的权重菲尼克斯scale_and_merge作为的一部分菲尼克斯软件套件(Terwilliger,Hung等。, 2016
).凤凰scale_and_merge使用多部分策略优化合并数据集中异常差异的准确性。该策略结合了局部缩放算法的使用、数据各向异性的校正以及最重要的是,基于异常差异与平均数据的相关性为每个数据集确定权重。原则上,局部缩放可以改善辐射损伤的影响,与数据剔除相比,加权单个数据集允许在最终合并数据中包含更多样本。While期间菲尼克斯缩放和合并尝试使用尽可能多的样本,识别并排除异常数据集。
在这里,我们评估了局部缩放和数据集加权的策略,并与使用全局缩放协议处理数据进行了比较。该系统是黄病毒NS1蛋白,为此我们解决了晶体结构来自反常散射硫(Akey、Brown、Dutta等。2014年
). S-SAD数据非常适合于本实验,因为完整的数据记录了24个晶体中每一个的六倍Bijvoet对多重性,而其他四个晶体中的每一个具有三倍多重性。此前,我们报告称,在某些情况下下部结构排除“离群值”数据集(Akey、Brown、Konwerski等。2014年
). 当添加数据(从最好到最坏)以创建合并数据集时,这一点得到了确认(特威利格,洪等。, 2016
). 在没有考虑数据间差异的情况下,添加“最差”数据集会降低异常差异的准确性(Terwilliger,Hung等。, 2016
). 异常晶体的识别可能很繁琐,并且可能因使用的度量标准而异。我们测试了数据集权重是否在菲尼克斯scale_and_merge将淡化轻微非同晶晶体的有害影响,并消除手动从异常晶体中排除数据的需要。
我们解决了晶体结构黄病毒NS1蛋白的天然硫SAD相位在低分辨率下使用多晶体数据进行,然后相位扩展到3.0º分辨率,得到了高质量的电子密度图(Akey、Brown、Dutta等。2014年
; Akey、Brown、Konwerski等。2014年
). 共收集了28个数据集,其中18个数据集合并为原始结构解。在这里,我们研究了一种局部缩放和异常优化策略,用于将单个数据集加权并组合为最终的高多重性合并数据集。由于重点是优化异常的确定下部结构,数据分析仅限于检测到异常信号(4.0º)的低分辨率壳体中的异常信号质量指示器。评估合并数据质量的指标是相关性(CC阿诺)观测到的异常差异(ΔF类)对于来自原子模型或参考数据集的数据,异常差异与总差异的比率结构振幅(〈|ΔF类|/F类〉)和异常的质量下部结构使用从合并的数据集确定SHELXD公司(谢尔德里克,2010年
; 发现的站点数量和CFOM)|ΔF类|/F类\9002;是一个有用的指标,因为它可以在没有结构信息的情况下计算,它似乎是异常信号质量的敏感指标,并且不依赖于误差估计。而异常差异的信噪比估计[|ΔF类|/σΔ(F类)〉]也可以使用,sigma值随用于估计它们的方法而变化,特别是对于小差异和弱差异F类,它们可能是评估不同合并策略的不可靠指标。
3.总结
原则上,局部标度将更好地解释辐射损伤或样品吸收建模错误引起的强度差异。在这里,对几个晶体中的每个晶体的数据进行局部缩放,并通过异常优化合并单个晶体数据集。这种缩放和合并过程产生了一个合并的多晶体数据集,其异常差异中的噪声低于对相同多晶体数据进行全局缩放和合并而未进行异常优化时观察到的噪声。局部缩放可以更准确地估计数据多重性较低时的异常差异,而数据集加权可以优化向下加权的可疑数据的异常差异(23-与28个晶体数据集),从而最小化从组合的元数据集中挑选数据的需要。本地扩展和数据集加权都有助于在下部结构决心。
我们调查的最显著结果是,对于相同多重性的数据集,异常差异的总体质量是相似的,无论是通过排除晶体还是通过排除每个晶体中受辐射破坏最严重的数据段来减少数据多重性。对于所测试的三种多重性(128倍、100倍和80倍)中的每一种,根据标准〈,晶体还原数据略优于损伤最小化数据|ΔF类|/F类〉和与计算出的异常差异的相关性。我们的预期正好相反:排除数据以最小化辐射损伤的影响将导致异常差异质量的显著改善。两个影响可能有助于发现使用更少的晶体比使用更少的每个晶体的数据实现给定的多重性稍微好一些。NS1晶体衍射至~3º分辨率,但我们仅分析了最强的数据(至4.0º分辨率),因为超出此极限的异常差异没有用处。预计最低分辨率的数据受辐射损伤的影响最小,因此,尽管在每个晶体的数据采集90°(×2)期间在~3°极限处出现了可见损伤,但仍可以保持4.0°分辨率的异常差异。第二个影响是,对于损伤最小化的数据集,每个晶体中观察到的异常差异的多样性减少了(从完整的90°数据集的六倍减少到45°数据集中的三倍)。对于低分辨率下的微弱异常差异(估计为1.5%F类对于NS1;图4中的红色实心曲线
一)在分辨率为4.0º及以下时,更大的多重性明显优于避免明显适度的辐射损伤影响。这在成对CC中也很清楚阿诺值,其中记录了45°(×2)数据的两个晶体数据中的异常差异与其他晶体的异常差异的相关性要差得多,即使振幅(F类)相关性良好。
异常子结构的确定几乎完全依赖于低分辨率、通常是高强度的数据,我们已经看到局部缩放和异常优化提高了多晶体数据集中异常差异的质量。这可能不是生成晶体衍射极限的结构因子振幅的最佳方法,因为高分辨率壳体中的局部比例因子仅使用最弱的数据生成。更全局的方案可能更适合为模型准备多晶体数据集精细化。局部缩放和异常优化的组合似乎为组合来自许多晶体的数据提供了一种稳健而有效的方法,以在困难的问题中最大限度地提高异常信号的质量。
致谢
这项工作得到了美国国立卫生研究院(P01AI055672至JLS,P01GM063210至TCT)、美国能源部(合同DE-AC02-05CH11231)至TCT以及Martha L.Ludwig蛋白质结构与功能教授至JLS的资助。通用汽车的光束线/CA@APS得到了国家普通医学科学研究所(“GM”;Y1-GM-1104)和国家癌症研究院(“CA”;Y1-CO-1020)的支持。
工具书类
Akey,D.L.、Brown,W.C.、Dutta,S.、Konwerski,J.、Jose,J.,Jurkow,T.J.、DelProposto,J.和Ogata,C.M.、Skiniotis,G.、Kuhn,R.J.和Smith,J.L.(2014)。科学类,343, 881–885. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Akey,D.L.、Brown,W.C.、Konwerski,J.R.、Ogata,C.M.和Smith,J.L.(2014)。《水晶学报》。D类70, 2719–2729. 科学网 交叉参考 IUCr日志 谷歌学者
Dauter,Z.和Adamiak,D.A.(2001年)。《水晶学报》。D类57, 990–995. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Evans,P.(2006)。《水晶学报》。D类62, 72–82. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Evans,P.R.和Murshudov,G.N.(2013)。《水晶学报》。D类69, 1204–1214. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Foadi,J.、Aller,P.、Alguel,Y.、Cameron,A.、Axford,D.、Owen,R.L.、Armour,W.、Waterman,D.G.、Iwata,S.和Evans,G.(2013年)。《水晶学报》。D类69,1617-1632年科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Giordano,R.,Leal,R.M.F.,Bourenkov,G.P.,McSweeney,S.&Popov,A.N.(2012年)。《水晶学报》。D类68, 649–658. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Hendrickson,W.A.和Ogata,C.M.(1997)。方法酶制剂。 276, 494–523. 交叉参考 谷歌学者
Hendrickson,W.A.、Smith,J.L.和Sheriff,S.(1985年)。方法酶制剂。 115, 41–55. 交叉参考 中国科学院 公共医学 谷歌学者
Kabsch,W.(2010年一).《水晶学报》。D类66,125–132科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Kabsch,W.(2010年b条).《水晶学报》。D类66, 133–144. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Liu,Q.、Dahmane,T.、Z.、Assur,Z.、Brasch,J.、Shapiro,L.、Mancia,F.和Hendrickson,W.A.(2012)。科学类,336, 1033–1037. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Liu,Q.,Liu,Q.&Hendrickson,W.A.(2013)。《水晶学报》。D类69, 1314–1332. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Sheldrick,G.M.(2010年)。《水晶学报》。D类66, 479–485. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Smith,J.L.和Hendrickson,W.A.(2001年)。国际结晶学表,卷。F类,由M.G.Rossmann和E.Arnold编辑,第299–303页。Dordecht:Kluwer学术出版社。 谷歌学者
Terwilliger,T.C.、Bunkóczi,G.、Hung,L.-W.、Zwart,P.H.、Smith,J.L.、Akey,D.L.和Adams,P.D.(2016)。《水晶学报》。D类72, 346–358. 交叉参考 IUCr日志 谷歌学者
Terwilliger,T.C.、Bunkóczi,G.、Hung,L.-W.、Zwart,P.H.、Smith,J.L.、Akey,D.L.和Adams,P.D.(2016)。《水晶学报》。D类72, 359–374. 交叉参考 IUCr日志 谷歌学者
![期刊徽标](//journals.iucr.org/logos/jicons/d_96x112.png) | 结构 生物学 |
编号:2059-7983
打开
访问