研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标基础
进展
国际标准编号:2053-2733

多数据集数据收集策略产生更好的衍射数据

十字标记_颜色_方形_文本.svg

中国科学院生物物理研究所生物大分子国家实验室,北京100101,中华人民共和国b条美国佐治亚大学生物化学和分子生物学系,雅典,佐治亚州30602
*通信电子邮件:zjliu@ibp.ac.cn,wang@BCL1.bmb.uga.edu

(收到日期:2011年7月5日; 2011年9月14日接受; 在线2011年10月18日)

提出并分析了一种用于大分子晶体衍射数据采集的多数据集(MDS)数据采集策略。理论分析表明,与常用的固定X射线剂量的单数据集策略相比,MDS策略可以降低衍射数据的标准偏差(背景噪声)。为了从实验上验证假设,开发了一种数据质量评估过程,称为X射线数据采集系统的准备测试。无锌胰岛素晶体中硫原子的异常信号被用作探针,以区分使用不同数据收集策略收集的数据的质量。使用基于家庭实验室的旋转阳极X射线和同步加速器X射线系统的数据采集结果表明,与常规数据采集策略采集的数据相比,使用MDS策略采集的衍射数据包含更准确的硫原子异常信号。此外,MDS策略在辐射损伤敏感晶体和更好地使用旋转阳极以及同步加速器X射线方面提供了更多优势。

1.简介

晶体的X射线衍射数据包含结晶分子的关键三维结构信息;它们是随后阐明结晶分子空间结构的唯一直接实验来源。单晶的X射线衍射数据收集是指测量单晶的衍射强度及其标准偏差(噪声)的过程。衍射数据的质量决定了最终模型的准确性。对于高分子晶体学,有许多因素会影响数据质量。这些因素可以分为三类。(i) 晶体:衍射质量取决于分子的内部有序度和晶体的镶嵌性,以及冷冻状态,如冷冻溶液的选择、回路和冷冻处理。(ii)仪器:X射线束质量(单色性、强度/位置稳定性、发散度等。)测角(测角系统的机械精度和快门同步)和探测器的质量[暗电流校正,不同镶嵌芯片的平衡,灵敏度,动态范围, 探测量子效率 等。]. (iii)数据收集策略:波长、衰减、探测器到晶体的距离、曝光时间、开始角度、扫描范围和振荡角度。因此,对于给定的晶体和X射线数据采集系统,获得尽可能高质量衍射数据的关键在于数据采集策略(Cianci等人。, 2008【Cianci,M.、Helliwell,J.R.和Suzuki,A.(2008),《结晶学报》,D64,1196-1209。】; Sarma&Karplus,2006年【Sarma,G.N.&Karplus,P.A.(2006),《水晶学报》,D62,707-716。】).

与小分子晶体相比,大分子晶体对X射线的衍射很差,在X射线束中的寿命通常要短得多。换句话说,大分子晶体只能承受一定量的X射线剂量,然后才能因辐射损伤而被破坏。因此,在大分子晶体的寿命内获得准确完整的衍射数据集是非常重要的(González,2003【González,A.(2003),《水晶学报》,D591935-1942年。】; 2011年,里尔【Leal,R.M.F.,Bourenkov,G.P.,Svensson,O.,Spruce,D.,Guijarro,M.&Popov,A.N.(2011),《同步辐射杂志》第18期,第381-386页。】; 等人。, 2003【Yang,C.、Pflugrath,J.W.、Courville,D.A.、Stence,C.N.和Ferrara,J.D.(2003)。晶体学报D591943-1957。】).

在本研究中,提出了一种多数据集(MDS)数据收集策略。理论分析表明,在固定X射线剂量下,MDS数据收集策略可以产生更好的数据质量。为了从实验上验证假设,开发了一种数据质量评估过程,称为X射线数据采集系统的准备测试。使用无锌胰岛素晶体作为标准测试晶体,并使用胰岛素晶体中硫原子的异常信号作为指标,以区分使用不同数据收集策略收集的数据的质量。

2.理论概述

在传统的数据收集实验中,晶体被暴露x个每帧s,总计°被扫描。拟议的MDS战略包括x个/N个每帧曝光秒数(N个是一个正整数),同时扫描总计°,其中重复扫描N个次。就X射线剂量而言,这两种策略都将相同数量的X射线光子放入晶体中,但MDS策略产生的数据质量更好。让我们看看这个理论。

20世纪60年代,单计数衍射仪被开发用于小分子晶体的X射线分析。反射的标准偏差值由以下公式计算得出

[\sigma_{\rm总计}=(\sigma^{2}_{\rm Is}+\sigma^{2}_{\rm Ins})^{1/2}\eqno(1)]

[=\kappa(Sc_{rm-peak}+Sc_{rm-bg}+\varepsilon-Sc^2)^{1/2}\eqno(2)]

哪里σ全部的是测量反射点的总标准偏差,σ是计数统计的标准偏差σIns公司是仪器误差的标准偏差。Sc公司Sc公司背景分别是反射峰区域和背景区域的光子计数。Sc公司是光子扫描计数的总和,是实验(无知)因子,通常为0.02<< 0.10. 20世纪80年代,当为高分子晶体数据采集开发面积检测器时,二维面积检测器的个别反射的标准偏差值也由方程(1)中表示的两种类型的误差建模[链接]例如,

[\sigma_{\rm总计}^2=\sigma^{2}_{\rm Is}+m\sigma^{2}_{\rm Ins}\eqno(3)]

[=G[I_s+I_{\rm bg}+(m/n)I_{\ rm bg}]+m(K/A)^2 I^2_s\eqno(4)]

哪里G公司是探测器的增益,n个分别是测量箱反射峰区域和背景区域中的像素数,背景分别是峰值和背景的总和强度,K(K)是比例常数,以及一个是一个与反射点半宽度有关的因素(Leslie,2001【Leslie,A.G.W.(2001),《大分子衍射数据整合》,第F卷,《国际结晶学表》,第4页。多德雷赫特:Kluwer学术出版社。]).

很明显σ全部的随着现在,如果我们将曝光时间减少一倍N个,因此

[I_j=I_s/N(5)]

哪里j个是1期间峰值强度的总和/N个曝光时间,那么

[\sigma_j^2=G[{I_s}+{I_{\rm-bg}}+(m/n){I{\rm bg}}]/n+m{(K/A)^2}{({I_s{/n)^2{。\等式(6)]

我们通过重复数据收集来补偿较弱的数据N个次。将所有等效反射的强度相加,我们得到

[I_s=I{j1}+I{j2}+I_{j3}+\ldots+I{jN}=NI_j\eqno(7)]

[\sigma_{rm总计}^2=\sigma _{1}^2+\sigma-{2}^2+\sigma/{3}^2+/\ldots+\simma^2_N=N\sigma.{j}^2\eqno(8)]

[=天然气[I_s+I_{\rm bg}+(m/n)I_{\ rm bg}]/n+牛米(K/A)^2(I_s/n)^2\eqno(9)]

[=G[I_s+I_{\rm bg}+(m/n)I_{.rm bg}]+{m(K/A)^2I_s^2}\在{n}}上。\等式(10)]

根据方程式(7)[链接]理论上,使用MDS策略和常规数据收集策略一样,可以恢复反射的强度。值得注意的是,MDS数据收集策略减少了错误[等式(10)中的第二项[链接]]乘以N个与使用常规方法收集的数据进行比较[方程式(4)][链接]]. 因此,对于固定的X射线剂量,由于减少了标准偏差,与使用常规数据收集方法收集单个数据集相比,使用MDS策略收集多个数据集可以产生更准确的数据。

3.数据质量评估

使用常规策略和MDS策略收集的数据之间的差异可能很小,因此需要一种敏感的方法来测量细微的差异,并评估这种差异对结构解决方案的影响。我们决定使用无锌胰岛素晶体中的硫异常信号作为探针,来评估使用这两种策略收集的衍射数据的数据质量。如果使用通常的X射线波长(0.97–2.0º)收集衍射数据,则硫的异常信号相对较弱,但这一缺点并没有阻止研究人员将硫的异常信息用作相位探针。Hendrickson&Teeter(1981)对其进行了实验研究[Hendrickson,W.A.&Teeter,M.M.(1981),《自然》(伦敦),290,107-113。])王(1985)的理论[王,B.C.(1985).《酶学方法》.115,90-112.]). 20世纪90年代报告了更多成功案例(Dauter等人。, 1999【Dauter,Z.、Dauter、M.、de la Fortelle,E.、Bricogne,G.和Sheldrick,G.M.(1999),《分子生物学杂志》289、83-92。】; 刘,2000[刘,Z.J.,维索茨基,E.S.,陈,C.J.,罗斯,J.P.,李,J.&王,B.C.(2000).蛋白质科学,2085-2093.]). 因此,硫原子的微弱反常信号可以作为一个灵敏的探针,来区分不同策略采集的衍射数据中的细微差异。通过测量和比较衍射数据中记录的异常信号的强度,可以评估两种数据收集策略的效率。选择胰岛素晶体的理由如下:(i)无锌胰岛素晶体具有高度对称性(213空间组),适用于使用这两种策略收集数据,而不会对晶体造成太多辐射损伤;(ii)很容易获得胰岛素样品并生长晶体,胰岛素晶体的衍射分辨率(约2.0º)适合评估数据质量;(iii)每个胰岛素分子有三个二硫键,这三个二硫化物键的异常信号是评估数据质量的理想探针。提出了三个参数来评估使用不同策略收集的数据的质量:

(1) 相对峰高(RPH):RPH是在50.0–2.5下计算的反常差值傅里叶图中前九个最高峰中三个二硫键(前三个最高峰)的平均峰高与后三个(第七、第八和第九个)的平均峰值高的比值使用异常数据和程序计算的刚性定义模型相位的奥数分辨率快速傅里叶变换在中CCP4型套件(协作计算项目,第4期,1994年[合作计算项目,第4期(1994年),《晶体学报》,D50,760-763。]). 这里的想法是将三个“特定”二硫键(前三个)的反常峰值密度与图中的“代表性”噪声峰进行比较。预计较高的RPH值意味着记录到三个二硫键的较强异常信号,因此收集了一组质量更好的数据。

计算中未选择第四、第五和第六个最高峰值,因为考虑到它们可能更受实验条件的影响。例如,来自胰岛素样品、缓冲液或结晶溶液的任何金属离子都可能导致更高水平的背景异常信号。因此,峰值4、5和6比峰值7、8和9更容易受到影响;换言之,第七、第八和第九峰值更有资格“表示”图中的噪声水平。

(2) 地图相关系数(Map-cc):Map-cc是地图相关系数模型相2之间(f)o个(f)c(c)在相同分辨率范围(50.0–2.5°)下计算的电子密度图和S-SAD相实验图。它用于测量实验S-SAD相位图与理论计算的理想图之间的偏差。这是使用不同策略收集的数据质量的间接指示。使用傅里叶合成方法和方程(11)计算模型相位图[链接]:

[p(x,y,z)=\textstyle\sum\limits_h\sum\limits_k\sum\limits_lwF(h,k,l)\exp{(-i\varphi)},\eqno(11)]

哪里第页是电子密度函数,w个是根据刚体计算的优值(FOM)精炼过程,F类是衍射数据中两次测量振幅的差值减去计算出的衍射因子(2(f)o个(f)c(c)),φ表示根据优化模型计算的阶段。S-SAD实验相位图使用相同的方程(11)计算[链接]和相同的振幅F类,但FOM和相位是使用硫原子的反常散射每个数据集中的信号(Wang,1985[王,B.C.(1985).《酶学方法》.115,90-112.]). 硫原子的坐标是从刚性体定义模型中获得的。地图抄送是相关系数在两个地图之间,使用重叠地图在中CCP4型套件(协作计算项目,第4期,1994年[合作计算项目,第4期(1994年),《晶体学报》,D50,760-763。]). 它由方程式(12)定义[链接]

[{\rm Map\,cc}={{(\langle xy\rangle-\langle x\rangle\langle y\rangle)}\ over{(\ langle x^2\rangle-\ langle x \rangle^2)^{1/2}\,(\ langley^2\langle-\langley\range^2)|{1/2{}},\eqno(12)]

哪里x个表示一张地图中的密度值表示另一幅图中的值,〉\9002;表示括号内数量的平均值。

(3) 地图比例相关系数(Rcc):Rcc定义为为使用MDS策略收集的数据计算的Map cc与使用常规策略收集的Map cc的比率,表示为

[{\rm Rcc}={{\rm-Map\,cc}_{\rm-DMS}}\ over{\rm-Map\,cc}_{\ rm-Reg}}},\eqno(13)]

其中地图抄送MDS公司和映射cc规则是分别用相同晶体的MDS和常规策略收集的数据的映射相关系数。它旨在比较MDS和定期数据收集的有效性。Rcc值越大,表示两种数据收集策略之间的差异越大。

4.实验验证

4.1. 结晶和数据收集

牛胰腺胰岛素样品购自Sigma–Aldrich(目录号I5500)。为了获得无锌胰岛素,将胰岛素样品溶解在缓冲液(50 m)中NaHPO公司4,0.02米EDTA,pH 11.0)至最终浓度15 mg ml−1,然后对照缓冲液进行透析(0.0182高性能操作4,pH值10.5,0.001EDTA pH 9.0)过夜;每4h更换缓冲液三次。使用悬挂滴气相扩散法进行结晶实验:将含有1µl蛋白质的2µl悬挂滴与1µl母液混合,在300µl储液上平衡,并在289 K下培养。晶体在15%PEG 4000、100 m中生长双三重,pH 8.0和100 m氯化钠。将尺寸约为0.2×0.2×0.2 mm的胰岛素晶体在含有30%甘油的母液中浸泡5 s,然后在液氮中闪速冷冻,以进行后续衍射测试和数据采集。使用家用实验室铜旋转阳极和波长为2.00º的同步辐射X射线源收集了异常衍射数据。旋转阳极衍射数据是使用带有MicroMax-007 X射线发生器的Saturn 944+CCD探测器收集的。同步加速器数据是在阿贡国家实验室先进光子源(APS)的22-ID束线(SER-CAT)处使用2.00埃波长X射线收集的。

每个晶体被用于数据采集两次——首先是常规曝光时间,然后是曝光时间的三分之一,但数据采集在相同的扫描范围内重复三次。常规和MDS暴露数据的总X射线剂量相同。对于每个数据收集策略,测试了三个具有相似尺寸和衍射质量的胰岛素晶体。为了证明MDS数据收集方法能够真正产生比常规方法更好的质量数据,即使有一些不太有利的条件,我们首先收集了常规暴露数据。该方法的基本原理如下。理论分析表明,使用MDS策略收集的数据比使用常规策略收集的质量更好。如果采用常规收集策略的数据是用新鲜晶体收集的,然后再采用MDS策略进行数据收集,则MDS策略产生的数据质量应受到常规数据收集过程中产生的辐射损伤的影响。如果即使在这种不太有利的情况下,MDS策略仍能产生比常规策略更高质量的数据,那么就证明了理论预测,并避免了不同测量过程中的辐射损伤伪影。如果常规策略和MDS策略的数据收集顺序颠倒,辐射损伤伪影就无法消除,可能无法得出MDS策略更好的结论。

4.2.结构确定和计算

使用旋转阳极X射线收集的数据被索引和缩放2000港币(Otwinowski&Minor,1997年[Otwinowski,Z.&Minor,W.(1997),《酶学方法》,276307-326。]). 数据收集和数据处理结果如表1所示[链接](). 使用同步辐射X射线收集的数据被索引并整合d*树(Pflugrath,1999年【Pflugrath,J.W.(1999),《结晶学报》,D551718-1725。】),并使用进行缩放三维比例(付等人。, 2004[Fu,Z.-Q.,Rose,J.P.&Wang,B.-C.(2004),《结晶学报》D60,499-506.]). 数据收集和数据处理结果如表1所示[链接](b条). 该结构通过差分傅里叶方法求解,使用REFMAC公司(穆尔舒多夫等人。, 1997【Murshudov,G.N.,Vagin,A.A.&Dodson,E.J.(1997),《结晶学报》D53,240-255。】)在中CCP4型套件(协作计算项目,第4期,1994年[合作计算项目,第4期(1994年),《晶体学报》,D50,760-763。])用猪胰岛素(PDB代码9英寸)作为初始模型(Gursky,1992【Gursky,O.,Li,Y.,Badger,J.&Caspar,D.L.D.(1992),《生物物理学杂志》第61期,第604-611页。】). 为了将计算中的模型偏差降至最低,仅需对刚体进行十次循环精炼对每个数据集使用REFMAC公司(穆尔舒多夫等人。, 1997【Murshudov,G.N.,Vagin,A.A.&Dodson,E.J.(1997),《结晶学报》D53,240-255。】)在50.0–2.5º分辨率范围内。当立方胰岛素晶体被索引时,有两种可能性,其中只有一种符合猪胰岛素晶体结构存放在PDB中9英寸。另一个索引可以用矩阵[-K(K),H(H),].

表1
数据收集和精炼统计学

()晶体1、2和3。X射线源:Rigaku MicroMax-007。X射线光学:VariMax HR;探测器:Rigaku Saturn 944+;波长:1.54º;空间组:213

  水晶1 水晶2 水晶3
单元格尺寸:=b条=c(c)(Å) 77.96 77.59 78.42
暴露 45 15 45 15 45 15
扫描范围(°) 50 3 × 50.0 50 3 × 50.0 50 3 × 50.0
分辨率(Ω) 50.00–2.00 (2.07–2.00) 50.00–2.00 (2.07–2.00) 50.00–1.95 (2.02–1.95) 50.00–2.10 (2.18–2.10) 50.00–1.95 (2.02–1.95) 50.00–2.10 (2.18–2.10)
R(右)sym(对称)(%) 5.3 (22.7) 5.5 (44.5) 4.8 (33.7) 6.9 (38.8) 3.9 (23.5) 5.8 (48.8)
/σ 47.84 (6.4) 66.21 (6.18) 39.60 (4.71) 53.16(10.06) 42.07 (5.58) 51.52 (5.17)
完整性(%) 99.6 (99.8) 99.8 (100.0) 93.5 (61.1) 98.4 (90.9) 99.8(100.0) 98.4(90.9)
冗余 5.3 16 5.5 16.9 5.2 15.5

(b条)晶体4、5和6。X射线源:SER-CAT 22-ID;X射线光学:单色仪;探测器:3月225日CCD;波长:2.0º;空间组:213

  水晶4 水晶5 水晶6
单元格尺寸:=b条=c(c)(Å) 77.84 78.58 77.76
暴露 9 3 9 3 9 3
扫描范围(°) 90 3 × 90.0 90 3 × 90.0 90 3 × 90.0
分辨率(Ω) 50.00–2.30 (2.38–2.30) 50.00–2.30 (2.38–2.30) 50.00–2.30 (2.38–2.30) 50.00–2.30 (2.38–2.30) 50.00–2.30 (2.38–2.30) 50.00–2.30 (2.38–2.30)
R(右)sym(对称)(%) 5.2(8.9) 6.5 (12.1) 5.3 (7.7) 5.8 (10.0) 5.1 (11.1) 6.7 (17.6)
/σ 62.3 (45.3) 89.4(58.0) 69.8(55.1) 106.5 (69.8) 58.2 (37.5) 105.7 (96.0)
完整性(%) 99.24 (99.14) 99.38 (99.19) 99.14 (99.05) 99.36 (99.19) 99.46 (99.30) 99.41 (99.29)
冗余 10.3 30.8 10.2 30.3 10.3 30.4
†括号中的数字是最高分辨率外壳的统计数据。
数据处理`d*TREK公司'然后按缩放`三维比例'软件。

5.结果

5.1. 相对峰值高度–RPH

选择六个晶体在两个不同的探测器上用两种类型的X射线源进行数据采集。晶体1、2和3在Rigaku Saturn944+CCD探测器上采集,而晶体4、5和6在Argonne国家实验室APS的SER-CAT的22-ID同步加速器光束线的Mar 225 CCD探测器上收集,使用2.00Ω波长的X射线。所有六个晶体的X射线衍射分辨率都超过2.0º。由于硫原子的异常信号强度随着衍射分辨率的增加而降低,因此所有计算都计划在50.0–2.5º分辨率范围内进行,因此选择数据收集参数以确保数据的高分辨率末端至少为2.30º(0.2在数据缩放过程中设置了分辨率余量)。这些参数包括探测器尺寸、晶体到探测器的距离、曝光时间和X射线波长。对于每个数据收集路径,晶体1、2和3的扫描范围为50°。晶体1、2和3的第一组数据(常规曝光数据集)的曝光时间为45 s,而随后的三组数据(MDS-exposure数据集)在同一扫描范围内采集了三次,每个数据集的曝光时间均为15 s。为了尽量减少晶体不同位置衍射变化的影响,晶体没有在常规数据集和MDS数据集之间转换。同样的数据收集策略应用于晶体4、5和6。在同步加速器上收集的晶体4、5和6的常规曝光时间为9秒,而MDS数据集的曝光时间为3秒。扫描范围为90°。对于每个晶体,常规曝光数据的反射被索引、集成并缩放到一个数据集,而三个MDS曝光数据集的反射被合并并缩放到一起。计算了每个数据收集策略的相对峰值,并在表2中列出[链接]如预期,冗余和/σMDS暴露(MDS策略)数据的值明显高于所有晶体的常规暴露数据的值。MDS暴露数据的相对峰高高于常规暴露数据。

表2
异常信号计算

RPH:相对峰高是在50.0–2.5Å分辨率下计算的异常差异图中,峰1、2和3的平均峰高除以峰7、8和9的平均峰高的比值。Map CC:在50.0–2.5Å分辨率下,S-SAD相位图和模型相位图之间的图相关系数。Rcc:同一晶体的MDS数据和常规曝光数据之间的Map CC比率。

  晶体1 水晶2 水晶3 水晶4 水晶5 水晶6
  常规 MDS公司 常规 MDS公司 常规 MDS公司 常规 MDS公司 常规 MDS公司 常规 MDS公司
分辨率(Ω) 50.0–2.5 50.0–2.5 50.0–2.5 50.0–2.5 50.0–2.5 50.0–2.5
RPH(RPH) 1.66 2.46 2.96 3.19 2.92 3.19 2.43 2.64 2.42 2.54 2.33 2.55
地图抄送 0.37 0.53 0.58 0.61 0.52 0.66 0.767 0.804 0.726 0.757 0.787 0.839
Rcc公司 1.43 1.05 1.27 1.05 1.05 1.27

5.2. 地图相关系数–地图抄送

地图的后续计算相关系数结果表明,就模型相地图和S-SAD相地图之间的一致性而言,MDS数据与常规暴露数据相比产生了更好的地图。这一结果表明,与常规曝光数据相比,MDS数据中硫原子的异常信号记录更准确。地图相关系数表2列出了六种晶体的两种数据收集策略的值Map cc和Rcc[链接].

选择晶体1的规则衍射和MDS衍射数据来计算S-SAD-相2(f)o个(f)c(c)图1所示的50.0–2.5°分辨率下的电子密度图[链接]MDS数据的映射质量明显优于常规公开数据,这与map cc值一致。

[图1]
图1
刚性体定义胰岛素分子模型与S-SAD相实验的叠加2(f)o个(f)c(c)50.0–2.5º分辨率下的电子密度图,1.0等高线σ. ()该图是使用晶体1的常规曝光数据计算得出的。图中的箭头表示主干道区域的缺失密度。(b条)该图是使用晶体1的MDS暴露数据计算得出的。

6.讨论

在本研究中,提出并分析了一种用于高分子晶体衍射数据采集的多数据集数据采集策略。理论分析表明,与固定X射线剂量的单数据集策略相比,MDS策略可以降低衍射数据的标准偏差。MDS策略的优点是对同一组衍射点进行多次测量的结果常规数据收集策略中的测量更少。例如,在常规的单数据集数据收集实验中,每个帧都为x个s、 在MDS数据收集实验中,每个帧都被暴露x个/N个s、 但整个扫描范围是重复的N个次。在两种数据收集策略中,晶体接收的X射线剂量相同。但从方程式(10)来看[链接],很明显,标准偏差的第二项减少了N个MDS战略中的时间;因此,与使用常规数据收集方法收集单个数据集相比,MDS策略生成的数据更准确。

为了通过实验验证MDS策略的理论预测,开发了一种灵敏而简单的方法来确定使用两种策略收集的衍射数据之间的差异。使用两个不同的数据采集系统采集的六个胰岛素晶体的衍射数据的计算表明,就数据质量评估中使用的三个参数而言,使用MDS策略采集的衍射数据明显优于使用常规单路径策略采集的数据,如表2[链接].S-SAD-相2的地图质量比较(f)o个(f)c(c)根据晶体1的数据计算出的50.0–2.5º分辨率的电子密度图表明,与使用常规数据收集策略收集的数据相比,MDS数据包含更准确的硫原子异常信号,如图1所示[链接].

衍射数据质量由两个客观因素决定,即晶体质量和数据采集仪器,以及一个主观因素,即数据采集策略。基于理论分析和实验验证,对于一个大分子晶体衍射数据采集实验,MDS数据采集策略产生了更好的数据质量。此外,MDS战略还有其他优势。(i) 如果晶体对辐射损伤敏感,或者在辐射损伤更成问题的微聚焦同步加速器束数据收集实验的情况下,MDS策略除了提供更好的数据质量外,还提供了获得更完整数据的更好选择,因为它每次扫描的曝光时间更短。可以决定在缩放过程中包括多少扫描,并消除可能遭受过多辐射损伤的图像。(ii)由于MDS策略使用多个扫描在常规数据采集实验中,如果晶体能够合理抵抗辐射损伤,那么随着扫描次数的增加,晶体中相位探头的异常信号会变得更强。这为进行基于信号的数据收集提供了更好的机会(Rose等人。, 2007【Rose,J.P.、Ruble,J.、Chrzas,J.和Swindell,J.T.II、Chen,L.、Fait,J.,Fu,Z.-Q.、Jin,Z.和Wang,B.C.(2007)。UGA和SER-CAT常规软X射线结构测定的进展。美国结晶学会年会,美国犹他州盐湖城。】)其中,异常信号的数据采集、数据处理和监测是在数据采集过程中“实时”计算的。基于信号的数据采集的目的是从定相探头获得预设的异常信号,包括使用机器人自动安装的额外晶体(如有必要),并且在结构成功定相所需的异常信号足够之前,数据采集不会停止。(iii)随着X射线检测技术的新进展,在高分子晶体数据采集中采用了更灵敏和低噪声的探测器,如像素阵列探测器。利用这类探测器,研究人员可以使用更短的曝光时间来获得与传统CCD探测器类似的信噪比。因此,这些探测器与MDS策略相结合,可以帮助研究人员获得更高质量的衍射数据。(iv)MDS数据收集策略可用于使用旋转阳极X射线源的内部数据收集,因为相对较弱的X射线束强度更适合多数据收集实验。应用可能包括使用Cu或Cr旋转阳极X射线的S-SAD、使用Cu/Cr旋转阳极或同步辐射X射线的Se或固有金属SAD实验。一个很好的例子是晶体结构使用Fe-SAD的人铁螯合酶的测定。在数据冗余达到70倍之前,来自2Fe–2S集群的异常信号不足以解决结构问题(Wu等人。, 2001[Wu,C.K.,Dailey,H.A.,Rose,J.P.,Burden,A.,Sellers,V.M.&Wang,B.-C.(2001),《国家结构生物学》第8期,第156-160页。]). (v) 本研究中开发的X射线数据采集系统的准备状态测试足够敏感和简单,可以用于区分不同策略采集的数据质量。但准备测试在以下领域有更广泛的用途:()它可以作为标准的X射线数据采集系统评估工具。它可以作为常规基准来测试整个X射线数据采集系统的性能状态。(b条)它可以作为一种优化工具,用于选择硫相位的最佳实验参数,如波长、衰减、晶体到探测器的距离、曝光时间.

在进行MDS数据采集实验时,一个重要的考虑因素是,选择最小曝光时间应确保光子计数在探测器的线性响应范围内。

总之,理论分析和实验验证支持这样的论点,即MDS数据收集策略提供了获得更高衍射数据质量的更好机会。X射线数据采集系统的准备状态测试是X射线系统评估和优化的一个敏感而简单的工具。我们希望更多的研究人员可以尝试这种新型的数据收集策略并进一步改进。

脚注

现地址:中华人民共和国天津市南开大学生命科学学院蛋白质科学天津重点实验室。

致谢

我们感谢乔治亚大学的Gerd Rosenbaum博士和John Rose博士就数据收集工具进行的富有启发性的讨论。我们感谢SER-CAT光束线的John Chrzas博士和上海同步辐射设施的何建华博士的有益讨论和建议。本研究得到了国家自然科学基金(30870483、31070660、31021062和31000334)、科学技术部(2009DFB30310、2009CB918803和2011CB911103)、中国科学院研究经费(YZ200839和KSCX2-EW-J-3)、,乔治亚大学研究基金会和乔治亚研究联盟。数据是在阿贡国家实验室先进光子源的东南地区合作访问团队(SER-CAT)22-ID光束线收集的。可在以下网址找到支持机构:https://www.ser-cat.org/members.html网址先进光子源的使用得到了美国能源部科学办公室基础能源科学办公室的支持,合同编号为W-31-109-Eng-38。

参考文献

第一次引用Cianci,M.、Helliwell,J.R.和Suzuki,A.(2008)。《水晶学报》。D类64, 1196–1209. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用协作计算项目,第4期(1994年)。《水晶学报》。D类50, 760–763. 交叉参考 IUCr日志 谷歌学者
第一次引用Dauter,Z.、Dauter、M.、de la Fortelle,E.、Bricogne,G.和Sheldrick,G.M.(1999)。分子生物学杂志。 289, 83–92. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用傅志强、罗丝、J.P.和王柏嘉(2004)。《水晶学报》。D类60, 499–506. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用González,A.(2003年)。《水晶学报》。D类59, 1935–1942. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Gursky,O.、Li,Y.、Badger,J.和Caspar,D.L.D.(1992)。生物物理学。J。 61, 604–611. 交叉参考 公共医学 中国科学院 科学网 谷歌学者
第一次引用Hendrickson,W.A.和Teeter,M.M.(1981年)。自然(伦敦),290, 107–113. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Leal,R.M.F.、Bourenkov,G.P.、Svensson,O.、Spruce,D.、Guijarro,M.和Popov,A.N.(2011年)。J.同步辐射。 18, 381–386. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Leslie,A.G.W.(2001)。高分子衍射数据的集成,第F卷,国际结晶学表,第4页。多德雷赫特:Kluwer学术出版社。 谷歌学者
第一次引用Liu,Z.J.、Vysotski,E.S.、Chen,C.J.、Rose,J.P.、Lee,J.&Wang,B.C.(2000)。蛋白质科学。 9, 2085–2093. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Murshudov,G.N.、Vagin,A.A.和Dodson,E.J.(1997)。《水晶学报》。D类53, 240–255. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Otwinowski,Z.&Minor,W.(1997年)。方法酶制剂。 276, 307–326. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Pflugrath,J.W.(1999)。《水晶学报》。D类55, 1718–1725. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Rose,J.P.、Ruble,J.、Chrzas,J.和Swindell,J.T.II、Chen,L.、Fait,J.,Fu,Z.-Q.、Jin,Z.和Wang,B.C.(2007)。UGA和SER-CAT常规软X射线结构测定的进展美国结晶学会年会,美国犹他州盐湖城谷歌学者
第一次引用Sarma,G.N.&Karplus,P.A.(2006年)。《水晶学报》。D类62, 707–716. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Wang,B.C.(1985)。方法酶制剂。 115, 90–112. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Wu,C.K.,Dailey,H.A.,Rose,J.P.,Burden,A.,Sellers,V.M.&Wang,B.-C.(2001)。自然结构。生物。 8,156–160科学网 交叉参考 中国科学院 谷歌学者
第一次引用Yang,C.、Pflugrath,J.W.、Courville,D.A.、Stence,C.N.和Ferrara,J.D.(2003年)。《水晶学报》。D类59, 1943–1957. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标基础
进展
国际标准编号:2053-2733