研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标结构
生物学
国际标准编号:2059-7983

挑战本地SAD阶段化的数据收集策略

十字标记_颜色_方形_文本.svg

瑞士光源,Paul Scherrer Institute,Villigen PSI,Switzerland,b条瑞士苏黎世苏黎世大学生物化学系,c(c)爱尔兰都柏林三一学院医学、生物化学和免疫学学院膜结构和功能组d日瑞士维利根PSI保罗·谢尔研究所生物与化学系生物分子研究实验室
*通信电子邮件:vincent.olieric@psi.ch

(2015年5月12日收到; 2015年12月15日接受; 2016年3月1日在线)

数据收集策略的最新改进推动了自然SAD(单波长异常衍射)定相的局限性,这种方法利用了大分子中自然存在的轻元素的微弱异常信号。这涉及合并来自多个晶体或在低X射线剂量下从多个方向收集的单晶的多个数据集。这两种方法都能产生高多样性的数据,同时最大限度地减少辐射损伤和系统误差,从而确保对异常差异的准确测量。在这里,我们描述了这两种策略的联合使用,以解决本地SAD阶段化的特殊挑战:低Bijvoet比率为1%的完整膜二酰甘油激酶(DgkA)和大200CRISPR相关内切酶(Cas9)的kDa复合物,结合引导RNA和靶DNA在低对称结晶空间组 C类2.讨论了基于对266kDa多蛋白/多配体微管蛋白复合物进行的系统测量的最佳天然SAD数据收集策略。

1.简介

本征SAD(单波长异常衍射)是一种从头开始的大分子结构测定方法,其中相位问题通过利用晶体中光原子的异常衍射信号来解决这个问题(有关异常衍射的综述,请参见Hendrickson,2014[Hendrickson,W.A.(2014),《生物物理学评论》第47期,第49-93页。]). 不同于其他从头开始的方法:用天然SAD进行结构求解,不需要加入外源重原子,这可能很繁琐,并可能导致非同构。然而,本地SAD阶段化也有其自身的挑战。首先吸收边缘,哪里反常散射最大化,对于硫和磷等元素低于2.5 keV(>5 Au),这超出了大多数当前大分子晶体学(MX)同步加速器束线的范围。数据收集也受到样品和空气吸收低能X射线的阻碍。因此,本地SAD数据采集通常在约6 keV(2.066 Au;穆勒-迪克曼等。, 2005【穆勒-迪克曼,C.,潘基卡尔,S.,塔克,P.A.和韦斯,M.S.(2005),《结晶学报》D61,1263-1272。】; 线路接口单元等。, 2014[刘,Q,郭,Y,张,Y,蔡,Z,阿苏尔,Z,Mancia,F,Greene,M.I.&Hendrickson,W.A.(2014),《结晶学报》第70期,第2544-2557页。]; 韦内特等。, 2015【Weinert,T.等人(2015),《自然方法》,第12期,第131-133页。】)最大化异常信号,同时最小化吸收。或者,通常使用Cu的家庭电源Kα(1.54º)或铬Kα(2.29Å)辐射也可用于此类测量。其次,由于数据采集是在远离这些光元素的吸收边缘的地方进行的,因此产生的异常信号很小,因此准确测量反射强度及其差异至关重要。为了获得这种精度,必须将随机和系统误差降至最低。然而,通常在单轴周围执行的第三代同步加速器的典型数据收集协议会产生异常数据,如果对输送到晶体的X射线剂量不够重视,这些数据可能会受到辐射损伤的不利影响。因此,本地SAD成功分阶段实施的案例仍然很少;目前,大约有150个天然SAD结构被保存在蛋白质数据库中(伯曼等。2000年[Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。核酸研究28,235-242。]).

数据收集策略的最新进展为本地SAD阶段化注入了新的活力(Rose评论等。, 2015【Rose,J.P.,Wang,B.-C.&Weiss,M.S.(2015)。国际癌症研究联合会,第2期,第431-440页。】). 多晶体平均法涉及合并统计等效晶体的数据集(刘等。, 2012[刘,Q.,Dahmane,T.,Zhang,Z.,Assur,Z,Brasch,J.,Shapiro,L.,Mancia,F.&Hendrickson,W.A.(2012).科学,336,1033-1037.], 2013[刘,Q,刘,Q&亨德里克森,W.A.(2013),《水晶学报》D691314-1332。])提高异常信噪比,同时最小化辐射损伤引起的异常信号衰减。获得足够多的多晶体平均值的关键同晶晶体可用于数据收集。这种方法之所以可行,是因为数据融合和数据处理算法足够强大,能够容纳大量不同的晶体数据集。在特别具有挑战性的情况下,多达18个数据集(Akey等。, 2014[Akey,D.L.,Brown,W.C.,Konwerski,J.R.,Ogata,C.M.&Smith,J.L.(2014)。晶体学报D70,2719-2729。])和32(El Omari等。, 2014【El Omari,K.、Iourin,O.、Kadlec,J.、Fearn,R.、Hall,D.R.、Harlos,K.和Grimes,J.M.&Stuart,D.I.(2014),《冰晶学报》第70期,第2197-2203页。】)为了成功地进行相位调整,需要分离晶体来获得足够的异常信号。一个极端的例子是最近使用在室温下收集的串行结晶学数据对溶菌酶进行了天然SAD定相,其中合并了从992个平均尺寸为20µm的随机取向晶体中分别获得的2°数据(Huang等。, 2015【Huang,C.-Y.,Olieric,V.,Ma,P.,Panepucci,E.,Diederichs,K.,Wang,M.&Caffrey,M.(2015),《结晶学报》第71期,第1238-1256页。】). 第二种方法涉及从多个方向的单晶中收集许多低剂量数据集(<0.5 MGy/360°),减轻辐射损伤,同时减少数据收集中的系统错误(Debreczeni等。, 2003[Debreczeni,J.É.,Bunkóczi,G.,Ma,Q.,Blaser,H.和Sheldrick,G.M.(2003)。晶体学报,D59,688-696。]; 布罗克豪泽等。, 2013【Brockhauser,S.、Ravelli,R.B.G.和McCarthy,A.A.(2013),《水晶学报》D69,1241-1251。】; 韦内特等。, 2015【Weinert,T.等人(2015),《自然方法》,第12期,第131-133页。】; 芬克等。, 2016【Finke,A.D.,Panepucci,E.,Vonrhein,C.,Wang,M.,Bricogne,G.&Oliéric,V.(2016)。分子生物学方法。1320,175-191。】). 通过改变晶体方向,可以测量探测器不同区域和不同样品吸收的不同衍射几何体中的相同反射,从而减少系统误差。该方法已被证明在11个实际案例中是成功的,包括一个266kDa的多蛋白/多密码子复合物,这是迄今为止本地SAD解决的最大结构(Weinert等。, 2015【Weinert,T.等人(2015),《自然方法》,第12期,第131-133页。】). 该方法得益于仪器开发,例如高精度PRIGo多轴测角仪(Waltersperger等。, 2015【Waltersperger,S.、Olieric,V.、Pradervand,C.、Glettig,W.、Salate,M.、Fuchs,M.R.、Curtin,A.、Wang,X.、Ebner,S.,Panepucci,E.、Weinert,T.、Schulze-Briese,C.和Wang,M.(2015)。J.Synchrotron Rad.22,895-900。】)以及一个经过低能量校准的光子计数、无噪声像素阵列探测器(亨利克等。, 2009[Henrich,B.,Bergamaschi,A.,Broenimann,C.,Dinapoli,R.,Eikenberry,E.F.,Johnson,I.,Kobas,M.,Kraft,P.,Mozzanica,A.&Schmitt,B.(2009),《Nucl.Instrum.Methods Phys.Res.A》,607,247-249。])这两种方法均用于本研究。

尽管数据收集策略最近有了许多改进反常散射亚结构、低对称性空间群、低衍射分辨率、小晶体、低Bijvoet比或其组合仍然是本地SAD定相的挑战。幸运的是,可以结合上述两种策略,从成功定相所需的尽可能多的晶体中以尽可能高的精度提取尽可能多异常信号(Klinke等。, 2015[克林克,S.、福斯,N.、里纳尔迪,J.J.、巴黎,G.、戈德鲍姆,F.A.、罗格朗,P.、吉马朗斯,B.G.和汤普森,A.(2015),《水晶学报》第71期,第1433-1443页。]). 在这里,我们提出了两个具有挑战性的本地SAD病例,通过从三个晶体的多个方向收集低剂量数据来解决:整体膜二酰甘油激酶DgkA(Li等。, 2013[Li,D.,Lyons,J.A.,Pye,V.E.,Vogeley,L.,Aragão,D.,Kenyon,C.P.,Shah,S.T.A.,Doherty,C.,Aherne,M.和Caffrey,M.(2013)。《自然》(伦敦),497521-524。]; 2×42kDa非对称单元, 空间组 P(P)212121,2.6μl分辨率)和大型Cas9–RNA–DNA复合物(Anders等。, 2014[Anders,C.、Niewoehner,O.、Duerst,A.和Jinek,M.(2014)。《自然》(伦敦),513569-573。]; 200千Da非对称单元, 空间组 C类2,2.2°分辨率)。此外,我们通过对多蛋白/多线微管蛋白-RB3微管蛋白酪氨酸连接酶复合物T2R-TTL(普罗塔,巴格森等。, 2013【Prota,A.E.,Bargsten,K.,Zurwerra,D.,Field,J.J.,Díaz,J.F.,Altmann,K.-H.&Steinmetz,M.O.(2013),《科学》,339,587-590。】; 韦内特等。, 2015【Weinert,T.等人(2015),《自然方法》,第12期,第131-133页。】; 266千帕非对称单元, 空间组 P(P)212121,2.3°分辨率)。

2.材料和方法

2.1. 结晶数据收集、数据处理和分析

所有实验均在瑞士维利根PSI瑞士光源(SLS)的超指向磁光束线X06DA(PXIII)上进行,工作电压为2.4 GeV,自顶向下模式为400 mA。光束线有一个能量分辨率为1.4×10的双通道切Si(111)单色器−4以及90×50µm的椭圆光束(FWHM)。数据是在100K下收集的,波长为2.066Å(6keV)通量约1.5×1010光子−1.在不同的χφ多轴PRIGo测角仪的设置(Waltersperger等。, 2015【Waltersperger,S.、Olieric,V.、Pradervand,C.、Glettig,W.、Salate,M.、Fuchs,M.R.、Curtin,A.、Wang,X.、Ebner,S.,Panepucci,E.、Weinert,T.、Schulze-Briese,C.和Wang,M.(2015)。J.Synchrotron Rad.22,895-900。】)在PILATUS 2M-F探测器上(亨利克等。, 2009[Henrich,B.,Bergamaschi,A.,Broenimann,C.,Dinapoli,R.,Eikenberry,E.F.,Johnson,I.,Kobas,M.,Kraft,P.,Mozzanica,A.&Schmitt,B.(2009),《Nucl.Instrum.Methods Phys.Res.A》,607,247-249。])在无快门模式下以10或20 Hz的帧速率和120 mm的采样到检测器距离运行。数据处理使用XDS公司并与进行缩放和合并XSCALE公司(卡布施,2010年【Kabsch,W.(2010),《结晶学报》,D66,125-132。】). 高分辨率数据截断基于统计指标CC1/2和CC*(Karplus和Diederichs,2012年【Karplus,P.A.&Diederichs,K.(2012),《科学》,3361030-1033。】).下部结构使用SHELXC公司/D类/E类(Sheldrick,2010年[Sheldrick,G.M.(2010),《水晶学报》,D66479-485.])使用香港(HKL)2地图接口(Pape&Schneider,2004【Pape,T.&Schneider,T.R.(2004),《应用结晶杂志》,第37期,第843-844页。】). 异常峰高的计算方法如下阳极没有决议截止(Thorn&Sheldrick,2011【Thorn,A.和Sheldrick,G.M.(2011),《应用结晶》第44卷,第1285-1287页。】). 使用找到的正确站点数SHELXD公司使用进行评估SITCOM公司(Dall’Antonia&Schneider,2006年【Dall’Antonia,F.&Schneider,T.R.(2006),《应用结晶杂志》,第39期,第618-619页。】).精炼和模型图互相关计算使用菲尼克斯(亚当斯等。, 2010【Adams,P.D.等人(2010),《水晶学报》,D66,213-221。】). X射线剂量用放射性剂量-3D类(泽尔丁等。, 2013【Zeldin,O.B.,Gerstel,M.&Garman,E.F.(2013),《应用结晶杂志》,第46期,第1225-1230页。】). 使用以下公式估算Bijvoet比率

[(|\Delta F^\pm|)/(|F|)=(2N_{\rm A}/N_{\rma P})^{1/2}\次(F''/Z_{\orm eff}),\eqno(1)]

哪里(f)〃是硫的虚散射贡献(6 keV时为0.95 e),N个一个是的数字反常散射原子,N个P(P)是指非对称单元,Z效率是平均蛋白质原子的有效电子数(6.7;Hendrickson&Teeter,1981[Hendrickson,W.A.&Teeter,M.M.(1981),《自然》(伦敦),290,107-113。]). 结构图使用PyMOL公司(DeLano,2002年[DeLano,W.L.(2002),《PyMOL》。https://www.pymol.org .]).

2.1.1. DgkA公司

P(P)212121DgkA突变体(A41C、C46A、I53V、I70L、M96L、V107D、C113A)的晶体,测量值为~100–200×50×20µm(补充图S1)由在中或其他地方描述的脂质立方相法(Li等。, 2013【Li,D.,Lyons,J.A.,Pye,V.E.,Vogeley,L.,Aragáo,D.,Kenyon,C.P.,Shah,S.T.A.,Doherty,C.,Aherne,M.&Caffrey,M.(2013),《自然》(伦敦),497,521-524。】)收获后在液氮中快速冷却。三个晶体用于数据收集(补充图S1). 从衍射到2.6º分辨率的第一个晶体,共有十个360°ω扫描的方向没有改变。第二块晶体衍射到2.8°分辨率,共有八块360°ω收集了扫描,包括两个360°ω沿着*轴,以便在同一图像上同时收集Bijvoet对。第三块晶体的衍射分辨率为2.8º,从多个方向收集数据:四个360°ω扫描于χ=0°和两个360°ω扫描每个χ=10、20和30°(表1[链接]). 数据收集速度为1度−1,每360°的平均剂量ω扫描结果估计为0.5 MGy。DgkA的坐标和结构因子已以登录码存放在蛋白质数据库(PDB)中5载重公里.

表1
数据收集和统计摘要

括号中的值表示最后一个shell。

数据集 DgkA公司 Cas9–RNA–DNA T型2R-TTL(高剂量、低多重性、单向) T型2R-TTL(低剂量、高多重性、多方位)
晶体数量
总振荡(χ/φ方位) 晶体1:10×360°,0.1 s,0.1°(χ= 0°) 水晶1 p1:8×360°,0.1秒,0.2°(χ= 0°,χ= 10°,χ= 20°,χ= 30°,χ= 30°/φ= 180°,χ= 20°/φ= 180°,χ= 10°/φ= 180°,χ= 5°/φ= 180°) 晶体1 p1:360°,1.6秒,0.2° 水晶1 p2:8×720°,0.1秒,0.2°(χ= 0°,χ= 5°,χ= 10°,χ=15°,χ= 20°,χ= 25°,χ= 30°,χ= 10°/φ= 90°)
晶体2:6×360°,0.2 s,0.2°(χ=0°),2×360°,0.2秒,0.2°(*对齐) 水晶1 p2:8×360°,0.1秒,0.2°(χ= 5°/φ= 45°,χ= 15°/φ=45°,χ= 25°/φ= 45°,χ=13°,χ= 13°/φ= 45°,χ= 18°,χ= 18°/φ= 45°,χ= 23°/φ= 45°) 晶体2 p1:360°,1.6秒,0.2° 水晶2 p2:8×720°,0.1秒,0.2°(χ= 0°,χ= 10°,χ= 20°,χ= 30°,χ= 25°,χ= 15°,χ= 5°,χ= 15°/φ= 90°)
晶体3:4×360°,0.1秒,0.1°(χ=0°),2×360°,0.2秒,0.2°(χ=10°),2×720°,0.1 s,0.1°(χ= 20°,χ= 30°) 晶体2:8×360°,0.1 s,0.1°(χ= 0°,χ= 5°,χ= 10°,χ= 15°,χ= 20°,χ= 25°,χ= 30°,χ= 35°) 水晶3 p1:360°,1.6秒,0.2° 水晶3 p2:8×720°,0.1秒,0.2°(χ= 0°,χ= 10°,χ= 20°,χ= 30°,χ= 25°,χ= 15°,χ= 5°,χ= 10°/φ= 90°)
  晶体3:8×360°,0.1 s,0.2°(χ= 0°,χ= 10°,χ= 20°,χ= 30°,χ= 30°/φ= 180°,χ= 20°/φ= 180°,χ= 10°/φ= 180°,χ=5°/φ= 180°)    
分辨率(Ω) 50.0–2.6 (2.67–2.60) 50–2.2 (2.30–2.20) 50–2.3 (2.39–2.30) 50–2.3 (2.39–2.30)
“空间”组 P(P)212121 C类2 P(P)212121 P(P)212121
单位-细胞参数(Ω,°) = 75.29,b条= 91.57,c(c)= 143.72 = 177.74,b条= 67.57,c(c)= 188.19,β= 111.32 = 104.88,b条=158.68,c(c)= 180.04 = 104.86,b条=158.57,c(c)= 180.31
反射次数 8396768 (235461) 16157127 (388880) 4330651 (206334) 69786479 (3327104)
独特反射次数 29385 (2108) 205825 (24766) 255989 (27045) 258112 (28073)
多重性§(°) 142.9 (55.84) 156.7 (31.4) 33.8 (15.3) 540.7 (237.0)
完整性(%) 99.6 (96.5) 99.3 (95.8) 99.2 (96.6) 100.0 (100.0)
/σ()〉 36.46 (4.18) 30.38 (1.88) 18.70(1.23) 39.59 (1.19)
R(右)测量(%) 22.1 (113.1) 14.1 (135.0) 11.1 (162.3) 25.5 (539.5)
R(右)下午。(%) 1.8 (15.1) 1.1 (24.1) 1.9 (41.5) 1.1 (35.0)
科科斯群岛1/2(%) 100.0(90.8) 100.0 (62.1) 99.8 (54.2) 100.0(52.4)
ΔF类/σ(ΔF类) 1.52 1.477 1.13 2.38
科科斯群岛阿诺(%) 43 44 34 63
镶嵌度(°) 0.09/0.19/0.26 0.10/0.16/0.07 0.10/0.10/0.10 0.10/0.10/0.10
†参见补充数据XDS公司/XSCALE公司处理合并数据集和单个数据集的统计信息。
对于测量期间平移的晶体,不同位置标记为p1和p2。
§Friedel对被视为合并反射。
2.1.2. Cas9–RNA–DNA

如前所述,生成、收获并冷冻保护Cas9–sgRNA–靶DNA复合体的晶体,其中互补(靶)DNA链在位置1–3与sgRNA指南不匹配(Anders等。, 2014[Anders,C.、Niewoehner,O.、Duerst,A.和Jinek,M.(2014)。《自然》(伦敦),513569-573。]). 三个C类数据采集使用了2个直径为~200×100×50µm的晶体(补充图S1b条). 第一、第二和第三晶体衍射分辨率分别为2.2、2.4和2.2º,异常信号延伸至~2.9º分辨率。第一块晶体足够大,可以从晶体上两个分离良好的位置收集两系列多方位数据集(补充图S1b条,晶体1)。在每个位置,共有八个360°ω扫描数据是用不同的χ/φ设置。对于第二个晶体,共有八个360°ω扫描是在5°下采集的χ在保持φ方向常数。对于第三个晶体,四个360°ω扫描收集于φ=0°和χ=0、10、20和30°,以及四个360°ω扫描收集于φ=180°和χ=0、10、20和30°(表1[链接]). 以2度的数据收集速度−1,每360°的平均剂量ω扫描估计为0.25 MGy。Cas9–RNA–DNA的坐标和结构因子已按照加入码存放在PDB中5平方英尺.

2.1.3. T型2R-TTL公司

杆状的P(P)212121T型2R-TTL晶体尺寸为~700×100×100µm(补充图S1c(c))如其他地方所述,在液氮中生长、低温保护和snap冷却(普罗塔、巴格斯坦等。, 2013【Prota,A.E.,Bargsten,K.,Zurwerra,D.,Field,J.J.,Díaz,J.F.,Altmann,K.-H.&Steinmetz,M.O.(2013),《科学》,339,587-590。】). 可复制的安装和低温保护对于T2R-TTL晶体对这些条件的变化极为敏感(Weinert等。, 2015【Weinert,T.等人(2015),《自然方法》,第12期,第131-133页。】; PDB条目4wbn(世界银行)). 在筛选出的20个晶体中,只有三个晶体根据统计指标(例如R(右)测量和〈/σ()〉(Karplus&Diederichs,2015)【Karplus,P.A.&Diederichs,K.(2015),《当前操作结构生物学》34,60-68。】). 这三个晶体衍射到2.3º的分辨率。从每个晶体中,在两个分离良好的不同位置收集数据。在第一个位置,单个高剂量360°ω收集了估计为~4 MGy的扫描数据(表1[链接]和补充数据;T型2R-TTL高剂量、低多重性、单向)。在第二个位置,八个低剂量720°ω扫描,对应于相同的累积剂量~4 MGy(0.25 MGy/360°ω扫描),共收集7个χ恒定从0°增加到30°φ和另一个ω扫描于χ=10或15°以及φ=90°(表1[链接]和补充数据;T型2R-TTL低剂量、高多重性、多向性)。

2.2.X射线荧光测量

X射线荧光(XRF)分析是在瑞士光源的菲尼克斯光束线上进行的,入射辐射能量为4.1 keV,高于CaK边缘(4.038keV)并且当前在大多数MX波束线处不可访问。晶体直接贴在碳胶带上,装入10−4Pa真空室。能量分散X射线荧光使用Roentec公司生产的具有180 eV能量分辨率的单元素固态探测器在室温下记录光谱。测量100×100µm的X射线束指向晶体的中心。在120秒的收集时间内,没有任何光束损坏的迹象。XRF光谱拟合使用PyMca公司(索莱等。, 2007【Solé,V.A.,Papillon,E.,Cotte,M.,Walter,P.&Susini,J.(2007),摘自《光谱学》第62、63-68页。】)提取被测晶体体积的元素组成。该软件使用高斯形状的发射线和与能量相关的光电截面,根据对应于不同原子能级跃迁的单峰提供元素组成。

3.结果和讨论

3.1. 本地SAD阶段化

3.1.1. DgkA公司

完整膜二酰甘油激酶DgkA在非对称单元代表6×130个残基,总分子量为84kDa。这个下部结构含有6×2蛋氨酸、6×1半胱氨酸和锌离子(图1[链接])对应于6 keV时1.1%的理论Bijvoet比率。之前在锌的SAD和MAD尝试吸收边缘未成功。该结构最初是通过使用衍射到2.05º分辨率(Li等。, 2013【Li,D.,Lyons,J.A.,Pye,V.E.,Vogeley,L.,Aragáo,D.,Kenyon,C.P.,Shah,S.T.A.,Doherty,C.,Aherne,M.&Caffrey,M.(2013),《自然》(伦敦),497,521-524。】). 当前研究中使用的晶体衍射分辨率仅为2.6º(参见§[链接]2.1.1). 收集了具有和不具有多晶体取向的数据(表1[链接]).下部结构标识使用SHELXD公司在4º分辨率下成功剪切数据E类值大于1.5;19个地点中有14个被确定,其中11个是使用情景喜剧带有参考PDB条目3季度3(李等。, 2013【Li,D.,Lyons,J.A.,Pye,V.E.,Vogeley,L.,Aragáo,D.,Kenyon,C.P.,Shah,S.T.A.,Doherty,C.,Aherne,M.&Caffrey,M.(2013),《自然》(伦敦),497,521-524。】). 1000后获得的唯一正确解SHELXD公司尝试有CC全部的和CC虚弱的值分别为26.2和12.0(图2[链接]). 正确的手是在SHELXE公司。通过搜索自动跟踪α-螺旋在十个循环后产生364个残留物(780个)(图2[链接]b条)与43.95%的数据具有良好的相关性。得到的电子密度图(图3[链接])显示了模型-映射的互相关SHELXE公司映射到66.8%的最终模型。

[图1]
图1
本地SAD结构。()DgkA和(b条)Cas9–RNA–DNA。蛋白质显示为灰色卡通,核酸主干为橙色。异常散射体被描述为彩色球体。
[图2]
图2
SHELX公司输出。()SHELXD公司1000次试验DgkA的子结构确定输出。(b条)SHELXE公司十个自动跟踪周期后的DgkA输出。(c(c))SHELXD公司Cas9 1000次试验的子结构确定输出。(d日)SHELXE公司三个自动跟踪周期后Cas9的输出。(e(电子))SHELXD公司 下部结构T的测定2R-TTL有1000个试验。((f))具有相位调整和密度调整的三个链追踪循环SHELXE公司对于T2R-TTL。
[图3]
图3
之后的实验地图SHELXE公司定相和密度修改,在2处绘制等高线σ. ()DgkA地图。(b条)Cas9–RNA–DNA图谱。

分析下部结构数据说明了异常数据的弱点,主要是由于链中无序的Met66和Cys41E类F类因此,该样品1%的实验Bijvoet比率低于1.1%的预期理论值。

3.1.2. Cas9–RNA–DNA

CRISPR相关蛋白Cas9是一种RNA引导的核酸内切酶,已被重新用于基因组编辑和基因表达控制。Cas9–RNA–DNA复合物,低对称结晶空间组 C类最初用从硒代蛋氨酸和铱衍生物(Anders)中获得的SAD相解决等。, 2014[Anders,C.、Niewoehner,O.、Duerst,A.和Jinek,M.(2014)。《自然》(伦敦),513569-573。]). 对于本地SAD阶段化实验,我们使用了Cas9–sgRNA–靶DNA复合体的晶体,其中互补DNA链在位置1–3处与导向RNA不匹配(参见§[链接]2.1.2). 这个非对称单元含有1371个氨基酸,83个RNA核苷酸和39个DNA核苷酸(总分子量~200 kDa),24个S原子和120个P原子(图1[链接]b条),其中包括最大的下部结构通过迄今为止的本地SAD分阶段解决。在这种情况下,从三个天然晶体中收集数据,在波长为2.066º的多个方向上衍射到~2.2º的分辨率,并在最初尝试从反常峰定位硫和磷位置时合并数据(表1[链接]). 这个下部结构1000即可获得溶液SHELXD公司使用2.6º的高分辨率截止值搜索65个站点的试验,不包括E类值低于1.2(图2[链接]c(c)). 该计划最初确定了使用SITCOM公司带有参考PDB条目4个月5(安德斯等。, 2014[Anders,C.、Niewoehner,O.、Duerst,A.和Jinek,M.(2014)。《自然》(伦敦),513569-573。]).SHELXE公司 下部结构 精炼完成了下部结构至114个位置,导致非常清晰的手部分离(图2[链接]d日). 搜索的三个链跟踪循环α-螺旋线形成了一个易于解释的地图(图3[链接]b条)构建Cα三个循环后1060个残留物链(1372个)(图2[链接]b条)与数据的相关性为28.75%。模型–映射SHELXE公司最终模型的映射率为68.0%。

只有使用从多个方向收集的三个晶体中合并的数据,才能成功确定亚结构。由新数据集的合并(来自同一晶体的新取向或来自额外晶体)导致的异常峰值高度的增加如图所示。4[链接]我们将每个晶体(或晶体位置)上的累积剂量限制在保守的~2 MGy,以尽量减少辐射损伤的影响。额外剂量带来的附加信息很少;在晶体1的情况下,我们观察到异常信号中的增益小到超过2MGy,并稳定在4MGy(补充图S2)。

[图4]
图4
Cas9-RNA-DNA合并数据集前70个异常峰的平均异常峰高。从三种不同的晶体中合并了总共3×360°的数据集。在两个完全分离的位置收集第一个晶体的数据(补充图S1b条,晶体1)。X射线剂量(上限x轴)每个位置的累积量约为2 MGy。

3.2.X射线荧光分析

晶体结构可能很难。低能耗数据收集的另一个好处是反常散射从这些元素中的一些可以帮助他们正确分配(米勒-迪克曼等。, 2007【穆勒-迪克曼,C.,潘基卡尔,S.,施密特,A.,穆勒,S.、库珀,J.、吉尔洛夫,A.、威尔曼斯,M.、辛格,R.K.、塔克,P.A.和维斯,M.S.(2007),《晶体学报》D63,366-380。】). 就Cas9–sgRNA–DNA复合物而言,某些离子最初被建模为Mg2+(PDB条目4个月5)显示强烈异常信号(>10σ),建议替代原子分配。然而,不可能从反常的峰高或现场化学结构的检查中明确确定相应的元素。随后,其中一种晶体被用于收集入射能量为4.1 keV的荧光光谱(见§[链接]2.2). 光谱证实了K的存在+(图5[链接])可能是结晶条件引起的(缓冲溶液含有250 mM(M)KCl和300 mM(M)KSCN)。因此,我们重新分配了6 Mg2+以K表示的离子+发现了另外一个离子。后续精炼反常散射贡献(f)'',如菲尼克斯定义(回声等。, 2014【Echols,N.、Morshed,N.,Afonine,P.V.、McCoy,A.J.、Miller,M.D.、Read,R.J.、Richardson,J.S.、Terwilliger,T.C.和Adams,P.D.(2014),《结晶学报》第70期,第1104-1114页。】),给出(f)′′(K+)值介于1.58和1.72e之间,与1.77e的理论值一致。

[图5]
图5
以4.1 keV的入射能量记录的Cas9–RNA–DNA晶体的X射线荧光光谱对数标度。测量的光谱绘制为黑点,拟合为黑色(总计)和彩色(针对不同元素)线。主要贡献(橙色)来自钾Kα1,2 (KL(左)KL(左))以及Kβ1 (KM(M))特征线。1.5到2 keV之间的较小(橙色)峰代表K–Si逃逸峰,是测量的伪影(Papp&Campbell,2001【Papp,T.&Campbell,J.L.(2001)。X射线光谱学。30,77-82。】). 硅峰(绿线)来自晶体支架。

3.3. 挑战本机SAD阶段的最佳数据收集策略:T2R-TTL作为测试用例

T型2R-TTL是一种由微管蛋白(T)、微管失稳和类stathmin蛋白RB3和微管蛋白修饰酶微管蛋白酪氨酸连接酶(TTL;Prota,Magiera等。, 2013【普罗塔·A.E.、马吉拉·M.M.、库伊杰佩斯·M.、巴格森·K、弗雷·D、威瑟·M、贾西·R、胡根拉德·C.C.、坎默尔·R.A.、扬克·C.和斯坦梅茨·M.O.(2013),《细胞生物学杂志》200、259-270。】). 这个非对称单元,由两部分组成α-微管蛋白,两个β-微管蛋白,一个RB3,一个TTL,两个GTP,两个GDP和一个AMPPNP分子,由2317个氨基酸组成(总分子量约266 kDa),具有下部结构具有118个S、13个P、3个Ca和2个Cl位点。遵循我们之前成功的T结构解决方案2R-TTL通过使用单晶、多方向数据收集策略的本地SAD相位调整(Weinert等。, 2015【Weinert,T.等人(2015),《自然方法》,第12期,第131-133页。】),我们决定使用该系统来评估多方向、多晶体组合策略的效益。T型2R-TTL是一个具有挑战性的测试用例的优秀示例;它有一个大非对称单元以及大量散射体,如下图所示,它形成了质量可变的晶体。

使用从单个T测量的多个本机SAD数据集2R-TTL晶体(参见§[链接]2.1.3和补充数据),无法确定下部结构。这可能是因为当前研究中使用的晶体质量低于原始研究中观察到的晶体质量(Weinert等。, 2015【Weinert,T.等人(2015),《自然方法》,第12期,第131-133页。】). 一个下部结构解决方案SHELXD公司只有合并来自三个不同晶体的数据集,每个晶体在八个不同方向上测得(表1[链接]和补充数据)搜索75个站点,分辨率截止值为3.3ºE类值大于1.5(图2[链接]e(电子)). 成功的SHELXD公司子结构解决方案具有CC全部的和CC虚弱的分别为36.9和18.2。使用确定的正确站点数量SITCOM公司带有参考PDB条目4wbn(世界银行),为86,使用时增至111下部结构 精炼在里面SHELXE公司密度调整导致双手明显分离(图2[链接](f)). 搜索的三个链跟踪循环α-螺旋线产生了一个易于解释的地图,构建了一个Cα三个循环后1669个残基链(2319个残基中的),与数据的相关性为28.75%。模型–映射SHELXE公司最终模型的映射率为78.5%。

通过比较四种数据收集策略的平均异常峰值高度来评估合并来自多个方向的多个晶体的低剂量数据的优点,这在合并统计中很容易观察到(见补充数据):(i)来自单晶的高剂量单方向;(ii)来自单晶的低剂量、多方位;(iii)合并来自三个晶体的高剂量、单向数据;和(iv)合并来自三个晶体的低剂量、多方位数据(图6[链接]). 高剂量下的单方向扫描仅给出了10以上的23个异常峰值σ,这不足以成功下部结构解决方案。尽管累积剂量高出三倍,但合并来自三种不同晶体的高剂量数据导致了10个以上的50个异常位置σ类似于合并来自单晶的低剂量、多方向数据。然而,这仍然不足以取得成功下部结构解决方案。这个下部结构只有当来自三个晶体的低剂量、多方位数据集合并时,搜索才成功,得到了10个以上的70个异常位点σ这与我们之前的研究一致,其中下部结构通过合并来自单晶的低剂量、多方位扫描,成功实现了溶液和自然SAD定相,给出了10个以上的80个异常位置σ(韦纳特等。, 2015[Weinert,T.等人(2015)。自然方法,12113-133。]). 这也与一项研究表明的一致下部结构当异常差分图中的平均峰高高于某一阈值时,搜索往往是成功的(班科奇等。, 2015【Bunkóczi,G.,McCoy,A.J.,Echols,N.,Grosse-Kunstleve,R.W.,Adams,P.D.,Holton,J.M.,Read,R.J.&Terwilliger,T.C.(2015),《自然方法》,第12期,第127-130页。】); 对于T2R-TTL晶体,该阈值约为10σ(图6中的虚线[链接]).

[图6]
图6
不同数据收集策略的异常峰值比较。对于T的四种数据收集策略,显示了前100个峰值的异常峰值高度2R-TTL数据集:(i)高剂量、低多重性、单晶位置的单方向(红色),(ii)低剂量、高多重性、晶体位置的多方向(砖),(iii)合并来自三个晶体(蓝色)的高剂量、单方向数据,(iv)合并低剂量,来自三个晶体(绿色)的多方位数据。对于每个晶体,在两个良好分离的位置以相同的剂量收集数据。虚线表示10σ门槛。箭头指向10以上的最后一个峰值σ并显示高于此阈值的站点数。

综上所述,将这两种数据收集策略结合起来有明显的好处:(i)低剂量、多方向方法有效地提取尽可能多的异常数据,同时将辐射损伤降至最低;(ii)如果单晶样品的异常信号不足以成功定相,来自多个统计等效晶体的数据集可以合并。结合这两种方法意味着需要更少的晶体样品。此外,对于相同的累积剂量,使用高剂量、单向策略收集的数据集与使用低剂量、多向策略收集的合并数据集之间的衍射分辨率没有差异(表1[链接]以及补充数据)。

4.结论与展望

本地SAD可以被视为“理想”从头开始的大分子的定相方法,因为它完全依赖于样品中自然存在的原子的信息。该方法适用于具有挑战性的案例。因此,完全有理由首先用含有足够数量的天然异常散射体的大分子来尝试天然SAD。在这里,我们表明,在一个晶体的数据不足的困难情况下,结合低剂量、多方向策略使用数据集的多晶体平均值是有益的。此外,在多个方向上收集低剂量数据意味着需要更少的晶体样品来提供所需的数据准确性。

也就是说,这种综合方法仍处于初级阶段,还有改进的余地,以便使本机SAD更广泛地适用和更普遍地被接受,特别是在低分辨率的情况下,目前主要是重原子分阶段方法。此外,如本文所述,在多个晶体上采集多个360°扫描比单向高剂量扫描需要更多的时间,并且在同步辐射束时间有限的情况下可能不具吸引力。然而,数据采集硬件的进步,尤其是探测器仪器,将迅速改善这种状况。此外,这里描述的方法有助于实现自动化。

随着晶体学前沿的不断拓展相位问题将继续发展。特别是,串行晶体学等新方法带来了新的挑战,需要开发用于获得最准确测量的工具。在低于6 keV的能量下收集数据会增强异常信号,但会带来技术挑战,尤其是空气吸收和散射、样品吸收和探测器几何结构。目前正在光子工厂的BL-1A等运行光束线进行研究(参见Rose等。, 2015【Rose,J.P.,Wang,B.-C.&Weiss,M.S.(2015)。国际癌症研究联合会,第2期,第431-440页。】)以及即将推出的光束线,如钻石光源(Allan)的I23等。, 2015【Allan,D.R.,Collins,S.P.,Evans,G.,Hall,D.,McAuley,K.,Owen,R.L.,Sorensen,T.,Tang,C.C.,von Delft,F.,Wagner,A.&Wilhelm,H.(2015).欧洲物理杂志,130,56。】)和LAX在NSLS-II(亨德里克森,2014[Hendrickson,W.A.(2014),《生物物理学评论》第47期,第49-93页。]).

支持信息


脚注

这些作者为这项工作做出了同等贡献。

§现住址:中国科学院上海生物科学研究所生物化学与细胞生物学研究所分子生物学国家重点实验室国家蛋白质科学中心,中华人民共和国上海。

致谢

这项工作的部分支持来自爱尔兰科学基金会(12/IA/1255 to MC)的资助,来自瑞士国家科学基金会的拨款(310030B_138659 to MOS)和欧洲研究委员会启动拨款(ANTIVIRNA,赠款编号337284 to MJ)。

工具书类

第一次引用P.D.亚当斯。等。(2010).《水晶学报》。D类66, 213–221. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Akey,D.L.、Brown,W.C.、Konwerski,J.R.、Ogata,C.M.和Smith,J.L.(2014)。《水晶学报》。D类70, 2719–2729. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Allan,D.R.,Collins,S.P.,Evans,G.,Hall,D.,McAuley,K.,Owen,R.L.,Sorensen,T.,Tang,C.C.,von Delft,F.,Wagner,A.&Wilhelm,H.(2015)。欧洲物理学。J.Plus公司,130,56交叉参考 谷歌学者
第一次引用Anders,C.、Niewoehner,O.、Duerst,A.和Jinek,M.(2014)。自然(伦敦),513, 569–573. 交叉参考 谷歌学者
第一次引用Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。核酸研究。 28, 235–242. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Brockhauser,S.、Ravelli,R.B.G.和McCarthy,A.A.(2013)。《水晶学报》。D类69, 1241–1251. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Bunkóczi,G.,McCoy,A.J.,Echols,N.,Grosse-Kunstleve,R.W.,Adams,P.D.,Holton,J.M.,Read,R.J.&Terwilliger,T.C.(2015)。自然方法,12, 127–130. 谷歌学者
第一次引用Dall’Antonia,F.&Schneider,T.R.(2006)。J.应用。克里斯特。 39, 618–619. 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用德布雷克泽尼,J.E。,Bunkóczi,G.、Ma,Q.、Blaser,H.和Sheldrick,G.M.(2003)。《水晶学报》。D类59, 688–696. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用DeLano,W.L.(2002)。PyMOL公司。 https://www.pymol.org谷歌学者
第一次引用Echols,N.、Morshed,N.、Afonine,P.V.、McCoy,A.J.、Miller,M.D.、Read,R.J.、Richardson,J.S.、Terwilliger,T.C.和Adams,P.D.(2014)。《水晶学报》。D类70, 1104–1114. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用El Omari,K.、Iourin,O.、Kadlec,J.、Fearn,R.、Hall,D.R.、Harlos,K.,Grimes,J.M.和Stuart,D.I.(2014)。《水晶学报》。D类70,2197年至2203年科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Finke,A.D.,Panepucci,E.,Vonrhein,C.,Wang,M.,Bricogne,G.&Oliéric,V.(2016)。方法分子生物学。 1320, 175–191. 交叉参考 谷歌学者
第一次引用Hendrickson,W.A.(2014年)。Q.生物物理学评论。 47, 49–93. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Hendrickson,W.A.和Teeter,M.M.(1981年)。自然(伦敦),290, 107–113. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Henrich,B.,Bergamaschi,A.,Broenimann,C.,Dinapoli,R.,Eikenberry,E.F.,Johnson,I.,Kobas,M.,Kraft,P.,Mozzanica,A.&Schmitt,B.(2009年)。编号。仪器。方法物理学。决议A,607, 247–249. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Huang,C.-Y.,Olieric,V.,Ma,P.,Panepucci,E.,Diederichs,K.,Wang,M.和Caffrey,M.(2015)。《水晶学报》。D类71, 1238–1256. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Kabsch,W.(2010年)。《水晶学报》。D类66, 125–132. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Karplus,P.A.&Diederichs,K.(2012年)。科学类,336, 1030–1033. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Karplus,P.A.&Diederichs,K.(2015年)。货币。操作。结构。生物。 34, 60–68. 交叉参考 谷歌学者
第一次引用Klinke,S.、Foos,N.、Rinaldi,J.J.、Paris,G.、Goldbaum,F.A.、Legrand,P.、Guimaráes,B.G.和Thompson,A.(2015)。《水晶学报》。D类71, 1433–1443. 交叉参考 IUCr日志 谷歌学者
第一次引用Li,D.,Lyons,J.A.,Pye,V.E.,Vogeley,L.,Aragáo,D.,Kenyon,C.P.,Shah,S.T.A.,Doherty,C.,Aherne,M.&Caffrey,M.(2013)。自然(伦敦),497, 521–524. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Liu,Q.、Dahmane,T.、Z.、Assur,Z.、Brasch,J.、Shapiro,L.、Mancia,F.和Hendrickson,W.A.(2012)。科学类,336, 1033–1037. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Liu,Q.、Guo,Y.、Chang,Y.、Cai,Z.、Assur,Z.、Mancia,F.、Greene,M.I.和Hendrickson,W.A.(2014)。《水晶学报》。D类70, 2544–2557. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Liu,Q.,Liu,Q.&Hendrickson,W.A.(2013)。《水晶学报》。D类69, 1314–1332. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Mueller-Dieckmann,C.、Panjikar,S.、Schmidt,A.、Mueller,S.,Kuper,J.、Geerlof,A.、Wilmanns,M.、Singh,R.K.、Tucker,P.A.和Weiss,M.S.(2007年)。《水晶学报》。D类63, 366–380. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Mueller-Dieckmann,C.,Panjikar,S.,Tucker,P.A.&Weiss,M.S.(2005年)。《水晶学报》。D类61, 1263–1272. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Pape,T.&Schneider,T.R.(2004)。J.应用。克里斯特。 37, 843–844. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Papp,T.&Campbell,J.L.(2001)。X射线光谱学。 30, 77–82. 交叉参考 谷歌学者
第一次引用Prota,A.E.、Bargsten,K.、Zurwerra,D.、Field,J.J.、Díaz,J.F.、Altmann,K.-H.和Steinmetz,M.O.(2013年)。科学类,339, 587–590. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Prota,A.E.,Magiera,M.M.,Kuijpers,M.,Bargsten,K.,Frey,D.,Wieser,M.、Jaussi,R.,Hoogenraad,C.C.,Kammerer,R.A.,Janke,C.&Steinmetz,M.O.(2013年)。《细胞生物学杂志》。 200, 259–270. 交叉参考 谷歌学者
第一次引用Rose,J.P.,Wang,B.-C.和Weiss,M.S.(2015)。IUCrJ大学,2, 431–440. 交叉参考 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.(2010年)。《水晶学报》。D类66,479–485页科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Solé,V.A.,Papillon,E.,Cotte,M.,Walter,P.&Susini,J.(2007)。在光谱。 62, 63–68. 谷歌学者
第一次引用Thorn,A.和Sheldrick,G.M.(2011年)。J.应用。克里斯特。 44,1285–1287科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Waltersperger,S.、Olieric,V.、Pradervand,C.、Glettig,W.、Salathe,M.、Fuchs,M.R.、Curtin,A.、Wang,X.、Ebner,S.,Panepucci,E.、Weinert,T.、Schulze-Briese,C.和Wang,M.(2015)。J.同步辐射。 22, 895–900. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用韦内特,T。等。(2015).自然方法,12, 131–133. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Zeldin,O.B.、Gerstel,M.和Garman,E.F.(2013年)。J.应用。克里斯特。 46, 1225–1230. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标结构
生物学
国际标准编号:2059-7983