研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标生物
结晶学
编号:1399-0047

网格和集合:同步辐射高分子晶体学光束线的自动多晶体数据采集工作流程

十字标记_颜色_方形_文本.svg

结构生物学小组,欧洲同步辐射设施,CS 40220,38043格勒诺布尔,法国,b条德国汉堡诺克斯特拉街85号汉堡分站欧洲分子生物学实验室,邮编:22607,c(c)欧洲分子生物学实验室,格勒诺布尔分站,71 Avenue des Martyrs,CS 90181,38042 Grenoble,France,d日格勒诺布尔阿尔卑斯大学病毒-宿主-细胞相互作用单位–EMBL–CNRS,38042格勒诺贝利,法国,e(电子)格勒诺布尔阿尔卑斯大学,IBS,38044 Grenoble,France,(f)CNRS,IBS,38044格勒诺布尔,法国,CEA,IBS,38044格勒诺布尔,法国,小时ICS-6:分子生物物理,复杂系统研究所(ICS),德国朱利奇研究中心,邮编:52425俄罗斯联邦莫斯科物理技术研究所膜蛋白高级研究实验室,Dolgoprudniy 141700
*通信电子邮件:leonard@esrf.fr公司

M.Schiltz编辑,卢森堡Recherche国家基金会(2015年6月19日收到; 2015年9月24日接受; 在线2015年10月31日)

这里描述了一种自动程序,用于识别安装在同一样品架上的许多低温冷却晶体的位置,快速预测和排列它们的相对衍射强度,并根据需要从尽可能多的晶体中收集部分X射线衍射数据集。后续层次结构聚类分析然后允许部分数据集的最佳组合,优化最终获得的数据集的质量。将该方法应用于各种系统和场景的结果,包括从膜蛋白细菌视紫红质的微小晶体中汇编完整的数据集,以及成功收集数据集结构测定使用单波长反常色散文中还介绍了该技术。

1.简介

将来自许多晶体的部分X射线衍射数据集合并成一个完整的数据集可以追溯到大分子晶体学(MX)的最初。事实上,为了应对室温下观察到的辐射损伤晶体结构肌红蛋白的解决需要合并部分数据集,每个数据集包含一张单旋进照片,每个重原子衍生物包含22个晶体(Kendrew等。, 1960【Kendrew,J.C.,Dickerson,R.E.,Strandberg,B.E.,Hart,R.G.,Davies,D.R.,Phillips,D.C.&Shore,V.C.(1960),《自然》(伦敦),185,422-427。】). 然而,随着低温数据收集技术的引入(霍普,1988)【霍普·H(1988),《水晶学报》,B44,22-26。】)辐射损伤的影响可能会大大有限。这通常允许从生物大分子单晶中收集完整的数据集,即使是在高强度第三代同步辐射源的光束线上,这很快就成为了规范。

X射线自由电子激光器(XFEL)的出现使MX中的多晶体数据采集恢复并达到其逻辑极限。由于XFEL光束异常明亮,实验人员采用了一种“破坏前衍射”方法,称为连续飞秒晶体成像(SFX),将微晶流通过X射线光束,并在晶体和X射线激光脉冲重合的地方收集静态衍射图像(查普曼等。, 2011[Chapman,H.N.等人(2011年),《自然》(伦敦),47073-77。]). 然后,通过组合数千张静态衍射图像的数据来编译完整的数据集。虽然SFX很可能证明在MX中是一个分水岭,主要是因为使用该技术测定的晶体结构在很大程度上应无辐射损伤(Neutze等。, 2000【Neutze,R.、Wouts,R.,van der Spoel,D.、Weckert,E.和Hajdu,J.(2000)。《自然》(伦敦),406752-757。】; 布泰等。, 2012【Boutet,S.等人(2012),《科学》,337,362-364。】),这项技术并非没有缺点。特别是,即使是基于分子置换技术的结构溶液,SFX实验所需的蛋白质量目前也相当高(仅收集本机数据集)。此外,尽管SFX数据分析软件正在迅速发展(Sauter等。, 2013【Sauter,N.K.、Hattne,J.、Grosse-Kunstleve,R.W.和Echols,N.(2013),《结晶学报》D69,1274-1282。】; 白色等。, 2012【怀特,T.A.,基里安,R.A.,马丁,A.V.,阿奎拉,A.,纳斯,K.,巴蒂,A.&查普曼,H.N.(2012),《应用结晶杂志》第45期,第335-341页。】, 2013【怀特,T.A.,巴蒂,A.,斯特拉托,F.,霍尔顿,J.M.,基里安,R.A.,扎茨平,N.A.和查普曼,H.N.(2013),《结晶学报》D69,1231-1240。】; 巴蒂等。2014年【Barty,A.,Kirian,R.A.,Maia,F.R.N.C.,Hantke,M.,Yoon,C.H.,White,T.A.&Chapman,H.(2014),《应用结晶杂志》第47期,第1118-1131页。】; 萨瓦亚等。2014年【Sawaya,M.R.等人(2014)。美国国家科学院院刊,111,12769-12774。】)由于在这些实验中收集的衍射图像主要包含用不同光谱含量的激光脉冲从不同尺寸的晶体测量的部分记录反射,因此强度的估计(及其标准偏差)如果SFX收集的数据质量要接近“传统”MX实验中目前可用的质量,那么任何给定反射的质量都是有问题的,数据处理方法必须大幅改进。

受SFX成功的启发,同步加速器MX束线的实验人员使用了类似的范例(明亮的X射线束、快速读出探测器、小晶体、单次曝光实验)来开发同步加速器串行晶体学(SSX),这表明,也可以从数百或数千个引入同步加速器束的晶体中汇编有用的数据集通过喷射器(Nogly等。, 2015【Nogly,P.等人(2015年),IUCrJ,2168-176。】)玻璃毛细管中的液体流(Stellato等。2014年[Stellato,F.等人(2014).国际货币联盟期刊,1204-212。]),自立式高粘度微流(博萨等。, 2015【Botha,S.,Nass,K.,Barends,T.R.M.,Kabsch,W.,Latz,B.,Dworkowski,F.,Foucar,L.,Panepucci,E.,Wang,M.,Shoeman,R.L.,Schlichting,I.&Doak,R.B.(2015),《结晶学报》D71,387-397。】)夹在两个氮化硅(SiN个4; 科凯勒等。, 2015【Coquelle,N.,Brewster,A.S.,Kapp,U.,Shilova,A.,Weinhausen,B.,Burghammer,M.&Colletier,J.-P.(2015),《结晶学报》第71期,第1184-1196页。】)或环状烯烃共聚物(COC;黄等。, 2015【Huang,C.-Y.,Olieric,V.,Ma,P.,Panepucci,E.,Diederichs,K.,Wang,M.&Caffrey,M.(2015),《结晶学报》第71期,第1238-1256页。】)通过X射线束平移或包含在低温冷却样品架(Gati)上的晶片等。2014年【Gati,C.、Bourenkov,G.、Klinge,M.、Rehders,D.、Stellato,F.、Oberthür,D.、Yefanov,O.、Sommer,B.P.、Mogk,S.、Duszenko,M.、Betzel,C.、Schneider,T.r.、Chapman,H.N.和Redecke,L.(2014)。国际癌症研究所,187-94。】). 在后一种情况下,整个样品架通过X射线束连续光栅化,同时旋转(de Sanctis等。, 2012【Sanctis,D.de等人(2012),J.Synchrotron Rad.19,455-461.】),并以设定的时间间隔实时记录衍射图像。至于在液流或氮化硅晶片上引入X射线束的晶体,所收集的大多数衍射图像都不包含有用的信息。然而,样品在被光栅化时也会旋转,这意味着在晶体和X射线束重合的地方,一些衍射图像可能包含完全记录的反射,因此,使用标准软件包进行衍射图像的处理和缩放相对简单,并提高了整体数据质量。此外,对于大于X射线束的晶体,衍射图像可以分为来自同一晶体的衍射图像,从而也方便了数据处理并提高了结果数据质量(Gati等。2014年【Gati,C.、Bourenkov,G.、Klinge,M.、Rehders,D.、Stellato,F.、Oberthür,D.、Yefanov,O.、Sommer,B.P.、Mogk,S.、Duszenko,M.,Betzel,C.、Schneider,T.r.、Chapman,H.N.和Redecke,L.(2014)。国际癌症杂志,1,87-94。】).

虽然对于相同的晶体体积和X射线束尺寸,SSX实验中获得的分辨率可能始终低于SFX,但SSX将成为MX中的一项重要技术,许多系统的初始晶体通常很小,SSX提供了一种研究它们的方法,而无需对晶体尺寸和/或质量进行通常耗时且繁琐的优化。事实上,当与未来低发射度第四代储存环上可用的极为明亮的X射线束相结合时(例如,参见,https://www.esrf.fr/Apache_files/Upgrade/esrf-orage-book.pdf)这样的实验很可能成为常态。然而,即使通过X射线束对冷冻样品架上的样品进行光栅化,SSX和SFX也经常会受到这样一个事实的影响,即在实验期间没有尝试同步X射线束和晶体的交点。此外,由于SFX“破坏前衍射”原理目前不适用于SSX对冷冻样品的实验,从任何给定晶体收集的衍射数据量远未优化。

基于光学(Huang等。, 2015【Huang,C.-Y.,Olieric,V.,Ma,P.,Panepucci,E.,Diederichs,K.,Wang,M.&Caffrey,M.(2015),《结晶学报》第71期,第1238-1256页。】)或基于衍射(Soares等。2014年【Soares,A.S.、Mullen,J.D.、Parekh,R.M.、McCarthy,G.S.、Roessler,C.G.、Jackimowicz,R.、Skinner,J.M.,Orville,A.M.、Allaire,M.和Sweet,R.M(2014)。J.Synchrotron Rad.21,1231-1239。】)对多晶体样品支架的预询问确保了SSX协议中X射线束和晶体的同步,并极大地减少了成功实验所需的样品量。为了在SSX实验中从能够在发生严重辐射损伤之前维持许多X射线衍射图像采集的样品中实现衍射数据的最佳采集,我们开发了一个自动程序(图1[链接]). 这里,使用基于X射线的二维扫描确定单个冷冻样品架中包含的许多随机定向(微型)晶体的位置,自动排列发现的每个晶体的衍射强度,并在线收集和处理每个晶体的部分数据集。后续手动分级聚类分析(HCA;佐丹奴等。, 2012[佐丹奴·R、利尔·R·M·F、伯伦科夫·G·P、麦克斯威尼·S·波波夫·A·N(2012),《结晶学报》D68、649-658。])然后用于确定要合并的最相关的部分数据集,以生成用于下游分析和结构解决方案的最佳质量数据集。所开发的协议原则上可以应用于安装在几乎任何类型的当前可用安装平台上的晶体(尼龙环、微孔、硅N个4或COC晶圆等。)并且不仅适用于多晶体数据采集,还可以在利用微焦点或微焦点X射线束时,自动从大晶体进行多位置数据采集。

[图1]
图1
这个网格和集合多晶体数据收集方法的工作流。()对样品进行网格扫描。生成的图像会自动进行蛋白质衍射检查,并根据衍射强度进行评分。生成了表示衍射强度的热图,其中标记了部分数据收集的位置。用户为部分数据收集选择设置后Mx CuBE公司2自动填充数据收集队列,并收集所有部分数据集。一旦部分数据集被自动处理,就可以使用HCA选择要合并的数据集,以生成最终的数据集用于结构求解。(b条)的流程图网格和集合使用的工作流。

为了证明所开发的协议的通用性,我们给出了将此方法应用于各种系统和场景的结果。这些包括从膜蛋白细菌视紫红质微晶中汇编完整的数据集,收集和合并从较大晶体的不同位置收集的部分数据集,以及收集用于结构测定使用单波长反常色散技术。

2.方法

在这里描述的实验中,安装在扁平样品架中的晶体获得了最佳结果(MiTeGen微型网格;MiTeGen,美国;图1[链接])避免晶体堆积和周围母液过多,然后在液氮中闪蒸冷却或直接在光束线上冷却。当安装在角度计上时,样品架的平面应垂直于X射线束的方向。这确保了带入X射线束的任何晶体在相对较小的旋转范围内(此处描述的实验中为±5°1). 为了进行这种调整,我们通常使用迷你卡帕测角仪(Brockhauser等。, 2013【Brockhauser,S.、Ravelli,R.B.G.和McCarthy,A.A.(2013),《水晶学报》D69,1241-1251。】)安装在ESRF的大多数MX波束线上。这个网格和集合协议(图1[链接]b条)在定制的Passrelle-EDM工作流引擎中实现(https://isencia.be/passerelle-edm-en)调用了光束线专家系统这是基于以前的发展(布罗克豪斯等。, 2012【Brockhauser,S.、Svensson,O.、Bowler,M.W.、Nanao,M.、Gordon,E.、Leal,R.M.F.、Popov,A.、Gerring,M.,McCarthy,A.&Gotz,A.(2012),《晶体学报》,D68,975-984。】)并嵌入到MXCuBE公司2光束线控制图形用户界面(Gabadinho等。, 2010【Gabadinho,J.等人(2010),J.同步加速器辐射17,700-707。】; de Sanctis&Leonard,2014年【Sanctis,D.de&Leonard,G.(2014)。不是。Neutroni Luce Sincrotrone,19,24-26。】). 启动工作流程后,用户定义要使用的X射线束的大小。理想情况下,这应对应或小于样品架中所含晶体的最小尺寸。进行初始二维网格扫描的区域(图1[链接])由用户绘制,网格尺寸和X射线束大小定义网格扫描中的点数。使用软件对在每个点收集的衍射图像进行实时蛋白质衍射分析DOZOR公司(§[链接]2.1). 用户收到热图(图1[链接]),也存储在ISPyB数据库中(Delagenière等。, 2011【Delagenière,S.等人(2011)。生物信息学,273186-3192。】),显示观察到衍射的网格点。然后,用户有可能调整对比度水平以包括或排除用于后续数据收集的点。在最后一个实验步骤中,部分数据集(总旋转范围为±5°,每个部分数据集100幅图像)在每个网格点按顺序收集DOZOR公司得分高于阈值。使用格伦阿德斯管道(摩纳哥等。, 2013[摩纳哥,S.,戈登,E.,鲍勒,M.W.,德拉吉尼埃,S)基于XDS公司(卡布施,2010年【Kabsch,W.(2010),《结晶学报》,D66,125-132。】)与数据收集并行运行。然后,使用XSCALE公司(卡布施,2010年【Kabsch,W.(2010),《结晶学报》,D66,125-132。】). 结果CC(,j)为每对数据集的共同唯一强度计算的值用于HCA协议(佐丹奴等。, 2012[佐丹奴·R、利尔·R·M·F、伯伦科夫·G·P、麦克斯威尼·S·波波夫·A·N(2012),《结晶学报》D68、649-658。])生成树状图(图1[链接]). 然后,使用中央对手方清算所4个程序无意义漫无目的的(Evans&Murshudov,2013年【Evans,P.R.和Murshudov,G.N.(2013),《结晶学报》D691204-1214。】)结构解决方案的最终数据集精炼(图1[链接]). 的一个功能无意义它使用作为输入提供的第一个部分数据集作为参考数据集。这避免了在自动数据处理过程中可能出现的部分数据集之间的模糊索引,结果是获得的合并数据集不是人工单体孪生的(有关这方面的讨论,请参阅Brehm&Diederichs,2014【Brehm,W.&Diederichs,K.(2014),《水晶学报》第70期,第101-109页。】). 任何孪生然后检测到(使用`H(H)-测试';叶芝,1997【Yeates,T.O.(1997),《酶学方法》,276344-358。】)在最终合并的数据集中,尽管包括所有晶体的平均值可能是真实的,这有助于确定真实值空间组用于正确的孪生后续结构解决方案中的分数(如果合适),以及精细化。

2.1.DOZOR公司

这里描述的协议的核心特征之一是能够自动识别和排列样品架低剂量网格扫描期间收集的一系列单衍射图案。这是使用程序执行的DOZOR公司。由于所使用的算法将在其他地方进行更详细的说明,因此此处仅作简要描述。

第一步,DOZOR公司确定衍射图像上背景强度的分布,作为衍射矢量长度的函数小时这是通过像素强度的迭代求和和异常值的顺序拒绝来实现的。在方位平均后,这会产生一维背景函数[{\hat I}_{\rm背景}(h)]。此函数应平滑:任何尖峰均表示冰环或盐衍射,且此类区域不用于进一步计算。

在生物大分子晶体衍射的情况下

[{\hat I}_{\rm powder}(h)={{1}\over{N(h)}}\textstyle\sum\limits_{I,j}^{h}I_{i,j}-{\hat I}_{\rm背景}(h),\eqno(1)]

哪里N个(小时)是探测器像素数,j是属于分辨率外壳的任何像素的强度,小时),将给出布拉格点平均强度的估计值,作为分辨率的函数,并将表示众所周知的威尔逊图,对于任何蛋白质晶体都可以使用[{\hat J}_{\rm u}(h)],平均平方结构系数震级的独特模式(Bourenkov&Popov,2006[Bourenkov,G.P.&Popov,A.N.(2006),《结晶学报》,D62,58-64。]).DOZOR公司通过将各向同性的德拜-沃勒因子应用于标准蛋白威尔逊图模型来近似实验数据,

[{\hat I}_{\rm powder}(h)={\rm-scale}\,{\hat-J}_{\ rm-u}(h)\exp(-Bh^{2}/2).\eqno(2)]

对结果拟合的质量进行评估通过这个相关系数(2)左右部分之间[链接],抄送该程序还识别单个布拉格斑点,并进行一些简单的几何检查,以进一步验证高分子晶体衍射的存在,并允许排除冰或盐污染。最后,衍射强度得分估计为总平均衍射强度乘以CC,其中V(V)(小时)是分辨率外壳的倒数体积,

[{\rm分数}={\rm-CC}_{\rm-fork}\textstyle\sum\limits_{h} V(V)(h) \,{\rm-scale}\,{\that J}_{\rm-u}(h)\exp(-Bh/2)/\textstyle\sum\limits_{h} V(V)(h) ●●●●。\等式(3)]

在以下情况下DOZOR公司找不到任何布拉格点,分数为零。

3.结果

3.1. 细菌视紫红质

如前所述制备细菌视紫红质(BR)晶体(戈德利等。, 2003[Gordeliy,V.I.,Schlesinger,R.,Efremov,R.,Büldt,G.和Heberle,J.(2003)。分子生物学方法228305-316。]). 在这项研究中,使用了两批细菌视紫红质晶体:BR1(图2[链接]),尺寸为~20×20×5µm和BR2(图3[链接]),尺寸为~5×5×2微米。衍射数据(表1[链接])在ESRF波束线ID29(de Sanctis)上采集等。, 2012【Sanctis,D.de等人(2012),J.Synchrotron Rad.19,455-461.】)使用PILATUS3 6M像素探测器(瑞士巴登Dectris)。

表1
数据收集和处理

括号中的值用于外壳。

  巴西雷亚尔1 巴西雷亚尔2 索姆丁 溶菌酶 嗜热菌蛋白酶 漩涡
衍射光源 ID29、ESRF ID29、ESRF ID29、ESRF ID23-1,欧洲战略参考框架 ID23-1,欧洲战略参考框架 ID23-1,欧洲战略参考框架
波长(Ω) 0.976 0.976 0.969 0.979 1.282 0.979
温度(K) 100 100 100 100 100 100
探测器 皮拉图斯3 6M 皮拉图斯3 6M 皮拉图斯3 6M 皮拉特斯6M 壁柱6M 皮拉特斯6M
光束直径(µm) 20 10 10 10 10 10
通量(光子−1) 3 × 1011 1.5 × 1011 8.7 × 1011 3.5 × 1010 4.0 × 1010 9.5 × 1010
每个点的绝对剂量,二维网格(MGy) 0.013 0.16 0.016 0.085 0.17 0.34
每个部分数据集的绝对剂量(MGy) 3.4 6.8 2.1 11.9 20.4 4.5
已收集部分数据集 10 59 100 54 96 137
已处理部分数据集 10 38 78 40 77 122
合并了部分数据集 9 10 74 21 49 45
“空间”组 6 6 41212 21 6122 H(H)32
单位-细胞参数(Ω,°) =b条= 61.13,c(c)= 110.31 =b条= 61.25,c(c)= 110.89 =b条= 57.93,c(c)= 150.64 = 27.58,b条= 62.64,c(c)= 59.55,β= 91.06 =b条= 92.87,c(c)= 92.87 =b条= 109.95,c(c)= 623.53
分辨率范围(Ω) 20.05–2.29 (2.41–2.29) 19.73–2.54 (2.68–2.54) 19.76–1.19 (1.26–1.19) 19.73–1.59 (1.68–1.59) 19.88–1.27 (1.33–1.27) 20.10–3.46(3.65–3.46)
反射总数 47395 37209 4188764 96305 3330113 562987
独特反射次数 9802 7306 81704 23004 80728 19167
完整性(%) 92.7(90.6) 96.7(81.4) 99.4 (96.1) 85.0 (82.1) 92.0 (53.4) 98.7 (94.6)
多重性 4.8 (4.6) 5.1 (4.3) 51.3 (48.4) 4.2 (4.0) 41.3 (8.6) 29.4 (27.7)
半集相关CC1/2 0.998 (0.409) 0.938 (0.263) 0.999 (0.692) 0.989 (0.541) 0.998 (0.321) 0.997 (0.39)
/σ()〉 13.0 (2.7) 4.8 (1.2) 48.7 (2.8) 8.0 (2.2) 25.4 (2.7) 9.5 (1.2)
R(右)下午。 0.050(0.548) 0.181 (0.797) 0.034 (0.503) 0.080 (0.486) 0.017 (0.344) 0.078 (0.638)
B类因子,威尔逊曲线2) 37 26.5 9.6 12.5 14.9 88.1
[图2]
图2
细菌视紫红质较大晶体的多晶体数据收集和结构解决方案。()在脂质中结晶得到的细菌视紫红质晶体中间相(博尔什切夫斯基等。, 2011【Borshchevskiy,V.I.,Round,E.S.,Popov,A.N.,Büldt,G.&Gordeliy,V.I.(2011),《分子生物学杂志》409,813-825。】); 平均晶粒尺寸为~20×20×5微米。(b条)样品架初始网格扫描后的热图。从暗红色到黄色的颜色表示在相应位置检测到的衍射信号的强度;白色十字标记用于收集部分数据集的位置。在显示的所有热量图中x个轴表示沿样品架水平平移的网格点以垂直网格点为轴。对于这两者,单位是梁尺寸。(c(c))基于CC HCA的树状图(,j)值产生于XSCALE公司。蓝色矩形显示合并的部分数据集,以生成最终数据集。(d日)Wilson图由最终数据集导出,使用最佳(布伦科夫和波波夫,2006年[Bourenkov,G.P.&Popov,A.N.(2006),《结晶学报》,D62,58-64。]). (e(电子))最终2的细节毫发光突发事件负极DF公司计算,α计算获得了电子密度图(在1.5×r.m.s.下绘制等高线),精细结构以球棒表示。((f))OMIT差异密度(毫发光突发事件负极DF公司计算,α计算)地图的末尾精炼视网膜分子的程序(轮廓为2.5×r.m.s.)(球棒表示法)。
[图3]
图3
细菌视紫红质微晶的多晶体数据采集和结构求解。()从脂质结晶中获得的细菌视紫红质微晶中间相;平均晶粒度~5×5×2微米。(b条)样品架初始网格扫描后的热图。(c(c))基于CC HCA的树状图(,j)值产生于XSCALE公司. (d日)使用以下公式导出的最终数据集的Wilson图最好的. (e(电子))决赛2细节毫发光突发事件负极DF公司计算,α计算电子密度图(以1.5×r.m.s.的等高线绘制),精细结构以球棒表示。((f))OMIT差异密度(毫发光突发事件负极DF公司计算,α计算)地图的末尾精炼视网膜分子的程序(轮廓为2.0×r.m.s.)(球棒表示法)。

对于BR1,使用20的高斯X射线束进行初始网格扫描直径为µm通量共3×1011光子−1生成的热图(图2[链接]b条)揭示了收集部分数据集的十个井衍射位置。在HCA(图2)之后,所有部分数据集都可以自动处理[链接]c(c)),选择了9个进行缩放和合并,以生成最终数据集d日最小值= 2.3奥(表1[链接]; Wilson图如图2所示[链接]d日).

对于BR2,初始网格扫描(X射线束10直径为µm通量1.5×1011光子−1)制作了一张热图(图3[链接]b条)显示了样品架中的59个衍射位置,从中收集了部分数据集。38个部分数据集可以在HCA之后自动处理(图3[链接]c(c)),十个被合并以生成最终数据集d日最小值= 2.6Å; 表1[链接]; Wilson图如图3所示[链接]d日).

对于BR1(孪生分数0.06)和BR2(孪生系数0.39),通过以下方法进行结构求解分子置换使用MOLREP公司(Vagin&Teplyakov,2010年【Vagin,A.和Teplyakov,A.(2010),《水晶学报》,D66,22-25。】)带有PDB条目3个(博尔什切夫斯基等。, 2011【Borshchevskiy,V.I.,Round,E.S.,Popov,A.N.,Büldt,G.&Gordeliy,V.I.(2011),《分子生物学杂志》409,813-825。】)去除水分子和配体作为搜索模型。结构精炼(表2[链接])使用孪生 精炼中的选项REFMAC公司5(穆尔舒多夫等。, 2011【Murshudov,G.N.,Skubák,P.,Lebedev,A.A.,Pannu,N.S.,Steiner,R.A.,Nicholls,R.A..,Winn,M.D.,Long,F.&Vagin,A.A..(2011),《晶体学报》,D67,355-367。】)在中穿插着几轮手动重建库特(埃姆斯利等。, 2010【Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010),《水晶学报》D66、486-501。】). 在这两种晶体结构中,根据电子密度和差异密度图的解释,视网膜辅因子的分配是可能的,并且在最后的2中都得到了很好的定义毫发光突发事件负极DF公司计算电子密度和OMIT差异密度图(图2[链接]e(电子), 2[链接](f), 3[链接]e(电子)和3[链接](f)).

表2
结构解决和细化

括号中的值用于外壳。

  巴西雷亚尔1 巴西雷亚尔2 索姆丁 溶菌酶 嗜热菌蛋白酶 漩涡
分辨率范围(Ω) 20.01–2.29 19.73–2.57 20.00–1.20 20.00–1.59 20.00–1.27 未注明日期。
反射次数,工作集 9318 6924 77618 21804 76712 未注明日期。
反射次数,测试集 480 365 3972 1182 3958 未注明日期。
最终R(右)晶体 0.232 0.193 0.133 0.213 0.143 未注明日期。
最终R(右)自由的 0.239 0.218 0.151 0.265 0.166 未注明日期。
十字柄DPI 0.0988 0.3826 0.0311 0.1509 0.0467 未注明日期。
非H原子数量
蛋白质 1612 1677 1640 2014 2448 未注明日期。
离子 5 未注明日期。
配体 95 20 10 14 31 未注明日期。
10 290 181 326 未注明日期。
总计 1717 1697 1940 2209 2810 未注明日期。
R.m.s.偏差
债券(澳元) 0.012 0.012 0.028 0.008 0.007 未注明日期。
角度(°) 1.59 1.46 2.18 1.27 1.32 未注明日期。
平均值B类因子(λ2)
蛋白质 39.2 29.5 13.7 16.9 16.5 未注明日期。
离子 16 未注明日期。
配体 41.3 22.6 10.9 24.3 35.4 未注明日期。
42.6 29.4 26 28.7 未注明日期。
总计 39.4 29.1 15.2 17.3 17.5 未注明日期。
拉马钱德兰阴谋
最受欢迎(%) 97.1 98.4 99 98 96.8 未注明日期。
允许(%) 2.8 1.6 1 2 3.2 未注明日期。
PDB代码 5a44年 5a45年 5a47岁 5a3赫兹 5a3年  

3.2. 索姆丁

将索姆丁(Sigma–Aldrich目录号T7638)溶解在双蒸馏水中,浓度为20毫克毫升−1.尺寸约为40×40×60的晶体在2中获得µmµl(1:1比例)悬挂液滴,使用0.1M(M)HEPES pH值7.5,0.7M(M)酒石酸钾/钠,20%甘油作为储液罐。晶体安装如§[链接]2无进一步低温保护。在ESRF束线ID29上收集数据。最初的网格扫描是用10的X射线束进行的直径为µm通量第8.7×10页11光子−1根据生成的热图(图4[链接])选取100个衍射点作为部分数据集的采集点,其中78个点可以自动积分。HCA后(图4[链接]b条)74被合并以产生最终数据集d日最小值= 1.2奥(表1[链接]; 图4所示的Wilson图[链接]c(c)).

[图4]
图4
多晶体数据采集和索玛汀晶体的结构解。()样品架初始网格扫描后的热图。(b条)基于CC HCA的树状图(,j)值产生于XSCALE公司. (c(c))使用以下公式导出的最终数据集的Wilson图最佳. (d日)精致的带状图晶体结构产生的thaumatin(棒状酒石酸盐分子)。(e(电子))决赛2细节毫发光突发事件负极DF公司计算,α计算电子密度图(以1.5×r.m.s.的等高线绘制),精细结构以球棒表示。((f))差异密度(毫发光突发事件负极DF公司计算,α计算)酒石酸盐分子后结构精炼(OMIT图)。差异密度显示在3×r.m.s的等高线水平上。

结构求解由分子置换使用MOLREP公司带有PDB条目4个许(西普里亚尼等。, 2012[Cipriani,F.,Röwer,M.,Landret,C.,Zander,U.,Felisaz,F.&Márquez,J.A.(2012),《结晶学报》D68,1393-1399。])去除水分子和配体作为搜索模型。结构精炼(表2[链接],图4[链接]d日)在此期间,对不同的电子密度图进行分析,可以清楚地确定酒石酸盐(一个分子;图4[链接]e(电子)和4[链接](f))甘油(单分子)部分与蛋白质结合REFMAC公司5个替换为手动重建库特.

3.3. 单克隆溶菌酶

溶菌酶(罗氏应用科学,目录号10837059001)在双蒸馏水中溶解至40的浓度毫克毫升−1.单斜的“花”(空间群21)溶菌酶晶体(图5[链接]),每个花瓣~80然后从2µl(1:1比例)悬挂液滴,使用0.6M(M)纳米技术作为沉淀剂/水库。安装前,1结晶液滴中加入µm 75%甘油进行低温保护。在ESRF光束线ID23-1(Nurizzo)上收集衍射数据等。,2006年【Nurizzo,D.、Mairs,T.、Guijarro,M.、Rey,V.、Meyer,J.、Fajardo,P.、Chavanne,J.,Biasci,J.-C.、McSweeney,S.和Mitchell,E.(2006)。《同步辐射杂志》第13期,第227-238页。】)使用10的X射线束直径µm,带通量3.5×1010光子−1初始网格扫描生成了热图(图5[链接]b条)它被用作收集54个部分数据集的基础,其中40个可以自动处理。HCA后(图5[链接]c(c))合并21个部分数据集,生成最终数据集d日最小值= 1.6奥(表1[链接]; Wilson图如图5所示[链接]d日). 结构解决方案和精炼(表2[链接],图5[链接]d日)然后按照上文所述对thaumatin进行治疗(使用PDB条目4xt(下一个)去除水分子和配体作为搜索模型分子置换;西普里亚尼等。, 2012[Cipriani,F.,Röwer,M.,Landret,C.,Zander,U.,Felisaz,F.&Márquez,J.A.(2012),《结晶学报》D68,1393-1399。])在此期间,电子密度和差异电子密度图的分析允许分配硝酸盐(NO负极)与溶菌酶分子之一结合的离子非对称单元(图5[链接](f)).

[图5]
图5
单斜溶菌酶晶体的多晶体数据采集和结构解。()结晶过程中产生的单斜溶菌酶晶体的“花”。(b条)对此处描述的工作流中使用的样本进行初始网格扫描后的热图。(c(c))基于CC HCA的树状图(,j)产生的价值XSCALE公司. (d日)使用以下公式导出的最终数据集的Wilson图最佳. (e(电子))2的详图毫发光突发事件负极DF公司计算,α计算电子密度图精炼程序(在1×r.m.s下绘制等高线;氨基酸残基以球棒表示)。((f))差异密度(毫发光突发事件负极DF公司计算,α计算)对于硝酸盐分子,在结构再精细化程序(OMIT图)的末尾。差异密度显示在3×r.m.s的等高线水平上()图表显示了HCA指导的数据集合并(21个合并数据集,蓝色)或收集的40个数据集中39个数据集的“盲”合并后获得的数据集的完整性(顶部面板)和质量的比较。(小时)差异密度(毫发光突发事件负极DF公司计算,α计算)基于通过合并所收集的40个数据集中的39个数据集而获得的数据集,在结构细化过程结束时用于硝酸盐分子。差异密度显示在2.5×r.m.s的等高线水平上。

3.4. 嗜热菌蛋白酶

热蛋白分解芽孢杆菌将嗜热菌蛋白酶(Sigma–Aldrich目录号T0331)溶解至100毫克毫升−1在45%二甲基亚砜中,0.05M(M)MES pH 6.0。储液罐中含有35%的饱和硫酸铵,而滴液由蛋白质溶液和0.05的溶液组成M(M)MES pH 6.0,1M(M)氯化钠,45%二甲基亚砜,比例为1:1。40×40×150至40×40 x 300之间的棒状晶体6μm大小快速浸泡M(M)三甲胺N个-氧化物(TMAO;米勒-迪克曼等。, 2011[Mueller-Dieckmann,C.,Kauffmann,B.&Weiss,M.S.(2011),《应用结晶杂志》,第44期,第433-436页。])安装在样品支架上之前进行低温保护(图6[链接]). 使用10的X射线束收集衍射数据直径为µm通量4.0×1010光子−1在锌的峰值K(K) 吸收边缘(λ= 1.256欧)在ESRF的波束线ID23-1上。初始网格扫描生成了一张热图(图6[链接])它被用作收集96个部分数据集的基础,其中77个数据集被自动处理,49个数据集在HCA分析后被手动合并,以生成最终数据集d日最小值= 1.37奥(表1[链接],图6[链接]b条和6[链接]c(c)). 结构方案(图6[链接]d日)使用SAD方法(Dauter等。, 2002【Dauter,Z.、Dauter、M.和Dodson,E.J.(2002),《水晶学报》D58,494-506。】)使用SHELXC公司/D类/E类管道(Sheldrick,2008[Sheldrick,G.M.(2008),《水晶学报》,A64112-122。])在中实施香港(HKL)2地图(Pape&Schneider,2004年【Pape,T.&Schneider,T.R.(2004),《应用结晶杂志》,第37期,第843-844页。】),带有首字母从头开始-获得的模型晶体结构精制(表2[链接],图6[链接]e(电子))使用迭代轮次REFMAC公司5和手动重建库特.

[图6]
图6
热溶蛋白晶体的多晶体数据采集和SAD结构解。()样品架安装在ID23-1上,然后立即启动网格和集合工作流。(b条)样品初始网格扫描后的热图清楚地显示了样品支架上所含晶体的尺寸和配置。(c(c))基于CC HCA的树状图(,j)值产生于XSCALE公司. (d日)CC图全部的 科科斯群岛虚弱的SHELXD公司/香港(HKL)2地图对于试验下部结构,明确表示成功下部结构解决方案。(e(电子))最终2的细节毫发光突发事件负极DF公司计算,α计算电子密度图精炼程序(在1.5×r.m.s下绘制等高线;氨基酸残基以球棒表示)。((f))显示两个异常差异图的细节(Δ如果阿诺,α计算+催化锌周围90°)峰(紫色鸡丝)2+离子(灰球)和三钙2+离子(黄色球体)和OMIT差异密度(毫发光突发事件负极DF公司计算,α计算(绿色鸡丝)在Val-Lys二肽区域发现结合在活性部位。OMIT差密度的等值线为3×r.m.s,异常差密度为4.5×r.m.s。

我们对嗜热菌蛋白酶晶体的实验揭示了所开发管道的其他特征。特别是,当样品架中含有一系列比X射线束大得多的晶体时(图6[链接])多晶体/多位置数据采集也实现了自动化。事实上,对于大于X射线束的晶体,使用DOZOR公司(§[链接]2.1)提供衍射图(Bowler等。, 2010【Bowler,M.W.、Guijarro,M.、Petitdemange,S.、Baker,I.、Svensson,O.、Burghammer,M.,Mueller-Dieckmann,C.、Gordon,E.J.、Flot,D.、McSweeney,S.M.和Leonard,G.A.(2010),《结晶学报》D66、855-864。】)样品架上包含的晶体(图6[链接]b条). 因此,该工作流程确保仅从任何给定晶体的衍射良好区域收集部分数据集。

3.5. 的MAEL域家蚕漩涡

硒代亚砜衍生物MAEL结构域晶体的衍射数据B.莫里漩涡(结晶条件见陈等。, 2015【Chen,K.M.,Campbell,E.,Pandey,R.R.,Yang,Z.,McCarthy,A.A.&Pillai,R.S.(2015)。RNA,21,833-839。】)使用10直径µm,带通量约9.5×1010光子−1在硒的峰值K(K) 吸收边缘(λ= 0.979欧)在ESRF的波束线ID23-1上。该系统的晶体(20–50最大尺寸为µm)衍射相当差;因此,为了增加数据的多样性,以便更准确地测定异常差异,本实验使用了六个不同的样品夹。初始网格扫描生成了热图(图7[链接])用于指导137个部分数据集的收集,其中122个可以自动处理,45个被合并以生成最终数据集d日最小值= 3.46HCA后的奥数(表1[链接],图7[链接]b条和7[链接]c(c)). 结构解决方案(图7[链接]d日和7[链接]e(电子))使用SAD技术执行曲柄2条管道(Skubák&Pannu,2013年【Skubák,P.&Pannu,N.S.(2013),《自然通讯》第4期,第2777页。】).

[图7]
图7
Maelstrom的多晶体数据采集和SAD结构解决方案。()分析了六个样品架的初始网格扫描热图。(b条)基于CC HCA的树状图(,j)值产生于XSCALE公司. (c(c))Wilson图来自最终数据集,使用最佳. (d日)CC图全部的 科科斯群岛虚弱的SHELXD公司/香港(HKL)2地图对于试验下部结构,明确表示成功下部结构解决方案。(e(电子))2的代表部分毫发光突发事件负极DF公司计算,α计算初始模型建立后的电子密度图精细化,有两个α-带状表示中显示的螺旋线。

4.讨论

4.1. 一般性意见

我们在这里描述的方法,与前面描述的安装在微米内的样品的多晶体数据采集方法类似(Soares等。2014年【Soares,A.S.、Mullen,J.D.、Parekh,R.M.、McCarthy,G.S.、Roessler,C.G.、Jackimowicz,R.、Skinner,J.M.,Orville,A.M.、Allaire,M.和Sweet,R.M(2014)。J.Synchrotron Rad.21,1231-1239。】),呈现出根本性差异。值得注意的是,样品架的极低X射线剂量预筛选用于识别样品架上包含的晶体位置,并对晶体的衍射特性进行排序,以便为后续自动收集部分数据集创造优先权,HCA协议用于选择要合并的部分数据集,以生成最佳的最终数据集。此外,当样品架包含一系列比X射线束大得多的晶体时,该方法还自动化了多晶体/多位置数据采集类型(Riekel等。, 2005【Riekel,C.,Burghamer,M.和Schertler,G.(2005)。当前操作。结构生物学。15556-562。】)在G蛋白偶联受体(GPCR;Rasmussen等。, 2011[Rasmussen,S.G.F.等人(2011)。《自然》(伦敦),477,549-555。]; 霍伦斯坦等。, 2013【Hollenstein,K.,Kean,J.,Bortolato,A.,Cheng,R.K.,Doré,A.S.,Jazayeri,A.,Cooke,R.M.,Weir,M.&Marshall,F.H.(2013)。《自然》(伦敦),499,438-443。】; 勒本等。, 2011【Lebon,G.、Warne,T.、Edwards,P.C.、Bennett,K.、Langmead,C.J.、Leslie,A.G.W.和Tate,C.G.(2011)。《自然》(伦敦),474,521-525。】). 此外,对于大于X射线束的晶体,使用DOZOR公司(§[链接]2.1)还提供衍射制图(Bowler等。, 2010【Bowler,M.W.、Guijarro,M.、Petitdemange,S.、Baker,I.、Svensson,O.、Burghammer,M.,Mueller-Dieckmann,C.、Gordon,E.J.、Flot,D.、McSweeney,S.M.和Leonard,G.A.(2010),《结晶学报》D66、855-864。】)确保部分数据集仅从任何给定晶体的衍射良好区域收集。

为了证明此处描述的工作流程的一般适用性,我们将其应用于不同的系统和场景,在这些系统和场景中,许多相同类型的晶体安装在同一个冷冻样品架上。在所有呈现的案例中,我们的工作流都产生了适合目的的数据集(表1[链接], §[链接]4.2). 如预期(Fry等。1996年[Fry,E.,Logan,D.&Stuart,D.(1996),《结晶方法和协议》,由C.Jones,B.Mulloy&M.Sanderson编辑,第319-363页。托托瓦:Humana出版社。]),这里描述的协议特别适合于系统(thaumatin、细菌视紫红质、漩涡)在高度对称的空间群中结晶。然而,我们使用溶菌酶单斜晶体的实验表明,该方法也可以应用于低对称性系统。此外,作为单斜形式的溶菌酶结晶为成簇的共生晶体(图5[链接])后一个实验的成功证明,在安装特定样品的单晶可能困难或不可能的情况下,所开发的协议还可以使用微焦点或微焦点X射线束自动收集衍射数据。

值得注意的是,在HCA指导下合并收集的部分数据集后,获得的单斜溶菌酶数据集的完整性相当不完整(40个自动处理的部分数据集中合并了21个,完整性为85%;表1[链接]). 然而,这并不是样品架中优先取向的低对称晶体组合的结果。事实上,合并40个自动处理的部分数据集中的39个大大提高了完整性(图5[链接]). 然而,与仅合并主HCA集群中的部分数据集相比,结果数据集的质量严重下降(图5[链接]). 此外,与HCA定向合并后观察到的情况相反,由此产生的电子密度差异不允许正确识别与蛋白质结合的硝酸根离子(图5[链接](f)和5[链接]小时). 因此,HCA显然是正确合并部分数据集的不可或缺的工具。然而,HCA后获得的单斜溶菌酶的合并数据集有些不完整,这表明,至少对于一些低对称性系统而言,可能需要从X射线束中不同方向的两个回路中的样品收集数据,以确保数据集完全完整、高质量。

我们提供的示例包括从一系列微晶(~5)收集的部分数据集中汇编完整的衍射数据最大尺寸为µm),包含在同一样品支架上,在脂质中生长的膜蛋白(细菌视紫红质)中间相。这种中间相是膜蛋白晶体生长的非常重要的介质(戈德利等。, 2003【Gordeliy,V.I.,Schlesinger,R.,Efremov,R.、Büldt,G.和Heberle,J.(2003)。《分子生物学方法》228,305-316。】),但在本质上通常是不透明的,尤其是在冷却时。因此,在这种介质中产生的X射线束中识别、安装和定心小晶体可能具有挑战性。这里描述的工作流程使用基于衍射的方法来识别样品架中晶体的位置,这在这种情况下显然是一个主要优势,因为它通过自动收集多个晶体的部分数据集,避免了此类问题,特别是当采集到整个结晶液滴时。

4.2. 结构解决和细化

4.2.1. 分子置换结构溶液的衍射数据

上述细菌视紫红质(BR1和BR2)、索姆丁和单斜溶菌酶的例子清楚地表明,即使对于非常小的晶体,我们开发的协议也能产生完整的衍射数据集,从而可以通过MR进行结构求解。此外,尽管所有数据集都是通过合并多个部分数据集获得的,但电子密度(2毫发光突发事件负极DF公司计算,α计算)和差异密度(毫发光突发事件负极DF公司计算,α计算)结构期间计算的贴图精炼明确允许识别MR搜索模型中未包括的部分:视网膜(BR1和BR2;图2[链接](f)和3[链接](f)),酒石酸盐(thaumatin;图4[链接](f))和否负极(单斜溶菌酶;图5[链接](f)). 这表明,所开发的方法在未来可能在碎片筛选项目中发挥重要作用(Murray&Blundell,2010)[Murray,C.W.和Blundell,T.L.(2010)。当前操作。结构生物学。20497-507。])作为药物设计的辅助手段。传统上,此类项目是基于生产用于浸泡实验的相对较大且坚固的晶体(Oster等。, 2015[Oster,L.、Tapani,S.、Xue,Y.和Kack,H.(2015)。《药物发现》,今日,第20期,第1104-1411页。]). 然而,这里给出的结果表明,显然不需要这样,而且可以直接从安装在同一样品架上的一系列较小的晶体中汇编完整、高质量的数据集。此外,有证据表明,较小的晶体需要减少碎片/配体浸泡时间,才能在晶体结构中获得相同的片段/配体占据率(科尔等。2014年[Cole,K.等人(2014)。公共科学图书馆,第9期,e101036。])基于微晶的碎片筛选实验很可能成为规范,浸泡时间基于结晶滴中包含的最大晶体,确保在单个样品环上安装的所有晶体中配体/碎片的最大占有率。

4.2.2. 利用反常散射进行结构解算的衍射数据

为了演示此处介绍的工作流程的可能性,以生成适用于利用的实验阶段化技术的数据反常散射,研究了两种不同的体系。第一种是嗜热菌素,它含有一个催化锌2+离子和三种Ca2+每个蛋白质链的离子(316个残基),产生理论上的反常衍射比(Δ如果/如果〉),对于在Zn峰值处收集的数据,为~2%K(K) 吸收边缘。第二种是MAEL结构域的硒代亚砜衍生物B.莫里漩涡(陈等。, 2015【Chen,K.M.,Campbell,E.,Pandey,R.R.,Yang,Z.,McCarthy,A.A.&Pillai,R.S.(2015)。RNA,21,833-839。】),在硒的峰值处收集的数据产生4.0%的理论异常衍射比K(K) 吸收边缘。然而,该系统的晶体衍射相当差(见表1[链接]). 因此,为这两个系统的结构解决方案收集足够高质量的数据显然具有挑战性,即使是从单晶中收集。然而,如图6所示[链接]和7[链接]对于这两个系统,我们的多晶体工作流程清楚地产生了足够质量的衍射数据,用于结构求解。正如所料,在这两种情况下,高数据多样性都很重要(表1[链接])为了实现这一点,需要结合安装在六个不同样品架上的晶体的部分数据集(图7[链接]).

4.3. 视角

我们开发了一种自动程序,用于定位、排列同一样品架上包含的大量晶体的衍射特性并收集部分数据集。随后收集的部分数据集的HCA允许选择合并哪些部分数据集,以生成下游结构解决方案的最终数据集,以及精细化。与之前提出的SSX协议(Gati等。2014年【Gati,C.、Bourenkov,G.、Klinge,M.、Rehders,D.、Stellato,F.、Oberthür,D.、Yefanov,O.、Sommer,B.P.、Mogk,S.、Duszenko,M.,Betzel,C.、Schneider,T.r.、Chapman,H.N.和Redecke,L.(2014)。国际癌症杂志,1,87-94。】; 大声地说等。, 2015【Nogly,P.等人(2015年),IUCrJ,2168-176。】; 斯特拉托等。2014年[Stellato,F.等人(2014).国际货币联盟期刊,1204-212。]),网格和集合有几个优点,特别是如果需要,可以从样品架上包含的所有晶体中收集小而连续的数据集。因此,晶体损耗不是一个问题,从原始衍射图像到结构因子和标准偏差的数据简化相当简单,并且最终数据集的质量得到了提高。此外,§[链接]3清楚地证明DOZOR公司在低剂量二维网格扫描中检测衍射信号,即使是最小的晶体(BR2;§3.1[链接])在这项工作中进行了研究,其平均体积为~50微米.

在开始这项工作时,我们假设包含在同一回路中的低温冷却晶体将相对同晶,因为所有晶体都来自同一结晶滴,并且在安装和低温冷却过程中受到类似的处理(佐丹奴等。, 2012[佐丹奴·R、利尔·R·M·F、伯伦科夫·G·P、麦克斯威尼·S·波波夫·A·N(2012),《结晶学报》D68、649-658。]). 图2所示的树状图[链接], 3[链接], 4[链接], 5[链接]和6[链接]尽管在我们的几个示例中,收集的许多部分数据集并没有用于构建最终结果,但我们还是建议这样做。上述直方图大多包含一个具有高互相关系数的主簇和一个与主簇相关性降低的连续数据集。这种模式表明部分数据集之间的数据质量差异很大,而不是晶体非同构,并表明一些部分数据集是从具有重叠晶格的位置或其他问题(例如晶体损坏)收集的。显然,初始二维网格扫描的评估DOZOR公司没有过滤掉这些位置。此外,由于在每个位置仅测量10°旋转范围,因此很难根据内部处理统计数据检测出此类有问题的数据集,并且HCA需要筛选出最差的部分数据集。在Maelstrom的情况下,部分数据集是从几个不同样品架上的晶体中测量的,树状图(图7[链接])显示了距离截止点上方人口稠密的集群(,j)=0.15,并且在该截止点以下连续存在相关性较差的数据集。这表明部分数据集之间存在非同构和数据质量差异。然而,可以看出,HCA程序成功地过滤了质量差和非同质部分数据集。

尽管上述实验取得了成功,但所开发的程序最终将在许多领域得到改进。这里,所有样品都是手动安装和冷冻的,利用机器人晶体处理方法,既可以从结晶液滴中去除母液,也可以在合适的样品架(Cipriani)中安装和冷冻晶体,可以获得更好的结果等。, 2012[Cipriani,F.,Röwer,M.,Landret,C.,Zander,U.,Felisaz,F.和Márquez,J.A.(2012)。晶体学报,D68,1393-1399。]). 此外,对于这里描述的不同实验,每个晶体的总吸收剂量(表1[链接]; 计算实验后使用放射性核素; Paithanar&Garman,2010年【Paithanhar,K.S.&Garman,E.F.(2010),《结晶学报》,D66,381-388。】)与亨德森/加曼的限额相比相当低(亨德森,1990【Henderson,R.(1990),《生物科学学报》第241卷第6-8页。】; 欧文等。,2006年[Owen,R.L.,Rudiño-Piñera,E.&Garman,E.F.(2006)。美国国家科学院院刊,103,4912-4917。])通常用于从低温冷却的大分子单晶中采集衍射数据。在这里介绍的未来版本的管道中,低剂量二维网格扫描后,在数据收集步骤之前,将使用EDNA公司表征软件(Bourenkov&Popov,2010[Bourenkov,G.P.&Popov,A.N.(2010),《结晶学报》,D66,409-419。]; 印卡多纳等。, 2009【Incardona,M.-F.,Bourenkov,G.P.,Levik,K.,Pieritz,R.A.,Popov,A.N.&Svensson,O.(2009),《同步辐射杂志》第16期,第872-879页。】)结果是每个晶体采集的数据质量更好和/或分辨率更高。对于高度辐射敏感的晶体,人们甚至可以想象使用“燃烧策略”工作流(Leal等。, 2011【Leal,R.M.F.,Bourenkov,G.P.,Svensson,O.,Spruce,D.,Guijarro,M.&Popov,A.N.(2011),《同步辐射杂志》第18期,第381-386页。】)提供每个晶体的最大允许总吸收剂量的精确估计。

作为EDNA公司程序意味着衍射图案的索引(Incardona等。, 2009[Incardona,M.-F.,Bourenkov,G.P.,Levik,K.,Pieritz,R.A.,Popov,A.N.&Svensson,O.(2009)。同步辐射杂志,第16期,第872-879页。])对于大于X射线束的晶体,定向矩阵的比较将允许对从同一晶体上不同点收集的部分数据集进行预聚类,或测量晶体尺寸和样品架中的对准。在后一种情况下,该信息可用于自动指导螺旋数据采集(Flot等。, 2010【Flot,D.,Mairs,T.,Giraud,T.、Guijarro,M.、Lesourd,M.,Rey,V.、van Brussel,D.、Morawe,C.、Borel,C.、Hignete,O.、Chavanne,J.、Nurizzo,D.、McSweeney,S.和Mitchell,E.(2010)。J.Synchrotron Rad.17,107-118。】; 德桑克提斯等。, 2012【Sanctis,D.de等人(2012),J.Synchrotron Rad.19,455-461.】)如果衍射是均匀的,则可以从样品架中包含的每个不同晶体中收集完整的数据集。对于尺寸与X射线束相似或更小的晶体,X射线束中晶体取向的先验知识将允许比目前情况更广泛的实验范围。特别是,可以构建部分数据集的收集顺序,以确保在只有少数晶体可用的情况下汇编完整的数据集,或者确保收集尽可能高的冗余数据。最后,对于含有许多坚固、衍射良好的小晶体的样品架,还可以设想对管道进行修改,其中包含用于结构求解和后续操作的完整衍射数据集精炼从样品架中包含的所有晶体中收集。将这些数据集分离成不同的簇将导致每个目标的晶体结构集合。

一旦数据收集和处理完成,对管道的最终改进就是选择要合并的部分数据集以生成最终数据集。这个选择显然取决于手头实验的目的(结构解决方案分子替换, 从头开始使用SAD构造解决方案等。),原则上最好使用基于CC的HCA(,j) (§[链接]2; 佐丹奴等。, 2012[佐丹奴·R、利尔·R·M·F、伯伦科夫·G·P、麦克斯威尼·S·波波夫·A·N(2012),《结晶学报》D68、649-658。]). 然而,对于来自低对称性晶体的部分数据集,每对数据集的共同唯一反射的数量可能很低,从而导致伪影,更好的方法可能是将HCA与当前在菲尼克斯包装(亚当斯等。, 2010【Adams,P.D.等人(2010),《水晶学报》,D66,213-221。】https://www.phenix-online.org/version_docs/dev-1977/reference/scale_and_merge.html)或最近描述的其他SSX协议(Huang等。, 2015【Huang,C.-Y.,Olieric,V.,Ma,P.,Panepucci,E.,Diederichs,K.,Wang,M.&Caffrey,M.(2015),《结晶学报》第71期,第1238-1256页。】).

5.结论

我们在这里提供了一个管道,用于从单个冷冻样品架中包含的相同生物大分子的许多随机定向晶体中常规收集部分衍射数据集。所开发的管道的主要优点是(i)它可以应用于安装在几乎任何适用于冷冻冷却的可用样品架中的晶体,从而使该方法适用于尽可能广泛的潜在用户,(ii)确定所有衍射良好晶体的位置,并在数据采集之前对其衍射强度进行排序,(iii)根据需要从样品架中包含的尽可能多的晶体中采集较小但连续的部分数据集,以及(iv)HCA用于选择部分数据集进行合并,以产生用于下游分析和结构解决方案的最佳可能数据集。如上所述,所开发的协议可应用于涉及微晶的SSX型实验以及从大于X射线束尺寸的晶体中进行多位置数据采集。这里的结果表明,所开发的方法在高分子晶体学的所有领域都是有用的,包括从许多非常小的晶体(~5µm(最大尺寸),in结构测定开发反常散射以及旨在合理设计药物的项目。

虽然我们的实验仅限于安装在冷冻样品架上的晶体,但如果考虑到增加的辐射损伤,则没有理由开发的自动筛选和数据收集程序也不能在室温下应用,尤其是在涉及就地筛选和数据收集(Axford等。, 2012【Axford,D.等人(2012),《水晶学报》,D68,592-600。】; 杰卡梅等。, 2004【Jacquamet,L.、Ohana,J.、Joly,J.和Borel,F.、Pirocchi,M.、Charrault,P.、Bertoni,A.、Israel-Gouy,P.和Carpentier,P.,Kozielski,F.,Blot,D.和Ferrer,J.-L.(2004)。结构,1219-1225。】; 勒梅尔等。, 2011【Maire,A.le,Gelin,M.,Pochet,S.,Hoh,F.,Pirocchi,M..,Guichou,J.-F.,Ferrer,J.-L.&Labesse,G.(2011),《结晶学报》,D67,747-755.】; 等。, 2015【Huang,C.-Y.,Olieric,V.,Ma,P.,Panepucci,E.,Diederichs,K.,Wang,M.&Caffrey,M.(2015),《结晶学报》第71期,第1238-1256页。】). 此外,Meshand收集还应可扩展到基于辐射损伤诱导相位(RIP;Ravelli)的结构解决方案等。, 2003[Ravelli,R.B.G.,Leiros,H.K.S.,Pan,B.,Caffrey,M.&McSweeney,S.(2003).结构,11,217-224.]; de Sanctis&Nanao,2012年【Sanctis,D.de&Nanao,M.H.(2012),《水晶学报》,D68,1152-1162。】)或基于反向光束协议的SAD实验(González,2003【González,A.(2003),《水晶学报》,D591935-1942年。】).

脚注

1在我们进行实验的ESRF光束线上设置测角仪意味着,一旦确定了其位置,每个晶体都会移动到X射线束中。这里,晶体的运动是通过两个电机(sampx和sampy)和测角仪的旋转轴没有位移。这种移动确保了晶体的正确垂直位置,但也存在晶体与X射线束方向不对齐的可能性。错位10此方向的µm将导致小于1的错位±5°旋转时为µm。因此,假设光束大于1在数据收集过程中,晶体将保留在X射线束中。

致谢

作者非常感谢ESRF MX beamtime allocation Panel为ESRF的本项目和其他正在进行的SSX项目分配波束时间(“SSX BAG”)。

工具书类

第一次引用P.D.亚当斯。等。(2010).《水晶学报》。D类66, 213–221. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用D.阿克斯福德。等。(2012).《水晶学报》。D类68, 592–600. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Barty,A.、Kirian,R.A.、Maia,F.R.N.C.、Hantke,M.、Yoon,C.H.、White,T.A.和Chapman,H.(2014)。J.应用。克里斯特。 47, 1118–1131. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Borshchevskiy,V.I.,Round,E.S.,Popov,A.N.,Büldt,G.&Gordeliy,V.I.(2011)。分子生物学杂志。 409, 813–825. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Botha,S.、Nass,K.、Barends,T.R.M.、Kabsch,W.、Latz,B.、Dworkowski,F.、Foucar,L.、Panepucci,E.、Wang,M.、Shoeman,R.L.、Schlichting,I.和Doak,R.B.(2015)。《水晶学报》。D类71, 387–397. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Bourenkov,G.P.&Popov,A.N.(2006)。《水晶学报》。D类62, 58–64. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
首次引用Bourenkov,G.P.和Popov,A.N.(2010年)。《水晶学报》。D类66, 409–419. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Boutet,S.公司。等。(2012).科学,337, 362–364. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Bowler,M.W.、Guijarro,M.、Petitdemange,S.、Baker,I.、Svensson,O.、Burghammer,M.,Mueller-Dieckmann,C.、Gordon,E.J.、Flot,D.、McSweeney,S.M.和Leonard,G.A.(2010年)。《水晶学报》。D类66, 855–864. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Brehm,W.和Diederichs,K.(2014)。《水晶学报》。D类70,101–109科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Brockhauser,S.、Ravelli,R.B.G.和McCarthy,A.A.(2013)。《水晶学报》。D类69, 1241–1251. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Brockhauser,S.、Svensson,O.、Bowler,M.W.、Nanao,M.、Gordon,E.、Leal,R.M.F.、Popov,A.、Gerring,M.、McCarthy,A.和Gotz,A.(2012年)。《水晶学报》。D类68, 975–984. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用H.N.查普曼。等。(2011).自然(伦敦),470, 73–77. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Chen,K.M.,Campbell,E.,Pandey,R.R.,Yang,Z.,McCarthy,A.A.&Pillai,R.S.(2015)。核糖核酸,21, 833–839. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Cipriani,F.、Röwer,M.、Landret,C.、Zander,U.、Felisaz,F.&Márquez,J.A.(2012)。《水晶学报》。D类68, 1393–1399. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用科尔,K。等。(2014).公共科学图书馆综合版,9,e101036科学网 交叉参考 公共医学 谷歌学者
第一次引用Coquelle,N.、Brewster,A.S.、Kapp,U.、Shilova,A.、Weinhausen,B.、Burghammer,M.和Colletier,J.-P.(2015)。《水晶学报》。D类71, 1184–1196. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Dauter,Z.、Dauter、M.和Dodson,E.J.(2002年)。《水晶学报》。D类58, 494–506. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Delagenière,S。等。(2011).生物信息学,27, 3186–3192. 科学网 公共医学 谷歌学者
第一次引用Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010年)。《水晶学报》。D类66, 486–501. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
首次引用Evans,P.R.和Murshudov,G.N.(2013)。《水晶学报》。D类69, 1204–1214. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Flot,D.、Mairs,T.、Giraud,T.,Guijarro,M.、Lesourd,M.,Rey,V.、van Brussel,D.、Morawe,C.、Borel,C.、Hignete,O.、Chavanne,J.、Nurizzo,D.、McSweeney,S.和Mitchell,E.(2010年)。J.同步辐射。 17, 107–118. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Fry,E.、Logan,D.和Stuart,D.(1996)。结晶方法和协议由C.Jones、B.Mulloy和M.Sanderson编辑,第319-363页。托托瓦:Humana出版社。 谷歌学者
第一次引用J·加巴丁霍。等。(2010).J.同步辐射。 17, 700–707. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Gati,C.、Bourenkov,G.、Klinge,M.、Rehders,D.、Stellato,F.、Oberthür,D.、Yefanov,O.、Sommer,B.P.、Mogk,S.、Duszenko,M.,Betzel,C.、Schneider,T.r.、Chapman,H.N.和Redecke,L.(2014)。IUCrJ大学,1, 87–94. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者
第一次引用Giordano,R.、Leal,R.M.F.、Bourenkov,G.P.、McSweeney,S.和Popov,A.N.(2012年)。《水晶学报》。D类68, 649–658. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用González,A.(2003年)。《水晶学报》。D类59, 1935–1942. 科学网 交叉参考 IUCr日志 谷歌学者
首次引用Gordeliy,V.I.、Schlesinger,R.、Efremov,R.、Büldt,G.和Heberle,J.(2003年)。方法分子生物学。 228, 305–316. 公共医学 中国科学院 谷歌学者
第一次引用Henderson,R.(1990年)。程序。R.Soc.B生物。科学。 241, 6–8. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Hollenstein,K.、Kean,J.、Bortolato,A.、Cheng,R.K.、Doré,A.S.、Jazayeri,A.、Cooke,R.M.、Weir,M.和Marshall,F.H.(2013年)。自然(伦敦),499, 438–443. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Hope,H.(1988)。《水晶学报》。B类44, 22–26. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
首次引用Huang,C.-Y.,Olieric,V.,Ma,P.,Panepucci,E.,Diederichs,K.,Wang,M.和Caffrey,M.(2015)。《水晶学报》。D类71, 1238–1256. 交叉参考 IUCr日志 谷歌学者
首次引用Incardona,M.-F.、Bourenkov,G.P.、Levik,K.、Pieritz,R.A.、Popov,A.N.和Svensson,O.(2009年)。J.同步辐射。 16, 872–879. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Jacquamet,L.、Ohana,J.、Joly,J.,Borel,F.、Pirocchi,M.、Charrault,P.、Bertoni,A.、Israel-Gouy,P.,Carpentier,P.和Kozielski,F.,Blot,D.&Ferrer,J.-L.(2004)。结构,12, 1219–1225. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
首次引用Kabsch,W.(2010年)。《水晶学报》。D类66, 125–132. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Kendrew,J.C.、Dickerson,R.E.、Strandberg,B.E.、Hart,R.G.、Davies,D.R.、Phillips,D.C.和Shore,V.C.(1960)。自然(伦敦),185, 422–427. 交叉参考 公共医学 中国科学院 科学网 谷歌学者
第一次引用Leal,R.M.F.、Bourenkov,G.P.、Svensson,O.、Spruce,D.、Guijarro,M.和Popov,A.N.(2011年)。J.同步辐射。 18, 381–386. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Lebon,G.、Warne,T.、Edwards,P.C.、Bennett,K.、Langmead,C.J.、Leslie,A.G.W.和Tate,C.G.(2011)。自然(伦敦),474, 521–525. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Maire,A.le,Gelin,M.,Pochet,S.,Hoh,F.,Pirocchi,M..,Guichou,J.-F.,Ferrer,J.-L.&Labesse,G.(2011年)。《水晶学报》。D类67, 747–755. 科学之网 交叉参考 IUCr日志 谷歌学者
第一次引用摩纳哥、S.、戈登、E.、鲍勒、M.W.、德拉吉尼埃、S.,吉亚罗、M.、斯普鲁斯、D.、斯文森、O.、麦克斯威尼、S.M.、麦卡锡、A.A.、伦纳德、G.和纳诺、M.H.(2013)。J.应用。克里斯特。 46, 804–810. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Mueller-Dieckmann,C.、Kauffmann,B.和Weiss,M.S.(2011年)。J.应用。克里斯特。 44,433–436科学之网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Murray,C.W.&Blundell,T.L.(2010)。货币。操作。结构。生物。 20, 497–507. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Murshudov,G.N.、Skubák,P.、Lebedev,A.A.、Pannu,N.S.、Steiner,R.A.、Nicholls,R.A、Winn,M.D.、Long,F.&Vagin,A.(2011)。《水晶学报》。D类67, 355–367. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Neutze,R.、Wouts,R.,van der Spoel,D.、Weckert,E.和Hajdu,J.(2000)。自然(伦敦),406, 752–757. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用诺格利,P。等。(2015).IUCrJ大学,2, 168–176. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者
首次引用Nurizzo,D.、Mairs,T.、Guijarro,M.、Rey,V.、Meyer,J.、Fajardo,P.、Chavanne,J.,Biasci,J.-C.、McSweeney,S.和Mitchell,E.(2006)。J.同步辐射。 13, 227–238. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Oster,L.、Tapani,S.、Xue,Y.和Kack,H.(2015)。药物研发。今天,20, 1104–1411. 公共医学 谷歌学者
首次引用Owen,R.L.,Rudiño-Piñera,E.和Garman,E.F.(2006年)。程序。美国国家科学院。科学。美国,103, 4912–4917. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Paithanhar,K.S.&Garman,E.F.(2010年)。《水晶学报》。D类66, 381–388. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Pape,T.和Schneider,T.R.(2004年)。J.应用。克里斯特。 37, 843–844. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用拉斯穆森,S.G.F。等。(2011).自然(伦敦),477, 549–555. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Ravelli,R.B.G.、Leiros,H.K.S.、Pan,B.、Caffrey,M.和McSweeney,S.(2003)。结构,11, 217–224. 科学之网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Riekel,C.、Burghammer,M.和Schertler,G.(2005)。货币。操作。结构。生物。 15, 556–562. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用桑克蒂斯·D·德等。(2012).J.同步辐射。 19,455–461科学之网 交叉参考 IUCr日志 谷歌学者
第一次引用Sanctis,D.de&Leonard,G.(2014)。不是。Neutroni Luce Sincrotrone公司,19, 24–26. 谷歌学者
第一次引用Sanctis,D.de和Nanao,M.H.(2012年)。《水晶学报》。D类68, 1152–1162. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Sauter,N.K.、Hattne,J.、Grosse-Kunstleve,R.W.和Echols,N.(2013)。《水晶学报》。D类69, 1274–1282. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用萨瓦亚,M.R。等。(2014).程序。美国国家科学院。科学。美国,111, 12769–12774. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Sheldrick,G.M.(2008)。《水晶学报》。A类64, 112–122. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Skubák,P.&Pannu,N.S.(2013年)。自然社区。 4, 2777. 谷歌学者
第一次引用Soares,A.S.、Mullen,J.D.、Parekh,R.M.、McCarthy,G.S.、Roessler,C.G.、Jackimowicz,R.、Skinner,J.M.,Orville,A.M.、Allaire,M.和Sweet,R.M(2014)。J.同步辐射。 21, 1231–1239. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
首次引用F.斯特拉托。等。(2014).IUCrJ大学,1, 204–212. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者
第一次引用Vagin,A.和Teplyakov,A.(2010年)。《水晶学报》。D类66, 22–25. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用White,T.A.、Barty,A.、Stellato,F.、Holton,J.M.、Kirian,R.A.、Zatsepin,N.A.和Chapman,H.N.(2013)。《水晶学报》。D类69, 1231–1240. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用White,T.A.、Kirian,R.A.、Martin,A.V.、Aquila,A.、Nass,K.、Barty,A.和Chapman,H.N.(2012年)。J.应用。克里斯特。 45, 335–341. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用叶芝,T.O.(1997)。Enzymol方法。 276, 344–358. 交叉参考 中国科学院 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证,允许在任何媒体上不受限制地使用、分发和复制,前提是引用原始作者和来源。

期刊徽标生物
结晶学
国际标准编号:1399-0047