1.简介
在小角度散射(SAS)研究中,使用X射线或中子探测物质的纳米结构。该技术适用于完全或部分无序物体,特别适用于研究接近天然溶液和药物配方中的生物大分子(Svergun等。, 2013). 在SAS实验中,散射强度我来自稀释溶液高分子(例如蛋白质,核酸类或复合物)。由于分子是随机取向的,因此对单个粒子的散射轮廓进行平均,从而产生各向同性强度我(秒)作为动量传递的函数秒=4π罪θ/λ,其中2θ是散射角和λ是辐射波长(图1). 尽管如此,即使从这些一维散射剖面,也可以重建整个粒子结构的三维模型。这可以在没有任何附加信息的情况下通过从头算方法(Chacón等。1998年; 斯维尔贡,1999年, 2001; Franke&Svergun,2009年)或通过混合建模,利用已知的域或亚基原子结构构建复合物模型(Petoukhov&Svergun,2005).
| 图1 FSC方法概述,用于估计结构集合的可变性。首先,多次运行从头算此处所示的溶菌酶建模是为了根据给定的散射强度分布生成一系列模型我(秒) (秒=4π罪θ/λ,其中2θ是散射角和λ是辐射波长)。然后,对重建的珠子模型或哑弹模型进行结构对齐,并计算其成对FSC函数。所有成对FSC函数的平均值用于确定可变性估计Δens公司作为2π/秒ens公司,其中秒ens公司是平均FSC降至0.5以下的动量传递值。使用线性回归模型根据可变性估计相应的分辨率。 |
从溶液散射剖面获得三维模型的可能性,以及仪器的最新进展,为现代同步加速器的高通量研究铺平了道路(佩诺等。, 2013; Acerbo公司等。, 2015; 布兰切特等。, 2015; 比齐安等。, 2016)在过去十年中,SAS在结构生物学中的普及程度大大提高。根据PubMed的统计数据,过去十年中,致力于生物溶液散射的出版物增加了近四倍,这表明SAS在结构生物学领域的复兴。然而,有两个主要的未解决问题阻碍了该方法成为一种成熟的结构生物学技术。一方面,由于SAS数据中的信息量受到球面平均值的限制,重建三维结构模型具有固有的模糊性,可以获得与实验数据同样吻合的模型集合。另一方面,作为一种低分辨率方法,SAS不提供原子级的信息。通常,基于SAS的模型默认分辨率为~10–20 但是没有客观的解决方法。这种情况与结构技术(如大分子X射线晶体学(MX)和电子冷冻显微镜(EM))形成了对比,后者的分辨率标准得到了很好的确立。
对于MX,分辨率根据布拉格定律取决于从背景中检测到的进入结构的最高阶衍射峰的倒数精炼(布拉格和布拉格,1913年). 应用该原理从最大动量传递值推导分辨率秒最大值用于生成SAS模型的仅给出标称理论极限(2π/秒最大值)由于SAS重建的模糊性,没有太大的实用价值。EM数据的分辨率通常通过傅里叶壳相关(FSC)方法进行估计,其中比较了从两组单独处理的实验图像重建的电子密度图互易空间(van Heel&Stöffler-Meilicke,1985年; Saxton&Baumeister,1982年; Harauz&van Heel,1986年). 分离为两个独立的数据集显然不适用于SAS,因为只有一个实验散射剖面可用,并且由于Shannon采样,实验SAS数据是相互关联的(Shannon&Weaver,1949). 另一种主要的结构方法,核磁共振波谱(NMR),产生了与实验核磁共振数据兼容的原子模型集合。虽然核磁共振模型没有商定的分辨率标准[例如模型之间的平方根偏差(r.m.s.d.)有时可能会高估分辨率;蒙特利奥内等。, 2013; 修道院等。, 2014]立体化学验证有助于评估模型质量。这种基于验证的方法也适用于MX结构(Read等。, 2011; 多雷利耶斯等。, 2012; 贝尔扬斯基等。, 2012),不能用于解决方案散射,因为SAS模型不显示原子细节。
在从头算使用SAS数据进行形状重建,使用有限体积元素表示三维模型,例如密密麻麻的珠子(Svergun,1999; Franke和Svergun,2009年)或假残留物(DR;Svergun等。, 2001). 重建从体积元素的随机配置开始,并使用优化算法(例如蒙特卡罗模拟退火),以将模型的计算理论散射拟合到实验SAS剖面。除了拟合的差异外,目标函数还包括确保模型物理可行性的约束,如互连性和紧凑性。多个从头算从不同随机配置开始的重建产生了具有相似整体外观的不同模型,每个模型与实验SAS数据一致。通常,进行10到20次重建,并使用成对归一化空间差异(NSD;Kozin&Svergun,2001)对模型(包括给出完全相同散射图案的对映体)进行叠加). 选择平均NSD最小的模型(或对映体),其他模型与之对齐,并对结果图进行平均。平均模型已被证明能够保留所有重建中最持久的特征(Volkov&Svergun,2003). 然而,平均程序没有提供分辨率评估,因为与NMR系综相比,多个SAS模型不具有一对一的原子或残基对应关系,并且不可能计算r.m.s.d.值。
缺乏客观标准来评估SAS模型的分辨率是一个严重的缺陷,这阻碍了对结果的批判性评估,特别是考虑到SAS在结构生物学中的日益使用以及SAS模型在档案中的沉积(Hura等。, 2009; 瓦伦蒂尼等。, 2015). 为了将SAS模型与其他实验技术获得的结构结果进行有意义的比较,需要一个定量的分辨率度量。在这里,我们提出了一种估计分辨率的方法从头算SAS通过分析与SAS数据兼容的模型集合中的FSC函数导出形状。结果表明,反映模型可变性的集合上的平均FSC函数可以与形状重建中单个模型的分辨率相关。该方法在一个公开可用的计算机程序中实现,并通过对合成数据的一系列测试和实际示例证明其实用性。
3.从可变性到分辨率
整体可变性是形状重建再现性的度量,其本身并不提供重建模型的分辨率(这是对其准确性的度量,即它们与“真正的结构”有多接近)。问题是这两个量是否以及如何相互关联。为了回答这个问题,我们计算了基准蛋白的已知高分辨率X射线晶体结构和从头算生成的信号群中的模型(补充表S1和S2以及补充图S1和图S2)。互相关分辨率Δ科科斯群岛系综的实际分辨率是SAS模型的实际分辨率,该模型基于与相同蛋白质的已知高分辨率结构的比较,该结构由平均成对FSC函数在0.5的截止点处确定。对于每个从头算模型对映体选择与PDB中的参考原子模型进行更好的对齐。
对于所分析的所有蛋白质,Δ科科斯群岛被发现系统性地比整体变异性大一些Δens公司(补充表S1、S2和图2). 这个Δ科科斯群岛基准数据集中的系综值在13.5到52.2之间 对于珠子模型,Ω介于13.4和76.0之间 对于DR型号,为“o”。最重要的是,可变性度量Δens公司和交叉验证的分辨率Δ科科斯群岛证明了良好的相关性,如图2所示这两个参数与皮尔逊相关系数之间的线性关系可以很好地描述相关性第页=0.80适用于达米夫模型和第页=0.86适用于GASBOR公司模型。采用基于基准数据的珠状和哑铃状集成的独立线性回归模型,从集成变化中预测SAS分辨率Δens公司.观察到的Δens公司和Δ科科斯群岛允许直接估计从头算系综变化的模型Δens公司作为
其中系数β是表示响应系综变异性变化的分辨率预期变化的斜率Δens公司、和α是一个常数,表示零变化时可达到的分辨率极限。系数β0.96±0.07和1.10±0.09以及恒定值α(7.7±1.3) ?和(5.8±1.2) 为找到了“”达米夫和GASBOR公司模型。新观测值和拟合函数的95%置信区间使用逆函数计算t吨统计n个− 2自由度,具有n个是数据对的数量(图2). 所有统计分析均采用MATLAB软件(Mathworks公司)。
由于受到互连性和紧凑性等约束,集合可变性系统地小于模型的实际分辨率从头算建模。这些约束限制了可用的构象空间,从而提高了模型的一致性并减少了系综变化(§S2,支持信息)。然而,必须强调的是,这些约束非常温和,总是以预定义的方式应用,不会导致数据不匹配或结果模型不准确。因此,从一个重建到另一个重建,可变性和分辨率之间的既定关系保持不变。有趣的是,对于珠子和DR建模,线性相关性都被一个常数所抵消(α),可以将其合理化为即使在理想情况下也始终存在的可变性,即基于SAS的最佳分辨率从头算形状重建(约7-8 O表示珠子造型,5–6 用于DR建模的是“o”)。不同的偏移值还与以下事实密切相关:结构模型中最小体积元素的大小限制了可获得的最大分辨率,并且与哑弹模型相比,珠子模型具有更粗粒度的表示。我们应该注意到达米夫(水化层包含在珠子模型中)和GASBOR公司(显式虚拟水分子)对可变性和分辨率之间的关系影响很小。
对于珠子建模,观察到一些数据点超出95%置信区间(图2一). 所有这些都是具有内部空腔或孔洞的寡聚蛋白结构(§S3,支持信息)。珠子建模过程总是试图建立与实验数据相兼容的最低复杂度模型,因此往往会模糊更精细的细节。这自然会增加Δ科科斯群岛并解释提升的Δ科科斯群岛/Δens公司这种结构的比例。有趣的是,基于DR的建模没有这种影响,它利用了更高的角度数据,因此可以更好地表示更复杂的形状(图2中没有观察到异常值。2b条).
为了进一步验证所提出的方法,我们对25个合成数据集进行了折刀测试,这些数据集取自PDB中未包含在原始基准集中的结构已知的蛋白质(图3和补充表S3)。使用可变性度量Δens公司在珠子和DR模型系综中,我们用(6)预测了有效分辨率并将其与相互关联的分辨率值进行了比较Δ科科斯群岛。比较得出了良好的相关性第页珠模型和DR模型分别为0.84和0.97,表明通过变异性计算分辨率的高保真度。
| 图3 交叉验证分辨率之间的比率Δ科科斯群岛以及折刀集(蓝色圆点)和实验数据集(红色圆点)的估计SAS分辨率,作为分子量的函数达米夫珠子模型(一)和GASBOR公司哑弹模型(b条). |
致谢
这项工作得到了玛丽·居里COFUND行动下的EMBL EIPOD计划、联邦教育和Forschung(BMBF)项目BIOSCAT(拨款05K12YE1)和欧盟地平线2020计划(iNEXT拨款,项目编号653706)的支持。
工具书类
Acerbo,A.S.、Cook,M.J.和Gillilan,R.E.(2015)。J.同步辐射。 22, 180–186. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Berjanskii,M.、Zhou,J.、Liang,Y.、Lin,G.和Wishart,D.S.(2012年)。《生物分子杂志》。核磁共振,53, 167–180. 交叉参考 中国科学院 公共医学 谷歌学者
Berman,H.、Henrick,K.和Nakamura,H.(2003)。自然结构。生物。 10, 980. 科学网 交叉参考 公共医学 谷歌学者
Bizien,T.、Durand,D.、Roblina,P.、Thureau,A.、Vachette,P.和Pérez,J.(2016)。蛋白质肽。莱特。 23, 217–231. 交叉参考 中国科学院 公共医学 谷歌学者
Blanchet,C.E.、Spilotros,A.、Schwemmer,F.、Graewert,M.A.、Kikhney,A.、Jeffries,C.M.、Franke,D.、Mark,D.、Zengerle,R.、Cipriani,F.,Fiedler,S.、Roessle,M.和Svergun,D.I.(2015)。J.应用。克里斯特。 48, 431–443. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
布拉格·W·H·和布拉格·W·L·(1913)。程序。R.Soc.A数学。物理学。工程科学。 88, 428–438. 交叉参考 中国科学院 谷歌学者
Chacón,P.、Morán,F.、Díaz,J.F.、Pantos,E.和Andreu,J.M.(1998)。生物物理学。J。 74, 2760–2775. 科学网 中国科学院 公共医学 谷歌学者
Doreleijers,J.F.、Vranken,W.F.、Schulte,C.、Markley,J.L.、Ulrich,E.L.、Vriend,G.和Vuister,G.W.(2012年)。核酸研究。 40,D519–D524科学网 交叉参考 中国科学院 公共医学 谷歌学者
Fox,N.K.、Brenner,S.E.和Chandonia,J.-M.(2014)。核酸研究。 42,D304–D309科学网 交叉参考 中国科学院 公共医学 谷歌学者
Franke,D.和Svergun,D.I.(2009年)。J.应用。克里斯特。 42, 342–346. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Harauz,G.和van Heel,M.(1986年)。Optik公司,73, 146–156. 谷歌学者
Heel,M.van和Schatz,M.(2005年)。J.结构。生物。 151, 250–262. 科学网 公共医学 谷歌学者
Heel,M.van和Stöffler-Meilicke,M.(1985)。EMBO J。 4, 2389–2395. 公共医学 科学网 谷歌学者
Hura,G.L.、Menon,A.L.、Hammel,M.、Rambo,R.P.、Poole,F.L.II、Tsutakawa,S.E.、Jenney,F.E.Jr、Classen,S.、Frankel,K.A.、Hopkins,R.C.、Yang,S.-J.、Scott,J.W.、Dillard,B.D.、Adams,M.W.和Tainer,J.A.(2009年)。自然方法,6,606–612交叉参考 公共医学 中国科学院 谷歌学者
Koch,M.H.J.,Vachette,P.&Svergun,D.I.(2003)。Q.生物物理学评论。 36, 147–227. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Konarev,P.V.、Petoukhov,M.V.、Volkov,V.V.和Svergun,D.I.(2006)。J.应用。克里斯特。 39, 277–286. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Kozin,M.B.和Svergun,D.I.(2001)。J.应用。克里斯特。 34, 33–41. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Montelione,G.T.,Nilges,M.,Bax,A.,Güntert,P.,Herrmann,T.,Richardson,J.S.,Schwieters,C.D.,Vranken,W.F.,Vuister,G.W.,Wishart,D.S.,Berman,H.M.,Kleywegt,G.J.&Markley,J.L.(2013)。结构,21, 1563–1570. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Penczek,P.A.(2010年)。方法酶学。 482, 73–100. 交叉参考 中国科学院 公共医学 谷歌学者
佩诺,P。等。(2013).J.同步辐射。 20, 660–664. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Petoukhov,M.V.和Svergun,D.I.(2005)。生物物理学。J。 89, 1237–1250. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
里德·R·J。等。(2011).结构,19, 1395–1412. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Reis,M.A.dos,Aparicio,R.和Zhang,Y.(2011)。生物物理学。J。 101, 2770–2781. 公共医学 谷歌学者
Saxton,W.O.和Baumeister,W.(1982)。《微生物学杂志》。 127, 127–138. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Semenyuk,A.V.和Svergun,D.I.(1991)。J.应用。克里斯特。 24, 537–540. 交叉参考 科学网 IUCr日志 谷歌学者
Shaikh,T.R.、Gao,H.、Baxter,W.T.、Asturias,F.J.、Boisset,N.、Leith,A.和Frank,J.(2008)。《国家协议》。 三, 1941–1974. 交叉参考 公共医学 中国科学院 谷歌学者
Shannon,C.E.&Weaver,W.(1949年)。传播数学理论。厄本纳:伊利诺伊大学出版社。 谷歌学者
Stuhrmann,H.B.(1970年)。《水晶学报》。A类26, 297–306. 交叉参考 IUCr日志 科学网 谷歌学者
Svergun,D.I.(1999)。生物物理学。J。 76, 2879–2886. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Svergun,D.、Barberato,C.和Koch,M.H.J.(1995)。J.应用。克里斯特。 28, 768–773. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Svergun,D.I.、Koch,M.H.J.、Timmins,P.A.和May,R.P.(2013)。生物大分子溶液的小角X射线和中子散射牛津大学出版社。 谷歌学者
Svergun,D.I.、Petoukhov,M.V.和Koch,M.H.J.(2001)。生物物理学。J。 80,2946–2953科学网 交叉参考 公共医学 中国科学院 谷歌学者
Valentini,E.、Kikhney,A.G.、Previtali,G.、Jeffries,C.M.和Svergun,D.I.(2015)。核酸研究。 43,D357–D363科学网 交叉参考 公共医学 谷歌学者
Volkov,V.V.和Svergun,D.I.(2003)。J.应用。克里斯特。 36, 860–864. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Vuister,G.W.、Fogh,R.H.、Hendrickx,P.M.S.、Doreleijers,J.F.和Gutmanas,A.(2014)。《生物分子杂志》。核磁共振,58, 259–285. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Zheng,W.和Doniach,S.(2005)。蛋白质工程设计。选择。 18, 209–219. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Zingg,T.(1935年)。博士论文。苏黎世ETH。 谷歌学者
国际标准编号:2052-2525
打开访问