1.简介
X射线溶液散射是收集溶液中生物分子结构信息的常用技术(Petoukhov&Svergun,2007); 科赫等。, 2003; 斯维尔根和科赫,2003年; Makowski,2010年; 伊希等。, 2010; 韦斯顿霍夫等。, 2010; 安德森等。, 2009; 赵等。, 2010; 马尔默伯格等。, 2011; 穆尼亚潘·金等。, 2012; 金,李等。, 2012; 易卜拉欣库蒂等。, 2011; Spilotros公司等。, 2012; 塔卡拉等。, 2014). 记录散射X射线的角强度分布,并可使用先进的计算算法从散射图案中确定三维结构(科纳列夫等。, 2006; 佩图霍夫等。, 2012; 线路接口单元等。, 2012). 小角度X射线散射(SAXS)提供了分子包络的信息。在较宽角度(WAXS)下,高分辨率信息被编码,但低散射强度和在为数据分配结构特征时缺乏唯一性阻碍了其实际应用。
时间分辨X射线溶液散射是一种新兴的观察蛋白质结构变化的技术(Ihee等。, 2010; 韦斯顿霍夫等。, 2010; 安德森等。, 2009; Makowski,2010年; 赵等。, 2010; 马尔默伯格等。, 2011; 穆尼亚潘·金等。, 2012; 金,李等。, 2012; 易卜拉欣库蒂等。, 2011; 斯皮洛特罗斯等。, 2012; 塔卡拉等。, 2014). X射线散射记录为反应时间的函数,并参考反应物的散射模式。差分技术可以通过检测WAXS获得更高的空间分辨率,因为所有背景信号都会被非常精确地抵消。在现代同步加速器设施中,时间分辨率被限制在大约100 ps,但自由电子激光源将分辨率提高到<100 fs。这为在原子运动的时间尺度上研究蛋白质的基本结构变化开辟了道路。
目前,蛋白质溶液X射线散射的瓶颈在于解释实验数据。人们被迫以迭代的方式对其建模,并计算大量试验结构的散射模式。由于总散射是蛋白质中所有原子之间成对干涉的结果,因此每次这样的计算都很耗时精炼很快就会变得对计算要求过高。
对于溶液中分子散射的真实表示,必须评估分子电子密度、置换溶剂的电子密度和溶剂化壳的任何多余电子密度对形状因子的贡献。第一项通常是根据分子的原子坐标计算出来的。为了表示被溶质置换的溶剂,通常使用修正的原子散射因子(弗雷泽等。, 1978). 虽然这种近似在小角度下是合理的,但在大角度下引入了系统偏差(巴丹等。, 2009). 溶剂化壳层中多余的电子密度通常被建模为均匀边界层,如流行程序中所实现的那样CRYSOL公司(斯维尔贡等。, 1995). 然而,由于引入并调整了描述溶剂化壳的两个参数,该策略存在问题特别的最近的发展包括显式溶剂处理(Grishaev等。, 2010; 公园等。, 2009)或更真实地表示溶质-溶剂边界(巴丹等。, 2009; 维塔宁等。, 2011). 通过使用这些更复杂的方法q个范围可以扩展到更高的值。然而,这些方法需要计算,并且很难通过实验证明其准确性。我们在下面明确地表明,当分析差分X射线散射时,对溶剂层的精确计算的需要被放宽了。
鉴于蛋白质的溶液散射信号没有编码足够的信息来揭示原子级细节,粗粒度表示通常适合解释SAXS和WAXS数据。这种表示大大降低了预测X射线散射曲线的计算成本(Yang等。, 2009; 斯托夫加德等。, 2010; Zheng和Tekpinar,2011年; 每日等。, 2012),呈现雄心勃勃的迭代精炼适用于相对较大蛋白质系统的方案。近年来,基于生物分子粗粒度表示的MARTINI模型已成为模拟各种生物系统动力学的流行模型(Marrink等。, 2007; 蒙蒂切利等。, 2008; 洛佩兹等。, 2009; 耶西列夫斯基等。, 2010; 德容等。, 2013; Marrink和Tieleman,2013年). 它大大降低了分子动力学仿真,允许在较长的时间尺度上进行仿真,并使用较少的计算资源对较大的系统进行仿真。力场设计用于再现热力学数据,并已成功应用于几个模拟问题,例如蛋白质-脂质相互作用(van den Bogaart等。, 2011; 谢弗等。, 2011; 洛希沃里等。, 2010).
在本研究中,我们描述并比较了粗粒度X射线散射计算的方法,特别是针对时间分辨差分散射的分析。我们展示了如何从蛋白质的MARTINI粗粒度表示有效地计算差异X射线散射剖面,并评估了这些计算的可靠性极限。我们发现粗粒度散射计算在更大范围内是可靠的q个与绝对散射相比,差分散射的范围。我们得出结论,该方法为结构精炼大蛋白的常规,特别是与时间分辨SAXS/WAXS实验相结合。
2.理论与方法
2.1. 粗颗粒结构的X射线散射
点状原子散射体集合的散射振幅(Warren,1990))由描述
哪里q个是散射矢量和(f)k个是原子的位置和散射因子k个分别是。对于溶液中随机取向的分子,散射强度是通过将此和乘以其复合共轭物得到的,
然后用 ,其中λ是辐射的波长,是散射角和是来自散射体的矢量我散射体k个.方程式(2)成为
最后一个结果称为德拜方程,可用于预测生物分子的真空散射。
一个复杂的问题是溶液散射图案包含大量不需要的溶剂信号。该信号可以通过减去缓冲区背景来消除,但代价是必须在预测数据中考虑置换溶剂的负项。它可以在原子散射因子的水平上以近似的方式引入,因此未修改的德拜方程[方程(3)]仍然可以使用。修正后的原子散射因子(f)k个不包括(q个)派生自(f)k个(q个)减去代表置换溶剂散射振幅的高斯球体(弗雷泽等。, 1978):
在这里是制表的(弗雷泽等。, 1978)每个原子的体积和是体积溶剂的平均电子密度。在本文的其余部分中,除非另有说明,否则所有散射因子都包含置换溶剂项。
对于生物分子,计算方程式(3)的计算成本)可能相当高。这对于迭代结构尤其重要精炼必须评估许多测试结构的程序。降低计算成本的一种策略是使用结构的粗粒度表示,其中每个粗颗粒代表一组原子。如果每个珠子都用散射因子来描述,则很方便F类(q个),因此散射强度由粗粒度德拜方程给出,其中指数(米,n个)表示粗珠子和R(右)米n个它们之间的距离:
找到这些F类米(q个)在描述本研究中采用的方法之前,我们回顾了一些可能性。
2.1.1. 珠子位置近似值
用粗粒度散射因子表示整体散射的最简单方法是考虑每个原子位于其粒子中心。然后,所有原子-原子距离都由相应的珠子-珠子距离近似。哪里(k个,我)是原子指数和(米,n个)表示粗珠子,德拜方程可写为:
然后我们有
在这种近似中,珠子的内部结构被完全忽略。我们注意到方程(7)正好为q个= 0.
2.1.2. 球形“glob”近似
另一种选择是,对于每个珠子,取振幅的球面平均值[方程式(1)]在测量强度之前。这相当于在半径为的球体上涂抹每个原子第页k个围绕珠子中心(哈克,1953):
这里考虑了每个原子到珠子中心的距离,但忽略了原子的角度排列。
2.1.3. 自洽集近似
本文中描述的最通用的方法是,对于给定的一组蛋白质,找到一组自洽的F类(q个)该值再现了相应原子结构的所有成对珠子-珠子散射强度项。考虑两个具有散射因子的珠子F类A类和F类B类,对的总散射强度我AB公司由方程式(3)给出). 这些量通过应用方程式(5)进行关联)对珠子:
如果F类B类在比较中保持不变,F类A类通过求解该二次方程,通过与方程(7)进行比较选择正确的根来获得),它实际上支持q个= 0. 从以下方案中可以找到一组自洽的粗粒度散射因子。
(一)生成珠子形状因子的初始猜测,例如,通过使用方程式(7)或(8).
(b条)在结构中随机选取一个珠子,并将其命名为a。
(c(c))遍历结构中的所有其他珠子,让每个珠子充当B,然后计算F类A类根据方程式(9)).
(d日)取所有这些的平均值F类A类,并将其指定给珠子A。
(电子)重复(b条)–(d日)直到集合形状因子收敛。
3.结果
3.2. 粗颗粒蛋白质结构的差分散射计算
时间分辨WAXS实验的分析通常需要重复评估来自许多不同试验结构的差异散射,因此依赖于在q个范围高达约1º−1为了估计粗颗粒结构差分散射计算的准确性,预测了人类脱氧血红蛋白晶体结构之间的差分散射(PDB代码2小时; 费米等。, 1984)与人类碳单氧血红蛋白(PDB代码1bbb(磅); 席尔瓦等。, 1992)用全原子和粗粒度方法计算,如图4所示该模型系统已用于含时X射线散射研究,并可获得高质量数据(Cammarata等。, 2008). 基于氨基酸的结果与全原子计算结果有很大偏差q个> 0.4 Å−1,但MARTINI粗粒度计算对于q个< 0.75 Å−1考虑到全原子表示中结构细节的水平最高,MARTINI粗粒度方案中结构细节水平降低,氨基酸方法中结构细节层次最低,这一发现是合理的。三条曲线在一般尺度下的计算时间约为50(全原子):1(马丁):0.2(氨基酸法)。
| 图4 人类脱氧血红蛋白和碳单氧血红蛋白晶体模型之间的溶液差散射计算(2小时–1bbb(磅))与Cammarata的实验溶液数据进行比较等。(2008). 计算中未考虑辅助因子。实验曲线已按比例缩放到计算数据q个= 0.18 Å−1. |
模型计算与Cammarata差分散射实验的比较等。(2008)表明结构模型和实验之间的一致性对于q个<0.4Å−1但该模型在更高水平上失败了q个值。这很可能是因为晶体结构不能很好地代表血红蛋白的溶液结构(Cammarata等。, 2008). 很明显,MARTINI粗粒度计算可以用于任何精炼算法改进了一致性,但氨基酸方法不会包含足够的结构细节来实现这一点。相反,这样精炼相对于原子散射模型,方案很可能受益于MARTINI表示的降低的计算成本。
图4所示的计算包括置换溶剂项,但溶剂化层的任何多余电子密度都被忽略。在考虑差分散射时,这是合理的,因为在采用差分时,误差会在一定程度上抵消。图5中的数据证明这一点。显示了抹香鲸肌红蛋白(脱氧和碳单氧状态)、人血红蛋白(脱氧与碳单氧态)和耐辐射脱诺克球菌光敏色素(Pr和Pfr状态)三个系统的差异散射。选择这些系统是因为它们涵盖了构象变化的广泛幅度,如各结构对的根平方偏差所示(囊性纤维变性.图5). 通过(i)考虑原子散射和置换溶剂[如等式(4)所示],以及(ii)另外包括溶剂化层引起的散射,计算每个测试系统的两条溶液差散射曲线。数据的计算方法为CRYSOL公司(斯维尔贡等。, 1995),具有最高分辨率(L(左)=50)和溶剂化壳和置换溶剂的默认参数(Svergun等。, 1995). 该程序通过假设蛋白质周围的电子分布均匀,近似于溶剂化层效应,与散装水相差+10%,这在高浓度下是不准确的-q个区域(公园等。, 2009). 然而,简单的溶剂化层处理CRYSOL公司可以用作原型来估计溶剂化层模型对差分散射计算的影响。很明显,用置换溶剂进行的计算与对所有三个测试系统的溶剂化层散射进行额外建模的计算非常一致。
| 图5 三种不同构象变化量模型系统的解差散射CRYSOL公司(斯维尔贡等。, 1995). 面板中显示了各个异构体的根-平方偏差(rmsd)。为了评估置换溶剂和溶剂化层散射的效果,显示了两条差异曲线:(i)置换溶剂的原子X射线散射和(ii)置换溶剂和溶液化层的原子X光散射。使用了以下结构(括号中的PDB代码):抹香鲸脱氧肌红蛋白(2千伏,第二状态;阿兰达等。, 2006),抹香鲸碳单氧肌红蛋白(第二代; 阿兰达等。, 2006),人脱氧血红蛋白(2小时)和人类碳单氧血红蛋白(1bbb(磅)); 这些结构在没有辅因子的情况下使用。耐辐射脱诺球菌光敏色素溶液结构取自塔卡拉等。(2014). |
4.讨论
日益流行的时间分辨WAXS方法需要先进的计算结构精炼计划。在本文中,我们已经表明,粗粒度结构会导致广角精度的损失。因此,在选择结构模型的粗糙度时,应仔细平衡计算成本与所需的精度,这一决定在很大程度上取决于q个兴趣范围。对于上述人类血红蛋白的情况,高分辨率晶体模型偏离了q个> 0.4 Å−1因此,MARTINI表示和散射模型适用于解释可用的差异数据q个= 0.75 Å−1.
据我们所知,有三种精炼蛋白质的时间分辨X射线散射实验方案。安等。(2009)已成功应用偏置分子动力学时间分辨X射线散射数据的模拟,Andersson等。(2009)和Ahn等。(2009)移动的刚体,以及Kim,Lee等。(2012)已使用从头算三维结构的确定。对于这三种方法,必须进行大量的X射线散射计算,这是研究中的限制因素。处理较大的蛋白质变得昂贵得令人望而却步。MARTINI粗粒度计算在X射线散射计算的准确性和计算速度之间提供了良好的折衷。MARTINI水平上粗颗粒蛋白质结构的X射线散射计算比相应的全原子计算快50倍(大约7-8个原子进入平均的MARTINE珠,72= 49). 这种加速可以为应用差分散射辅助结构开辟新天地精炼更大的蛋白质。1
当许多试验结构要进行评估时,使用需要计算的最新方法来解释溶剂化效果是不可行的。我们在此表明,不太复杂的溶剂化处理可以用于可靠地模拟差异WAXS。这是合理的,因为在不同的蛋白质构象之间,溶剂壳层的形状变化不大,并且其对散射的贡献在差异散射中完全抵消。使用差分散射作为实验观测值的另一个优点是,它没有因缓冲区和毛细管散射的不正确相减而产生的实验伪影。这意味着与标准SAXS/WAXS相比,计算和实验之间的差异显著减小。