MARTINI bead form factors for the analysis of time-resolved X-ray scattering of proteins

Niebling, S.; Björling, A.; Westenhoff, S.

doi:10.1107/S1600576714009959

研究论文

的日志
应用
结晶学

国际标准编号：1600-5767

第47卷| 第4部分| 2014年8月| 第1190-1198页

https://doi.org/10.107/S1600576714009959

打开

访问

附录和勘误表
这篇文章的更正已经发表。要查看更正，请单击在这里.

用于蛋白质时间分辨X射线散射分析的MARTINI珠形因子

斯蒂芬·尼布林,^一亚历山大·比约林 ^一和塞巴斯蒂安·韦滕霍夫 ^一 ^*

^一哥德堡大学化学与分子生物学系，瑞典哥德堡SE-40530，邮箱462
^*通信电子邮件：westenho@chem.guse公司

(2013年12月18日收到； 2014年5月2日接受；在线2014年6月14日)

时间分辨小角度和广角X射线散射（SAXS和WAXS）方法探测溶液中蛋白质的结构动力学。尽管技术先进，但这些方法在许多情况下受到数据解释的限制。X射线散射剖面的计算要求很高，并且对所有SAXS/WAXS辅助结构都构成了瓶颈精炼特别是用于时间分辨数据的分析。加速这些计算的一种方法是将生物分子表示为粗颗粒散射体的集合。在此，提出并讨论了这种粗粒度方案，并检查了其准确性。结果表明，散射因子与流行的MARTINI粗粒度方案一致，在0范围内产生可靠的差分散射<q个< 0.75 Å⁻¹这些发现为X射线散射数据分析的未来尝试带来了希望，并可能有助于弥合时间分辨实验与其解释之间的差距。

关键词： X射线溶液散射;蛋白质;粗粒度;马丁;结构动力学;小角度X射线散射;广角X射线散射;蛋白质结构精细化.

类似文章

1.简介

X射线溶液散射是收集溶液中生物分子结构信息的常用技术（Petoukhov&Svergun，2007）; 科赫等。, 2003 ; 斯维尔根和科赫，2003年 ; Makowski，2010年 ; 伊希等。, 2010 ; 韦斯顿霍夫等。, 2010 ; 安德森等。, 2009 ; 赵等。, 2010 ; 马尔默伯格等。, 2011 ; 穆尼亚潘·金等。, 2012 ; 金，李等。, 2012 ; 易卜拉欣库蒂等。, 2011 ; Spilotros公司等。, 2012 ; 塔卡拉等。, 2014 ). 记录散射X射线的角强度分布，并可使用先进的计算算法从散射图案中确定三维结构（科纳列夫等。, 2006 ; 佩图霍夫等。, 2012 ; 线路接口单元等。, 2012 ). 小角度X射线散射（SAXS）提供了分子包络的信息。在较宽角度（WAXS）下，高分辨率信息被编码，但低散射强度和在为数据分配结构特征时缺乏唯一性阻碍了其实际应用。

时间分辨X射线溶液散射是一种新兴的观察蛋白质结构变化的技术（Ihee等。, 2010; 韦斯顿霍夫等。, 2010; 安德森等。, 2009; Makowski，2010年; 赵等。, 2010; 马尔默伯格等。, 2011; 穆尼亚潘·金等。, 2012; 金，李等。, 2012; 易卜拉欣库蒂等。, 2011; 斯皮洛特罗斯等。, 2012; 塔卡拉等。, 2014). X射线散射记录为反应时间的函数，并参考反应物的散射模式。差分技术可以通过检测WAXS获得更高的空间分辨率，因为所有背景信号都会被非常精确地抵消。在现代同步加速器设施中，时间分辨率被限制在大约100 ps，但自由电子激光源将分辨率提高到<100 fs。这为在原子运动的时间尺度上研究蛋白质的基本结构变化开辟了道路。

目前，蛋白质溶液X射线散射的瓶颈在于解释实验数据。人们被迫以迭代的方式对其建模，并计算大量试验结构的散射模式。由于总散射是蛋白质中所有原子之间成对干涉的结果，因此每次这样的计算都很耗时精炼很快就会变得对计算要求过高。

对于溶液中分子散射的真实表示，必须评估分子电子密度、置换溶剂的电子密度和溶剂化壳的任何多余电子密度对形状因子的贡献。第一项通常是根据分子的原子坐标计算出来的。为了表示被溶质置换的溶剂，通常使用修正的原子散射因子（弗雷泽等。, 1978 ). 虽然这种近似在小角度下是合理的，但在大角度下引入了系统偏差（巴丹等。, 2009 ). 溶剂化壳层中多余的电子密度通常被建模为均匀边界层，如流行程序中所实现的那样CRYSOL公司（斯维尔贡等。, 1995 ). 然而，由于引入并调整了描述溶剂化壳的两个参数，该策略存在问题特别的最近的发展包括显式溶剂处理（Grishaev等。, 2010 ; 公园等。, 2009 )或更真实地表示溶质-溶剂边界（巴丹等。, 2009; 维塔宁等。, 2011 ). 通过使用这些更复杂的方法q个范围可以扩展到更高的值。然而，这些方法需要计算，并且很难通过实验证明其准确性。我们在下面明确地表明，当分析差分X射线散射时，对溶剂层的精确计算的需要被放宽了。

鉴于蛋白质的溶液散射信号没有编码足够的信息来揭示原子级细节，粗粒度表示通常适合解释SAXS和WAXS数据。这种表示大大降低了预测X射线散射曲线的计算成本（Yang等。, 2009 ; 斯托夫加德等。, 2010 ; Zheng和Tekpinar，2011年 ; 每日等。, 2012 )，呈现雄心勃勃的迭代精炼适用于相对较大蛋白质系统的方案。近年来，基于生物分子粗粒度表示的MARTINI模型已成为模拟各种生物系统动力学的流行模型（Marrink等。, 2007 ; 蒙蒂切利等。, 2008 ; 洛佩兹等。, 2009 ; 耶西列夫斯基等。, 2010 ; 德容等。, 2013 ; Marrink和Tieleman，2013年 ). 它大大降低了分子动力学仿真，允许在较长的时间尺度上进行仿真，并使用较少的计算资源对较大的系统进行仿真。力场设计用于再现热力学数据，并已成功应用于几个模拟问题，例如蛋白质-脂质相互作用（van den Bogaart等。, 2011 ; 谢弗等。, 2011 ; 洛希沃里等。, 2010 ).

在本研究中，我们描述并比较了粗粒度X射线散射计算的方法，特别是针对时间分辨差分散射的分析。我们展示了如何从蛋白质的MARTINI粗粒度表示有效地计算差异X射线散射剖面，并评估了这些计算的可靠性极限。我们发现粗粒度散射计算在更大范围内是可靠的q个与绝对散射相比，差分散射的范围。我们得出结论，该方法为结构精炼大蛋白的常规，特别是与时间分辨SAXS/WAXS实验相结合。

2.理论与方法

2.1. 粗颗粒结构的X射线散射

点状原子散射体集合的散射振幅（Warren，1990）)由描述

$[F（{\bf q}）=\textstyle\sum\limits_k F_k\exp（i{\bf-q}\cdot{\bfr}_k），\eqno（1）]$

哪里q个是散射矢量 $[{\bf r}（_k）]$ 和（f）_k个是原子的位置和散射因子k个分别是。对于溶液中随机取向的分子，散射强度是通过将此和乘以其复合共轭物得到的，

$[\eqaligno{I（{\bf q}）&=\bigg[\textstyle\sum\limits_k f_k\exp \bf r}_{kl}），&（2）}]$

然后用 $[q=|{\bf q}|=]$ $[4\pi（{\sin{\theta}}/{\lambda}）]$ ，其中λ是辐射的波长， $[2\θ]$ 是散射角和 $[{\bfr}{kl}]$ 是来自散射体的矢量我散射体k个.方程式（2)成为

$[\eqaligno{I（q）&=\left\langle I（{\bf q}kl}）\right\rangle=\sum\limits_k\sum\limits_l f_k fl{\sin（qr{kl}）\在qr{kl}}上&(3)}]$

最后一个结果称为德拜方程，可用于预测生物分子的真空散射。

一个复杂的问题是溶液散射图案包含大量不需要的溶剂信号。该信号可以通过减去缓冲区背景来消除，但代价是必须在预测数据中考虑置换溶剂的负项。它可以在原子散射因子的水平上以近似的方式引入，因此未修改的德拜方程[方程（3)]仍然可以使用。修正后的原子散射因子（f）_k个^不包括(q个)派生自（f）_k个(q个)减去代表置换溶剂散射振幅的高斯球体（弗雷泽等。, 1978):

$[f^{\rm excl}_k（q）=f_k（k）-\nu_k\rho_{\rms}\exp（-\pi\nu_k}^{2/3}q^{2}）.\eqno（4）]$

在这里 $[\nuk]（_k）$ 是制表的（弗雷泽等。, 1978)每个原子的体积和 $[\rho_{\rm s}]$ 是体积溶剂的平均电子密度。在本文的其余部分中，除非另有说明，否则所有散射因子都包含置换溶剂项。

对于生物分子，计算方程式（3）的计算成本)可能相当高。这对于迭代结构尤其重要精炼必须评估许多测试结构的程序。降低计算成本的一种策略是使用结构的粗粒度表示，其中每个粗颗粒代表一组原子。如果每个珠子都用散射因子来描述，则很方便F类(q个)，因此散射强度由粗粒度德拜方程给出，其中指数(米,n个)表示粗珠子和R（右）_米n个它们之间的距离：

$[I（q）=\sum\limits_m\sum\limits_n F_m（q）F_n（q）{\sin（qR_{mn}）}\over{qR_}mn}.\eqno（5）]$

找到这些F类_米(q个)在描述本研究中采用的方法之前，我们回顾了一些可能性。

2.1.1. 珠子位置近似值

用粗粒度散射因子表示整体散射的最简单方法是考虑每个原子位于其粒子中心。然后，所有原子-原子距离都由相应的珠子-珠子距离近似。哪里(k个,我)是原子指数和(米,n个)表示粗珠子，德拜方程可写为：

$[\eqalignno{I（q）&=\sum\limits_k\sum\limits_l f_k f_l{\sin（qr_{kl}）\over qr_[kl}}\cr&=\sum \limits _m\sum \ limits_n\sum\limits_{k\in m}\sum \limits _{l\in n}f_k f _l{sin在qr{mn}上的{k\inm}\sum\limits_{l\inn}f_kf_l{sin（qr{锰}）}\cr&=\sum_m\sum\limits_n{\sin（qR_{mn}）\over qR{mn}}\Bigg&(6)}]$

然后我们有

$[F_m\simeq\textstyle\sum\limits_{k\ in m}F_k.\eqno（7）]$

在这种近似中，珠子的内部结构被完全忽略。我们注意到方程（7)正好为q个= 0.

2.1.2. 球形“glob”近似

另一种选择是，对于每个珠子，取振幅的球面平均值[方程式（1)]在测量强度之前。这相当于在半径为的球体上涂抹每个原子第页_k个围绕珠子中心（哈克，1953 ):

$[\eqaligno{F_n（q）&=\left\langle F_n$

这里考虑了每个原子到珠子中心的距离，但忽略了原子的角度排列。

2.1.3. 自洽集近似

本文中描述的最通用的方法是，对于给定的一组蛋白质，找到一组自洽的F类(q个)该值再现了相应原子结构的所有成对珠子-珠子散射强度项。考虑两个具有散射因子的珠子F类_A类和F类_B类，对的总散射强度我_AB公司由方程式（3）给出). 这些量通过应用方程式（5）进行关联)对珠子：

$[I{\rm AB}=F{\rmA}^{2}+F{\RMB}^{2}+2F{\rma B}{{sin（qR{\rmAB}）}\在{qR{上。\eqno（9）]$

如果F类_B类在比较中保持不变，F类_A类通过求解该二次方程，通过与方程（7）进行比较选择正确的根来获得)，它实际上支持q个= 0. 从以下方案中可以找到一组自洽的粗粒度散射因子。

(一)生成珠子形状因子的初始猜测，例如，通过使用方程式（7)或（8).

(b条)在结构中随机选取一个珠子，并将其命名为a。

(c（c）)遍历结构中的所有其他珠子，让每个珠子充当B，然后计算F类_A类根据方程式（9）).

(d日)取所有这些的平均值F类_A类，并将其指定给珠子A。

(电子)重复(b条)–(d日)直到集合形状因子收敛。

2.1.4. 单珠近似

虽然概念上很简单，但最后一种方法很麻烦，特别是对于大型蛋白质库。杨等。(2009)提出了一种更简单的方法，即选择形状因子，以再现孤立珠子的散射强度。在这种方法中，只需取一组原子散射强度的平方根，即可获得整个氨基酸残基的数值正确的粗粒形状因子：

$[F_m（q）=\Bigg[\sum\limits_{k\ in m}\sum\limits_{l\in m}F_kf_l{\sin（qr_{kl}）}\在{qr_}kl}}\Bigg]^{1/2}上。\等式（10）]$

我们注意到，这个方程只能产生正的形状因子，如果包含置换溶剂的负项，这通常是不正确的。对于q个=0，珠子形状因子的值必须等于原子散射因子的总和：

$[F_m（q=0）=\textstyle\sum\limits_{k\in m}F_k（q=O）.\eqno（11）]$

以水为溶剂，（f）_k个(q个当包括置换溶剂贡献时，=0）对于氢原子为负值。因此F类(q个)可能发生在含有氢原子的珠子上[（f）(q个=0）=−0.72电子单位（e.u.）]。因此，使用方程式（10）获得的形状系数)不满足方程（11)必须纠正。实际上，这是只包含氢原子和碳原子的侧链珠子的情况。当珠子由整个氨基酸组成时（f）(q个=0）值通常为正（Yang等。, 2009). 校正不满足等式（11）的散射因子)，我们使用所有这些散射因子的一个共同特征，即出现带有两个相关拐点的最小值（图1). 数据具有q个大于高点-q个拐点用于六阶多项式拟合，约束为q个=0以满足方程（11). 然后将该多项式作为粗珠子的实际形状系数（图1).

图1
珠子散射因子校正示例（脯氨酸，侧链1）：根据方程式（10）计算虚线

). 的值q个=0不满足等式（11

) (囊性纤维变性.表1

). 因此，只有拐点之后的点（最小值之后）才用于六阶多项式曲线拟合（星形）。值位于q个=0（根据表1

)用作相等约束（实心圆）。这将产生校正的珠子散射因子（实线）。

为了说明上述四种方法之间的差异，从MARTINI计算了鸡蛋白溶菌酶的粗颗粒X射线散射)粗粒度结构，并与全原子计算进行比较（图2). 为了能够直接比较形状因子计算方法，在没有置换溶剂模型的情况下计算散射。对于q个< 0.25 Å⁻¹，所有方法与全原子计算结果吻合良好。这是合理的，因为在此中探测了较长的层间距离q个范围。关于高-q个区域中，焊道位置近似值显示了以下方面的显著偏差q个> 0.4 Å⁻¹.球面球近似很好地再现了全原子计算q个< 1.2 Å⁻¹但偏差较大q个值。自洽集近似和单粒子近似产生了几乎相同的结果，并且与全原子计算相一致，即使在高q个值。

图2
比较四种确定粗粒度形状因子的方法。所有计算都是在没有蛋清溶菌酶置换溶剂模型的情况下进行的（PDB代码6里兹).

这种一致程度对应于珠的内部结构的解释顺序：珠的位置近似忽略了内部结构，球形球体近似将原子涂抹在其中心周围的球体上，单珠近似和自洽集近似最准确地包含了内珠结构。后两种近似与全原子计算非常吻合。单粒子近似比自洽集近似的计算成本更低。因此，在本研究的其余部分中，我们选择使用前者来计算粗粒度散射因子。

2.2. MARTINI模型的应用

现在我们将注意力转向将单珠近似应用于MARTINI模型（Marrink等。, 2007; 德容等。, 2013; Marrink&Tieleman，2013年)作为计算粗颗粒结构X射线散射的有效方法。在MARTINI模型中，四个非氢原子及其相关氢原子平均映射到一个珠子上，每个氨基酸残基由一个主链珠子和多达四个侧链珠子（蒙蒂塞利等。, 2008). 珠子按其极性和氢键能力进行分组，共产生20种不同的珠子类型，其相互作用由马丁力场规定。

对于X射线散射计算，几何相似性和分子式珠子的（电子数）是最重要的，而不是极性或氢键能力。因此，我们推导了每种氨基酸残基类型中出现的MARTINI珠的X射线形状因子。这产生了表1中列出的49种不同散射类型在X射线散射计算中，保留了根据MARTINI模型将原子映射为珠子的原始映射。这意味着MARTINI粗粒度结构可以直接用作这些计算的输入。

表1
用于粗粒度X射线散射计算的珠子类型及其基本公式

原子散射因子的总和q个=0，用置换溶剂模型校正，如最后一列所示。∑的所有珠子的形状因子（f）(q个=0）<0，用粗体标记，按正文所述进行更正。

		原子数
AA公司	有孔小珠	C类	小时	N个	O（运行）	S公司	（f）(q个= 0)
ALA公司	BB公司	三	5	1	1	0	9.04
ALA公司	BB公司	三	5	1	1	0	10.69
ARG公司	SC1公司	三	6	0	0	0	−2.79
ARG公司	补充条款2	1	5	三	0	0	15.39
ASN公司	BB公司	2	2	1	1	0	10.69
ASN公司	SC1公司	2	4	1	1	0	9.25
ASP公司	BB公司	2	2	1	1	0	10.69
ASP公司	SC1公司	2	2	0	2	0	9.48
CYS公司	BB公司	2	2	1	1	0	10.69
CYS公司	SC1公司	1	2	0	0	1	8.44
GLN公司	BB公司	2	2	1	1	0	10.69
GLN公司	SC1公司	三	6	1	1	0	8.32
GLU公司	BB公司	2	2	1	1	0	10.69
GLU公司	SC1公司	三	4	0	2	0	8.55
GLY公司	BB公司	2	三	1	1	0	9.97
高速钢	BB公司	2	2	1	1	0	10.69
高速钢	SC1公司	2	2	0	0	0	−0.42
高速钢	补充条款2	1	1	1	0	0	5.95
高速钢	补充条款3	1	1	1	0	0	5.95
国际照明局	BB公司	2	2	1	1	0	10.69
国际照明局	SC1公司	4	9	0	0	0	−4.44
低浓缩铀	BB公司	2	2	1	1	0	10.69
亮	SC1公司	4	9	0	0	0	−4.44
LYS公司	BB公司	2	2	1	1	0	10.69
LYS公司	SC1公司	三	6	0	0	0	−2.79
赖氨酸	补充条款2	1	5	1	0	0	3.07
遇见	BB公司	2	2	1	1	0	10.69
遇见	SC1公司	三	7	0	0	1	5.86
PHE公司	BB公司	2	2	1	1	0	10.69
PHE公司	SC1公司	三	三	0	0	0	−0.63
PHE公司	补充条款2	2	2	0	0	0	−0.42
PHE公司	补充条款3	2	2	0	0	0	−0.42
赞成的意见	BB公司	2	1	1	1	0	11.41
赞成的意见	SC1公司	三	6	0	0	0	−2.79
SER公司	BB公司	2	2	1	1	0	10.69
SER公司	SC1公司	1	三	0	1	0	3.30
推力	BB公司	2	2	1	1	0	10.69
推力	SC1公司	2	5	0	1	0	2.37
TRP公司	BB公司	2	2	1	1	0	10.69
TRP公司	SC1公司	三	2	0	0	0	0.09
TRP公司	补充条款2	2	2	1	0	0	5.74
TRP公司	补充条款3	2	2	0	0	0	−0.42
TRP公司	补充条款4	2	2	0	0	0	−0.42
泰尔（TYR）	BB公司	2	2	1	1	0	10.69
泰尔（TYR）	SC1公司	三	三	0	0	0	−0.63
泰尔（TYR）	补充条款2	2	2	0	0	0	−0.42
泰尔（TYR）	补充条款3	2	2	0	1	0	4.53
VAL公司	BB公司	2	2	1	1	0	10.69
VAL公司	SC1公司	三	7	0	0	0	−3.51

MARTINI珠在单珠近似下的平均形状因子是从合理选择的蛋白质结构库中获得的，该蛋白质结构库涵盖了广泛的蛋白质折叠和不同的二级结构含量（Oberg等。, 2003 ). 我们排除了七种缺失非氢原子的蛋白质。这产生了表2中所示的43个蛋白质库。使用pdb2gmx工具添加缺失的氢原子，该工具是GROMACS公司套房（Hess等。, 2008 ). 为了研究珠子大小对准确性的影响，使用了一个额外的粗粒度映射，每个珠子包含一个氨基酸（Yang等。, 2009; Zheng&Tekpinar，2011年). 氨基酸和MARTINI珠都位于各自原子团的质量中心。

表2
用于测定平均焊道形状因子的PDB结构

PDB条目	原子	氨基酸	MARTINI珠子
1ARV型	4845	336	682
第1天	3854	247	555
1BP2号机组	1842	123	276
1BPI公司	892	58	130
1COL公司	6006	394	804
1CSE公司	4827	337	685
1CSH公司	6765	435	952
1小时	3527	236	493
1GAL公司	8700	581	1242
1小时	3973	258	585
1HEL公司	1960	129	283
1HML公司	1946	123	277
1HRC公司	1672	104	236
1小时	2775	174	385
国际标准化委员会	5852	384	862
1个LPE	2364	144	310
1摩尔	3124	188	440
1PNK公司	11708	750	1675
1PPN（1PPN）	3245	212	469
1RTP（1RTP）	4974	327	705
1SCS系统	3564	237	518
1平方厘米	4320	302	616
1吨	3031	207	445
1顶置	2466	162	338
1UBI公司	1231	76	163
1个yp	5636	378	856
1个月	2411	153	343
2AAI公司	8212	529	1149
2加仑	7154	490	1022
2GST（2GST）	7246	434	1036
2小时	11278	748	1576
2台蒸汽发生器	5425	369	780
2SBL型	25698	1614	3636
2ST1型	3837	275	540
2TGA公司	3222	223	465
3个EBX	920	62	139
3PGK公司	6376	415	878
第3页	5163	347	728
4CMS系统	4854	320	704
第四政治公众人物	4672	325	679
6额定功率	1857	124	273
7时间	7556	494	1050

为了使这些计算简单且普遍适用，忽略了一些结构细节。首先，对于粗粒度计算，没有区分N端和C端。在平均珠子散射因子的计算中包括了各自的氨基酸，因此，C末端的电子数较多，可以通过这种平均反映出来。带电原子也被忽略了，这既是为了限制珠子类型的数量，也是因为电荷信息并不总是可用的。

3.结果

3.1. 珠粒形状因子的库平均值

这项工作的中心目的是评估与珠子尺寸相关的粗粒度X射线散射计算的可靠性。使用了两种粗粒度映射方案：Yang使用的氨基酸映射等。(2009)和我们的MARTINI-bead方法。第一次比较可以在形状因子平均阶段进行。平均的单个形状因子之间的变化越小，粗粒度散射计算的可靠性越高。这对于小蛋白质或结构或氨基酸含量异常的蛋白质尤其重要。

库中所有蛋氨酸的珠子散射因子如图3所示数据通过方程式（10）计算). 氨基酸珠和骨架MARTINI珠的偏差q个=0是包含N末端氨基酸的结果，N末端氨基酸含有两个额外的氢原子。由于置换溶剂校正的氢散射为负q个，对应的低散射系数q个低于大多数曲线。

图3
用置换溶剂计算氨基酸库中所有蛋氨酸的形状因子(一)和MARTINI珠子(b条), (c（c）)粗粒度。珠状因子根据流行的蛋白质二级结构基序（蓝色：α-螺旋蛋白；绿色：β-片状蛋白；灰色：不可能进行唯一赋值）。红色曲线表示所有单个形状因子的平均值。

计算的氨基酸珠的形状因子显示出很大的变化（图3一)而更精细的MARTINI珠子的形状因子更均匀（图3b条和3c（c）). 当比较两个MARTINI珠子（主链和侧链）时，主链珠子散射因子更加不均匀，而侧链散射因子则由平均值很好地表示。

为了确定珠子散射因子变异的结构起源，我们根据蛋白质库的主要二级结构对其进行聚类。根据Oberg的分类等。(2003)蛋白质的散射因子显示α-螺旋线和β-纸张以不同的颜色显示（图3). MARTINI主链珠散射因子根据二级结构明显分为两组。相反，氨基酸珠并没有显示出如此清晰的图像。

3.2. 粗颗粒蛋白质结构的差分散射计算

时间分辨WAXS实验的分析通常需要重复评估来自许多不同试验结构的差异散射，因此依赖于在q个范围高达约1º⁻¹为了估计粗颗粒结构差分散射计算的准确性，预测了人类脱氧血红蛋白晶体结构之间的差分散射（PDB代码2小时; 费米等。, 1984 )与人类碳单氧血红蛋白（PDB代码1bbb（磅）; 席尔瓦等。, 1992 )用全原子和粗粒度方法计算，如图4所示该模型系统已用于含时X射线散射研究，并可获得高质量数据（Cammarata等。, 2008 ). 基于氨基酸的结果与全原子计算结果有很大偏差q个> 0.4 Å⁻¹，但MARTINI粗粒度计算对于q个< 0.75 Å⁻¹考虑到全原子表示中结构细节的水平最高，MARTINI粗粒度方案中结构细节水平降低，氨基酸方法中结构细节层次最低，这一发现是合理的。三条曲线在一般尺度下的计算时间约为50（全原子）:1（马丁）:0.2（氨基酸法）。

图4
人类脱氧血红蛋白和碳单氧血红蛋白晶体模型之间的溶液差散射计算(2小时–1bbb（磅）)与Cammarata的实验溶液数据进行比较等。(2008

). 计算中未考虑辅助因子。实验曲线已按比例缩放到计算数据q个= 0.18 Å⁻¹.

模型计算与Cammarata差分散射实验的比较等。(2008)表明结构模型和实验之间的一致性对于q个<0.4Å⁻¹但该模型在更高水平上失败了q个值。这很可能是因为晶体结构不能很好地代表血红蛋白的溶液结构（Cammarata等。, 2008). 很明显，MARTINI粗粒度计算可以用于任何精炼算法改进了一致性，但氨基酸方法不会包含足够的结构细节来实现这一点。相反，这样精炼相对于原子散射模型，方案很可能受益于MARTINI表示的降低的计算成本。

图4所示的计算包括置换溶剂项，但溶剂化层的任何多余电子密度都被忽略。在考虑差分散射时，这是合理的，因为在采用差分时，误差会在一定程度上抵消。图5中的数据证明这一点。显示了抹香鲸肌红蛋白（脱氧和碳单氧状态）、人血红蛋白（脱氧与碳单氧态）和耐辐射脱诺克球菌光敏色素（Pr和Pfr状态）三个系统的差异散射。选择这些系统是因为它们涵盖了构象变化的广泛幅度，如各结构对的根平方偏差所示(囊性纤维变性.图5). 通过（i）考虑原子散射和置换溶剂[如等式（4）所示]，以及（ii）另外包括溶剂化层引起的散射，计算每个测试系统的两条溶液差散射曲线。数据的计算方法为CRYSOL公司（斯维尔贡等。, 1995)，具有最高分辨率(L（左）=50）和溶剂化壳和置换溶剂的默认参数（Svergun等。, 1995). 该程序通过假设蛋白质周围的电子分布均匀，近似于溶剂化层效应，与散装水相差+10%，这在高浓度下是不准确的-q个区域（公园等。, 2009). 然而，简单的溶剂化层处理CRYSOL公司可以用作原型来估计溶剂化层模型对差分散射计算的影响。很明显，用置换溶剂进行的计算与对所有三个测试系统的溶剂化层散射进行额外建模的计算非常一致。

图5
三种不同构象变化量模型系统的解差散射CRYSOL公司（斯维尔贡等。, 1995

). 面板中显示了各个异构体的根-平方偏差（rmsd）。为了评估置换溶剂和溶剂化层散射的效果，显示了两条差异曲线：（i）置换溶剂的原子X射线散射和（ii）置换溶剂和溶液化层的原子X光散射。使用了以下结构（括号中的PDB代码）：抹香鲸脱氧肌红蛋白(2千伏，第二状态；阿兰达等。, 2006

)，抹香鲸碳单氧肌红蛋白(第二代; 阿兰达等。, 2006

)，人脱氧血红蛋白(2小时)和人类碳单氧血红蛋白(1bbb（磅）); 这些结构在没有辅因子的情况下使用。耐辐射脱诺球菌光敏色素溶液结构取自塔卡拉等。(2014

3.3. 从粗颗粒蛋白质结构计算绝对X射线散射的可靠性

现在，我们将注意力转向评估来自粗粒结构的绝对X射线散射计算的准确性。图6显示了粗粒度对鸡蛋白溶菌酶的X射线散射计算的影响6里兹（戴蒙德，1974年 ); 图6(一)]和人类碳单氧血红蛋白2小时，图6(一)]. 这些结构不是用于导出粗粒度形状因子的蛋白质结构库的一部分。对于这两种结构，全原子计算和粗粒度计算之间的一致性对于低q个越高越糟糕q个如预期，根据MARTINI方案的粗粒度与全原子计算一致q个而不是氨基酸方法。为了量化这种一致性，我们使用了0到范围内的平均相对平方误差q个(N个)带有N个是在相应范围内的数据点的数量：

$[{\rm error}={{1}\ over{N}}\sum\limits_{q=0}^{q（N）}{{（S_{\rm-aa}-S{\rm-cg}）^2}\ over{S_{\rmaa}^2}}.\eqno（12）]$

图6中的虚线标记最大值q个粗粒度计算的值(q个_门槛)，其中误差[方程式（12)]小于0.2%。0.2%的误差极限是任意的，但是根据鸡蛋白溶菌酶的绝对散射曲线选择的（图6一). 对于鸡蛋白溶菌酶和人碳单氧血红蛋白q个_门槛值为0.31和0.25º⁻¹对于氨基酸方法和0.48和0.47⁻¹分别用于MARTINI胎圈方法。

图6
(一)确定q个_门槛（详见正文）用于可靠的鸡蛋白溶菌酶蛋白质X射线散射粗粒度计算（PDB代码6里兹)和碳氧血红蛋白（PDB代码2小时). 在评估散射之前，去除了辅因子(b条)对于蛋白质结构库的每个结构q个误差小于0.2%的值[根据方程式（12

)]已确定。直方图说明了这些q个_门槛两种粗粒度方法（氨基酸和MARTINI）的值。

这个q个_门槛[方程式（12)]库中所有蛋白质的氨基酸值和MARTINI方法如图6中的直方图所示(b条). 很明显，MARTINI粗粒度计算提供了更广泛的q个范围（平均0.53º⁻¹)与氨基酸珠法相比（平均0.27℃⁻¹). 这表明，与氨基酸粗粒化相比，MARTINI珠的使用大大扩展了散射的可靠计算范围。

我们注意到，结果如图6所示不要包括蛋白质周围溶剂化层的模型。已经有许多复杂的方法来结合这一点，这对于与绝对实验SAXS/WAXS数据进行比较至关重要（Grishaev等。, 2010; 公园等。, 2009; 巴丹等。, 2009). 然而，用于计算图6所示数据的模型很好地捕捉到了潜在的物理现象，即结构的粗糙表示会导致分辨率下降.

4.讨论

日益流行的时间分辨WAXS方法需要先进的计算结构精炼计划。在本文中，我们已经表明，粗粒度结构会导致广角精度的损失。因此，在选择结构模型的粗糙度时，应仔细平衡计算成本与所需的精度，这一决定在很大程度上取决于q个兴趣范围。对于上述人类血红蛋白的情况，高分辨率晶体模型偏离了q个> 0.4 Å⁻¹因此，MARTINI表示和散射模型适用于解释可用的差异数据q个= 0.75 Å⁻¹.

据我们所知，有三种精炼蛋白质的时间分辨X射线散射实验方案。安等。(2009 )已成功应用偏置分子动力学时间分辨X射线散射数据的模拟，Andersson等。(2009)和Ahn等。(2009)移动的刚体，以及Kim，Lee等。(2012)已使用从头算三维结构的确定。对于这三种方法，必须进行大量的X射线散射计算，这是研究中的限制因素。处理较大的蛋白质变得昂贵得令人望而却步。MARTINI粗粒度计算在X射线散射计算的准确性和计算速度之间提供了良好的折衷。MARTINI水平上粗颗粒蛋白质结构的X射线散射计算比相应的全原子计算快50倍（大约7-8个原子进入平均的MARTINE珠，7²= 49). 这种加速可以为应用差分散射辅助结构开辟新天地精炼更大的蛋白质。¹

当许多试验结构要进行评估时，使用需要计算的最新方法来解释溶剂化效果是不可行的。我们在此表明，不太复杂的溶剂化处理可以用于可靠地模拟差异WAXS。这是合理的，因为在不同的蛋白质构象之间，溶剂壳层的形状变化不大，并且其对散射的贡献在差异散射中完全抵消。使用差分散射作为实验观测值的另一个优点是，它没有因缓冲区和毛细管散射的不正确相减而产生的实验伪影。这意味着与标准SAXS/WAXS相比，计算和实验之间的差异显著减小。

5.结论

（生物）分子X射线散射的计算速度可以通过对底层结构进行粗颗粒化来控制。我们的结果为将粗粒度级别与所需分辨率相匹配提供了基础。当珠子含有全部氨基酸时，对于更精细的MARTINI方案，我们估计其可靠性q个范围为0–0.3º⁻¹和0–0.5º⁻¹分别是。因此，MARTINI粗粒度模型涵盖了q个在标准SAXS实验中可用的范围，比全原子计算快50倍。当分析差异X射线散射时，例如，在时间分辨SAXS/WAXS中，可靠性q个范围显著扩大至0.75º⁻¹我们为模型系统人类血红蛋白展示了这一点。我们预计，蛋白质X射线散射计算效率的提高将使蛋白质的时间分辨差分X射线散射的增长领域能够进行更全面的结构分析。

支持信息

MARTINI珠子的形状因子库。内政部：https://doi.org/10.107/S1600576714009959/aj5230sup1.pdf

MARTINI珠子的形状系数。内政部：https://doi.org/10.107/S1600576714009959/aj5230sup2.txt

脚注

¹表格系数可从IUCr电子档案中获得（参考：AJ5230).

鸣谢

作者感谢杨思春教授的富有成果的讨论。ERC赠款“StructDyn”和瑞典战略研究基金会FFL4项目的资助也得到了承认。

工具书类

安·S、金·K、金·Y、金·J和伊熙·H（2009）。《物理学杂志》。化学。B类,113, 13131–13133. 科学之网交叉参考公共医学中国科学院谷歌学者
 Andersson，M.、Malmerberg，E.、Westenhoff，S.、Katona，G.、Cammarata，M.，Wöhri，A.B.、Johansson，L.C.、Ewald，F.、Eklund，M.和Wulff，M.以及Davidsson，J.和Neutze，R.（2009年）。结构,17, 1265–1275. 科学之网交叉参考公共医学中国科学院谷歌学者
 Aranda，R.、Levin，E.J.、Schotte，F.、Anfinrud，P.A.和Phillips，G.N.（2006）。《水晶学报》。D类62, 776–783. 科学之网交叉参考中国科学院 IUCr日志谷歌学者
 Bardhan，J.、Park，S.和Makowski，L.（2009年）。J.应用。克里斯特。 42, 932–943. 科学之网交叉参考中国科学院 IUCr日志谷歌学者
 Bogaart，G.van den，Meyenberg，K.，Risselada，H.J.，Amin，H.，Willig，K.I.，Hubrich，B.E.，Dier，M.，Hell，S.W.，Grubmüller，H.、Diederichsen，U.&Jahn，R.（2011年）。自然,479, 552–555. 科学之网公共医学谷歌学者
 Cammarata，M.、Levantio，M.，Schotte，F.、Anfinrud，P.、Ewald，F.，Choi，J.、Cupane，A.、Wulff，M.和Ihee，H.（2008年）。自然方法,5, 881–886. 科学之网交叉参考公共医学中国科学院谷歌学者
 Cho，H.、Dashdorj，N.、Schotte，F.、Graber，T.、Henning，R.和Anfinrud，P.（2010年）。程序。美国国家科学院。科学。美国,107, 7281–7286. 科学之网交叉参考中国科学院公共医学谷歌学者
 Daily，M.D.、Makowski，L.、Phillips，G.N.Jr和Cui，Q.（2012年）。化学。物理学。 396, 84–91. 科学之网交叉参考中国科学院公共医学谷歌学者
 Diamond，R.（1974）。分子生物学杂志。 82, 371–391. 交叉参考中国科学院公共医学科学之网谷歌学者
 Fermi，G.、Perutz，M.F.、Shaanan，B.和Fourme，R.（1984年）。分子生物学杂志。 175，159–174交叉参考中国科学院公共医学科学之网谷歌学者
 Fraser，R.D.B.、MacRae，T.P.和Suzuki，E.（1978年）。J.应用。克里斯特。 11, 693–694. 交叉参考中国科学院 IUCr日志科学之网谷歌学者
 Grishaev，A.、Guo，L.、Irving，T.和Bax，A.（2010年）。美国化学杂志。Soc公司。 132, 15484–15486. 科学之网交叉参考中国科学院公共医学谷歌学者
 Harker，D.（1953年）。阿克塔·克里斯特。 6, 731–736. 交叉参考中国科学院 IUCr日志科学之网谷歌学者
 Hess，B.、Kutzner，C.、van der Spoel，D.和Lindahl，E.（2008）。化学杂志。理论计算。 4, 435–447. 科学之网交叉参考中国科学院公共医学谷歌学者
 Ibrahimkutty，S.、Kim，J.、Cammarata，M.、Ewald，F.、Choi，J.和Ihee，H.&Plech，A.（2011年）。美国化学会纳米,5, 3788–3794. 科学之网交叉参考中国科学院公共医学谷歌学者
 Ihee，H.、Wulff，M.、Kim，J.和Adachi，S.（2010年）。国际物理评论。化学。 29, 453–520. 科学之网交叉参考中国科学院谷歌学者
 Jong，D.H.de，Singh，G.，Bennett，W.F.D.，Arnarez，C.，Wassenaar，T.A.，Schäfer，L.V.，Periole，X.，Tieleman，D.P.和Marrink，S.J.（2013）。化学杂志。理论计算。 9, 687–697. 谷歌学者
 Kim，K.H.，Muniyappan，S.，Oang，K.Y.，Kim，J.G.，Nozawa，S.、Sato，T.、Koshihara，S.和Henning，R.、Kosheleva，I.、Ki，H.、Kim，Y.、Kim、T.W.、Kin，J.、Adachi，S.&Ihee，H.（2012年）。美国化学杂志。Soc公司。 134, 7001–7008. 科学之网交叉参考中国科学院公共医学谷歌学者
 Kim，T.W.、Lee，J.H.、Choi，J.、Kim，K.H.、van Wilderen，L.、Guerin，L.，Kim，Y.、Jung，Y.O.、Yang，C.、Kim。美国化学杂志。Soc公司。 134, 3145–3153. 科学之网交叉参考中国科学院公共医学谷歌学者
 Koch，M.H.、Vachette，P.和Svergun，D.I.（2003）。Q.生物物理学评论。 36, 147–227. 科学之网交叉参考公共医学中国科学院谷歌学者
 Konarev，P.V.、Petoukhov，M.V.、Volkov，V.V.和Svergun，D.I.（2006）。J.应用。克里斯特。 39，277–286科学之网交叉参考中国科学院 IUCr日志谷歌学者
 Liu，H.、Hexemer，A.和Zwart，P.H.（2012）。J.应用。克里斯特。 45, 587–593. 科学之网交叉参考中国科学院 IUCr日志谷歌学者
 López，C.，Rzepiela，A.，de Vries，A.，Dijkhuizen，L.，Hünenberger，P.&Marrink，S.（2009年）。化学杂志。理论计算。 5, 3195–3210. 谷歌学者
 Louhivuori，M.，Risselada，H.J.，van der Giessen，E.&Marrink，S.J.（2010年）。程序。美国国家科学院。科学。美国,107, 19856–19860. 科学之网交叉参考中国科学院公共医学谷歌学者
 Makowski，L.（2010）。J.结构。功能。基因组学,11, 9–19. 交叉参考中国科学院公共医学谷歌学者
 Malmerberg，E.、Omran，Z.、Hub，J.S.、Li，X.、Katona，G.、Westenhoff，S.、Johansson，L.C.、Andersson，M.、Cammarata，M.和Wulff，M.，van der Spoel，D.、Davidsson，J.、Specht，A.和Neutze，R.（2011）。生物物理学。J。 101, 1345–1353. 科学之网交叉参考中国科学院公共医学谷歌学者
 Marrink，S.J.、Risselada，H.J.、Yefimov，S.、Tieleman，D.P.和de Vries，A.H.（2007）。《物理学杂志》。化学。B类,111, 7812–7824. 科学之网交叉参考公共医学中国科学院谷歌学者
 Marrink，S.J.和Tieleman，D.P.（2013年）。化学。Soc.版本。 42, 6801–6822. 科学之网交叉参考中国科学院公共医学谷歌学者
 Monticelli，L.、Kandasamy，S.、Periole，X.、Larson，R.、Tieleman，D.和Marrink，S.（2008）。化学杂志。理论计算。 4, 819–834. 科学之网交叉参考中国科学院谷歌学者
 Oberg，K.、Ruysschaert，J.和Goormaghtigh，E.（2003年）。蛋白质科学。 12, 2015–2031. 科学之网交叉参考公共医学中国科学院谷歌学者
 Park，S.、Bardhan，J.、Roux，B.和Makowski，L.（2009）。化学杂志。物理学。 130, 134114. 科学之网交叉参考公共医学谷歌学者
 Petoukhov，M.V.、Franke，D.、Shkumatov，A.V.、Tria，G.、Kikhney，A.G.、Gajda，M.、Gorba，C.、Mertens，H.D.T.、Konarev，P.V.和Svergun，D.I.（2012）。J.应用。克里斯特。 45, 342–350. 科学之网交叉参考中国科学院 IUCr日志谷歌学者
 Petoukhov，M.V.和Svergun，D.I.（2007）。货币。操作。结构。生物。 17, 562–571. 科学之网交叉参考公共医学中国科学院谷歌学者
 Schäfer，L.V.、de Jong，D.H.、Holt，A.、Rzepiela，A.J.、de Vries，A.H.、。，Poolman，B.、Killian，J.A.和Marrink，S.J.（2011年）。程序。美国国家科学院。科学。美国,108，1343-1348年科学之网公共医学谷歌学者
 Silva，M.M.、Rogers，P.H.和Arnone，A.（1992年）。生物学杂志。化学。 267, 17248–17256. 公共医学中国科学院科学之网谷歌学者
 Spilotros，A.、Levantio，M.、Schiro，G.、Cammarata，M.和Wulff，M.&Cupane，A.（2012年）。软物质,8, 6434–6437. 科学之网交叉参考中国科学院谷歌学者
 Stovgaard，K.、Andreetta，C.、Ferkinghoff Borg，J.和Hamelryck，T.（2010年）。BMC生物信息学,11，第429页谷歌学者
 Svergun，D.、Barberato，C.和Koch，M.H.J.（1995）。J.应用。克里斯特。 28, 768–773. 交叉参考中国科学院科学之网 IUCr日志谷歌学者
 Svergun，D.I.和Koch，M.H.（2003）。Rep.程序。物理学。 66, 1735. 科学之网交叉参考谷歌学者
 Takala，H.、Björling，A.、Berntsson，O.、Lehtivuori，H.，Niebling，S.、Hoernke，M.、Kosheleva，I.、Henning，R.、Menzel，A.、Ihalainen，J.和Westenhoff，S.（2014）。自然,509, 245–249. 科学之网交叉参考中国科学院公共医学谷歌学者
 Virtanen，J.J.、Makowski，L.、Sosnick，T.R.和Freed，K.F.（2011）。生物物理学。J。 101, 2061–2069. 科学之网交叉参考中国科学院公共医学谷歌学者
 沃伦，B.E.（1990）。X射线衍射纽约：多佛出版公司谷歌学者
 Westenhoff，S.、Nazarenko，E.、Malmerberg，E.、Davidsson，J.、Katona，G.和Neutze，R.（2010）。《水晶学报》。A类66, 207–219. 科学之网交叉参考中国科学院 IUCr日志谷歌学者
 Yang，S.、Park，S.和Makowski，L.&Roux，B.（2009年）。生物物理学。J。 96，4449–4463科学之网交叉参考公共医学中国科学院谷歌学者
 Yesylevsky，S.、Schäfer，L.、Sengupta，D.和Marrink，S.（2010年）。PLoS计算机。生物。 6，e1000810科学之网交叉参考公共医学谷歌学者
 Zheng，W.和Tekpinar，M.（2011）。生物物理学。J。 101, 2981–2991. 科学之网交叉参考中国科学院公共医学谷歌学者