研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

IUCrJ大学
第5卷| 第3部分| 2018年5月| 第348-353页
国际标准编号:2052-2525

组成生物分子的原子的离子散射因子

交叉标记_颜色_正方形_no_text.svg

日本兵库县佐贺县口都1-1-1号日清SPring-8中心生物结构机制实验室,邮编:679-5148b条横滨城市大学医学生命科学研究生院计算生命科学实验室,地址:1-7-29,Suehiro-cho,Tsurumi-ku,Yokohama,Kanagawa 230-0045,Japan
*通信电子邮件:yone@spring8.or.jp

编辑:F.Sun,中国科学院,中国(2018年2月28日收到; 2018年4月3日接受; 在线2018年4月27日)

用多组态Dirac–Fock方法计算了组成生物分子的原子的离子散射因子。这些离子在化学上不稳定,除O外,其散射因子尚未报道然而,这些因素对于估计蛋白质分子中的部分电荷是必需的,并且核酸。这些离子的电子散射因子特别重要,因为在结构生物学探索的空间分辨率范围内,中性原子和带电原子之间的电子散射曲线差异很大。然后,将计算出的X射线和电子散射因子参数化,用于X射线、电子-蛋白质结晶学和单粒子低温电子显微镜中的主要散射曲线模型。给出了X射线和电散射因子以及拟合参数,以供日后参考。

1.简介

X射线和电子的散射因子对于用X射线和电子束探测的实验数据的分析是必不可少的。X射线被原子周围的电子散射,生成电子密度图,而电子被库仑势散射,生成库仑势图。因此,散射因子与带电状态直接相关,尤其是电子散射因子,当sinθ/λ小于0.1º−1直到罪过才相配θ/λ达到0.2–0.3º−1(图1[链接]). 在这里θ表示散射角的一半,λ是入射X射线或电子的波长和sin的后一个值θ/λ对应于1/(0.2×2)-1/(0.3×2)=2.5~1.67º的空间分辨率。因此,电荷状态本质上影响蛋白质和蛋白质复合物的结构分析,包括核酸类通过电子晶体学和单粒子冷冻电子显微镜。

[图1]
图1
文献中典型X射线(上排)和电子(下排)散射因子图[例如,国际结晶表(科利克斯等。, 2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。])]. O和O的电子散射因子显示为sinθ/λ= 0.25 Å−1其他都是0.5º−1.部分带电O的电子散射因子0.3−和O0.6−根据中性氧原子和完全电离氧原子的线性组合进行计算(Yonekura和Maki-Yonekula,2016【Yonekura,K.和Maki-Yonekula,S.(2016),《应用结晶杂志》,第49期,第1517-1523页。】)和也覆盖在左下方的图中。

电荷实际上是在蛋白质分子中的几个原子上离域的核酸,产生可被视为有效散射因子的部分电荷。蛋白质和蛋白质复合物中的所有原子都应带有部分电荷(见图2[链接]用于氨基酸和核酸中的理论部分电荷分布)。虽然这种方法比使用代表典型小分子化学键的形状因子更定性(Chang等。1999年【Chang,S.,Head-Gordon,T.,Glaeser,R.M.&Downing,K.H.(1999),《结晶学报》A55,305-313。】; Yamashita和Kidera,2001年【山下康成(Yamashita,H.)和基德拉(Kidera,A.)(2001),《水晶学报》A57,518-525。】; 等。, 2002[Zhong,S.、Dadarlat,V.M.、Glaeser,R.M.,Head-Gordon,T.&Downing,K.H.(2002),《结晶学报》A58162-170。]),它允许通过电子二维(Mitsuoka)提取与电荷相关的信息等。1999年[Mitsuoka,K.,Hirai,T.,Murata,K..,Miyazawa,A.,Kidera,A.,木村,Y.和藤桥,Y.(1999),《分子生物学杂志》286,861-882.])和三维(3D)晶体学(Yonekura等。, 2015【Yonekura,K.、Kato,K.,Ogasawara,M.、Tomita,M.&Toyoshima,C.(2015).美国国家科学院院刊,112,3368-3373.】; Yonekura&Maki-Yonekura2016年【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】)和单粒子冷冻-EM(Yonekura和Maki-Yonekura2016【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】). 此外,离子散射因子可以产生更精确的结构精炼根据低温电子显微镜数据(Yonekura和Maki-Yonekura2016【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】). 然而,这些研究假设了有限数量的原子的部分电荷,包括可滴定残基(如天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸)中侧链的O和H。

[图2]
图2
典型氨基酸和核酸模板中原子的理论电荷分布。摘自晶体信息文件(Brown&McMahon,2002)【Brown,I.D.&McMahon,B.(2002),《结晶学报》,B58,317-324。】)在中菲尼克斯图书馆(亚当斯等。, 2010【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】).

计算了原子和离子对X射线和电子的散射因子(例如Doyle&Turner,1968年【Doyle,P.A.&Turner,P.S.(1968),《水晶学报》,A24,390-397。】; Schmidt&Weiss,1979年【Schmidt,P.C.&Weiss,A.(1979).Z.Naturforsch.341471-1481.】; 雷兹等。, 1994[Rez,D.,Rez,P.&Grant,I.(1994),《水晶学报》A50,481-497。]; 等。, 1996[Wang,J.,Smith,V.H.,Bunge,C.F.和Jáuregui,R.(1996)。晶体学报A52,649-658。]; Su&Coppens,1997年[Su,Z.和Coppens,P.(1997),《水晶学报》A53,749-762.]; Macchi&Coppens,2001年【Macchi,P.和Coppens,P..(2001),《水晶学报》A57,656-662。】)和之前参数化的(例如Doyle&Turner,1968年【Doyle,P.A.&Turner,P.S.(1968),《水晶学报》,A24,390-397。】; 雷兹等。1994年[Rez,D.,Rez,P.&Grant,I.(1994),《水晶学报》A50,481-497。]; Waasmaier&Kirfel,1995年【Waasmaier,D.&Kirfel,A.(1995),《结晶学报》A51,416-431。】; 等。, 1996【彭·L·M、伦·G、杜达列夫·S·L·&惠兰·M·J(1996)。《结晶学报》A52,257-276。】; Su&Coppens,1997年[Su,Z.和Coppens,P.(1997),《水晶学报》A53,749-762.]; 彭,1998[彭丽明(1998).《结晶学报》A54,481-485.]; Macchi&Coppens,2001年【Macchi,P.和Coppens,P..(2001),《水晶学报》A57,656-662。】; 柯里克斯等。, 2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。]),但除O外,还没有报道蛋白质和蛋白质复合物中化学不稳定离子的散射因子为了填补这一空白,本研究采用多组态Dirac–Fock(MCDF)方法计算了这些离子的散射因子。我们只为组成氨基酸的C、N、O、P和S原子选择离子核酸,它们是生物分子的主要组成部分。H的电子散射因子+还介绍了。然后,我们提供系数,以便将计算出的散射因子拟合到X射线、电子晶体学和单粒子低温电子显微镜中使用的主要曲线模型。

2.计算

2.1. 径向波函数的计算

计算了C,C基态下的径向波函数+,C,N,N+,N个、O、O+,O,O2−、P、P+,P,P2+,P3+、S、S+,S,S2+,S2−,S3+和S4+采用MCDF方法。这个GRASP2K型软件包(1.1版,Jönsson等。, 2013【Jönsson,P.,Gaigalas,G.,Bieron,J.,Froese Fischer,C.&Grant,I.P.(2013),《计算物理通讯》184,2197-2203。】)用于对波函数的自洽场进行扩展的最优水平计算。已知孤立的负离子在真空中不稳定,寿命短,并且往往受到MCDF计算固有的收敛性不足的影响。解决这个问题的一个实际方法是在离子周围的给定半径外放置正电荷(Watson,1958【Watson,R.E.(1958),《物理评论》第111期,第1108-1110页。】; Schmidt&Weiss,1979年【Schmidt,P.C.&Weiss,A.(1979).Z.Naturforsch.341471-1481.】; 雷兹等。1994年[Rez,D.,Rez,P.&Grant,I.(1994),《水晶学报》A50,481-497。]),但合成的散射曲线在sin范围内存在显著差异θ/λ< 0.4 Å−1,取决于半径的大小(Schmidt&Weiss,1979【Schmidt,P.C.&Weiss,A.(1979).Z.Naturforsch.341471-1481.】). 以前的研究(王等。, 1996【Wang,J.,Smith,V.H.,Bunge,C.F.&Jáuregui,R.(1996),《结晶学报》A52,649-658。】; Macchi&Coppens,2001年【Macchi,P.和Coppens,P..(2001),《水晶学报》A57,656-662。】)表明Dirac–Fock计算为O提供了良好的解决方案以及周围没有正电荷的卤化物。基于这些研究,我们在没有周围正电荷的情况下进行了MCDF计算;这种治疗对O来说很简单,P和S以及中性原子和正离子,P除外3+和S4+.对于C和N,从中性原子径向函数的初始估计和/或增加GRASP2K型这些计划产生了合理的解决方案。对于封闭壳离子:O,使用这种方法没有获得稳定的溶液2−,S2−,P3+和S4+.

2.2。转换为散射因子

散射因子是根据Su&Coppens(1997)中描述的相对论波函数计算的[Su,Z.和Coppens,P.(1997),《水晶学报》A53,749-762.]). 简言之,径向电荷密度ρ(第页)半径为第页可以计算为

[\rho(r)={{\sum_iNq_i[P^{\,2}_i(r)+Q^{\、2}_i[r)]}\在{4\pir^2}}上,\eqno(1)]

哪里P(P)(第页)和(第页)分别表示径向波函数的主分量和次分量第个轨道,和编号是相应轨道的广义占据数。X射线散射因子如果x个()在=正弦θ/λ然后可以从ρ(第页)通过极坐标下的傅里叶变换

[F_x(s)=4\pi\int^\infty_0r^2\rho(r){\sin(4\pi-rs)}\ over{4\pi rs}}{\rm d}r.\eqno(2)]

方程(2)中的积分[链接]通过composite-Simpson求和得到第页由三次样条插值给出。散射因子计算为= 12 Å−1。一个名为scsumrhofft.py格式(在支持信息中提供)是在方程式(1)和(2)中为这些计算编写的。

2.3. 散射因子参数化

这个ScatCurve(扫描曲线)套餐(Yonekura&Maki-Yonekura2016【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】)用于参数化X射线蛋白质结晶学中使用的主要曲线模型的X射线散射因子,表示为

[\sum_i^n a_i\exp(-b-is^2)+c,\eqno(3)]

哪里n个=4,四个高斯加上一个常数模型(Colliex等。, 2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。])和n个=5,五个高斯加上一个常数模型(Waasmaier&Kirfel,1995)【Waasmaier,D.&Kirfel,A.(1995),《结晶学报》A51,416-431。】). 程序散射曲线拟合进行了修改,以实现散射因子与模型之间差异的更稳健最小化。

X射线散射因子如果x个转换为电子散射因子如果埃尔对于一个原子Z轴0电子和Z轴使用莫特公式计算的核电荷:

[\eqalign{F_{\rm el}(s)&={{m_0e ^2}\over{8\pi\varepsilon_0 h^2}}}{[Z-F_{\rm x}(s)]}\over{s^2}}\cr&={m_0 e ^2}\over{8\pi\varepsilon_0 h^2}}\biggl \{[Z_0-F{\rm x}(s)]}\over{s^2}}+{\Delta Z}\over{s^2}}\biggr \},}(4)]

哪里0表示电子质量,e(电子)电子电荷, [\varepsilon]0是自由空间的介电常数,小时是普朗克常数,并且(0e(电子)2/8π0小时2) = 0.02393366.ΔZ轴是离子电荷,定义为ΔZ轴=Z轴——Z轴0H的散射因子+也可从方程式(4)中获得[链接]具有如果x个第页,共页+=0和ΔZ轴= 1. 通过使用散射曲线拟合(Yonekura和Maki-Yonekura2016年【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】)再次,对五个高斯加一个电荷项模型的电子散射因子进行了参数化(Peng,1998[彭丽明(1998).《结晶学报》A54,481-485.])表示为

[\sum_i^5 a_i\exp(-b-i s^2)+{{m_0 e^2}\over{8\pi\varepsilon_0h^2}}{{Delta Z}\over{s^2}{.\eqno(5)]

计算的散射因子和对曲线模型的拟合通过R(右)赶快走开因子(彭,1998[Peng,L.-M.(1998),《晶体学报》,第A54卷,第481-485页。]; Yonekura&Maki-Yonekura2016年【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】)通过使用scatcurvediff猫散射曲线拟合。R(右)赶快走开定义为

[R_{{\rm scat}}={{\sum_s\mid F(s)-F_{\rm-c}(s)\mid}\超过{\sum_s\mid F(s)\ mid}}\乘以100,\eqno(6)]

哪里如果是这项工作中计算的散射振幅,以及如果c(c)是曲线模型的参考值或拟合值。

3.结果和讨论

3.1. 散射因子验证

为了验证从MCDF计算中获得的X射线散射因子,我们比较了C、N、O、P、S和O的计算值参考值,在国际结晶学表(科利克斯等。, 2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。]). 表中包含的数据最多为= 6 Å−1对于中性原子和1.5º−1对于O.R(右)赶快走开方程(6)中定义的值[链接]在这些范围内进行计算(表1[链接]). 0.02–0.01%的微小差异表明本研究中计算的值与参考数据一致。计算的散射因子图和参考曲线几乎完全相同。

表1
R(右)赶快走开参考曲线的X射线散射因子

原子 R(右)赶快走开(%)
C类 0.0125
N个 0.0194
0.0223
0.0223
P(P) 0.0047
S公司 0.0075
†方程式(6)中定义[链接]。在散射因子和参考值之间计算国际结晶学表(科里克斯等。, 2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。]). sin的数据求和θ/λ=0至1.5Å−1对于O以及从0到6º−1为所有其他人。

已知相对论效应对轻原子来说很小(例如等。, 1996【Wang,J.,Smith,V.H.,Bunge,C.F.&Jáuregui,R.(1996),《结晶学报》A52,649-658。】). 尽管如此,我们还是将相对论效应作为Colliex中的大多数散射因子等。(2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。])采用了相对论计算方法,即使对于本研究中涉及的原子也是如此。这些原子的MCDF计算在当前PC系统上不需要太多计算成本。O的参考散射因子非相对论计算(Colliex等。, 2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。])与相对论计算的差异很小(表1[链接]),证实了相对论项的一个非常小的贡献。

= 0.2–0.3 Å−1(图1[链接]). 计算的X射线和电子散射因子曲线显示了这些预期的外观,见图3[链接]和4[链接]分别是。图3[链接]和4[链接]还表明,不同电荷态曲线重叠的点因每个原子而异。相反,H的电子散射因子在国际结晶学表(科利克斯等。, 2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。])H的和+源自Hirai等。(2007【Hirai,T.、Mitsuoka,K.、Kidera,A.和Fujiyoshi,Y.(2007),《电子显微镜杂志》,第56期,第131-140页。】)甚至比不上= 0.5 Å−1(参见2016年Yonekura和Maki-Yonekura2016的图1【Yonekura,K.和Maki-Yonekula,S.(2016),《应用结晶杂志》,第49期,第1517-1523页。】). 我们计算了H的电子散射因子+根据方程式(4)[链接]只需设置如果x个第页,共页+到0和ΔZ轴=1.新曲线与中性H的曲线匹配为sinθ/λ增加(图4[链接]). 计算的X射线和电子散射因子,包括H的新值+,被制表到 = −1分别在表S1和S2中列出(参见支持信息)。

[图3]
图3
通过MCDF计算获得的X射线散射因子图。sin下的X射线散射因子θ/λ=0等于电子数Z轴0虚线表示中性原子图。洋红色和红色曲线对应O,O的散射因子+和O,绿色曲线是S的曲线2+和S3+。下一行中的绘图显示与上一行中相同的曲线,但直到sinθ/λ= 2 Å−1.
[图4]
图4
根据莫特公式(方程式4)从X射线散射因子转换而来的电子散射因子图[链接]). 虚线表示中性原子的绘图。负离子在较低的sin中显示负值θ/λ范围。洋红色和红色曲线对应O,O的散射因子+和O,青色和蓝色曲线是H、H的曲线+绿色曲线是S曲线2+和S3+H的散射曲线由国际结晶学表(科利克斯等。, 2006[Coliex,C.,Cowley,J.M.,Dudarev,S.L.,Fink,M.,Gjönnes,J.,Hilderbrandt,R.,Howie,A.,Lynch,D.F.,Peng,L.M.、Ren,G.,Ross,A.W.,Smith,V.H.,Spence,J.H.、Steeds,J.W.、Wang,J.、Whelan,M.&Zvyagin,B.(2006)。电子衍射。《国际结晶表》,C卷,E。普林斯,第263-281页。多德雷赫特:克鲁沃。]).

我们还尝试了标准的量子化学课程高斯09(弗里希等。, 2016【Frisch,M.J.等人(2016)。高斯09,A.02版,高斯公司,美国康涅狄格州沃林福德。】)和GAMESS公司(施密特等。, 1993[Smidt,M.W.,Baldridge,K.K.,Boatz,J.A.,Elbert,S.T.,Gordon,M.S.,Jensen,J.H.,Koseki,S.,Matsunaga,N.,Nguyen,K.A.,Su,S.,Windus,T.L.,Dupuis,M.&Montgomery,J.A.(1993)。计算机化学杂志,第14期,1347-1363页。])用于计算散射因子,希望获得O的散射因子2−,S2−,P3+和S4+,因为MCDF计算没有给出这些离子的稳定溶液。分子轨道使用不同的高斯型基集,如cc-pVTZ、cc-pV5Z、aug-cc-pVTZ、d-aug-cc-pVTZ等,进行了ROHF、UHF、MP2、3、4和CCSD(T)的计算ρ然后在足够精细的网格上计算并转换为径向散射因子。这个R(右)赶快走开然而,相对于中性原子和O的参考值,该值约为0.5–1.0%和远大于从MCDF计算中获得的误差(表1[链接]),尽管上面的基准集本应可用于定量计算。散射因子图似乎与参考值不同,特别是在低sin范围内θ/λ这种不一致性可能反映出高斯型基集不能描述核附近的尖点和电子间结合点(例如Pachucki&Komasa,2004年【Pachucki,K.和Komasa,J.(2004),《化学物理快报》389209-211。】). 因此,我们没有采用这些计算。

3.2. 散射因子参数化

然后,我们在表S1中参数化了四个高斯加一个常数的X射线散射因子(表2[链接])五个高斯加一个常数模型(表3[链接]),以及表S2中五个高斯加一个电荷项模型的电子散射因子(表4[链接]). 数据最多= 6 Å−1用于所有X射线散射因子和=0.04至6º−1正离子的电子散射因子。仅来自的数据=0.04至1.5º−1用于负离子的电子散射因子,如R(右)赶快走开当包含数据超过时,散射因子和拟合曲线之间的值变得更差= 1.5 Å−1.计算系数和R(右)赶快走开表2中汇总了这些值[链接], 3[链接]和4[链接].所有R(右)赶快走开数值小于0.09%,通常约为0.05-0.005%。负离子的电子散射因子稍差R(右)赶快走开值,但这些值与其他离子的报告值相当(Peng,1998[彭丽明(1998).《结晶学报》A54,481-485.]). 方程式(4[链接])和(5[链接])H相同+当一切发生时1–5=0,并且不需要对五个高斯加一个电荷项模型进行参数化。磷和硫的多价阳离子的散射因子对于一些化学物质来说可能是必要的,例如烟酰胺腺嘌呤二核苷酸磷酸盐[参见晶体信息文件(Brown&McMahon,2002)【Brown,I.D.&McMahon,B.(2002),《结晶学报》,B58,317-324。】)在中菲尼克斯图书馆(亚当斯等。, 2010【Adams,P.D.,Afonine,P.V.,Bunkóczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.-W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.,Read,R.J.,Richardson,D.C.,Richards,J.S.,Terwilliger,T.C.&Zwart,P.H.(2010),《水晶学报》D66,213-221。】)]. 支持信息中提供了表S1、S2和2-4,以供将来参考。

表2
四高斯加常数模型离子X射线散射因子的参数化

  1 2 4 c(c) R(右)赶快走开
离子 b条1 b条2 b条 b条4   (%)
C类+ 6.727东经+0 1.439东经+0 2.191东经+0 9.913E-1号机组 −6.349E+0 0.0154
4.479E-3段 6.231E-1号机组 1.313东经+1 2.971东经+1  
C类 1.598东经+0 2.161E+0号 2.360东经+0 6.549E-1型 2.238E-1 0.0606
5.843E-1号机组 1.346东经+1 3.831E+1 1.405E+2  
N个+ 1.570电子+0 2.068东经+0 1.847E+0 2.870E-1型 2.271E-1号机组 0.0025
4.122E-1段 8.064东经+0 1.665E+1 3.340E+1  
N个 1.569东经+0 2.640东经+0 2.795E+0 7.386E-1号机组 2.551E-1型 0.0394
4.393E-1号机组 9.202E+0年9月 2.624E+1 9.062东经+1  
+ 1.553东经+0 2.237东经+0 2.466东经+0 5.079E-1号机组 2.367E-1型 0.0015
3.148E-1段 5.618E+0 1.191E+1 2.504东经+1  
1.535E+0 3.038东经+0 3.280电子+0 8.555E-1号机组 2.886E-1型 0.0346
3.459E-1段 6.556东经+0 1.876E+1 6.328东经+1  
P(P)+ 1.732E+0 6.472E+0 3.698东经+0 9.940E-1号机组 1.105东经+0 0.0065
5.089E-1号机组 1.893E+0 2.424E+1 5.215E+1  
P(P) 1.990E+0 6.243东经+0 4.686东经+0 1.928东经+0 1.146东经+0 0.0423
5.903E-1号机组 1.967东经+0 3.046东经+1 1.031东经+2  
P(P)2+ 1.825E+0 6.368东经+0 3.076东经+0 6.076E-1号机组 1.124E+0 0.0046
5.431E-1号机组 1.924E+0 2.114东经+1 4.185E+1  
S公司+ 1.419E+0 6.923东经+0 4.736E+0 1.076东经+0 8.458E-1号机组 0.0115
2.405E-1号机组 1.459E+0 2.028东经+1 4.519东经+1  
S公司 1.505东经+0 6.721东经+0 5.614E+0 2.130东经+0 1.024东经+0 0.0372
3.506电子-1 1.507E+0 2.411E+1 7.728东经+1  
S公司2+ 1.442东经+0 6.787东经+0 4.206东经+0 5.939E-1号机组 9.715E-1号机组 0.0092
3.088E-1号机组 1.488东经+0 1.846E+1 3.950东经+1  
S公司3+ 1.611E+0 6.550东经+0 3.434东经+0 3.284E-1号机组 1.078东经+0 0.0051
4.062E-1号机组 1.543东经+0 1.637E+1 3.422E+1  
†在方程(6)中定义[链接].在散射因子和拟合曲线之间计算。sin的数据求和θ/λ=0至2º−1.

表3
五高斯加常数模型离子X射线散射因子的参数化

  1 2 4 5 c(c) R(右)赶快走开
离子 b条1 b条2 b条 b条4 b条5   (%)
C类+ 8.431E-2号机组 5.957电子-1 1.145东经+0 2.224东经+0 9.528E-1号机组 −2.457E-3 0.0194
4.787E-2型 2.273E-1号机组 7.042E-1号机组 1.328E+1 3.012东经+1  
C类 5.946E-1号机组 1.229东经+0 2.295E+0 2.257东经+0 6.050E-1号机组 1.642E-2型 0.0516
1.840E-1型 7.149E-1页 1.408东经+1 4.041东经+1 1.463东经+2  
N个+ 1.670E-1型 6.515E-1型 9.987E-1号机组 2.749东经+0 1.427E+0 5.943E-3号机组 0.0228
6.426E-2号机组 194E-1年2月 5.482E-1 9.105东经+0 2.215东经+1  
N个 6.423电子-1 1.169东经+0 2.685东经+0 2.758E+0 7.215E-1号机组 2.224E-2号机组 0.0403
1.451E-1号机组 5.304E-1号机组 9.338东经+0 2.664东经+1 9.161E+1  
+ 6.042E-1 1.171E+0 2.398东经+0 2.376东经+0 4.253E-1号机组 2.527E-2型 0.0047
1.078E-1号机组 3.764E-1号机组 5.797东经+0 1.247E+1 2.613东经+1  
6.950E-1号机组 1.102东经+0 3.023东经+0 3.287东经+0 8.611E-1号机组 2.919E-2号机组 0.0367
1.195E-1号机组 4.139E-1段 6.546东经+0 1.869东经+1 6.309电子+1  
P(P)+ 1.496东经+0 1.992东经+0 5.676E+0 3.739东经+0 9.422E-1号机组 1.546E-1 0.0107
7.120E-2段 9.188E-1号机组 1.987东经+0 2.446东经+1 5.304E+1  
P(P) 1.505东经+0 2.539东经+0 5.185E+0 4.696东经+0 1.909东经+0 1.595E-1型 0.0431
7.246E-2号机组 1.008东经+0 2.097东经+0 3.061东经+1 1.036东经+2  
P(P)2+ 1.501E+0 2.253东经+0 5.421东经+0 3.145东经+0 5.236E-1号机组 1.563E-1型 0.0084
7.155E-2段 9.661E-1号机组 2.041东经+0 2.148东经+1 4.363E+1  
S公司+ 1.477东经+0 1.268E+0 6.299E+0年 4.788东经+0 1.011东经+0 1.569E-1型 0.0155
6.175电子2 6.681E-1号机组 1.521E+0 2.047东经+1 4.613E+1  
S公司 1.483东经+0 1.597东经+0 6.016东经+0 5.623E+0 2.114电子+0 1.610E-1型 0.0397
6.259E-2号机组 7.320E-1号机组 1.570东经+0 2.419东经+1 7.758东经+1  
S公司2+ 1.483东经+0 1.520东经+0 6.052东经+0 4.257东经+0 5.300E-1号机组 1.594E-1号机组 0.0131
6.220E-2号机组 7.229E-1段 1.558东经+0 1.865E+1 4.092东经+1  
S公司3+ 1.489东经+0 1.983东经+0 5.618E+0 3.476东经+0 2.716电子-1 1.626E-1号机组 0.0084
6.277E-2号机组 8.002E-1号机组 1.631E+0 1.656E+1 3.620E+1  
†方程式(6)中定义[链接].在散射因子和拟合曲线之间计算。sin的数据求和θ/λ =0至6º−1.

表4
五高斯加电荷项模型离子电子散射因子的参数化

  1 2 4 5 R(右)赶快走开
离子 b条1 b条2 b条 b条4 b条5 (%)
C类+ 2.079E-2号机组 9.266E-2号机组 2.949E-1 6.812E-1号机组 3.304E-1号机组 0.0156
5.950E-2号机组 5.359E-1号机组 2.760东经+0 9.283东经+0 2.442东经+1
C类- 2.248E-1号机组 8.254E-1段 1.769东经+0 1.690E+0 6.994E-1号机组 0.0810
5.518E-1型 4.308东经+0 1.600E+1 5196E+1号机组 1.708东经+2
N个+ 196E-2年2月2日 1.004E-1号机组 3.289E-1段 6.546E-1号机组 2.733E-1 0.0132
5.522E-2型 4.910E-1型 2.402E+0 7.751E+0号 2.051E+1
N个 2.192E-1号机组 7.256E-1号机组 1.398东经+0 1.245E+0 4.381E-1号机组 0.0430
4.784E-1型 3.389东经+0 1.171E+1 3.604东经+1 1.125E+2
+ 2.439E-2型 1.036E-1号机组 3.360E-1号机组 6.112E-1段 2.447E-1型 0.0120
5.082E-2号机组 4.390E-1号机组 2.036东经+0 6.407东经+0 1.710E+1
2.236E-1号机组 6.923E-1号机组 1.176东经+0 9.354 E-1号机组 2.821E-1号机组 0.0218
4.372E-1号机组 2.918东经+0 9.670东经+0 2.868E+1 8.489东经+1
P(P)+ 6.191E-2号机组 3.154E-1段 6.324E-1号机组 1.661E+0 1.027电子+0 0.0447
6.525E-2型 6.224E-1号机组 3.009东经+0 1.258E+1 3.411E+1
P(P) 4.590E-1号机组 1.002E+0 2.724电子+0 3.228东经+0 1.336东经+0 0.0728
2019年5月1日 3.545东经+0 1.445E+1 4.313E+1 1.303东经+2
P(P)2+ 4.997E-2号机组 2.497E-1型 4.690E-1型 1.099东经+0 6.144E-1号机组 0.0233
5.712E-2号机组 5.372E-1号机组 2.398东经+0 1.051东经+1 2.704东经+1
S公司+ 6.232E-2号机组 3.129E-1段 6.541E-1号机组 1.742E+0 9.377E-1 0.0391
6.149E-2号机组 5.785E-1号机组 2.848E+0 1.107东经+1 2.978E+1
S公司 4.496E-1号机组 9.810E-1型 2.598东经+0 2.717东经+0 8.614E-1号机组 0.0543
4.656E-1号机组 3.259东经+0 1.233E+1 3.583东经+1 1.055东经+2
S公司2+ 5.029E-2号机组 2.440E-1型 4.671E-1号机组 1.196E+0 7.100E-1日 0.0230
5.364E-2号机组 4.908E-1号机组 2.186东经+0 8.911东经+0 2.266东经+1
S公司3+ 3.991E-2号机组 1.787E-1号机组 3.465E-1页 7.425E-1型 5.600E-1型 0.0124
4.652E-2型 4.001E-1号机组 1.626东经+0 6.936东经+0 1.724E+1
†在方程(6)中定义[链接].在散射因子和拟合曲线之间计算。sin的数据求和θ/λ=0.04至6Å−1对于正离子,从0.04到1.5º−1对于负离子。

3.3. 辐射损伤

在最近的单粒子重建中,经常观察到天冬氨酸和谷氨酸带负电荷的侧链的密度损失(例如巴提萨吉等。, 2014【Bartesaghi,A.、Matthies,D.、Banerjee,S.、Merk,A.和Subramaniam,S.(2014)。美国国家科学院院刊,11111709-11714。】; Fromm公司等。, 2015【Fromm,S.A.,Bharat,T.A.,Jakobi,A.J.,Hagen,W.J.&Sachse,C.(2015),《结构生物学杂志》189,87-97。】; Hryc公司等。, 2017【Hryc,C.F.,Chen,D.H.,Afonine,P.V.,Jakana,J.,Wang,Z.,Haase-Pettingell,C.,Jiang,W.,Adams,P.D.,King,J.A.,Schmid,M.F.&Chiu,W..(2017),美国国家科学院院刊,114,3103-3108。】)可能被解释为辐射损伤(菲奥拉万蒂等。, 2007【Fioravanti,E.,Vellieux,F.M.D.,Amara,P.,Madern,D.&Weik,M.(2007),J.Synchrotron Rad.14,84-91.】)即使是从低累积电子剂量收集的数据集重建。密度损失的一部分应归因于带负电荷的原子,如果在没有低分辨率数据的情况下计算出的图谱恢复了相应的密度(Yonekura等。, 2015【Yonekura,K.、Kato,K.,Ogasawara,M.、Tomita,M.&Toyoshima,C.(2015).美国国家科学院院刊,112,3368-3373.】). 相反,强光束(如无X射线电子激光器)会对样品造成电离损伤,这可能会影响衍射模式(Hau-Riege,2007)【Hau-Riege,S.P.(2007),《物理评论A》,76,042511。】). 这些自由基失去一些电子的散射因子可能有助于我们正确处理数据(Hau-Riege,2007)【Hau-Riege,S.P.(2007),《物理评论A》,76,042511。】).

4.结论

我们提供了C的X射线和电子散射因子+,C,N个+,N个,O+,O,P+,P,P2+,S+,S,S2+和S3+,H的电子散射因子+四个高斯加常数,五个高斯加一常数,五种高斯加一电荷项模型的系数。部分带电原子的散射因子和曲线模型的拟合参数可以由中性原子和完全电离原子的散射系数和拟合参数的线性组合得到,使用scatcurvecomb公司(如2016年的Yonekura和Maki-Yonekula【Yonekura,K.和Maki-Yonekula,S.(2016),《应用结晶杂志》,第49期,第1517-1523页。】). 我们现在正在测试本研究中结构的计算值精炼与电子三维晶体学和单粒子冷冻电子显微镜获得的数据对比。

致谢

我们感谢Toshiyuki Azuma对二价阴离子特性的评论。使用计算高斯09在HOKUSAI GreatWave HPC系统RIKEN中执行。

资金筹措信息

这项工作得到了日本科学技术署SENTAN项目(至KY)、日本科学促进会(向KY)和日本科学促进协会(向KY16 H04757)的支持。

工具书类

第一次引用Adams,P.D.、Afonine,P.V.、Bunkóczi,G.、Chen,V.B.、Davis,I.W.、Echols,N.、Headd,J.J.、Hung,L.-W.、Kapral,G.J.、Grosse-Kunstleve,R.W.、McCoy,A.J.、Moriarty,N.W.、Oeffner,R.、Read,R.J.、Richardson,D.C.、Richards,J.S.、Terwilliger,T.C.和Zwart,P.H.(2010)。《水晶学报》。D类66, 213–221. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Bartesaghi,A.、Matthies,D.、Banerjee,S.、Merk,A.和Subramaniam,S.(2014年)。程序。美国国家科学院。科学。美国111, 11709–11714. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Brown,I.D.和McMahon,B.(2002年)。《水晶学报》。B类58, 317–324. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Chang,S.、Head-Gordon,T.、Glaeser,R.M.和Downing,K.H.(1999)。《水晶学报》.A型55, 305–313. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Colliex,C.、Cowley,J.M.、Dudarev,S.L.、Fink,M.、Gjönnes,J.、Hilderbrandt,R.、Howie,A.、Lynch,D.F.、Peng,L.M.,Ren,G.,Ross,A.W.、Smith,V.H.、Spence,J.C.H.、Steeds,J.W.、Wang,J.,Whelan,M.和Zvyagin,B.(2006年)。电子衍射。国际结晶学表第C卷,E.Prince编辑,第263-281页。多德雷赫特:克鲁沃。 谷歌学者
第一次引用Doyle,P.A.和Turner,P.S.(1968年)。《水晶学报》。一个24, 390–397. 交叉参考 IUCr日志 科学网 谷歌学者
第一次引用Fioravanti,E.,Vellieux,F.M.D.,Amara,P.,Madern,D.&Weik,M.(2007年)。J.同步辐射。 14, 84–91. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用弗里希,M.J。等。(2016).高斯09,修订版A.02,Gaussian Inc.,美国康涅狄格州沃林福德谷歌学者
第一次引用Fromm,S.A.、Bharat,T.A.、Jakobi,A.J.、Hagen,W.J.和Sachse,C.(2015)。J.结构。生物。 189,87–97科学网 交叉参考 公共医学 谷歌学者
第一次引用Hau-Riege,S.P.(2007)。物理学。版次A76, 042511. 谷歌学者
第一次引用Hirai,T.、Mitsuoka,K.、Kidera,A.和Fujiyoshi,Y.(2007)。《电子显微镜杂志》。 56,131–140科学网 交叉参考 谷歌学者
第一次引用Hryc,C.F.,Chen,D.H.,Afonine,P.V.,Jakana,J.,Wang,Z.,Haase-Pettingell,C.,Jiang,W.,Adams,P.D.,King,J.A.,Schmid,M.F.&Chiu,W..(2017年)。程序。美国国家科学院。科学。美国114, 3103–3108. 交叉参考 中国科学院 谷歌学者
第一次引用Jönsson,P.、Gaigalas,G.、Bieron,J.、Froese Fischer,C.和Grant,I.P.(2013)。计算。物理学。Commun公司。 184, 2197–2203. 谷歌学者
第一次引用Macchi,P.和Coppen,P.(2001)。《水晶学报》。一个57, 656–662. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Mitsuoka,K.、Hirai,T.、Murata,K..、Miyazawa,A.、Kidera,A.、木村,Y.和藤桥,Y.(1999)。分子生物学杂志。 286,861–882页科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Pachucki,K.和Komasa,J.(2004)。化学。物理学。莱特。 389, 209–211. 交叉参考 中国科学院 谷歌学者
第一次引用彭立明(1998)。《水晶学报》。一个54, 481–485. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Peng,L.-M.,Ren,G.,Dudarev,S.L.&Whelan,M.J.(1996)。《水晶学报》。一个52, 257–276. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Rez,D.、Rez,P.和Grant,I.(1994年)。《水晶学报》。一个50, 481–497. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Schmidt,M.W.、Baldridge,K.K.、Boatz,J.A.、Elbert,S.T.、Gordon,M.S.、Jensen,J.H.、Koseki,S.、Matsunaga,N.、Nguyen,K.A.、Su,S.,Windus,T.L.、Dupuis,M.和Montgomery,J.A(1993)。J.计算。化学。 14, 1347–1363. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Schmidt,P.C.和Weiss,A.(1979年)。Z.Naturforsch公司。 34, 1471–1481. 交叉参考 谷歌学者
第一次引用Su,Z.和Coppens,P.(1997)。《水晶学报》。一个53, 749–762. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Waasmaier,D.&Kirfel,A.(1995年)。《水晶学报》。一个51, 416–431. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Wang,J.、Smith,V.H.、Bunge,C.F.和Jáuregui,R.(1996)。《水晶学报》。一个52, 649–658. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Watson,R.E.(1958年)。物理学。版次。 111, 1108–1110. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Yamashita,H.和Kidera,A.(2001年)。《水晶学报》。一个57,第518页至第525页科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Yonekura,K.和Maki-Yonekula,S.(2016)。J.应用。克里斯特。 49, 1517–1523. 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Yonekura,K.、Kato,K.,Ogasawara,M.、Tomita,M.&Toyoshima,C.(2015)。程序。美国国家科学院。科学。美国112, 3368–3373. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Zhong,S.、Dadarlat,V.M.、Glaeser,R.M.和Head-Gordon,T.&Downing,K.H.(2002)。《水晶学报》。一个58,162–170科学网 交叉参考 中国科学院 IUCr日志 谷歌学者

这是一篇开放获取的文章,根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

IUCrJ大学
第5卷| 第3部分| 2018年5月| 第348-353页
国际标准编号:2052-2525