计算机程序\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标的日志
应用
结晶学
国际标准编号:1600-5767

阳极:反常和重原子密度计算

十字标记徽标

哥廷根大学结构化学系,德国哥廷根Tammannstrasse 4,D-37077
*通信电子邮件:gsheldr@shelx.uni-ac.gwdg.de公司

(收到日期:2011年8月8日; 2011年10月10日接受; 在线2011年11月12日)

新程序阳极通过颠倒通常的用单波长和多波长反常衍射和单波长反常绕射等方法测定实验相位的程序来估算反常或重原子密度同晶置换 反常散射。不是向重原子相添加相移以获得天然蛋白质相的起始值,而是从天然相减去相移以获取重原子下部结构阶段。所需的天然相是根据结构的蛋白质数据库文件中的信息计算得出的。由此产生的密度甚至可以定位非常微弱的异常散射体,例如硫。潜在的应用包括识别未知原子和验证分子置换解决。

1.简介

程序谢尔克斯/D类/电子(谢尔德里克,2008年[Sheldrick,G.M.(2008),《水晶学报》,A64112-122。], 2010[Sheldrick,G.M.(2010),《水晶学报》,D66479-485.])采用简化但有效的方法对大分子进行实验阶段划分。谢尔克斯估算标记原子结构因子|F类A类|和相移α从实验数据来看。标记原子通常是重金属、卤化物、硒或溴,特别用于相位调整,或天然存在的金属或硫原子。|F类A类|值由使用SHELXD公司通过集成Patterson和直接方法。近似原生相φT型然后通过添加相移来估计α到计算的相位φA类对于标记原子下部结构:

[\varphi_{\rm T}=\varphi_{\rmA}+\alpha.\eqno(1)]

给定高质量的多波长反常微分(MAD)或单个同晶置换 反常散射(SIRAS)数据中,生成的本征相位可能足以给出一个可解释的图,但对于单波长异常微分(SAD)和SIR相位,这些相位始终需要通过密度修改来改善,例如具有SHELXE公司在MAD方法中,对在接近吸收边理论上可以估计|F类A类|和α仅受测量数据精度的限制。在SAD方法中|F类A类|假设与异常差值的绝对值成正比Δ阿诺= |F类香港特别行政区|负极|F类[\上划线h\上划线k\上划线l]|、和α假设为90°,当Δ阿诺为正,为负时为270°。事实上,更好的近似值是Δ阿诺= |F类A类|罪α,带有α在0–360°范围内,但不可能推导出两个参数(|F类A类|和α)根据一次观察(Δ阿诺). 尽管存在这些激烈的假设,SAD阶段化仍然有效,这是对密度修改能力的赞扬,尽管这有助于这些近似值最适合具有最大异常差异的反射。

如果结构和因此φT型已知,方程式(1)[链接]可以重新安排以估计φA类:

[\varphi_{\rm A}=\varphi_{\rmT}-\alpha.\eqno(2)]

何时|F类A类|和α来源于SAD数据,即使用这些值和方程(2)计算的地图[链接]通常通俗地称为“反常傅里叶映射”。这样的地图可能是Strahs&Kraut(1968年)首次使用的【Strahs,G.&Kraut,J.(1968),《分子生物学杂志》35,503-512。】). 然而,这种方法同样适用于SIR、MAD和SIRAS定相,对它们来说,“重原子密度图”可能是一种更合适的描述。程序阳极这里描述的只是应用方程(2)[链接]计算这些地图。阶段φT型通过结构系数使用蛋白质数据库(PDB;Berman)中的信息进行计算等。, 2000[Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。核酸研究28,235-242。])文件,以及α以及|F类A类|程序可以方便地提供值谢尔克斯XPREP公司(来自SHELXTL公司; 谢尔德里克,2008年[Sheldrick,G.M.(2008),《水晶学报》,A64112-122。]),目前用于估计实验阶段的这些参数。这通常会创建与输入PDB文件具有相同单位-细胞原点选择的地图,但如果晶体对称性允许替代索引,则仍需小心(参见§[链接]2.4)。

1.1. 输入和输出文件

阳极由包含文件名词干和可选的一个或多个开关的命令行启动:

[\tt阳极\,\,name \qquad\qquad\\qquad \qquad\qquae\qquad

读取PDB格式文件名称.ent,或者如果找不到名称.pdb,并从该文件中提取unit-cell参数、space-group名称和atom坐标。文件姓名_fa.hkl谢尔克斯XPREP公司然后读取以提取反射索引|F类A类|和α值。对于随后的计算,这些数据是否来源于SAD、SIR、SIRAS、MAD或辐射损伤诱导的相位变化实验,没有区别。A类结构系数使用PDB文件中的信息进行计算,生成相位φT型对于这些反射和φA类然后使用方程式(2)计算它们[链接]开关控制所需的输出量,并可用于截断超过指定分辨率的数据(−d日)或将傅里叶系数乘以exp(-8)形式的阻尼项π2B类2θ/λ2). 实际上,这些开关的默认设置几乎总是足够的(Thorn,2011【Thorn,A.(2011),博士论文,Georg-August-Universität Göttingen,德国。】).阳极通过快速傅里叶变换计算密度图,然后导出σ,密度方差的平方根,并输出以下结果:

(1) 平均密度(单位:σ)在每种类型的原子位置,例如`S_Met’,使用PDB文件中的坐标。

(2) 地图中唯一峰的高度和坐标,以及它们与PDB文件中最近原子的距离,同时考虑了空间组对称性和单位-细胞平移。

(3) 一个文件名称.pha以程序可以理解的格式包含映射系数库特(埃姆斯利等。, 2010【Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010),《水晶学报》D66、486-501。】)用于显示密度。

(4) 一个文件名称_ fa.res与程序编写的格式相同SHELXD公司对于SAD或MAD阶段 。这可以输入到SHELXE公司(谢尔德里克,2010年[Sheldrick,G.M.(2010),《水晶学报》,D66479-485.])的分子置换SAD阶段化(Schuermann&Tanner,2003[Suermann,J.P.和Tanner,J.J.(2003)。晶体学报D59,1731-1736。]),例如减少模型偏差分子置换结构解决方案。

(5) 列表文件姓名lsa.

套房阳极如果命令行中没有文件名,则会列出可用的选项。图1[链接]显示了的流程图阳极.

[图1]
图1
的流程图阳极程序。

2.示例

2.1. 非常微弱的硫-SAD数据

对于基于硫作为反常散射体的尝试定相,似乎即使当Friedel差异太小而无法通过SAD定相解决结构时,S原子也可以通过阳极例如,粘毒素B2(PDB代码2v9b版; 朋友等。, 2008【Pal,A.,Debreczeni,J.E.,Sevvana,M.,Gruene,T.,Kahle,B.,Zeeck,A.&Sheldrick,G.M.(2008),《结晶学报》D64,985-992。】)尽管有1.70波长的同步加速器数据可用,但它抵制了所有通过硫-SAD解决该结构的尝试以及在分子中有六个二硫键的事实非对称单元(事实上是由从头算 直接方法使用来自另一个晶体的高分辨率本地数据,而不使用异常数据)。阳极发现平均密度为9.20σ二硫化物S原子和6.21σ六种硫酸盐离子的S原子。原子位置的次强密度为0.84σ相应的异常密度图如图2所示[链接].

[图2]
图2
粘毒素B2的异常密度,等高线为2.8σ尽管异常信号对于硫-SAD相位来说太弱,但在异常密度中可以清楚地看到六个二硫键和硫酸根阴离子的S原子。硫酸盐离子的密度较低,因为它们具有较高的流动性,并且其中一些离子可能被磷酸盐离子部分取代。

2.2. 魔术三角相位

硫-SAD和卤化物浸泡的一个有吸引力的替代品(Dauter等。, 2000【Dauter,Z.、Dauter、M.和Rajashankar,K.R.(2000),《水晶学报》D56、232-237。】)是浸泡或与魔术三角共同结晶(贝克等。, 2008[Beck,T.,Krasauskas,A.,Gruene,T.和Sheldrick,G.M.(2008),《晶体学报》,第64期,1179-1182页。]),它包含三个碘原子,用6.0构成等边三角形奥赛德斯。这种结构易于识别,并提供比硫-SAD更多的定相能力。使用贝克的数据等。(2008[Beck,T.,Krasauskas,A.,Gruene,T.和Sheldrick,G.M.(2008),《晶体学报》,第64期,1179-1182页。])用于四方溶菌酶(PDB条目3e3d(3e3d)),阳极获得的平均密度为22.6σ在12个碘位点(四个结合的I3C分子),2.71σ对于SD_Met站点,2.30σ对于SG_Cys站点和2.30σ单个HEPES缓冲分子的S原子。原子位置的次强密度为0.54σ以这种方式确定硫位可能有助于在I3C的帮助下追踪阶段性结构。

2.3. MAD示例

乍一看,人们可能会想到由阳极仅显示MAD实验中使用的波长跨越吸收边的原子。然而,由于他们反常散射,其他原子也有助于F类A类值,尽管强度不如目标原子。当MAD重原子图与MAD实验中使用的不同波长的SAD图进行比较时,情况变得更清楚。阳极用于分析三波长Zn-MAD对嗜热菌素(PDB代码)的实验结果第三代烟气脱硫; P.Pfeffer、G.Neudert、L.Englert、T.Ritschel、B.Baum和G.Klebe,准备中),其中锌过量2+已添加以确保锌场地的完全占用。所有三组数据均在柏林贝西同步加速器的光束线14.2处收集,分辨率为2.06Å。除了锌位置处的强密度外,Ca和S原子对应于密度最大值。还有一个峰值,约为原生锌位密度的35%,约为3.25与钙和硫密度不同,该密度几乎是一次锌密度的恒定分数,如表1所示[链接],表明它也必须是锌位点(可能由一个或多个O原子连接到主位点)。这证实了Holland的结论等。(1995【Holland,D.R.,Hausrath,A.C.,Juers,D.&Matthews,B.W.(1995)。蛋白质科学,1955-1965。】)根据现场的自然密度和化学环境。重原子密度图如图3所示[链接].

表1
重原子密度(σ单位)阳极对于含过量锌的嗜热菌蛋白酶的三波长Zn-MAD数据2+

然而,对于三个SAD实验,钙位和锌位的平均密度比随波长而变化,因为(f)'对于锌的变化很大,对于MAD实验和作为三个单独SAD实验处理的相同数据,未知位置与锌位置的密度比几乎恒定(35%),这强烈表明该位置也被锌占据。蛋氨酸S原子的密度也异常,但几乎不显著。

数据 三种波长 拐点 峰值 高能遥控器
实验 摩洛哥迪拉姆 SAD公司 SAD公司 SAD公司
2+ 82.5 55.7 66.4 56
2+(平均值) 11.2 15.1 11.1 12.8
SD_Met(平均值) 1.8 3.5 2.3 2.9
未知 28.5 18.2 24.7 20.1
Ca比率2+/锌2+ 0.136 0.271 0.167 0.229
比率未知/Zn2+ 0.345 0.326 0.372 0.359
[图3]
图3
三波长Zn-MAD数据的重原子密度轮廓为3.5σ含过量锌的嗜热菌素2+,显示额外的部分占用锌位置约3.25来自主锌位置的氧。

2.4. 索引不一致

当Laue对称性低于晶格的度量对称性时,有其他方法可以索引彼此不兼容的反射。因此姓名_fa.hkl文件可能与用于生成PDB文件的数据中的文件不兼容,PDB文件很可能来自不同的晶体。幸运的是,对于65个Sohnke空间群中除三个外的所有空间群,只需考虑一个再定向矩阵。-我在上指定了标志阳极命令行。对于三个Sohnke空间组,每个空间组都可以用四种不同的方法进行索引-i1号机组,-i2类-i3类可以使用。阳极当可以进行替代索引时,输出警告,因此用户不需要熟悉此类技术细节。

3.项目可用性和分发

阳极作为Fortran源代码和预编译二进制文件,可用于大多数现代Windows、Mac和Linux系统,作为SHELX公司系统(https://shelx.uni-ac.gwdg.de/shelx网站/),免费分发供学术使用。静态链接的二进制文件不需要其他程序、库、数据文件或环境变量,除了程序谢尔克斯(或XPREP公司)需要准备姓名_fa.hkl的输入文件阳极.

4.结论

尽管进行了相当激烈的简化和近似,尤其是假设只有一种类型的反常散射体存在,并且αSAD数据为90°或270°-阳极被证明是产生和分析异常或重原子密度的一种相当有效的方法。阳极对于明显弱于实验定相所需的反常数据,似乎工作得很好,并且应该证明在识别未知原子方面很有用(例如以区分氯离子和水分子),用于验证分子置换解决方案(例如定位S原子)或作为最终模型验证的一部分。

致谢

我们感谢Tobias Beck、Marianna Biadene、Gabor Buncoczi、Judit Debreczeni、Ina Dix、Christian Grosse、Tim Gruene、Uwe Müller和Manfred Weiss提供的测试数据和/或测试阳极图2[链接]和3[链接]使用首席运营官(埃姆斯利等。, 2010【Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010),《水晶学报》D66、486-501。】)和PyMOL公司(德拉诺,2002【DeLano,W.L.(2002),美国圣卡洛斯,PyMOL,DeLano Scientific,https://www.pymol.org/。]).

工具书类

第一次引用Beck,T.、Krasauskas,A.、Gruene,T.和Sheldrick,G.M.(2008)。阿克塔·克里斯特。D类64, 1179–1182. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。核酸研究。 28, 235–242. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Dauter,Z.、Dauter、M.和Rajashankar,K.R.(2000年)。阿克塔·克里斯特。D类56, 232–237. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用DeLano,W.L.(2002)。PyMOL公司DeLano Scientific,美国圣卡洛斯,https://www.pymol.org/谷歌学者
第一次引用Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010年)。阿克塔·克里斯特。D类66, 486–501. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Holland,D.R.,Hausrath,A.C.,Juers,D.&Matthews,B.W.(1995)。蛋白质科学。 4, 1955–1965. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Pal,A.,Debreczeni,J.E。,Sevvana,M.、Gruene,T.、Kahle,B.、Zeeck,A.和Sheldrick,G.M.(2008年)。阿克塔·克里斯特。D类64, 985–992. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Schuermann,J.P.和Tanner,J.J.(2003)。阿克塔·克里斯特。D类59, 1731–1736. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.(2008)。阿克塔·克里斯特。A类64, 112–122. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.(2010年)。阿克塔·克里斯特。D类66, 479–485. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Strahs,G.&Kraut,J.(1968)。分子生物学杂志。 35, 503–512. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Thorn,A.(2011)。博士论文,Georg-August-Universität Göttingen,德国。 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标的日志
应用
结晶学
国际标准编号:1600-5767
遵循J.Appl。克里斯特。
注册电子通知
遵循J.Appl。克里斯特。在推特上
在脸书上关注我们
注册RSS订阅源