研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标结构
生物学
国际标准编号:2059-7983

实验定相SHELXC公司/D类/E类:将链跟踪与密度修改相结合

十字标记_颜色_方形_文本.svg

哥廷根大学结构化学系,德国哥廷根Tammannstrasse 4,D-37077
*通信电子邮件:gsheldr@shelx.uni-ac.gwdg.de

(收到日期:2009年5月21日; 2009年9月22日接受)

程序SHELXC公司SHELXD公司SHELXE公司旨在通过SAD、MAD、SIR、SIRAS和RIP方法对大分子进行简单、稳健和高效的实验阶段划分,特别适用于自动化结构-解决管道。本文概述了使用这些程序进行的实验相位调整,并描述了迭代密度修正在SHELXE公司通过加入自动蛋白主链追踪。这很好地说明了该结构是否已被求解,并使可解释图能够从较差的起始阶段获得。自动跟踪算法从可能的七个残存的位置开始α-螺旋和常见三肽。在这些片段在两个方向上延伸之后,使用各种标准来决定是接受还是拒绝得到的poly-Ala迹线。非晶体学对称性(NCS)适用于追踪碎片,而非密度。进一步的特点是使用“no-go”图来防止痕迹通过重原子或对称元素,并使用拼接技术来组合部分重叠的痕迹的最佳部分(包括NCS生成的痕迹)。

1.简介

大分子的实验阶段化通常需要标记原子的存在,例如天然蛋白质中的金属原子或硫、通过浸泡引入的重金属或卤化物,或通过使用合适的表达系统将蛋氨酸替换为硒蛋氨酸而引入的硒。在程序套件中SHELXC公司/D类/E类(谢尔德里克,2008年[Sheldrick,G.M.(2008),《水晶学报》,A64112-122。])为了快速、可靠地获得可解释的电子密度图,而不是找到最准确的相位,已尽一切努力将实验相位减少到其绝对值。这需要进行一些严格的简化,例如假设只存在一种类型的标记原子,尽管实际上混合元素很少会导致问题。然而,这种方法的优点是可以生成健壮、快速、简单的程序,这些程序非常适合合并到图形用户界面和自动化管道中。这些程序仅限于通过MAD(多波长反常色散)、SAD(单波长反常频散)、SIR(单一同晶替换)、SIRAS(SAD和SIR组合)和RIP(基于辐射引起的结构变化的相位调整)方法进行的实验相位调整。程序SHELXC公司提供输入数据的统计分析,估计标记原子结构因子如果A类以及相移α并为其他两个程序设置文件。SHELXD公司(Usón和Sheldrick,1999年[Usón,I.&Sheldrick,G.M.(1999),《当代手术结构生物学》,第9期,第643-648页。]; 谢尔德里克等。2001年[Sheldrick,G.M.,Hauptman,H.A.,Weeks,C.M.,Miller,M.&Usón,I.(2001)。《高分子晶体学国际表格》,第F卷,由E.Arnold&M.Rossmann编辑,第333-345页。多德雷赫特:Kluwer学术出版社。]; Schneider&Sheldrick,2002年【Schneider,T.R.和Sheldrick,G.M.(2002),《水晶学报》D581772-1779。】)用于求解子结构(定位标记原子)和SHELXE公司(谢尔德里克,2002年[Sheldrick,G.M.(2002).Z.Kristallogr.217,644-650.])通过密度修改提供迭代相位改善。

如果可以定位标记原子的位置,则可以使用它们来计算参考相位φA类,标记原子的相位下部结构。获得相位的第一近似值φT型高分子的相移α添加到这些参考阶段。α根据观察到的异常和/或色散强度差异进行估算,如下所示,

[\varphi_{\rm T}=\varphi_{\rmA}+\alpha.\eqno(1)]

使用这些近似相位计算的电子密度图φT型和观察到的结构因素如果T型可能很难或不可能解释。对于SAD分阶段来说尤其如此,其中α限制为90°(反射时小时k个明显强于反射−小时, −k个, −)或270°(反之亦然);当异常差异较大时,这些估计更可靠。在SAD定相中,与中心对称投影相对应的反射没有起始相位。然而,在有利的情况下,从这些阶段开始密度调整,反复修改密度,使其看起来更像大分子的预期密度,可以产生可解释的图谱。

Peter Main、Kevin Cowtan和Tom Terwilliger提出了许多复杂的密度调整方案,并将其纳入广泛使用的项目中,例如糖尿病(Cowtan&Main,1998年【Cowtan,K.&Main,P.(1998),《结晶学报》D54,487-493。】)和决心(特威利格,2000年【Terwilliger,T.C.(2000),《水晶学报》,D56,965-972。】). 霍普和加斯曼(Hoppe&Gassmann,1968)可能首次成功地将密度修正应用于小分子的高分辨率数据【Hoppe,W.&Gassmann,J.(1968),《结晶学报》,B24,97-107。】). 大分子密度修饰的有效概念包括NCS(非晶体对称)平均(Main,1967)【Main,P.(1967),《水晶学报》,第23期,第50-54期。】; 布里科涅,1976年[Bricogne,G.(1976)《晶体学报》A32832-847.]; Kleywegt&Read,1997年【Kleywegt,G.J.和Read,R.J.(1997),《结构》,第5期,1557-1569页。】),溶剂压平(Wang,1985[王,B.-C.(1985)。《酶学方法》,115,90-112。]),直方图匹配(Zhang&Main,1990[张,K.Y.J.&Main,P.(1990),《晶体学报》A46,41-46。]),溶剂翻转(亚伯拉罕,1997【Abrahams,J.P.(1997),《水晶学报》,D53,371-376。】)和统计方法(Terwilliger,2000[Tewilliger,T.C.(2000),《晶体学报》,D561965-972页。], 2003b条【Terwilliger,T.C.(2003b),《结晶学报》D591688-1701。】; 考坦,2000年[考坦(Cowtan,K.)(2000),《水晶学报》D56,1612-1621.]). 本文提出了另一种方法,即通量球法(Sheldrick,2002[Sheldrick,G.M.(2002).Z.Kristallogr.217,644-650.]),将通过使用main-chain跟踪对其进行迭代进行扩展。

2.讨论

2.1. 实验相位信息

卡勒(1980)【Karle,J.(1980),《国际量子化学杂志》,《量子生物》,第7期,第357-367页。】)和亨德里克森等。(1985[Hendrickson,W.A.、Smith,J.L.和Sheriff,S.(1985)。《酶学方法》。115,41-55。])代数分析表明,仅给定一种反常散射原子,MAD实验中的衍射强度由下式给出

[|F_{\pm}|^{2}=|F__{\rm T}|^}2}+a|F_}\rm a}|^{2}+b|F_\rm T}||F_{\rm a}|\cos\alpha\pm c|F{\rmT}|| F_{\fm a}|\sin\alpha,\eqno(2)]

其中±符号的“+”部分表示反射小时,k个,以及反射−的“−”部分小时, −k个, −.常数,b条c(c)是复散射因子的函数(f)+(f)′ +如果“”表示存在的元素:对于每个波长,它们是不同的,但对于特定波长,在给定分辨率下的所有反射,它们是相同的。如果A类结构系数仅针对标记原子,忽略来自(f)'和(f)'',和如果T型是总数结构系数对于大分子,包括标记原子,但忽略来自(f)'和(f)′′. 对于两个或更多波长,(2)[链接]表示一个过度确定的方程组,该方程组可以求解以获得|如果A类|, |如果T型|和α对于每个反射。|如果A类|然后可以使用这些值来求解下部结构,从中φA类可以计算。

对于单波长(SAD)实验,三个未知数只有两个方程(一个方程用于|如果+|2一个用于|如果负极|2). 如果我们假设反常散射相对于总散射、本征结构因子而言较小|如果T型|通过以下公式得到了很好的近似值|如果T型| ≃ (|如果+| + |如果负极|)/2. 的减法|如果负极|来自|如果+|在(2)中[链接]并取代|如果T型|给予

[|F_{+}|-|F_{-}|\simeq c|F_{\rm A}|\sin\alpha.\eqno(3)]

令人惊讶的是,这些系数可以用来代替|如果A类|以定位下部结构按双空间直接法(谢尔德里克等。2001年[Sheldrick,G.M.,Hauptman,H.A.,Weeks,C.M.,Miller,M.&Usón,I.(2001)。《高分子晶体学国际表格》,第F卷,由E.Arnold&M.Rossmann编辑,第333-345页。多德雷赫特:Kluwer学术出版社。])使用程序,如SHELXD公司最初是为从头算小分子结构的解决方案。对这种幸运状况的解释是直接法只在每个分辨率壳中使用最强的反射,而这些反射往往是带有罪恶的反射α接近+1或−1,对应于估计值α值分别为90°或270°。尽管只使用了最大的异常差异,但由于标记原子位置的数量较少,因此标记原子位置数据与参数的比率仍然相对较高。对于SIR定相,类似的分析得出

[|F_{\rm导数}|-|F_}\rm原生}|\simeq b|F_{\rm A}|\cos\alpha,\eqno(4)]

给出可用于替代的系数|如果A类|定位重原子并估计α同晶差异最大的反射值为0°和180°。对于SIRAS,(3)[链接]和(4)[链接]可以结合起来给出无偏估计|如果A类|和α估计范围为0–360°。实际上,这些估计值将不如MAD实验中的估计值准确,因为原生晶体和衍生晶体不会完全同晶。放大问题SHELXC公司/D类/E类通常通过使用标准化结构因子来避免(E类值),但在RIP相位调整的情况下,通常需要进一步手动调整(Nanao等。, 2005【Nanao,M.H.、Sheldrick,G.M.和Ravelli,R.B.G.(2005),《结晶学报》,D611227-1237。】).

2.2.下部结构解决方案

亲属|如果A类|(MAD或SIRAS)|如果A类α|(SAD)或|如果A类余弦α|(SIR和RIP)计算使用SHELXC公司转化为标准化结构因子(E类值)在双空间直接方法子结构求解程序中SHELXD公司.SHELXC公司输出(i)文件*.hkl(香港)包含小时,k个,、强度和σ(强度)用于密度调整,也可能用于以后精炼具有SHELXL公司(谢尔德里克,2008年[Sheldrick,G.M.(2008),《水晶学报》,A64112-122。]),(ii)文件*_fa.hkl公司包含小时k个,如果A类,σ(如果A类)和相移α供使用SHELXD公司对于下部结构解决方案和依据SHELXE公司用于计算密度修改的起始阶段和(iii)文件*_fa.ins(fa.ins)包含用于运行的晶体数据和指令SHELXD公司. Theα仅需要估算SHELXE公司.SHELXD公司写一个*_fa.res(传真)中的文件SHELX公司最佳格式下部结构解决方案,然后由读取SHELXE公司.

使用Patterson种子通常更有效(Schneider&Sheldrick,2002【Schneider,T.R.和Sheldrick,G.M.(2002),《水晶学报》D581772-1779。】)而不是在SHELXD公司 下部结构解决方案,但高对称立方空间群除外,在该空间群中,大量Patterson向量会使Patterson种子效率低下。通过考虑Patterson函数作为两个原子之间具有固定矢量距离的潜在双原子搜索碎片;这些向量可以平移,但不能旋转。在每次试验开始时,从Patterson峰列表中伪随机选择一个向量,以支持较高的峰。中的大量随机位置单位电池测试产生的双原子碎片;极性空间组的默认数字是9999,非极性空间的默认数字为9999。基于两个原子及其所有对称等价物,给出最佳Patterson叠加最小函数的两原子碎片的位置用作种子。该程序确保每条轨迹都从与Patterson一致的不同种子开始。然后使用这两个原子及其对称等价物生成一个全对称Patterson叠加最小函数;对其进行峰值搜索以获得用于启动双空间循环的进一步重原子位置。按照Nordman(1966)的建议,这些最小函数是所有矢量30%最弱Patterson密度的总和【Nordman,C.E.(1966),《美国晶体学家协会Trans.Am.Crystallogr.Assoc.2》,第29-38页。】).

关键决策是必须将数据截断到的分辨率下部结构解决方案;通常,这取决于可以观察到显著异常差异的分辨率(Schneider&Sheldrick,2002【Schneider,T.R.和Sheldrick,G.M.(2002),《水晶学报》D581772-1779。】). 在困难的情况下,每种溶液可能需要多达10000次试验,将二硫化物与“超硫”峰相匹配在硫-SAD定相(Debreczeni等。, 2003[Debreczeni,J.E..,Girmann,B.,Zeeck,A.,Krätzner,R.&Sheldrick,G.M.(2003),《结晶学报》D59,2125-2132。]). 这个相关系数(CC)观测值和计算值之间E类值通常可以明确地确定正确的解决方案,CC值(弱)、相关系数基于反射波未用于双空间回收,也是一个很好的检查。它就像一个免费的R(右)值,但不是很独立,因为所有数据都在占用率中使用精致。考虑到占用率、位移参数的可能变化(B类值)和不同类型标记原子的存在,已证明有助于改进最后两个双空间循环中的占用率。最后一个真实现场和第一个噪声峰值之间的精确占用率急剧下降也是一个良好解决方案的有用测试,但不能用于卤化物浸泡,因为通常会发现连续的占用范围。

2.3。通量球算法

密度修正SHELXE公司不使用溶剂展平(需要生成溶剂掩模)或直方图匹配(需要参考直方图,例如来自具有相同溶剂含量和分辨率的相关结构)。相反,影响范围算法(Sheldrick,2002)[Sheldrick,G.M.(2002).Z.Kristallogr.217,644-650.])用于指示地图中每个单独的体素(体积元素)与真实原子位置对应的可能性。

差异对于地图中的每个体素,计算半径为2.42Ω的球面上的密度。使用球形表面而不是球形体积是为了节省时间和添加少量化学信息(2.42º是蛋白质和DNA中典型的1,3距离)。给出了体素对应真实原子位置的概率指示。低的体素被翻转了(ρ′ = −ργ,其中γ通常设置为1.0)。对于高像素,ρ被替换为[ρ4/(ν2σ2(ρ) +ρ2)]1/2[带有ν通常为0.5,其中σ2(ρ)是密度的方差ρ如果为正值,则在整个单元格上],如果为负值,则乘以零。这与中央对手方清算所4程序橡子(姚明,2002[姚,J.-X.(2002),《水晶学报》D581941-1947。])但它对所有体素应用相同的过程。对于中间值使用两种处理的适当加权混合物。相位复合的经验加权方案用于对抗模型偏差。同样可能的是下部结构将拥有正确或错误的手。中所有体素的方差非对称单元个别差异的,程序输出为“对比度”,可以很好地指示哪个标记原子对映体是正确的;对于正确的选择来说,它几乎总是更高,尤其是经过5-10次密度修改循环之后。然而,成功的链追踪(如下所述)可能是正确标记原子的更好指示对映体。两者对比度的明显差异下部结构对映体很好地表明结构已被解决。然而,如果标记原子子结构是中心对称的,例如当三斜空间群中有两个唯一的重原子或单斜空间群有一个唯一的重原子时,两者都是下部结构对映体应该给出相似的对比值,并且两者都会导致正确的结构。

改善实验测量反射相位的另一种简单有效的算法是将数据和相位外推到比实际可获得的分辨率更高的分辨率(自由午餐算法;FLA;Caliandro等。, 2005【Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.&Siliqi,D.(2005),《结晶学报》D61,556-565。】; 嘉兴等。, 2005[Jia-xing,Y.,Woolfson,M.M.,Wilson,K.S.&Dodson,E.J.(2005),《结晶学报》D61,1465-1475。]); 这也已在中实现SHELXE公司(乌森等。, 2007[Usón,I.,Stevenson,C.E.M.,Lawson,D.M.和Sheldrick,G.M.(2007),《水晶学报》,D63,1069-1074。]). 当测量数据的分辨率达到2.0º或更高时,该算法是有效的,并且可以改善5°到30°之间测量反射的平均相位误差。

2.4. 自动跟踪

一种相对快速的迭代自动跟踪算法已被纳入到SHELXE公司它主要是为了在起步阶段很差的地图中获得立足点,例如平均相位误差大于60°。跟踪过程如下。

  • (i) 寻找潜力α-密度中的螺旋线,并尝试在两端延伸它们。然后找到其他潜在的三肽,并尝试以相同的方式在两端延伸它们。

  • (ii)根据需要整理并拼接迹线,进行任何必要的对称操作。

  • (iii)使用跟踪残差来估计相位,并使用σA类重量(Read,1986[Read,R.J.(1986),《结晶学报》,A42140-149。])然后重新启动密度修改。这个精炼第页,共页B类每个残留物的值提供了进一步的机会来抑制错误跟踪的残留物。

2.4.1. 正在搜索α-螺旋和其他三肽

链跟踪是通过查找七个剩余来启动的α-螺旋或三种最常见的三肽(Pavelcik&Pavelcikova,2007【帕维尔西克·F·和帕维尔西科娃·P(2007),《结晶学报》,D63,1162-1168。】)通过加权和计算密度(f)(ρ修正密度的′)ρ'在原子位置以及由于与所讨论碎片的空间位阻碰撞而预期没有密度的点(“空穴”)。权重设置为原子序数,但C除外β(甘氨酸不存在)重量设置为4,“空穴”的重量设置为−2。在进行此计算之前,对密度进行修改,以便ρ′ =ρ1/2对于ρ≥0且ρ′ = −|ρ|1/2对于ρ< 0. 该随机搜索的起始位置使用密度峰值进行播种,将峰值放置在距离O原子约0.25º的C=O键上。这样的模板搜索是由Kleywegt&Jones(1997)首创的【Kleywegt,G.J.&Jones,T.A.(1997),《结晶学报》D53,179-185。】)使用程序埃森斯如图1所示[链接],搜索对于α-螺旋比三肽的螺旋更大,因为涉及的原子数更多,也因为几何变化更小。

[图1]
图1
搜索结果()七个残留物α-螺旋线和(b条)普通三肽,使用通过SHELXE公司GerE(Ducros)2.75ºMAD试验数据的密度修正等。2001年【Ducros,V.M.,Lewis,R.J.,Verma,C.S.,Dodson,E.J.,Leonard,G.,Turkenburg,J.P.,Murshudov,G.N.,Wilkinson,A.J.&Brannigan,J.A.(2001),《分子生物学杂志》306,759-771.】; PDB代码第一节).Δ定义为到真实原子位置的平均距离;在计算平均值之前,将大于2.5°的距离替换为2.5°;(f)(ρ')在文本中定义。
2.4.2. 延长两端的链条

链延伸算法在当前添加的残留物之前寻找两个残留物,并使用单纯形算法来找到与原子中心以及链中“孔”处密度的最佳匹配。链扩展的每个步骤中使用的目标函数与初始片段搜索的目标函数类似。仅扭转角φψ和N-Cα-C角允许变化,但后者被限制为接近其标准值。15启动φ/ψ每种肽都使用配对,以提供人口稠密的拉玛钱德兰区域的良好样本。一次添加一个残差,但算法会提前查看两个残差来决定哪一个是最佳路线。在接受之前,对每个完成的痕迹的质量进行独立评估决心(特威利格,2003年【Terwilliger,T.C.(2003a),《结晶学报》,D59,38-44。】)和海盗(Cowtan,2006年【Cowtan,K.(2006),《水晶学报》,D621002-1011。】)单纯形算法用于海盗在跟踪和文本(罗摩语等。, 2006[Remo,T.D.,Sachettini,J.C.和Ioerger,T.R.(2006)。晶体学报D62,1401-1406。])搜索侧链。中使用的算法的重要功能SHELXE公司是生成一个“no-go映射”,它定义了不应进行跟踪的区域,例如由于对称元素或现有原子,以及晶体对称性。轨迹不限于预定义的体积,拼接算法考虑了对称等价物。链追踪通常从部分正确的三肽开始,其中三肽中的N端或C端肽事实上与侧链对接。这种链可以通过以下事实来识别:它们只能向一个方向延伸。

2.4.3. 链条验收标准

以下标准被合并为接受跟踪链的单个优点数字。

  • (i) 修正密度ρ'应在原子位置处较高,在哑原子位置处较低。

  • (ii)链必须足够长(一般至少七个氨基酸);链条越长,重量越大。

  • (iii)可以容忍一些Ramachandran异常值,例如对于甘氨酸,但一般来说φψ角对应位于拉马钱德兰图中人口稠密的区域。

  • (iv)应有明确的二级结构( φ/ψ对于连续的残基,配对应该趋于相似)。

  • (v) 平均而言,从N到N→H方向(到氢键受体),应存在显著的正密度2.9Ω。这考虑到了蛋白质中绝大多数主链NH基团参与与氧或其他负电原子的氢键的事实(图2[链接]).

[图2]
图2
由于大多数主链酰胺N-H基团都参与氢键,通过将N-H矢量从N原子外推到2.9º得出的某一点的密度可以指示酰胺的位置是否正确。
2.4.4. 拼接

如果两条记录道合并或交叉,则在最近的接触点将它们都切成两条,并且最佳的N端子部分与最佳的C端子部分相结合(图3[链接]). 虽然这项技术是由于在处理no-go映射中的对称性时出现编程错误而发现的,但它在提高映射的整体质量方面非常有效,因此重新定义了no-go-映射,以允许不同的轨迹重叠,但不允许轨迹与对称元素,标记原子或标记自身(这可能会导致跟踪循环)。如果三个Cα原子重叠,链在三个C的最合适基团的中间原子处拼接α原子;如果没有三个原子组成的紧密配合的群(例如因为一条链的延伸不够远),也考虑重叠的原子对或单个原子。重叠原子的平均值是使用权重来平滑从一个链到下一个链的过渡,但在拼接点周围仍可能出现主链几何的一些小变形。

[图3]
图3
两条几乎重合的链条在主干部分的拼接。首先,找出链条最适合的位置,将每条链条切成两部分(P(P)R(右)S公司). 更好的P(P)(根据文本中定义的优点数字)拼接到更好的R(右)S公司并且丢弃另外两个部分链。
2.4.5. 纤维结合蛋白测试结构

此结构(PBD代码2cg6号机组)最初由Rudiño-Piñera解决等。(2007[Rudiño-Piñera,E.,Ravelli,R.B.,Sheldrick,G.M.,Nanao,M.H.,Korostelev,V.V.,Werner,J.M.、Schwarz-Linek,U.,Potts,J.R.&Garman,E.F.(2007),《分子生物学杂志》,第368期,第833-844页。])主要通过利用辐射损伤(UV-RIP方法)。当时,尽管ESRF的BM14上收集了1.77º波长的高度冗余数据集,但相比长波硫-SAD定相,这提供了更好的相位。这些数据扩展到2.0Ω分辨率,短波(0.98Ω)数据扩展到1.5Ω分辨率,但溶剂含量较低(34%)。随后的分析表明(与硫-SAD一样),以下程序对于获得良好的硫亚结构至关重要。

  • (i) 找到截断数据的正确点(2.5º)。

  • (ii)使用二硫重溶程序(DSUL inSHELXD公司)在每个双空间循环的峰值搜索中定位S-S单元。

  • (iii)不要急躁!尽管CC值可接受[例如快速获得33.5%的CC和16.2%的CC(弱)(试验编号35),运行数千次试验可以获得更好的峰高分布的更好的解决方案[最佳CC为49.9%,CC(弱的)为30.4%]。

该结构说明了自动跟踪从有噪声的硫-SAD图开始的能力(图4[链接]). 回收部分(但相当准确)的痕迹可以得到更好的相位和几乎完整的结构。硫SAD定相和SHELXE公司仅密度修正就得到了53.4°的平均相位误差和地图相关系数相对于0.63的精细结构。使用FLA,这些可以分别提高到42.9°和0.70,或者使用迭代自动跟踪,分别提高到32.3°和0.84。然而,FLA与自动追踪相结合仅略优于单独的自动追踪(31.6°和0.86°)。

[图4]
图4
密度修改周期的模型质量改进,然后从硫-SAD相开始自动追踪纤维连接蛋白测试结构。颜色表示C的偏差α原子的真实位置。每行代表从N-末端到C-末端的蛋白质。在第一个周期中,41%的患者被追踪到Cα1.0º内的原子、0.5º内33%的原子和4%的原子被错误追踪。三个周期后,数据分别为94%、87%和0%。
2.4.6. GerE测试结构

此结构(Ducros等。2001年[Ducros,V.M.、Lewis,R.J.、Verma,C.S.、Dodson,E.J.、Leonard,G.、Turkenburg,J.P.、Murshudov,G.N.、Wilkinson,A.J.和Brannigan,J.A.(2001)。分子生物学杂志306,759-771。]; PDB代码第一节)说明了SHELXC公司/D类/E类四波长硒代蛋氨酸MAD实验,数据分辨率为2.75º。图5[链接]显示70%的Cα当仅使用2.75º数据时,原子在其真实位置的1.0º范围内,42%在0.5º范围之内,3%不正确(误差超过2.0º)。如果将相扩展到2.15º天然(硫)数据,则1.0º内的数字为78%,0.5º内为69%,但6%不正确。

[图5]
图5
使用与图4相同的约定自动跟踪GerE测试结构的质量()仅使用2.75ºMAD数据和(b条)在相扩展到2.15º原始数据之后。

图6[链接]显示了PDB条目中结构上GerE结构的部分主链跟踪的叠加第一节.

[图6]
图6
C类α来自MAD阶段2.7º时GerE的SHELXE公司(蓝色)与PDB条目相比第一节(红色)。一些端子残留物缺失,但其他方面配合良好。此图是使用PyMOL公司(德拉诺,2002[DeLano,W.L.(2002)。PyMOL分子查看器。DeLano Scientific,San Carlos,USA。https://www.pymol.org。]).
2.4.7. 自动跟踪中包含NCS

NCS通常用于在确定NCS算符和分子包络之后平均各种等效单体的密度。SHELXE公司这些算符来自重原子位置,但随后将其应用于迹线,然后按照上述方法进行拼接,始终保留最适合密度的部分迹线。因此,定义明确的单体有助于追踪定义不明确的区域,例如具有更高的B类值,但从定义不明确的NCS拷贝中转换的片段将取代已被很好跟踪的片段的风险很小。这适用于2.75ºGerE测试结构中的六倍NCS(每个单体有两个标记原子)(图7[链接]),但该方法仍需要一些微调。它使用起来快速简单,与SHELXE公司哲学。

[图7]
图7
GerE测试结构的第一个循环后的自动赛车质量(PDB代码第一节)仅使用2.75ÅMAD数据和与图4中相同的约定。4无NCS和有NCS。无NCS 55%的Cα原子的真实位置在1.0°以内,35%在0.5°以内,6%被错误追踪。当考虑到六倍的NCS时,数字分别为74%、49%和3%。

3.结论

链跟踪算法和拼接标准以及决定接受哪些链的标准是部分主链跟踪成功的关键,有助于理解质量较差的地图。这些算法设计用于可靠地拟合部分结构,而不是生成完整的主干道,尽管这在一些情况下已经实现,包括一个以前未解决的237残余结构(Ni等。, 2009【Ni,S.,Sheldrick,G.M.,Benning,M.&Kennedy,M.A.(2009),《结构生物学杂志》165,47-52。】). 将自动跟踪引入的想法SHELXE公司是为了在嘈杂的地图中找到立足点,给出部分主色调和更好的地图。重要的是,当晶体仍在光束线上时,这一操作的执行速度足够快。对于2.66 GHz PCSHELXC公司/D类/E类GerE结构(包括一个自动跟踪循环和NCS)的时间不到3分钟。当结果足够令人信服时,可以移除晶体,然后用更复杂的程序完成结构解,例如ARP协议/弯曲(佩拉基斯等。, 1999【Perrakis,A.、Morris,R.和Lamzin,V.S.(1999),《自然结构生物学》,第6期,第458-463页。】),决心(特威利格,2000年【Terwilliger,T.C.(2000),《水晶学报》,D56,965-972。】),海盗(Cowtan,2006年【Cowtan,K.(2006),《水晶学报》,D621002-1011。】)和库特(Emsley和Cowtan,2004年【Emsley,P.&Cowtan,K.(2004),《水晶学报》,D60,2126-2132。】).

的新自动跟踪版本的测试版SHELXE公司目前由大约80名志愿者进行,可通过电子邮件向作者索取。这个beta测试版本还可以通过迭代密度修改和自动跟踪来改进阶段,从以下步骤获得的片段开始分子置换因此可用于MRSAD阶段化(Panjikar等。, 2009【Panjikar,S.,Parthasarathy,V.,Lamzin,V.S.,Weiss,M.S.&Tucker,P.A.(2009),《结晶学报》D65,1089-1097。】). 它已用于汽车里克肖服务器位于https://www.embl-hamburg.de/Auto-Rickshaw网站/(潘基卡尔等。, 2005【Panjikar,S.,Parthasarathy,V.,Lamzin,V.S.,Weiss,M.S.&Tucker,P.A.(2005),《结晶学报》D61,449-457。】). 这是有意的,正如已经发生的情况一样SHELXC公司SHELXD公司,它将在完全调试后作为开放源代码分发。这个SHELX公司对于不依赖于其他程序或库的通用操作系统,程序也可以作为独立二进制文件使用。

致谢

作者感谢化学工业基金会的支持,以及Isabel Usón、Tim Grüne、Stephan Rühl、Elspeth Garman、Tobias Beck、Christian Grosse、Andrea Thorn和许多人SHELX公司用户寻求帮助和鼓励。

工具书类

第一次引用Abrahams,J.P.(1997)。《水晶学报》。D类53, 371–376. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Bricogne,G.(1976年)。《水晶学报》。A类32, 832–847. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Caliandro,R.、Carrozzini,B.、Cascarano,G.L.、De Caro,L.、Giacovazzo,C.和Siliqi,D.(2005)。《水晶学报》。D类61, 556–565. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Cowtan,K.(2000年)。《水晶学报》。D类56, 1612–1621. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Cowtan,K.(2006)。《水晶学报》。D类62, 1002–1011. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Cowtan,K.&Main,P.(1998年)。《水晶学报》。D类54, 487–493. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用德布雷切尼,J.É。,Girmann,B.、Zeeck,A.、Krätzner,R.和Sheldrick,G.M.(2003年)。《水晶学报》。D类59, 2125–2132. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用DeLano,W.L.(2002)。PyMOL分子查看器。DeLano Scientific,美国圣卡洛斯。https://www.pymol.org谷歌学者
第一次引用Ducros,V.M.、Lewis,R.J.、Verma,C.S.、Dodson,E.J.、Leonard,G.、Turkenburg,J.P.、Murshudov,G.N.、Wilkinson,A.J.和Brannigan,J.A.(2001)。分子生物学杂志。 306, 759–771. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Emsley,P.&Cowtan,K.(2004)。《水晶学报》。D类60, 2126–2132. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Hendrickson,W.A.、Smith,J.L.和Sheriff,S.(1985年)。方法酶制剂。 115, 41–55. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Hoppe,W.和Gassmann,J.(1968)。《水晶学报》。B类24, 97–107. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Jia-xing,Y.、Woolfson,M.M.、Wilson,K.S.和Dodson,E.J.(2005)。《水晶学报》。D类61, 1465–1475. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Karle,J.(1980)。国际量子化学杂志。量子生物学。交响乐团。 7,第357页至第367页中国科学院 谷歌学者
第一次引用Kleywegt,G.J.&Jones,T.A.(1997年)。《水晶学报》。D类53, 179–185. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Kleywegt,G.J.和Read,R.J.(1997)。结构,5, 1557–1569. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Main,P.(1967)。《水晶学报》。 23, 50–54. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Nanao,M.H.、Sheldrick,G.M.和Ravelli,R.B.G.(2005)。《水晶学报》。D类61, 1227–1237. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Ni,S.、Sheldrick,G.M.、Benning,M.和Kennedy,M.A.(2009年)。J.结构。生物。 165, 47–52. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Nordman,C.E.(1966年)。事务处理。Am.Crystallogr公司。协会。 2, 29–38. 中国科学院 谷歌学者
第一次引用Panjikar,S.、Parthasarathy,V.、Lamzin,V.S.、Weiss,M.S.和Tucker,P.A.(2005)。《水晶学报》。D类61, 449–457. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Panjikar,S.、Parthasarathy,V.、Lamzin,V.S.、Weiss,M.S.和Tucker,P.A.(2009年)。《水晶学报》。D类65, 1089–1097. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Pavelcik,F.和Pavelcikova,P.(2007)。《水晶学报》。D类63, 1162–1168. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Perrakis,A.、Morris,R.和Lamzin,V.S.(1999年)。自然结构。生物。 6, 458–463. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Read,R.J.(1986年)。《水晶学报》。A类42, 140–149. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Romo,T.D.、Sacchettini,J.C.和Ioerger,T.R.(2006)。《水晶学报》。D类62, 1401–1406. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Rudiño-Piñera,E.、Ravelli,R.B.、Sheldrick,G.M.、Nanao,M.H.、Korostelev,V.V.、Werner,J.M.,Schwarz-Linek,U.、Potts,J.R.和Garman,E.F.(2007)。分子生物学杂志。 368, 833–844. 科学网 公共医学 谷歌学者
第一次引用Schneider,T.R.和Sheldrick,G.M.(2002)。《水晶学报》。D类58, 1772–1779. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.(2002)。Z.克里斯塔洛格。 217, 644–650. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Sheldrick,G.M.(2008)。《水晶学报》。A类64,112–122科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.、Hauptman,H.A.、Weeks,C.M.、Miller,M.和Usón,I.(2001)。国际高分子晶体学表,体积。如果由E.Arnold&M.Rossmann编辑,第333–345页。多德雷赫特:Kluwer学术出版社。 谷歌学者
第一次引用特威利格,T.C.(2000)。《水晶学报》。D类56, 965–972. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Terwilliger,T.C.(2003)).《水晶学报》。D类59, 38–44. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Terwilliger,T.C.(2003)b条).《水晶学报》。D类59, 1688–1701. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Usón,I.和Sheldrick,G.M.(1999)。货币。操作。结构。生物。 9, 643–648. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Usón,I.、Stevenson,C.E.M.、Lawson,D.M.和Sheldrick,G.M.(2007年)。《水晶学报》。D类63, 1069–1074. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Wang,B.-C.(1985)。方法酶制剂。 115, 90–112. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用姚,J.-X.(2002)。《水晶学报》。D类58, 1941–1947. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Zhang,K.Y.J.和Main,P.(1990)。《水晶学报》。A类46, 41–46. 交叉参考 中国科学院 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标结构
生物学
国际标准编号:2059-7983