研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标结构
生物学
编号:2059-7983

我们离自动化还有多远晶体结构通过分子置换技术解决问题?

十字标记_颜色_方形_文本.svg

意大利佩鲁贾大学,佩鲁贾广场大学,费西卡地质研究所,邮编:I-06123b条意大利巴里岛I-70126 Amendola 122/O,CNR Cristallografia学院
*通信电子邮件:carmelo.giacovazzo@ic.cnr.it

(2019年7月15日收到; 2019年11月15日接受)

虽然分子置换技术的成功需要解决六维问题,但这通常又分为两个三维问题。REMO(远程遥控)09是采用这种方法的项目之一。根据一种新的概率方法对其进行了重新审视,该方法能够直接推导条件分布函数,而无需经过联合概率分布的先前计算。条件分布考虑了各种类型的先验信息:在旋转步骤中,先验信息可能涉及一个无定向模型分子,也可能与一个或多个定位模型分子一起。由此得到的公式用于导出优值图,以识别旋转步骤中的正确方向和平移步骤中的准确位置。这个新版本的REMO(远程遥控)09被用作管道的起点,该管道在其第一步中延伸和细化分子置换相,并在其第二步中创建最终的电子密度图,该图由驾驶室是一个蛋白质和DNA/RNA结构的自动建模程序。

1.符号和缩写

EDM:电子密度修正。

C类= (R(右),T型),使用= 1, …,:目标结构的对称操作符。R(右)是旋转部分,T型是翻译部分是对称运算符的数量。

t吨,t吨第页:目标和模型结构的不对称单元中的原子数。

N个=公吨,N个第页=公吨第页:分别为目标结构和模型结构单元中的原子数。为了简单起见,假设所有原子都处于一般位置。通常情况下N个第页N个,但也可能是这样N个第页>N个.

(f)j:的原子散射因子jth原子(包括热因子)。

F类第页=[\textstyle\sum_{s=1}^m\sum_{j=1}^{t_p}f_j\exp[2\pii{\bfh}({\bf R}_s{\bf-R}_{pj}+{\bv t}_s)]]= |F类第页|经验(φ第页):结构系数模型结构。第页第页是模型结构定向和定位良好时的原子位置。

F类=[\textstyle\sum_{s=1}^m\sum_{j=1}^{t}f_j\exp[2\pii{\bfh}({\bf R}_s{\bv R}_j+{\bf-t}_s)]]= |F类|经验(φ):结构系数目标结构的。第页j是真实的原子位置。假设目标分子和模型分子是同晶的,因此第页j=第页第页+Δ第页j.Δ第页j是原子位置之间的不匹配第页j在目标和相应的第页第页在模型结构中。

E类=A类+国际银行=R(右)经验(φ),E类第页=A类第页+国际银行第页=R(右)第页经验(φ第页):归一化结构因子F类F类第页分别是。

[\Sigma_N=\textstyle\sum_{j=1}^N f_j^2],[\Sigma_{N_p}=\textstyle\sum_{j=1}^{N_p}f_j^2]:给定罪恶时的散射功率θ/λ分别针对目标和模型结构。

D类=〈cos(2π小时Δ第页j)〉. 平均值是按分辨率外壳计算的。

σA类=[D(\Sigma_{N_p}/\Sigma-N)^{1/2}].σA类是模型和目标结构之间相关性的统计估计值(Srinivasan,1966[Srinivasan,R.(1966),《结晶学报》,第20期,第143-144页。])。理想的σA类=0,对于不相关模型和σA类对于相同的模型和目标结构,=1。

SI:模型分子和目标分子之间的序列一致性。

AMB:自动化模型构建。

2.简介

分子置换(MR)技术(Rossmann&Blow,1962)【Rossmann,M.G.和Blow,D.M.(1962),《水晶学报》,第15期,第24-31页。】; 罗斯曼,1972年[Rossmann,M.G.(1972),《分子替换方法》,纽约:Gordon&Breach出版社。], 1990[Rossmann,M.G.(1990),《结晶学报》A46,73-82。])目的是使用已知的搜索分子对未知目标结构进行相位调整。要解决的问题具有六维性质,因为它意味着搜索分子的正确方向和位置。一些MR程序在六维空间中面临这种情况[例如EPMR公司(基辛格等。, 1999[基辛格·C·R、盖尔哈尔·D·K·和福格尔·D·B(1999),《水晶学报》D55,484-491.]),SOMoRe公司(贾姆罗格等。, 2003[Jamrog,D.C.,Zhang,Y.&Phillips,G.N.Jr(2003),《结晶学报》,D59,304-314.])和黑桃皇后(Glykos&Kokkindis,2000年【Glykos,N.M.和Kokkindis,M.(2000),《结晶学报》D56,169-174。】); 另请参阅Fujinaga&Read(1987【Fujinaga,M.&Read,R.J.(1987),《应用结晶杂志》,第20期,第517-521页。】)],即使通常可以避免穷尽的六维搜索。一般来说,这样的程序非常耗时。更常见的做法是将MR过程分为两个三维步骤:旋转和平移步骤。最受欢迎的相关节目有X-PLOR公司/中枢神经系统(布伦格,1992年【Brünger,A.T.(1992).X-PLOR v.3.1。X射线晶体成像和核磁共振系统。纽黑文:耶鲁大学出版社。]),AMoRe公司(纳瓦扎,1994年[Navaza,J.(1994),《结晶学报》,A50,157-163。]),野兽(阅读,1999[Read,R.J.(1999),《水晶学报》,D551759-1764。]),MOLREP公司(Vagin&Teplyakov,2010年【Vagin,A.和Teplyakov,A.(2010),《水晶学报》,D66,22-25。】)和相位器(麦考伊等。2007年【McCoy,A.J.,Grosse-Kunstleve,R.W.,Adams,P.D.,Winn,M.D.,Storoni,L.C.&Read,R.J.(2007),《应用结晶杂志》,第40期,第658-674页。】)。野兽相位器,应用了基于极大似然的条件分布(见Read&McCoy,2016[Read,R.J.&McCoy,A.J.(2016),《水晶学报》第72期,第375-387页。], 2018[Read,R.J.&McCoy,A.J.(2018),《水晶学报》第74期,第98-105页。]; 麦考伊等。, 2018【McCoy,A.J.,Oeffner,R.D.,Millán,C.,Sammito,M.,Usón,I.&Read,R.J.(2018),《结晶学报》第74期,第279-289页。】)。各种技术的综合评述(更新至2007年)已收集在2008年1月发行结晶学报D辑近年来,更多的研究致力于研究可用的实验结构与目标仅在远处同源的情况;例如,请参阅Simpkin等。(2018【Simpkin,A.J.,Simkovic,F.,Thomas,J.M.H.,Savko,M.,Lebedev,A.,Uski,V.,Ballard,C.,Wojdyr,M.、Wu,R.,Sanishvili,R.、Xu,Y.,Lisa,M.-N.,Buschiazo,A.,Shepard,W.,Rigden,D.J.&Keegan,R.M.(2018),《结晶学报》第74期,第595-605页。】),里格登等。(2018[Rigden,D.J.,Thomas,J.M.H.,Simkovic,F.,Simpkin,A.,Winn,M.D.,Mayans,O.&Keegan,R.M.(2018),《结晶学报》第74期,第183-193页。]),普洛普等。(2014[普洛普,K.,梅德尔,K.、萨米托,M.、迪特里克,B.、谢尔德里克,G.M.、波尔,E.&乌森,I.(2014),《水晶学报》第70期,1743-1757页。]),Millán等。(2015【Millán,C.,Sammito,M.&Usón,I.(2015年),IUCrJ,295-105。】)和Cabellero等。(2018【Caballero,I.,Sammito,M.,Millán,C.,Lebedev,A.,Soler,n.&Usón,I.(2018),《水晶学报》第74期,194-204年。】).

2009年,MR项目(REMO(远程遥控)09; 卡利安德罗等。, 2009【Caliandro,R.、Carrozzini,B.、Cascarano,G.L.、Giacovazzo,C.、Mazzone,A.和Siliqi,D.(2009),《结晶学报》,A65,512-527。】)提出了一种基于联合概率分布方法的概率方法。联合分布是在没有或在各种先决条件下得出的。例如,在旋转步骤中,当其他单体先前定向或定位时,或者当此类信息不可用时,通过计算优值来确定单体的正确旋转。还推导了平移步骤的联合分布:单体的位置给定其自身的方向或其他单体的方向和/或位置。

布拉等。(2017【Burla,M.C.,Cascarano,G.L.,Giacovazzo,C.&Polidori,G.(2017),《水晶学报》第73期,第877-888页。】),从开始REMO(远程遥控)09阶段,检查了协同结合主流的阶段重新定义管道的效率精炼技术(特别是糖尿病; 考坦,2001年【Cowtan,K.(2001),《水晶学报》D571435-1444。】)使用流外技术[特别是,免费午餐(卡利安德罗等。, 2005【Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.&Siliqi,D.(2005a),《结晶学报》D61,556-565。】,b条【Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.&Siliqi,D.(2005b),《结晶学报》D61,1080-1087。】),低密度傅里叶变换(Giacovazo&Siliqi,1997【Giacovazo,C.和Siliqi,D.(1997),《水晶学报》A53,789-798。】),维拉差异(布雷、卡利安德罗等。, 2010【Burla,M.C.,Caliandro,R.,Giacovazzo,C.&Polidori,G.(2010),《水晶学报》A66,347-361。】; 贾科瓦佐·布拉等。, 2010[Bulla,M.C.,Giacovazzo,C.和Polidori,G.(2010)。《应用晶体》杂志,第43825-836页。]),幻影衍生物(贾科瓦佐,2015年b条[Giacovazzo,C.(2015b).晶体学报A71,483-512.]; 卡罗齐尼等。,2016年【Carrozzini,B.、Cascarano,G.L.和Giacovazzo,C.(2016),《水晶学报》第72期,第551-557页。】)和相驱动模型精炼(贾科瓦佐,2015年【Giacovazzo,C.(2015a),《水晶学报》A71,36-45。】)]。为了简单起见,我们将此模量称为协同作用.布拉等。(2017【Burla,M.C.,Cascarano,G.L.,Giacovazzo,C.&Polidori,G.(2017),《水晶学报》第73期,第877-888页。】)自动提交由协同作用AMB程序驾驶室(布拉等。, 2017【Burla,M.C.,Cascarano,G.L.,Giacovazzo,C.&Polidori,G.(2017),《水晶学报》第73期,第877-888页。】):它适用海盗(Cowtan,2006年【Cowtan,K.(2006),《水晶学报》,D621002-1011。】)以循环的方式。

在最近的一篇论文中(Giacovazzo,2019)【Giacovazzo,C.(2019),《水晶学报》A75,142-157。】)对联合概率分布函数的标准方法进行了修订和更新。特别地,通过条件分布直接估计两相、三相和四相不变量,而不经过相关联合概率分布的先前计算。由此获得的概率公式通常与通过联合概率分布函数的标准研究建立的相应公式不一致。其中一些方法直接适用于MR,而另一些方法也适合于MR。由此获得的公式构成了REMO(远程遥控)09中使用。

本文根据我们中的一个人在2019年英国诺丁汉CCP4研究周末上的演讲,我们展示了应用修改后的REMO(远程遥控)09协同作用驾驶室管道连接到大量蛋白质和核酸结构。为了获得这些结果,我们扩展了驾驶室通过利用鹦鹉螺(Cowtan,2014年【Cowtan,K.(2014).国际货币联盟期刊,1387-392.】)周期性。其目的有两个:检查修改版本中使用的新概率公式的效率REMO(远程遥控)09和检查基于MR相位的现代晶体学管道距离自动晶体结构高分子溶液。

3.的一般特征REMO(远程遥控)09

各种指令允许REMO(远程遥控)09用户选择合适的方法来解决大分子结构。在本节中,我们将总结所有应用程序中使用的默认方法。

  • (i) 观测和计算数据通过Wilson技术进行缩放,该技术也用于计算归一化结构因子(观测和计算的〈R(右)2〉按壳缩放为统一壳)。自动修改模型原子的各向同性热因子,使其与目标结构的整体温度因子兼容。

  • (ii)读取目标和模型序列。

  • (iii)根据Lattman角对定向空间进行采样(Lattman,1972【Lattman,E.E.(1972),《结晶学报》,B281065-1068。】)角度步长取决于活动反射的分辨率(最大角度步长为5°)。定向空间的范围仅限于旋转组的非对称区域(Hirshfeld,1968[赫什菲尔德·F·L(1968),《结晶学报》,A24,301-311。])。对于要定位的第一个单体,在转换步骤中只探索柴郡细胞。

  • (iv)在沿着每个轴的翻译搜索中使用的地图网格对于蛋白质是数据分辨率的1/3,对于核酸是数据分辨率的1/4。

  • (v) 自动选择用于计算旋转和平移搜索中使用的优值数字的活动反射。低分辨率反射(高达7除非SI小于0.5,否则应从计算中删除。最高可接受分辨率为2.5Å. 由于在旋转步骤中获得的先验信息增加,此限制对于平移步骤略有延长。SI通常对核酸,主要是因为核酸螺旋可以采用相似的构象,即使它们的序列完全不同。

  • (vi)根据轮换优值(RFOM;见第4节[链接])。好的解决方案通常分散在有序解决方案列表的顶部:因此,为了加快计算速度,只有一个子集被提交到转换步骤,在转换步骤中使用了新的优值TFOM(参见第5节[链接]).

4.只有一个单体位于非对称单元目标结构的

通过将模型分子定位在1立方单位单元格。根据拉宾诺维奇的说法等。(1998【拉比诺维奇·D、罗森伯格·H和沙克德·Z(1998),《结晶学报》D54,1336-1342。】),模型的结构因子只计算一次:通过旋转观测数据获得对观测数据的拟合倒易点阵相对于模型晶格。

为获取模型分子的正确方向而设计的优值是RFOM,即所观察到的R(右)2及其期望值〈R(右)2〉根据Giacovazo(2019)描述的概率方法计算【Giacovazzo,C.(2019),《水晶学报》A75,142-157。】)。对于正确的车型定位和〈,预计RFOM将最大化R(右)2〉是R(右)2根据模型立体化学的先验信息:

[\langle R^2\rangle=1+\sigma_{\rm A}^2\left(\textstyle\sum\limits_{s=1}^m|E_{ps}|^2-1\right),\eqno(1)]

哪里

[E_{ps}={{F{ps}}\在{(\Sigma_{N_p})^{1/2}}={\\textstyle\sum\limits_{j=1}^{t_p}F_j\exp[2\pii{\bfh}({\bf R}_s{\bfr}_{pj}+{\bf-t}_s)]}在{。\等式(2)]

F类是对计算模型的贡献结构系数产生于非对称单元模型结构,以及E类是它的归一化形式(相对于模型结构的散射功率,包括对称等效分子)E类通过FFT计算并存储放大的立方单元中模型结构的电子密度。

(1)[链接]具有适当的渐近行为:什么时候σA类=0然后R(右)2〉=1,因为在没有事先信息的情况下σA类=1,则为R(右)2〉 =[\textstyle\sum_{s=1}^m|E_{ps}|^2].身份〈R(右)2〉 =R(右)2只能发生在非对称单元仅包含一个与目标分子具有高相似性指数的单体。

尽管它具有良好的渐近性质,(1)的使用[链接]没有导致非常有效的RFOM。原因可能在于σA类2:根据Carrozzini等。(2013【Carrozzini,B.,Cascarano,G.L.,Giacovazzo,C.&Mazzone,A.(2013),《水晶学报》A69,408-412。】)它与|F类|2和计算出的平方结构因素。在旋转步骤中σA类2通常都很小,主要是因为[\textstyle\sum_{s=1}^m|E_{ps}|^2]不是计算的平方的主要分量结构因素。因此,在某些分辨率外壳中σA类<0(反相关情况),而σA类2(1)中使用的参数[链接]保持积极。这表明我们消除了σA类来自(1)[链接]并将其简化为

[\langle R^2\rangle=\textstyle\sum\limits_{s=1}^m|E_{ps}|^2.\eqno(3)]

在平移步骤中,选择对应于RFOM最高值的200个取向:如果目标分子中存在多个单体,则该数目增加到300,如果SI<0.4,则增加到400。

5.当只有一个单体位于非对称单元目标结构的

根据第4节选择的方向[链接]被逐一提交到翻译搜索。这是通过使用Crowther&Blow(1967)的T2功能来实现的【Crowther,R.A.&Blow,D.M.(1967),《水晶学报》,第23期,第544-548页。】)以原田修改的形式等。(1981【Harada,Y.,Lifchitz,A.,Berthou,J.&Jolles,P.(1981),《结晶学报》A37,398-406。】)纳瓦扎(1994)[Navaza,J.(1994),《结晶学报》,A50,157-163。])。根据Vagin&Teplyakov(1997)的建议,T2通过FFT实现【Vagin,A.和Teplyakov,A.(1997),《应用结晶杂志》,第30期,1022-1025页。】).

只有落在柴郡的山峰单位电池已考虑。对于相同的方向,可以找到更多的峰值:为了节省计算时间,每个方向只保存最大的五个平移。通过优值TFOM选择最佳平移,与观测振幅之间的相关系数相一致|F类|和结构系数振幅|F类第页|按每次翻译计算。

一些进一步的控制修改了上述简单方法。

  • (i) 将TFOM值最大的转换提交给SIMPLEX方法(Rowan,1990[Rowan,T.(1990)。数值算法的函数稳定性分析。博士论文。美国德克萨斯大学奥斯汀分校计算机科学系。]),一种与下坡法相关的无约束优化技术(Nelder&Mead,1965【Nelder,J.A.&Mead,R.(1965),《计算杂志》第7期,第308-313页。】),这里应用于六维参数空间(三个用于旋转,三个用于平移)。该方法应用于选定的五个(或十个)核酸类或者,如果SI<0.4)具有TFOM最大值的旋转平移:然后将其提交给REFMAC公司优化周期。其目的是优化模型并更好地识别最佳解决方案。最后的优点是

    [{\rm TFOM}=1-R_{\rm cryst}}=\ max,]

    哪里

    [R_{1{\rm晶体}}={{\textstyle\sum\big||F|-k\langle|F|\rangle\big|1}\over{\texttyle\sum|F|}}。]

  • (ii)进行碰撞试验(在对称等效分子之间),当发现非均匀碰撞时,将转储上面计算的TFOM值。倾卸系数设置为

    [{\rm转储}=1.0-(0.8{\rm-cl}),]

    其中cl是C的百分比α原子处于碰撞状态。倾倒系数不能小于0.2。

价值最高的轮转翻译自动提交给协同作用步骤和到驾驶室程序。

6.当多个单体位于非对称单元目标分子的

在标准中REMO(远程遥控)09程序,当几个具有相同立体化学的单体出现在非对称单元,使用以下三步方法。

  • (i) 搜索第一个单体的方向时,会选择许多方向。

  • (ii)一旦定位了第一单体,在步骤(i)中选择的最可能的取向中搜索第二单体的取向。

  • (iii)在定位第二个单体后,重复步骤(i)和(ii),直到定位所有单体。

非对称单元较大(超过三个)或当目标由若干具有不同立体化学的组分组成时,每个组分在不对称单元中贡献一部分散射功率。

这是PDB条目的情况1拉特2若第一个测试结构显示了两条分别含有71和74个残基的链,以及两条相同的核酸链,每条都含有19个残基核苷酸。带有PDB代码的结构2若由三条蛋白质链组成:两条含有212和214个残基,第三条只有129个残基。该模型与第三靶蛋白链相吻合。

然后我们决定修改REMO(远程遥控)09方法如下:当第一个分子已经定位时,必须使用从头开始旋转步骤和,在这种情况下,使用不同的模型。

在这两种方法中,用于识别正确旋转的优值必须设计为考虑到一个或多个单体先前已经定向和定位。这增加了寻找新单体时的信噪比。

让我们考虑最简单的情况:第一个单体已经定位,我们想定位第二个单体(不认为其他单体位于不对称单元中)。附录A类[链接]表明RFOM可能仍然是观察到的R(右)2及其期望值〈R(右)2〉,但现在

[\langle R^2\rangle=\sigma_{\rm A}1}^2(R_{p1}^2-1)+1+\sigma_{\rma A}2}^2\left(\textstyle\sum\limits_{s=1}^m|E_{sp2}|^2-1\right),\eqno(4)]

哪里R(右)2第页1是标准化模型的平方振幅结构系数对应于已定位的第一模型单体(相对于包含第一单体及其对称等效物的结构的散射功率进行归一化),以及σA1类σA类对应于对的值(R(右),R(右)第页1)。(4)右侧的最后一项[链接]对应于第二模型单体的贡献(我们正在寻找的正确方向)。σA2类σA类对应于对的值(R(右), 〈R(右)221/2),其中

[\langle R_2^2\rangle=1+\sigma_{\rm A}2}^2\left(\textstyle\sum\limits_{s=1}^m|E_{sp2}|^2-1\right).\eqno(5)]

让我们简要讨论一下(4)的预期行为[链接].

用于推导(4)的概率方法[链接]排除了一个混合非零项的存在,该非零项与已定位的单体和搜索方向的单体有关。因此,这两种贡献只是相加的。

当第一单体取向不良和/或位置不良时σ2A1类预计接近于零。σ2A2类总是期望值很小(至少对于非-1个空间组;见第4节[链接]),预计RFOM较小。当第一个单体位置良好,第二个单体取向良好时,RFOM预计会更大。然而σ2A1类σ2A2类这两者都接近统一是意料之外的,因为Σ第页1/ΣN个Σ第页2/ΣN个两种接近统一的价值观是不允许的。第4节[链接]和5[链接]建议避免使用σA类值,因此R(右)2〉减少到

[\langle R^2\rangle=R_{p1}^2+\textstyle\sum\limits_{s=1}^m|E_{sp2}|^2。\方程式(6)]

最终RFOM是相关系数在被观察者之间R(右)2及其期望值R(右)2〉. 现在让我们概括一下(6)[链接]在这种情况下非对称单元在第一和第二单体已经定向和定位的条件下。表达式(6)[链接]仍然有效;我们只需要改变符号的含义。R(右)第页1将表示对应于第一和第二单体的模型结构的归一化振幅(包括对称等价物),[\textstyle\sum_{s=1}^m|E_{sp2}|^2-1]将表示搜索正确方向的单体所产生的贡献。

这个过程现在是循环的:同样的方程可以应用于任何数量的单体。

7.当多个单体位于非对称单元目标分子的

首先假设一个单体已经定向并定位(F类1是其通用结构因子),并且第二个单体已定向。如果我们使用Crowther T2函数来定位平移步骤中的第二个单体,那么预期的平方结构系数由两个单体构成的结构及其在正确位置的对称等价物为

[\langle|F|^{2}\rangle=|F{1}|^{2]+|F{2}|^}2}]

由于〈|F类|2〉不包括混合术语F类1F类2.

更好的方法是使用涉及F类而不是它的正方形。第页第页是的当前位置向量j第二种模型单体的第th个原子:结构系数由第二单体构成的结构及其在正确位置上的对称等价物

[\eqalignno{F_2&=\textstyle\sum\limits_{s=1}^m\sum\limits_{j=1}^{t_{p2}}F_j\exp\{2\pii{\bf-h}[{\bf R}_s=1}^{t_{p2}}F_j\exp[2\pii{\bfh}({\bf R}_s{\bfr}_{pj}+{\bf-t}_s)]\cr&=\textstyle\sum\limits{s=1}^ma_sF{2ps},&(7)}]

哪里Δ第页是合适的未知位置偏移,

[a_s=\exp(2\pii{\bfh}{\bf R}_s\Delta{\bf-R})]

[F{2ps}=\textstyle\sum\limits_{j=1}^{t_{p2}}F_j\exp[2\pii{\bfh}({\bf R}_s{\bf-R}_{pj}+{\bv t}_s)]]

是当前模型结构因子的组成部分。

算法非常简单。F类2在第二单体的初始位置,对每个主动反射只计算一次。然后第二个单体被移动Δ第页的所有网格点上非对称单元,哪里F类2通过(7)计算[链接]并用F类1以获得

[\langle F\rangle=F_{1}+F_{2}。]

正确的网格位置预计为TFOM,即观测振幅之间的相关因子|F类|和结构系数振幅〈F类是一个最大值。

该方法简单地推广到定位n个当第一个n个−1单体已被很好地定向和定位。

8.应用

我们应用了自动修改的管道REMO(远程遥控)09协同作用驾驶室扩展测试结构、蛋白质和核酸。我们使用了80个蛋白质和38个核酸测试结构,其PDB代码如表1所示[链接]和2[链接]。Burla以前使用过前34种蛋白质测试结构等。(2017【Burla,M.C.,Cascarano,G.L.,Giacovazzo,C.&Polidori,G.(2017),《水晶学报》第73期,第877-888页。】)检查协同作用 精炼标准工艺REMO(远程遥控)09阶段。蛋白质25-34属于DiMaio研究的13种结构的集合等。(2011[DiMaio,F.,Terwilliger,T.C.,Read,R.J.,Wlodawer,A.,Oberdorfer,G.,Wagner,U.,Valkov,E.,Alon,A.,Fass,D.,Axelrod,H.L.,Das,D.,Vorobiev,S.M.,Iwa,H..,Pokkuluri,P.R.&Baker,D.(2011)。《自然》(伦敦),473,540-543。])模型和目标结构之间的SI小于0.30。其余46个蛋白质测试结构的实验数据和模型已由斯克里普斯研究所威尔逊实验室结构基因组联合中心存放在PDB中:它们用于验证我们在大量测试结构上的管道效率(其中大多数最初不是MR解决的)。

表1
80个蛋白质测试结构通过其PDB代码识别

他们的实验数据被提交给REMO(远程遥控)09 +协同作用+驾驶室管道。对于每个测试结构,我们显示了MRP°,平均相位误差/加权平均相位误差,以度为单位REMO(远程遥控)09; SYN°,在协同作用步骤;和MA,C数的比值α0.6以内的原子Å与公布位置的距离/C的数量α不对称单元中的原子'。虚线表示MR程序没有找到有用的roto翻译。

PDB公司 物料需求计划 同步 妈妈   PDB公司 物料需求计划 同步 妈妈   PDB公司 物料需求计划 同步 妈妈
第1天5 55/42 15 99   第2页,共53页 58/43 30 95   3个6 79/67 58 90
1亿 74/60 28 97   2年 54/40 33 89   3zyt公司 88/89 90 1
2立方英尺 57/43 32 98   2个月 77/64 36 96   第6季度 80/66 56 99
1吨 58/44 35 94   2英尺8米 62/47 41 96   3对5 73/62 43 73
2a46年 75/58 31 96   1年 74/60 37 95   4平方英尺 第76页,共61页 60 90
1个lys 第45页,共36页 28 96   第2页,共84页 56/42 35 92   3吨x8 75/58 47 5
1个 78/66 46 100   1立方厘米 74/64 39 98   3个8 90/90 89 1
2otb个 55/43 34 99   1个月 64/50 39 98   3npg 79/67 76
1千夸瓦 59/46 33 99   2a4k个 59/47 32 91   4e2吨 74/60 27 96
2星 54/42 39 96   2b5亿 52/40 33 88   3年 76/61 66 9
1拉特 68/55 53 46   1年 55/43 31 89          
1个8a 69/54 39 98   2若 第62页,共53页 70 4          
 
1个vkf 第90页,共89页   3平方米 72/57 47 94   4毫鲁 76/67 73 23
1个vki 73/56 37 100   3个月 56/41 31 96   4盎司 68/54 47 96
1伏2 90/90   3平方米 89/90   4盎司 49/36 29 98
1伏7 71/57 42 95   3年 77/68 50 96   4q1伏 72/60 44 98
1个vlc 69/55 31 95   3obi公司 89/90   第4季度34 70/53 36 99
第二个星期五 55/43 38 97   3盎司2 74/62 37 93   第4季度53 62/49 32 95
2x7小时 67/59 51 98   第3页94 61/46 38 97   4q6k个 64/48 34 99
第3页第49页 75/61 52 97   3不明飞行物 77/65 38 94   第4季度9a 81/76 89 1
3加仑 75/61 40 96   3美元5 66/52 37 98   4季度 66/51 35 88
3小时9分 56/43 34 97   第四版 54/40 39 89   4qni公司 74/63 42 82
3小时9分 63/48 50 87   4参考2 69/52 38 96   4r0公里 53/39 33 99
3千赫 90/90   4盎司 68/50 28 98   4伏 第74页,共61页 69 8
第三章23 73/56 41 94   4伏 89/88   4周 69/54 39 94
31倍 69/55 33 99   4GB 55/38 36 85   4岁 71/56 68 99
3米7安 76/61 41 98   4克/分 65/50 32 98          
300万桶 75/59 43 97   4个 69/50 30 98          

表2
38个核酸测试结构通过其PDB代码识别

他们的实验数据被提交给REMO(远程遥控)09 +协同作用+驾驶室管道。对于每个测试结构,我们给出了MRP°,平均相位误差/加权平均相位误差,以度为单位REMO(远程遥控)09; SYN°,以度为单位的平均相位误差协同作用步骤;和MA,P原子的残基数之比在1.3以内?与公布位置的距离/不对称单元中的残基数'。虚线表示MR程序没有找到有用的旋转翻译。

PDB公司 物料需求计划 同步 妈妈   PDB公司 物料需求计划 同步 妈妈   PDB公司 物料需求计划 同步度 妈妈
1iha公司 38/27 41 88   4英寸 37/27 28 87   5升4升 68/54 41 83
1996年第1季度 90/90   4克 54/41 51 25   5lj4号机组 42/30 32 77
1z7英尺 39/27 35 100   4毫秒5 70/57 60 78   5毫伏 65/55 29 95
2a0便士 34/24 32 100   4对3 88/88   5分5秒 28/18 26 100
2b1天 83/81 82 2   4平方公里 53/37 48 2   5新西兰元6 42/29 27 93
第2页,共0页 49/36 33 95   4个zym 77/68 80 0   5t4瓦 第46页,共33页 27 100
2个pn4 47/34 42 61   5立方厘米2 89/90   5加仑 72/56 34 86
3ce5公司 60/51 48 57   5毫米 75/63 63 59   5个ua3 84/80 85 0
3d2伏 77/69 60 27   5fj0型 89/88   5克3 90/90
3eil公司 62/47 47 79   5i4类 51/40 38 64   5uz6型 73/64 34 99
第3节第0节 68/51 34 100   5小时 70/51 39 13   5泽格 88/89
3n4零 36/26 35 73   2004年6月5日 50/33 27 95   6天4 56/42 43 90
3托克 第60页,共45页 49 14   5千伏 65/50 51 94          

38个核酸结构是从PDB中选择的:我们下载了观察到的衍射数据单位电池,空间群对称性、已发表的序列和MR模型。其中20个是DNA,其余18个是RNA片段。有关所有测试结构的其他信息,请参见补充表S1S2系列.

对于所有测试结构,都使用了相同的小指令集(与我们的默认集一致),如表3所示[链接]用于PDB条目1个月.

表3
默认使用的指令REMO(远程遥控)09/协同作用/驾驶室管道

该示例涉及PDB编码的蛋白质1个月.

%驾驶室海盗
%结构1xyg
%1xyg上的job分子置换试验
%数据
mtz 1xyg.mtz(毫米波)
标签H K L F SIGF
序列1xyg.seq
%远程
碎片1vkn.pdb
%结束

实验结果见表1[链接]和2[链接]对于每个测试结构,PDB是PDB代码,MRP°是REMO(远程遥控)09步,SYN°是协同作用步骤。对于蛋白质,MA是C数的比率α0.6以内的原子距离公布位置的距离/C数α原子在不对称单元根据获得驾驶室。对于核酸,MA是P原子在1.3以内的残基数之比距离公布位置的距离/不对称单元按照驾驶室解释。我们将假设良好的模型是通过驾驶室当MA足够大时:根据经验法则,我们将假定当MA>0.5时自动找到了一个好的解决方案。

对于蛋白质,我们观察如下。

  • (i) 在80种测试蛋白中,有64种找到了良好的溶液。这16次故障主要是由于REMO(远程遥控)09.事实上,对于16次故障中的14次,MRP°≥74°:在这些条件下协同作用通常无法大幅降低平均相位误差,从而允许驾驶室才能成功。REMO(远程遥控)09 DiMaio结构经常出现故障,因为由于SI值极低,MR步骤通常以较大的模型偏差结束协同作用无法更正。

  • (ii)当MRP°不是非常大时,协同作用大大降低了平均相位误差。在15种情况下,73-80°区间内的MRP°值被分解为小于43°的值,从而允许驾驶室才能成功。

  • (iii)驾驶室因为蛋白质是非常有效的。MA值通常接近100(成功解释地图的明确信号),即使在其中9种情况下协同作用以SYN°>50°结束。

全景不同于核酸。这种行为在一定程度上是预期的,因为DNA/RNA结构的特殊立体化学。它们在主链中有大量的可旋转键(六个,而蛋白质有两个);因此,低分辨率下的构象通常是模糊的(Keating&Pyle,2012【Keating,K.S.&Pyle,A.M.(2012),《水晶学报》,D68,985-995。】; 默里等。, 2003[Murray,L.J.、Arendall,W.B.、Richardson,D.C.和Richardsson,J.S.(2003)。美国国家科学院院刊,10013904-13909。])。我们的实验结果可以总结如下:在38个核酸结构中,只有24个是常规解决的。14次故障中的10次可归因于REMO(远程遥控)2009年(对于这些MRP°≥77°)。其余五次故障中有四次是由于驾驶室失败(驾驶室无法解释PDB条目的电子密度图3托克,4克,四轮驱动5小时,其中SYN°≤51°)。

协同作用再次有效(大于70°的MPR°值被分解为小于40°的值)。

上述实验测试表明REMO(远程遥控)09和驾驶室DNA/RNA是管道的最薄弱点。相反地,协同作用,应用于两者核酸类和蛋白质,以及驾驶室对蛋白质尤其有效。管道中存在的弱点不允许我们积极回答本文标题中的问题。有三种简单的方法可以改善现状。

  • (i) 修改REMO(远程遥控)09以提供更现代、更高效的版本。

  • (ii)更换REMO(远程遥控)09,有一个更高效的程序。

  • (iii)修改驾驶室DNA/RNA结构的算法。

修改(一)和(三)需要补充工作,而且可能需要很长时间,这超出了本文件的目的。对于建议(ii),最简单的选择是替换REMO(远程遥控)09通过一个流行且有文档记录的MR工具,检查通过我们的管道获得的结果所建议的结论是否通过包含更好的更新MR程序而得到证实。MOLREP公司(Vagin&Teplyakov,2010年【Vagin,A.和Teplyakov,A.(2010),《水晶学报》,D66,22-25。】)是我们的选择:由于它的简单使用和可能的自动化,它也是首选。我们的违约MOLREP公司过程对应于以下指令(例如下面显示的PDB条目1个月):

[\eqalign{\tt{molrep\,\,}&{\tt{\hbox{-}}f 1xyg.mtz\,\

专家用户可能会提供更好的默认设置;因此MOLREP公司当然要比我们选择的天真默认值大得多。然而,通过管道获得的实验结果MOLREP公司协同作用驾驶室,如表4所示[链接]和5[链接],有助于更好地回答有关自动晶体结构通过MR解决方案。

表4
80个蛋白质测试结构通过它们的PDB编码进行识别

他们的实验数据被提交给MOLREP公司+协同作用+驾驶室管道。对于每个测试结构,我们给出了MRP°,平均相位误差/加权平均相位误差,以度为单位MOLREP公司; SYN°,SYNERGY步骤结束时的平均相位误差;和MA,C数的比值α0.6以内的原子距离公布位置的距离/C数α不对称单元中的原子'。虚线表示MR程序没有找到有用的旋转翻译。

PDB公司 物料需求计划 同步 妈妈   PDB公司 物料需求计划 同步 妈妈   PDB公司 物料需求计划 同步 妈妈
第1天5 90/90   第2页,共53页 66/58 71 8   3个6 86/83 83 1
1亿 76/68 29 98   2年 56/46 31 94   3zyt公司 90/91
2立方英尺 57/44 32 98   2个月 70/62 33 97   第6季度 第83页,共79页 78 9
1吨 61/49 35 94   2英尺8米 65/55 37 99   3个5 89/89 89 1
2a46年 69/59 29 98   1伊萨 76/69 36 95   4平方英尺 83/79 81
1个lys 68/62 50 96   第2页,共84页 58/47 32 94   3吨x8
1个   1立方厘米 77/69 35 100   3o8秒 90/90
2otb个   1个月 63/53 35 94   3npg 89/89
1千夸瓦 62/52 32 98   2a4k个 62/53 30 93   4e2吨 79/72 31 96
2星 53/41 39 95   2b5亿 第52页,共41页 31 88   3年 78/70 66 19
1磅 89/89   1年 58/47 30 90          
1e8a 71/62 35 98   2若 67/60 69          
 
1个vkf 84/76 51 96   3平方米 82/73 49 93   4毫鲁 69/60 45 98
1个vki 81/73 35 100   3个月 52/40 31 97   4盎司 68/58 47 96
1伏2 77/68 42 97   3平方米 90/90   4盎司 52/42 29 99
1伏7 77/69 63 92   3年 83/79 76 14   4q1伏 72/64 44 97
1个vlc 67/56 47 71   3双 80/74 44 97   第4季度34 第77页,共67页 37 99
第二个星期五 第59/50页 38 97   3盎司2 79/72 37 94   第4季度53 64/55 33 96
2x7小时 49/40 38 98   第3页94 58/48 37 97   4季度6千 53/42 35 99
第3页第49页 63/51 45 96   3不明飞行物 78/71 39 91   第4季度9a 71/61 45 97
3加仑 74/67 42 97   3美元5 67/56 37 98   4季度 67/55 36 82
3小时9分 59/47 32 98   第四版 55/45 39 94   4qni公司 78/70 42 81
3小时9分 73/65 68 2   4参考2 73/63 38 98   4公里 44/34 30 99
3千赫 第77页,共69页 56 93   4盎司 79/67 27 98   4伏 78/70 67 32
第三章23 75/65 41 96   4英尺/秒 74/65 60 86   4转/分 第70页,共59页 39 93
31倍 74/64 34 99   4GB 57/43 37 89   4岁 71/61 70 89
3米7安 76/68 41 99   4克/分 65/52 32 98          
300万桶 77/69 43 95   4个 78/70 63 65          

表5
38个核酸测试结构通过其PDB代码识别

他们的实验数据被提交给MOLREP公司+协同作用+驾驶室管道。对于每个测试结构,我们给出了MRP°,平均相位误差/加权平均相位误差,以度为单位MOLREP公司; SYN°,SYNERGY步骤结束时的平均相位误差(度);和MA,P原子的残基数之比在1.3以内?与公布位置的距离/不对称单元中的残基数'。虚线表示MR程序没有找到有用的旋转翻译。

PDB公司 MRP° 同步 妈妈   PDB公司 物料需求计划 同步度 妈妈   PDB公司 物料需求计划 同步度 妈妈
1iha公司 71/61 28 94   4英寸 52/41 28 88   5l4° 74/64 37 86
1996年第1季度 90/89   4克 59/52 55 6   5lj4号机组 67/55 30 95
1z7英尺 49/36 27 100   4毫秒5 88/87   5毫伏 68/55 24 100
2a0便士 40/31 32 100   4对3 87/87   5分5秒 51/37 25 100
2b1天 87/86   4平方公里 88/89   5新西兰元6 44/34 25 88
第2页,共0页 61/52 25 100   4日 87/87   5t4瓦 第61/47页 27 91
2个pn4 第49页,共37页 39 64   5平方厘米 88/90   5吨/加仑 77/71 49 86
3ce5公司 72/68 58 57   5毫米 87/86   5个ua3 86/83
3d2伏 90/90   5fj0型   5个ux3 89/87
3eil公司 85/82 83 23   5i4类 67/63 38 82   5uz6型 72/62 65 93
第3节第0节 74/66 33 100   5小时 88/89   5泽格 88/89
3n4零 43/26 30 85   2004年6月5日 88/89   第6页 57/45 43 95
3托克 第67页,共54页 47 17   5千伏 第59/52页 54 91          

表4中的结果[链接]对于蛋白质,可以概括如下。

  • (i) 在80个测试结构中,有61个找到了解决方案。大多数是由于我们的非最优MOLREP公司默认选项。

  • (ii)效率协同作用驾驶室与描述的REMO(远程遥控)09协同作用驾驶室管道。

  • (iii)REMO(远程遥控)09和MOLREP公司有互补的行为。事实上,在80个蛋白质测试结构中,只有9个未被两条管道解决。

表5中的实验结果[链接]对于核酸结构,可以概括如下。

  • (i) 在38种核酸中,只有20种自动解决:18种失败中的16种可能是由于我们的违约有效性有限MOLREP公司程序(对于这些MRP°≥86°)和两到驾驶室(PDB条目3托克,其中SYN°=47°,以及4克,其中SYN°=55°);

  • (ii)38个核酸结构中的14个仍未被两条管道解决。

9.结论

这个相位问题因为小分子在实践中被认为是普遍解决的。本文的主要目的是检查如果使用磁共振技术,高分子是否也会出现类似的情况。我们使用了两条管线REMO(远程遥控)09协同作用驾驶室MOLREP公司协同作用驾驶室80个蛋白质结构和38个核酸结构。80个蛋白质结构中只有9个未被两条管道解决;大多数故障发生在SI极低(低于0.30)时。更好的模型的可用性不断增加,为REMO(远程遥控)09和MOLREP公司以及可能使用更高效的MR程序(例如 协同作用驾驶室可以使用相位器)建议自动晶体结构溶液中的蛋白质含量很高。核酸结构的情况不同:38个核酸结构中有14个仍未被两条管道解决。因此,需要进一步努力,以实现其自动化晶体结构解决方案:必要的改进包括MR程序(尤其是配体的处理,配体可能是结构中不可忽略的部分)和AMB部分。

附录A

关于第二单体的取向

我们将在本附录中处理的问题如下:如果第一个单体已经正确定向和定位,我们如何固定第二个单体的定向?为了回答这个问题,在下面的概率方法中,我们将明确考虑第二个单体的方向已经固定,而其位置未知的情况。我们将看到,由此得出的结论性公式可用于确定第二单体的取向。

t吨1t吨第页1分别为第一目标单体及其模型分子的非H原子数:为简单起见,我们假设t吨1t吨第页1.t吨2t吨第页2是第二个目标单体及其模型分子的当量。我们命令目标中的原子非对称单元所以它结构系数可以表示为

[\eqalignno{F=&\textstyle\sum\limits_{s=1}^m\sum\limits_{j=1}^{t_{p1}}F_j\exp\{2\pii{bfh}[{\bf R}_s({\bfr}_{pj}+\Delta{\bfr}_j)+{\bf-t}_s]\}\cr&+\textstyle\sum\limits{s=1{m\sum\ limits{j={t_{p1}}+1}^{t1}F_j\exp[2\pii{\bfh}({\bf R}_s{\bf-R}_j+{\bv t}_s)]\cr&+\textstyle\sum\limits_{s=1}^m\sum\limits_{j=t_1+1}^{t1+t{p2}}f_j\exp\{2\pii{\bfh}[{\bf R}_s h}({\bf R}_s{\bfr}_j+{\bf-t}_s)],&(8)}]

哪里t吨=t吨1+t吨2是目标中非H原子的数量非对称单元。在我们的概率方法中小时是固定的,而位置向量是基本随机变量。U型是将第二单体定位在正确位置所必需的整体自由平移向量,以及Δ第页j是将目标单体的原子位置与模型的相应位置相关联的局部变量。按顺序,(8)[链接]可以改写为

[F=F_1+F_{q1}+F_2+F_}q2}。]

原子对F类1通过局部位移矢量与第一单体模型分子的原子相关Δ第页j只有(第一个单体已经定位)。原子对F类2通过局部位移矢量与第二单体模型分子的原子相关Δ第页j并通过未知的整体平移向量U型(实际上,第二个单体还没有找到)。原子的坐标F类q个1F类q个2与模型分子的原子无关;它们可能被认为是无约束的未知变量。

我们现在计算|F类|2在给定上述先前信息的情况下,

[\eqalignno{\langle|F|^2\rangle=\&m\textstyle\sum\limits_{j=t_{p1}+1}^{t1}F_j^2+m\sum\limits_{j=t1+t_{p2}+1}^t F_j_2\cr&+\\biggr\langle\textstyle\sum\slimits_{s1,s2=1}^m\sum\ limits_a{i,j=1}^{t_p1}F.if_j\exp\{2\pii{\bfh}[{\bf R}_{s1}+\Delta{\bf r}_j)+{\bf-T}_{s1}-{\bf-T}_{s2}pi}-{\bfr}_{pj}+\Delta{\bfr}_i-\Delta}\bfr}_j)]\}\right\rangle。\cr&&(9)}]

如果出现以下情况,则可以更明确地写出上述方程式:=j和/或1个=强调了2点。我们有

[\eqaligno{\langle|F|^2\rangle=\;&m\textstyle\sum\limits_{j=t_{p1}+1}^{t1}F_j^2+m\sum\limits_{j=t1+t_{p2}+1}^t F_j_2+m\sum \limits{j=1}^{t_p1}}F_j ^2+m \sum\limits_{j=t1+1}^{t1+t{p2}}}F.j^ 2\cr&+D_1^2\textstyle\sum\limits_{s=1}^m\sum\limits_{i\nej=1}^{t_{p1}F_if_j\exp\{2\pii{\bf-h}[{\bf R}_s({\bf-R}_{pi}{\bfr}_{pj})]\}\cr&+D_1^2\textstyle\sum\limits_{s1\ne s2=1}^m\sum\limits_{j=1}^{t_{p1}}f_j^2\exp\{2\pi i{\bf h}[({\bf-r}_{s1}-{\bf-r}_{s2}){t}_{s2}]\}\cr&+D_1^2\textstyle\sum\limits_{s1\ne s2=1}^m\sum\limits\{i\ne j=1}^{t_{p1}}f_i f_j\exp[2\pi i{\bf h}({\bf-r}_{s1}{\bf-r}_{pi}{\bf R}_{s2}{\bv R}_{pj}+{\bf-T}_{s1}-{\bf-T}_{s}{pi}-{\bfr}{pj})]\},&(10)}]

哪里D类1D类2D类值(参见第1节[链接])分别计算单体1和2。现在让我们考虑一下这些关系(11)[链接], (12)[链接]和(14)[链接]如下所示。

[m\textstyle\sum\limits_{j=t_{p1}+1}^{t1}f_j^2+m\sum\limits_{j=t1+t_{p2}+1}^t f_j_2+m\sum \limits _{j=1}^{t{p1{}}f.j^2+m \sum\ limits_{j=t1+1}^{t_1+t{p2}fj^2=\Sigma_N,\eqno(11)]

[\eqaligno{|F_{p1}|^2&=m\textstyle\sum\limits_{j=1}^{t_{p1{}F_j^2\cr&\\,\,+\\textstyle\sum\sims_{s=1}^m\sum\limits_{i\ne j=1}^{t_p1}}F_i F_j\exp\{2\pii{\bfh}[{bf R}_s({bf R}_{pi}-{bfr}{pj})]\}\cr&\\,\,+\\textstyle\sum\limits_{s1\nes2=1}^m\sum\limits_{i=1}^{t_{p1}}F_j^2\exp\{2\pii{\bfh}[({\bf R}{s1}{\bf R}_{s2}}{pi}-{\bfR}{s2}{\bfr}{pj}+{\bf T}{s1}-{bf T{{s2})]\cr&&(12)}]

以便

[\eqalignno{\textstyle\sum\limits_{s=1}^m&\textstyle_sum\limiss_{i\ne j=1}^{t_{p1}}fi f_j\exp\{2\pi i{\bf h}[{\bf-R}_s({\bfr}_{pi}-{\bfr}_{pj}}^{t_{p1}}f_j^2\exp\{2\pii{\bfh}[({\bf R}{s1}-{\bf-R}{s2})\}\cr&+\textstyle\sum\limits_{s1\ne s2=1}^m\sum\limits_{i\ne j=1}^{t{p1}}fi f_j\exp[2\pi i{bf h}cr&=|f{p1}|^2-m\textstyle\sum\limits_{j=1}^{t{p1{}f_j^2&(13)}]

F类第页1结构系数对应于已经定位的模型分子构成的结构(及其对称等价物)。

[\textstyle\sum\limits_{s=1}^m\sum\limits_{i,j=t1+1}^{t1+t{p2}}f_if_j\exp[2\pii{\bfh}{\bf R}_s({\bf-R}{pi}-{\bfr}{pj})]=\sum\limits_{s=1}^m|f{sp2}|^2,\eqno(14)]

哪里

[F{sp2}=\textstyle\sum\limits_{j=t1+1}^{t1+t{p2}}F_if_j\exp(2\pii{\bfh}{\bf R}_s{\bfr}_{pj})]

是对结构系数第二单体的模型分子(定向但未定位)非对称单元。根据(14)[链接],我们有

[\eqalign{\sum\limits_{s=1}^m\sum\limits_{i\ne j=t1+1}^{t1+t{p2}}f_if_j\exp\{2\pi i{\bf h}[{\bf-R}_s({\bfr}_{pi}-{\bfr}_{pj})]\}\cr=\sum\limits{s=1{m|f{sp2}|^2-m\sum\ limits_{j=t1+1}^{t1+t{p2}}fj^2。\等式(15)}]

替换(11)[链接], (13)[链接]和(15)[链接]到(10)[链接]给予

[\eqalignno{\langle|F|^2\rangle&=\Sigma_N+D_1^2\left(|F_{p1}|^2-m\textstyle\sum\limits_{j=1}^{t_{p1{}}F_j^2\right)\cr&\\quad+\D_2^2\leaft}F_j^2\右)。&(16)}]

划分(16)的左侧和右侧[链接]通过ΣN个导致

[\eqalign{\langle R^2\rangle&=1+D_1^2\left({{|F_{p1}|^2}\ over{\Sigma_N}}{\Sigram_{p1\}}\ over{\ Sigma_{p1'}}-{\Siga_{p1}\ over-{\Simma_N}}\ right)\cr&\\quad+\D_2^2\leaft({textstyle\sum\limits=1}^m}{|F{sp2}|^2}\ over{\Sigma_N}}{{\Sigram_{p2}}\ over}\Sigma{p2}}}-{\Siga_{p2{}}\ ever{Sigma_N}}\ right),}]

从中

[\langle R^2\rangle=1+\sigma_{\rm A}1}^2(R_p^2-1)+\sigra_{\rma A}2}^2\left(\textstyle\sum\limits_{s=1}^m|E_{sp2}|^2-1\ right),\eqno(17)]

哪里

[\sigma_{{\rm A}1}^2=D_1^2{\ sigma_{p1}}\超过{\ sigma_N}}}\,\,\ sigma_{{\rm A}2}^2=D_2^2{\ sigma_{p2}{}}\超过{\ sigma_N}}。]

R(右)2相对于整个目标的散射功率进行归一化单位电池, R(右)2第页1相对于由定向和定位的分子(包括对称当量)构成的结构的散射功率进行归一化,并且|E类2|2相对于定向但未定位的模型分子(包括对称等价物)的散射功率进行归一化。

我们现在可以回到这个问题:当我们主要对一个单体位置良好的情况感兴趣,而我们正在寻找第二个单体的方向时,为什么我们要为一个单体位置良好而第二个单体取向良好的情况制定概率论?答案很简单。事实上,当我们不断旋转时互易空间并在两者之间寻找最佳匹配R(右)2和〈R(右)2我们希望找到第二单体定向良好的旋转。在这种情况下R(右)2〉将真正成为R(右)2根据(17)[链接],而对于所有其他方向,将不遵守此条件。因此,相关性将达到最大。

支持信息


致谢

我们感谢K.Cowtan和P.Bond为我们的MR测试提供了一套46种蛋白质测试结构,并进行了富有启发性的讨论。

工具书类

第一次引用Brünger,A.T.(1992)。X-PLOR公司v.3.1版。X射线晶体成像和核磁共振系统。纽黑文:耶鲁大学出版社。 谷歌学者
第一次引用Burla,M.C.、Caliandro,R.、Giacovazzo,C.和Polidori,G.(2010年)。阿克塔·克里斯特。A类66, 347–361. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Burla,M.C.、Cascarano,G.L.、Giacovazzo,C.和Polidori,G.(2017年)。阿克塔·克里斯特。D类73, 877–888. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Burla,M.C.、Giacovazzo,C.和Polidori,G.(2010年)。J.应用。克里斯特。 43, 825–836. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Caballero,I.、Sammito,M.、Millán,C.、Lebedev,A.、Soler,n.和Usón,I.(2018年)。阿克塔·克里斯特。D类74, 194–204. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Caliandro,R.、Carrozzini,B.、Cascarano,G.L.、De Caro,L.、Giacovazzo,C.和Siliqi,D.(2005)).阿克塔·克里斯特。D类61, 556–565. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Caliandro,R.、Carrozzini,B.、Cascarano,G.L.、De Caro,L.、Giacovazzo,C.和Siliqi,D.(2005)b条).阿克塔·克里斯特。D类61, 1080–1087. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Caliandro,R.、Carrozzini,B.、Cascarano,G.L.、Giacovazzo,C.、Mazzone,A.和Siliqi,D.(2009年)。阿克塔·克里斯特。A类65, 512–527. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Carrozzini,B.、Cascarano,G.L.和Giacovazzo,C.(2016)。阿克塔·克里斯特。D类72, 551–557. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Carrozzini,B.、Cascarano,G.L.、Giacovazzo,C.和Mazzone,A.(2013)。阿克塔·克里斯特。A类69, 408–412. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Cowtan,K.(2001)。阿克塔·克里斯特。D类57,1435-1444年科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Cowtan,K.(2006)。阿克塔·克里斯特。D类62,1002–1011科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Cowtan,K.(2014)。IUCrJ大学,1, 387–392. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者
第一次引用Crowther,R.A.&Blow,D.M.(1967年)。阿克塔·克里斯特。 23, 544–548. 交叉参考 IUCr日志 科学网 谷歌学者
第一次引用DiMaio,F.、Terwilliger,T.C.、Read,R.J.、Wlodawer,A.、Oberdorfer,G.、Wagner,U.、Valkov,E.、Alon,A.、Fass,D.、Axelrod,H.L.、Das,D.、Vorobiev,S.M.、Iwa,H.、Pokkuluri,P.R.和Baker,D.(2011年)。自然(伦敦),473, 540–543. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Fujinaga,M.和Read,R.J.(1987年)。J.应用。克里斯特。 20, 517–521. 交叉参考 科学网 IUCr日志 谷歌学者
第一次引用Giacovazzo,C.(2015年).阿克塔·克里斯特。A类71, 36–45. 交叉参考 IUCr日志 谷歌学者
第一次引用Giacovazzo,C.(2015年b条).阿克塔·克里斯特。A类71, 483–512. 交叉参考 IUCr日志 谷歌学者
第一次引用Giacovazzo,C.(2019年)。阿克塔·克里斯特。A类75, 142–157. 交叉参考 IUCr日志 谷歌学者
第一次引用Giacovazzo,C.和Siliqi,D.(1997年)。阿克塔·克里斯特。A类53, 789–798. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Glykos,N.M.和Kokkindis,M.(2000年)。阿克塔·克里斯特。D类56,第169–174页科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Harada,Y.、Lifchitz,A.、Berthou,J.和Jolles,P.(1981年)。阿克塔·克里斯特。A类37, 398–406. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Hirshfeld,F.L.(1968)。阿克塔·克里斯特。A类24, 301–311. 交叉参考 IUCr日志 科学网 谷歌学者
第一次引用Jamrog,D.C.、Zhang,Y.和Phillips,G.N.Jr(2003)。阿克塔·克里斯特。D类59, 304–314. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Keating,K.S.和Pyle,A.M.(2012年)。阿克塔·克里斯特。D类68, 985–995. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Kissinger,C.R.、Gehlhaar,D.K.和Fogel,D.B.(1999)。阿克塔·克里斯特。D类55, 484–491. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Lattman,E.E.(1972年)。阿克塔·克里斯特。B类28, 1065–1068. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用McCoy,A.J.、Grosse-Kunstleve,R.W.、Adams,P.D.、Winn,M.D.、Storoni,L.C.和Read,R.J.(2007年)。J.应用。克里斯特。 40, 658–674. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用McCoy,A.J.、Oeffner,R.D.、Millán,C.、Sammito,M.、Usón,I.&Read,R.J.(2018)。阿克塔·克里斯特。D类74, 279–289. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Millán,C.、Sammito,M.和Usón,I.(2015)。IUCrJ大学,2, 95–105. 科学网 交叉参考 公共医学 IUCr日志 谷歌学者
第一次引用Murray,L.J.、Arendall,W.B.、Richardson,D.C.和Richardsson,J.S.(2003)。程序。美国国家科学院。科学。美国,100,13904–13909科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Navaza,J.(1994)。阿克塔·克里斯特。A类50,157–163交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Nelder,J.A.&Mead,R.(1965年)。计算。J。 7, 308–313. 交叉参考 科学网 谷歌学者
第一次引用Pröpper,K.,Meindl,K.、Sammito,M.、Dittrich,B.、Sheldrick,G.M.、Pohl,E.和Usón,I.(2014)。阿克塔·克里斯特。D类70, 1743–1757. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Rabinovich,D.、Rozenberg,H.和Shakked,Z.(1998年)。阿克塔·克里斯特。D类54, 1336–1342. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Read,R.J.(1999)。阿克塔·克里斯特。D类55, 1759–1764. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Read,R.J.和McCoy,A.J.(2016)。阿克塔·克里斯特。D类72, 375–387. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Read,R.J.和McCoy,A.J.(2018年)。阿克塔·克里斯特。D类74, 98–105. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Rigden,D.J.、Thomas,J.M.H.、Simkovic,F.、Simpkin,A.、Winn,M.D.、Mayans,O.&Keegan,R.M.(2018年)。阿克塔·克里斯特。D类74, 183–193. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Rossmann,M.G.(1972年)。分子置换法纽约:Gordon&Breach。 谷歌学者
第一次引用Rossmann,M.G.(1990年)。阿克塔·克里斯特。A类46, 73–82. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Rossmann,M.G.和Blow,D.M.(1962)。阿克塔·克里斯特。 15, 24–31. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Rowan,T.(1990)。数值算法的功能稳定性分析博士论文。美国德克萨斯大学奥斯汀分校计算机科学系谷歌学者
第一次引用Simpkin,A.J.、Simkovic,F.、Thomas,J.M.H.、Savko,M.、Lebedev,A.、Uski,V.、Ballard,C.、Wojdyr,M.,Wu,R.、Sanishvili,R.,Xu,Y.、Lisa,M.-N.、Buschiazzo,A.、Shepard,W.、Rigden,D.J.和Keegan,R.M.(2018年)。阿克塔·克里斯特。D类74, 595–605. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Srinivasan,R.(1966年)。阿克塔·克里斯特。 20, 143–144. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Vagin,A.和Teplyakov,A.(1997)。J.应用。克里斯特。 30, 1022–1025. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Vagin,A.和Teplyakov,A.(2010年)。阿克塔·克里斯特。D类66, 22–25. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标结构
生物学
编号:2059-7983