研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标基础
进展
编号:2053-2733

单原子R(右)1:一种求解晶体结构的新优化方法

十字标记徽标

美国路易斯安那州70118新奥尔良弗雷特街6400号杜兰大学化学系
*通信电子邮件:xzhang2@tulane.edu

编辑:A.Altomare,结晶研究所-CNR,意大利巴里(收到日期:2023年11月23日; 2024年2月16日接受; 在线2024年3月18日)

A类晶体结构具有N个它的原子单位电池可以从原子为1的模型开始求解j个−1被定位。定位下一个原子j个,该方法使用了对传统定义的修改R(右)其依赖于原子位置的1个因子j个+1至N个已删除。此已修改R(右)1称为单原子R(右)1 (新加坡特别行政区1) ,因为原子1到j个−1英寸新加坡特别行政区1是已知参数,只有原子的位置j个未知。找到原子的正确位置j个从而转化为优化新加坡特别行政区1函数,相对于其分数坐标,x个j个,j个,z(z)j个。使用实验数据,已验证新加坡特别行政区1在每个缺失的原子附近都有一个空穴。此外,已经验证了基于新加坡特别行政区1,特此称为新加坡特别行政区1种方法,可以解决晶体结构(单位电池中最多有156个非氢原子)。还优化了执行此计算的策略。的主要功能新加坡特别行政区1方法是从单个任意定位的原子开始,逐渐揭示其结构。在用户的帮助下,删除了结构中不确定的部分新加坡特别行政区1种方法可以建立高质量的最终模型。因此,新加坡特别行政区1是解决晶体结构的可行且有用的工具。

1.简介

结晶学中求解晶体结构的大多数方法都依赖于电子密度图的傅里叶合成。由于结构因子的相位角不是直接测量的,而是傅立叶合成所需要的,因此求解结构的中心主题是从测量的反射强度中恢复相位角。这通常分两步完成。第一步是建立一个近似或部分模型,以对相位角进行初始估计,第二步是通过双空间循环过程迭代改进相位,该过程涉及往复空间相位精炼和/或实际空间电子密度修改(周等。, 1993【Weeks,C.M.,DeTitta,G.T.,Miller,R.&Hauptman,H.A.(1993),《结晶学报》D49,179-181。】; 米勒等。, 1993【Miller,R.、DeTitta,G.T.、Jones,R.和Langs,D.A.,Weeks,C.M.和Hauptman,H.A.(1993),《科学》,第259期,第1430-1433页。】; 德提塔等。1994年【DeTitta,G.T.,Weeks,C.M.,Thuman,P.,Miller,R.&Hauptman,H.A.(1994),《结晶学报》A50,203-210。】). 在最流行的求解小型结构的程序中,SHELXT公司(谢尔德里克,2015年[Sheldrick,G.M.(2015),《水晶学报》A71,3-8。]),启动模型由Patterson叠加最小函数建立(Buerger,1959【Buerger,M.J.(1959),《向量空间》,纽约:威利出版社。】)双空间循环包括实际空间的峰值拾取和从大约40%的最可靠相开始的相的反向空间扩展(谢尔德里克等。2001年[Sheldrick,G.M.、Hauptman,H.A.、Weeks,C.M.、Miller,R.&Uson,I.(2001)。《国际结晶学表》,第F卷,由E.Arnold&M.Rossmann编辑,第333-351页。多德雷赫特:Kluwer学术出版社。]; Schneider&Sheldrick,2002年【Schneider,T.R.和Sheldrick,G.M.(2002),《水晶学报》D581772-1779。】). 在大分子晶体学中,分子置换方法(MR;Hoppe,1957【Hoppe,W.(1957),《水晶学报》,第10期,第750-751页。】; Rossmann&Blow,1962年【Rossmann,M.G.和Blow,D.M.(1962),《水晶学报》,第15期,第24-31页。】; 罗斯曼,1972年[Rossmann,M.G.(1972),《分子替换方法》编辑,纽约:Gordon&Breach出版社。]; 克劳瑟,1972年【Crowther,R.A.(1972),《分子置换法》,M.G.Rossmann编辑,第173-178页。纽约:Gordon&Breach。]; 埃格特,1983年【Egert,E.(1983),《水晶学报》,A39,936-940。】; Rossmann&Arnold,1993年[Rossmann,M.G.&Arnold,E.(1993),《国际结晶学表》,B卷,互惠空间,U.Shmueli编辑,第230-263页。多德雷赫特:Kluwer学术出版社。])通过将已知模型优化放置到目标中来建立启动模型单位细胞;在中同晶置换方法(佩鲁茨,1956[佩鲁茨,M.F.(1956),《结晶学报》,第9期,第867-873页。]; 肯德鲁等。, 1958【Kendrew,J.C.,Bodo,G.,Dintzis,H.M.,Parrish,R.G.,Wyckoff,H.&Phillips,D.C.(1958),《自然》,181,662-666。】)重原子下部结构根据导数样品和天然样品(添加重原子前的样品)之间测量的强度变化确定导数;以及在单波长或多波长反常色散/衍射方法中(SAD或MAD;Hendrickson&Teeter,1981[Hendrickson,W.A.&Teeter,M.M.(1981),《自然》,290,107-113。]; 王,1985[王,B.-C.(1985)。《酶学方法》,115,90-112。]; 多泰等。, 1999【Dauter,Z.、Dauter、M.、de La Fortelle,E.、Bricogne,G.和Sheldrick,G.M.(1999),《分子生物学杂志》289、83-92。】, 2002【Dauter,Z.、Dauter、M.和Dodson,E.J.(2002),《水晶学报》D58,494-506。】; 多德森,2003[Doddson,E.(2003),《晶体学报》,第59期,1958-1965页。]; 亨德里克森,1991年[Hendrickson,W.A.(1991),《科学》,第254、51-58页。]; 史密斯,1998[Smith,J.L.(1998)。《求解大分子结构的直接方法》,S.Fortier编辑,第211-225页。多德雷赫特:Kluwer学术出版社。])反常散射体下部结构是从观测到的反射强度的异常差异中导出的。大分子晶体学的双空间循环步骤涉及各种电子密度修饰技术:溶剂压平(Wang,1985)[王,B.-C.(1985)。《酶学方法》,115,90-112。]; 莱斯利,1988年【Leslie,A.G.W.(1988)。《CCP4研究周末会议记录》。改善蛋白质相,S.Bailey,E.Dodson&S.Phillips编辑。沃灵顿:达斯伯里实验室。】)或溶剂翻转(Abrahams&Leslie,1996【Abrahams,J.P.&Leslie,A.G.W.(1996),《晶体学报》,D52,30-42。】)、直方图匹配和非晶体对称性平均值(Cowtan和Zhang,1999[Cowtan,K.D.和Zhang,K.Y.(1999)。生物物理进展。分子生物学。72245-270。]; 特威利格,2002年【Terwilliger,T.C.(2002),《水晶学报》,D581937-1940年。】; 布伦格尔等。, 1998【Brünger,A.T.、Adams,P.D.、Clore,G.M.、DeLano,W.L.、Gros,P.、Grosse-Kunstleve,R.W.、Jiang,J.-S.、Kuszewski,J.、Nilges,M.、Pannu,N.S.、Read,R.J.、Rice,L.M.,Simonson,T.和Warren,G.L.(1998),《晶体学报》D54,905-921。】).

虽然晶体学中结构解的主要途径是通过相位进行的,但从测量的反射强度到结构解的直接途径也得到了广泛的探索。最著名的例子是Patterson函数,在分子再置换计算的模型搜索步骤中已经利用了它(Hoppe,1957【Hoppe,W.(1957),《水晶学报》,第10期,第750-751页。】; Rossmann&Blow,1962年【Rossmann,M.G.和Blow,D.M.(1962),《水晶学报》,第15期,第24-31页。】; 罗斯曼,1972年[Rossmann,M.G.(1972),《分子替换方法》编辑,纽约:Gordon&Breach出版社。]; 克劳瑟,1972年【Crowther,R.A.(1972),《分子置换法》,M.G.Rossmann编辑,第173-178页。纽约:Gordon&Breach。]; 埃格特,1983年【Egert,E.(1983),《水晶学报》,A39,936-940。】; Rossmann&Arnold,1993年[Rossmann,M.G.&Arnold,E.(1993),《国际结晶学表》,B卷,互惠空间,U.Shmueli编辑,第230-263页。多德雷赫特:Kluwer学术出版社。])以及各种Patterson反褶积技术(Richardson&Jacobson,1987)[Richardson,J.W.&Jacobson,R.A.(1987)。Patterson and Pattersons,编辑:J.P.Glusker,B.K.Patterson&M.Rossi,第310-317页。牛津大学出版社。]; 帕维尔契克,1988年[帕维尔契克,F.(1988),《结晶学报》A44724-729。]1994年[帕维尔契克(Pavelík,F.)(1994),《水晶学报》A50,467-474.]; 布拉等。, 2004【Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.&Polidori,G.(2004),《应用结晶学杂志》37,258-264。】, 2006【Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2006a),《应用结晶杂志》39,527-535。】,b【Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2006b),《应用结晶杂志》39,728-734。】, 2007【Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2007),《应用结晶杂志》,第40期,第211-217页。】; 卡利安德罗等。, 2008【Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Mazzone,A.&Siliqi,D.(2008),《应用结晶杂志》第41期,第548-553页。】). 通过使用原子散射因子和原子位置(不处理相位),可以从试验模型计算反射强度,这一事实也被用于求解结构,即:,可以通过优化技术通过最佳匹配计算的反射强度和观察到的反射强度来求解结构。沿着这条攻击线有一些研究。麦考伊等。(2017【McCoy,A.J.、Oeffner,R.D.、Wrobel,A.G.、Ojala,J.R.、Tryggvason,K.、Lohkamp,B.和Read,R.J.(2017)。美国国家科学院院刊,114,3637-3641。】)据报道,对数似然强度增益最大化(LLGI)在含有2525个非氢原子的蛋白质结构中成功定位了多达10个S原子。布拉等。(2018【Burla,M.C.,Carrozzini,B.,Cascarano,G.L.,Giacovazzo,C.&Polidori,G.(2018),《水晶学报》A74,123-130。】)据报道,对角线最小二乘法(最小二乘法的简化版本)已应用于生产从头算小晶体结构的相位调整。

在两年多的时间里,我们一直在探索一种新的优化方法,我们称之为单原子R(右)1 (新加坡特别行政区1). 应用新加坡特别行政区1用于求解晶体结构,类似于LLGI方法(McCoy等。, 2017【McCoy,A.J.、Oeffner,R.D.、Wrobel,A.G.、Ojala,J.R.、Tryggvason,K.、Lohkamp,B.和Read,R.J.(2017)。美国国家科学院院刊,114,3637-3641。】),搜索参数空间,目的是在晶胞。由于本文是该方法的第一个正式描述,在第2节中[链接]我们提供了一个详细的数学推导新加坡特别行政区1个概念。尽管新加坡特别行政区1方法已从数学上推导出来,其有效性仅取决于试验计算。这是因为推导是基于数学直觉,而不是基于绝对的数学事实。在第3节中[链接]的一些基本性质新加坡特别行政区用实验数据进行了计算。在接下来的几节中,将描述求解结构的测试计算。在此过程中,已经建立了避免重影原子的规则,以及应用的最佳策略新加坡特别行政区1解决了晶体结构问题。这些测试计算的成功表明,该算法可以用于求解晶体结构。报告最后对未来的发展方向进行了总结和讨论。

2.单原子R(右)1 (新加坡特别行政区1) 方法

反射由索引香港特别行政区,其强度与振幅的平方成正比结构因素。我们使用振幅的平方,F类o个2(香港特别行政区),表示观察到的反射强度(已适当缩放,见下文),相应的计算反射强度为F类c(c)2(香港特别行政区),可通过以下方式从模型中计算:

[\eqalinno{F_{\rm c}^2(hkl)&=\left[\textstyle\sum\limits_j F_j(hkl)\cos 2\pi(hx_j+ky_j+lz_j)\right]^2&&cr&quad+\left[\textstyle\sum\limits_jf_j(hkl)\sin 2\pi(hx_j+ky_j+lz_j)\right]^2。&(1)}]

这里是原子j个位于(x个j个,j个,z(z)j个)并且有一个原子散射因子 (f)j个(香港特别行政区),用各向同性位移参数计算U型= 0 Å2.此选项U型是故意的,因为使用U型>0将加宽新加坡特别行政区1张地图并制作新加坡特别行政区1定位缺失原子的方法精度较低且效率较低。

方程式(1)[链接]也可以用以下形式表示:

[\eqaligno{F{\rm c}^2(hkl)&=\textstyle\sum\limits_j F_j^2(hkl)+2\sum\limits_{j\,\lt\,{j'}F_j(hk1)F_{j'{(hkl)&\cr&\quad\times\cos2\pi[h(x_j-x_{j'})+k(y_j-y_{j''})+1(z_j-z_{j`})]&(2)}]

在这个表达式中,第一个和是正的,它只取决于原子的数量和类型,而不是原子的位置。第二个和取决于原子对的相对位置,包括正值和负值,因为余弦函数的值是从−1到+1。当所有反射的强度相加时,这些贡献基本上相互抵消,因此可以达到以下近似值:

[\textstyle\sum\限制_{hkl}F_{\rm c}^2(hkl)\simeq\sum\limits_{hkl}\sum\limits_jf_j^2(kl)。\等式(3)]

这种近似表明,观测到的强度F类o个2(香港特别行政区)应按比例缩放,使其和等于Σ香港特别行政区Σj个(f)j个2(香港特别行政区). 此缩放规则将应用于新加坡特别行政区1方法。

我们使用传统R(右)1评估计算强度与观测强度之间的不匹配:

[R_1=\textstyle\sum\limits_{hkl}|F_{rm-c}(hkl)-F_{rm-o}(kl)|/\sum\limits_{hkl}F_{\rm o}(香港)。\等式(4)]

R(右)1可以被视为3的函数N个原子坐标。因此,原则上,原子模型可以通过全局最小化来求解R(右)1同时调整所有N个原子晶胞。当然,这种暴力计算对于当前的计算技术来说太过强大了。因此,我们寻求一种逐步算法,其中每一步只确定一个原子的位置。

第一个原子很容易被定位。如方程式(2)所示[链接],F类c(c)2(香港特别行政区)只取决于原子对的相对位置。所以,整个结构的绝对位置是非物质的,第一个原子可以放在任何位置。为了便于编程,我们选择(0.3,0.3,0.3)作为第一个原子的位置,尽管任何其他位置都可以用于此目的。至于应该选择哪个原子作为第一个原子,选择权落在最重的原子上,以便第一个原子尽可能多地占据散射功率。

接下来,让我们将注意力转向以下步骤。这里我们假设原子1到j个−1已确定。确定原子的位置j个,我们使用R(右)1由方程式(4)定义[链接],其中只有F类c(c)(香港特别行政区)取决于原子的位置。这种依赖关系可以在方程式(2)中看到[链接],其中所有N个原子也参与其中。我们已经知道原子1到j个−1,我们无需担心这些位置。剩余原子的位置j个N个仍然未知。但我们只想找到原子的位置j个在这一步中,我们应该删除F类c(c)2(香港特别行政区)关于原子的位置j个+1至N个删除所有依赖于原子位置的项j个+1至N个根据方程式(2)[链接],得到的近似方程可以操作为以下形式:

[\eqaligno{F{rm c}^2(hkl)&\simeq[f1(hk1)\cos 2\pi _j+lz_j)]^2&\cr&\quad+F_{j+1}^2(hkl)+\ldots+F_N^2(hkl)&(5)}]

注意,人们可能会试图通过删除所有依赖于原子位置的项来推导这个方程j个+1至N个根据方程式(1)[链接]在这种情况下,可以得到一个类似等式的方程(5)[链接]但没有尾巴[f_{j+1}^2(hkl)+\ldots+f_N^2(hkl)]。我们用这种变体测试了该方法,但发现结果比使用方程式(5)时差得多[链接]当然,这是可以理解的,因为[f_{j+1}^2(hkl)+\ldots+f_N^2(hkl)]计算R(右)1更准确。

现在我们可以给出单原子的形式化定义R(右)1 (新加坡特别行政区1) :何时F类o个2(香港特别行政区)按比例缩放,使其和等于Σ香港特别行政区Σj个(f)j个2(香港特别行政区),何时F类c(c)2(香港特别行政区)通过方程(5)的近似计算[链接],当原子坐标1到j个−1是已知参数,计算的传统参数R(右)1取决于未知的原子坐标j个只有,所以它被称为单原子R(右)1 (新加坡特别行政区1).

新加坡特别行政区1原子的位置j个−1显示为已知参数,而唯一未知参数是原子的坐标j个以下为:(x个j个,j个,z(z)j个). 那么,原子j个充当探测原子。到目前为止,原子1到j个−1已经被放入模型中,原子j个N个模型中缺少。当我们移动探测原子时j个大约,新加坡特别行政区1将更改。直觉告诉我们,当探针移动到缺失原子的位置时,新加坡特别行政区1将减小,因为现在探针解释了该位置的衍射功率,尽管它可能低估或高估了它。当探针开始远离该位置时,新加坡特别行政区1将随着探针进入无需考虑衍射功率的区域而增加。因此,我们预测新加坡特别行政区在每个缺失原子的位置上有一个洞。

人们可以问:在所有缺失的原子中j个N个,应选择哪个原子作为探针?直觉再次告诉我们,我们应该选择最重的原子,这可能产生最深的原子新加坡特别行政区1个孔。至少,如果我们选择最重的缺失原子作为探针,当探针移动到最重缺失原子的位置时,我们会到达最深的位置新加坡特别行政区1个孔。所以,在这样的安排中,在每一步中新加坡特别行政区1个洞定位最重的缺失原子。这就完成了新加坡特别行政区1算法。

这个新加坡特别行政区1算法可以通过两种方式执行。在第一种方法中,可以找到新加坡特别行政区1函数,确保丢弃与晶胞。随后,这些最小值中的最低值被选为原子的正确位置j个在第二种情况下,直接搜索全局最小点并将其位置指定给原子j个,因为最深处的最小点新加坡特别行政区1个孔必须是全局最小点。由于全局最小化可能更容易编程,我们最初使用了这种方法。然而,正如后面所示,与我们的直觉相反,第一种方法被证明更有效。

在第3节中[链接]我们做了一些计算来验证新加坡特别行政区每个缺失的原子附近有一个洞。第3节之后几个章节的试验计算成功[链接]用来验证另一个预测,即最深的新加坡特别行政区1个洞定位最重的缺失原子。

在当前的实施中新加坡特别行政区1方法,所有计算都以最小值执行P(P)1空间组,任何定心也被忽略。该策略在其他一些项目中被证明是稳健的(Sheldrick&Gould,1995[Sheldrick,G.M.&Gould,R.O.(1995),《结晶学报》,B51,423-431。]; 布拉等。, 2000【Burla,M.C.,Carrozzini,B.,Cascarano,G.L.,Giacovazzo,C.&Polidori,G.(2000),《应用结晶杂志》,第33期,第307-311页。】; 卡利安德罗等。, 2007【Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.&Siliqi,D.(2007),《应用结晶杂志》,第40期,第883-890页。】; 谢尔德里克,2015年[Sheldrick,G.M.(2015),《水晶学报》A71,3-8。]). 反射数据扩展为P(P)通过补充任何缺失的对称等价物,Friedel对也被完全展开。通过采用简单(非加权)平均值合并重复反射。计算结果自然会考虑到任何现有的晶体对称性(包括定心),稍后可以通过检查生成的单元格内容来恢复。然而,对于本报告中的示例,没有完全执行此额外步骤:只有空间组使用(斯佩克,2020年[Spek,A.L.(2020),《水晶学报》E76,1-11.])程序对最终模型进行分析,但没有执行移动单元原点以匹配约定和提取结构的不对称部分。

3.基本属性新加坡特别行政区1

本报告选择并详细研究了三个样品,即样品1、2和3。表1[链接]给出了这些样品的晶体学信息。

表1
本报告中详细研究的三个样品的结晶信息

样品 公式(不包括H) Z轴 电池中的非氢原子 (Å) b(Å) c(c)(Å) α(°) β(°) γ(°) “空间”组
1 S公司22C类12 2 32 5.86 10.34 10.74 90 104.50 90 P(P)2(1)
2 C类46 1 46 5.95 10.80 12.97 103.77 99.95 90.46 P(P)1
C类78 2 156 12.34 15.98 16.57 114.10 90.70 103.20 P(P)1

样本1用于揭示新加坡特别行政区1.样品1的正确型号如图1的顶部面板所示[链接].

[图1]
图1
样本1的模型。顶部面板:正确的型号。中间面板:通过全局最小化计算得到的模型,允许聚集虚原子。底部面板:通过全局最小化计算得到的模型,排除了聚集重影原子。

注意,在正确的样品1模型中,如图1的顶部面板所示[链接],原子从重到轻依次编号:S1到S4,O5到O8,C9到C32。不同新加坡特别行政区1的定义取决于已知的原子。三个新加坡特别行政区将研究1:新加坡特别行政区1(S2),其中只有S1是已知原子;新加坡特别行政区1(O7),其中S1到S4和O5到O6是已知原子;新加坡特别行政区1(C20),其中S1到S4、O5到O8和C9到C19是已知原子。每个孔的所有孔新加坡特别行政区1个位于单位电池发现,并为每个丢失的原子分配一个新加坡特别行政区1个离它最近的洞。缺失原子与其指定的最小点之间的距离新加坡特别行政区表2中列出了1个孔[链接]表2中列出的数据[链接]向大家展示新加坡特别行政区1(S2)可以在0.00到0.41Ω范围内定位缺失的原子,新加坡特别行政区1(O7)可以在0.00到0.19Ω范围内定位缺失的原子,并且新加坡特别行政区1(C20)可以在0.03到0.13℃范围内定位缺失的原子。因此,一般来说,当模型变得更完整时新加坡特别行政区1可以更准确地定位缺失的原子。但即使是最差的精度0.41Ω也小于0.5Ω,因此,一般来说新加坡特别行政区1可以在0.5°内定位每个缺失的原子。

表2
最小点之间的距离列表新加坡特别行政区1个空穴及其相应缺失原子的位置(单位:Ω)

原子 新加坡特别行政区1(S2) 新加坡特别行政区1(O7) 新加坡特别行政区1(C20)
S2系列 0.31    
第3章 0.04    
S4系列 0.30    
O5公司 0.17    
O6公司 0.33    
O7公司 0.05 0.03  
第8页 0.16 0.05  
C9级 0 0.04  
C10号机组 0.09 0.06  
C11号机组 0.25 0.13  
第12项 0.12 0.05  
第13页 0.41 0.08  
第14项 0.24 0.11  
第15项 0.27 0.11  
第16页 0.13 0.06  
第17页 0.18 0.08  
第18号 0.34 0.11  
第19号 0.31 0.10  
C20个 0.29 0.15 0.09
第21页 0.15 0.06 0.04
C22型 0.25 0.04 0.03
第23页 0.24 0.09 0.05
C24型 0.33 0.06 0.04
C25型 0.36 0.11 0.06
C26型 0 0.11 0.06
第27页 0.07 0.08 0.05
第28页 0.21 0.07 0.05
第29页 0.36 0 0.09
C30型 0.10 0.19 0.13
C31号机组 0.31 0.08 0.07
C32型 0.24 0.14 0.08

图2[链接]显示了R(右)1的最小值新加坡特别行政区1(S2)个空穴是每个缺失原子的邻居。图2中的数据[链接]表明较重的缺失原子S2到S4的深度要深得多新加坡特别行政区比较轻的原子O5到O8和C9到C32有1个空穴。

[图2]
图2
这个R(右)每个最小点1个值新加坡特别行政区1个(S2)空穴,紧邻缺失的原子。

The profiles of an新加坡特别行政区还可以计算1个孔(详细信息见支持信息)。在一个典型的新加坡特别行政区沿着穿过最小点的直线的1个剖面新加坡特别行政区1个孔,孔的局部最小点夹在两个相邻的局部最大点之间,这两个最大点之间的距离大于1.2°。这表明我们可以选择0.4°步长来设置粗网格,以执行全局最小化新加坡特别行政区1,以及用于定位新加坡特别行政区1个孔。

4.避免聚集重影原子

如第2节所预测[链接],全局最小化新加坡特别行政区1可以依次定位未解决结构的原子。以样品1为例,在开始时,单个原子S1放置在(0.3,0.3,0.3)处,这为定义新加坡特别行政区1(S2)。接下来,通过全局最小化来定位S2新加坡特别行政区1(S2)。为了实现这种全局最小化,在整个单元内设置了一个步长为0.4º的粗网格。这个新加坡特别行政区在所有网格点和最小网格点上计算1个值新加坡特别行政区1值表示全局最小点。通过在局部重复将步长减半,将该最小点的定位精度提高到0.001°(更多技术细节见支持信息)。此时,S1和S2都已知,因此新加坡特别行政区可以定义1(S3)并全局最小化以定位S3。重复此步骤。最后,S1到S4、O5到O8和C9到C31都是已知的,并且新加坡特别行政区可以定义1(C32)并全局最小化以定位最后一个原子C32。该程序的最终结果模型如图1中间面板所示[链接]该模型存在以下问题:O5太接近S1(仅0.55º距离),C22太接近S2(仅0.47º距离。像O5、C22和C23这样的原子被称为聚集鬼原子,因为它们的化学性质不正确。为了避免这些聚集重影原子,应强制执行以下规则:当候选位置离已知原子太近(在取决于已知原子类型的排除半径内)时,应取消该位置作为全局最小化候选的资格。如果已知原子是I、Mo、Pd和Se等重原子之一.,排斥半径选择为2.2°,而对于所有其他原子,则选择1.2°。这些选择基于反复试验。根据这一规则,全局最小化步骤可以得到图1底部面板中所示的结果模型[链接]。该模型只有以下小问题:O5应指定为C5,O8应指定为C8,C9应指定为O9,C13应指定为O33。这些小问题可以在结构中纠正精炼步骤。(有趣的是,如果删除O5、O8、C9和C13,并使用另一批全局最小化步骤重建模型,这些原子将被正确分配。)

新加坡特别行政区1方法,用各向同性位移参数计算原子散射因子U型= 0. 显然,这个原子模型与原子的真实电子密度不匹配。它解释了真实原子中心区域的电子密度。在这个中心区域附近,有一些未知的电子密度,它可能愚弄探针原子,并产生一个新加坡特别行政区1个洞的深度足以产生一个鬼原子,特别是当已经定位的原子是重原子时。这就是聚集鬼原子的可能形成机制。

5.防止完全或部分形成苯环中心的鬼原子

样品2的正确型号如图3的顶部面板所示[链接]。该结构具有多个苯环。应用的全局最小化新加坡特别行政区1的规则是不将鬼原子聚集到这个样本中,得到的模型如图3的中间面板所示[链接]此结果模型具有一种新型的鬼原子:C7是位于苯环中心的鬼原子,C1和C6是位于两个部分形成的苯环中心(每个苯环只有四个原子,缺少完整苯环的六个原子)的两个鬼原子。这些重影原子与其宿主(全部或部分)苯环形成三角键。因此,如果强制执行排除三角键的规则,就可以防止这些鬼原子:假设原子A类B类已经找到并且L(左)是候选位置,如果L(左)可以与A类B类所有三个键都短于1.6º,那么L(左)应该被取消候选人资格。使用此规则重新执行全局最小化步骤,得到的模型如图3底部面板所示[链接],将与正确的型号相同。

[图3]
图3
样本2的模型。顶部面板:正确的型号。中间面板:通过应用全局最小化得到的模型新加坡特别行政区1的规则排除聚集鬼原子(但不排除三角键)。底部面板:排除聚集鬼原子和三角键时的结果模型。

执行排除三角键的规则有一个陷阱:再次考虑原子A类B类,以及候选位置L(左).如果其中一个A类B类是一个幽灵原子,而L(左)位置是否正确,三者是否形成三角形连接?在这种情况下,强制执行规则将排除此正确位置。一种可能的策略是放弃此规则,在完成模型后,手动删除虚原子,然后重新执行全局最小化步骤以再次完成模型。然而,这种方法会令人沮丧:被删除的重影原子,在允许三角键的情况下,会不断回来。一个更好的策略是执行排除三角键的规则,即使这条规则偶尔会导致错误。稍后可以通过删除重影原子来手动更正错误。删除虚原子后,重复全局最小化步骤以再次完成模型。这一次,因为现在的计算是基于一个更完整的模型,所以结果更准确,使得正确的位置赢得了竞争,并在重影位置之前被采用(尽管一些重影位置有机会被检查,但它们被排除三角键的规则拒绝)。

对于含有苯环的结构,当探针原子移过苯环中心时,它同时占环中所有六个原子衍射功率的一部分;这样,一个新加坡特别行政区1个空穴形成,当深度足够大时,就会产生一个幽灵原子。这是苯环中心鬼原子的合理形成机制。

6.使用新加坡特别行政区1个孔,用于预测所有缺失原子的可能位置

因为新加坡特别行政区1张地图在缺失原子的位置上有洞,所有洞的集合包含了缺失原子的所有位置。因此新加坡特别行政区1仅限于这些孔。该策略可以大大缩短这些全局最小化步骤的计算时间。在求解样本1这样的小结构时,此策略的好处可能并不明显,但在求解样本3这样的大结构时,它的好处是巨大的。样品3的正确模型如图4的第一个面板所示[链接].它有156个C原子晶胞。通过这种新策略解决结构的步骤也如图4所示[链接]计算首先将单个C原子置于(0.3,0.3,0.3)。在步骤1中,首先,所有缺失C原子的可能位置都是由新加坡特别行政区1个基于单个已知C原子的映射。这些洞是通过步长为0.4º的网格粗略发现的:如果网格点较小,则标记一个洞R(右)比所有六个相邻网格点都大1。通过在局部重复将步长减半来提高定位孔的精度(更多技术细节见支持信息)。由于孔仅用于估计新加坡特别行政区1,在确定候选点接近真正的全局最小点后,最终精度将进一步细化到0.001°。因此,初始精度不需要很高,以节省计算时间;但也不应该太低(以避免选择不是最深的孔)。作为折衷方案,我们选择0.1º作为初始精度。通常,在新加坡特别行政区1样本3的地图。取最深的780个(细胞中156个C原子总数的五倍)洞就足够了,因为缺失原子的洞比噪声更深。在预测了缺失原子的可能位置后,我们进行了一批全局最小化步骤(在每个步骤中,我们只搜索这780个候选位置),以将模型扩展到10个原子。在步骤2、3和4中,我们做同样的事情,将模型分别扩展到30、80和156个原子,以获得中间完整模型。这个中间完整模型相当完整,它的18个重影原子被识别并删除。在步骤5中,删除这些虚原子并再次预测缺失原子的位置后,我们执行最后一批全局最小化步骤以再次扩展到完整模型。这个最终的完整模型只有一个原子错放了。用这种新策略求解结构的整个过程大约需要1小时才能完成。相比之下,如果计算是以整个单元的0.4°步长网格点(总共52 080个点)作为执行全局最小化的候选位置进行的,则整个模型在大约18小时内完成。更糟糕的是,得到的模型在156个原子中只有73个位于0.5以内在所有156个原子中,只有约20个原子形成可识别的碎片。因此,手动删除所有不保证正确的原子,并重复计算几个周期以达到最终正确的模型,这将导致需要花费更多的时间才能完成。

[图4]
图4
样本3的正确模型和求解该结构的步骤(使用一批全局最小化步骤,这些步骤是通过以下方法预测缺失原子的位置开始的新加坡特别行政区1个孔)。

令人惊讶的是,当整个52 080个网格点作为候选点时,结果模型的质量比在全局最小化步骤中仅使用780个选定点时差。乍一看,使用所有网格点应确保真正“全局”地执行最小化,因此其结果应更好,或至少相同。人们应该意识到,问题来自于强制执行规则,排除聚集的虚原子。这条规则在晶胞。这些空穴以已知原子为中心。当进行真正的全局最小化时,有时在这些孔的边缘实现全局最小值。但这不是一个真正的局部极小点,并导致一个虚原子。另一方面,所选择的780个点都是真正的局部最小点,并且在使用它们作为候选者时,即使执行相同的规则,也不会创建新的人造重影原子。因此,新策略意外地带来了生成更高质量模型的额外好处。

人们可能会注意到,在将第一个C原子置于(0.3,0.3,0.3)之后,可以通过使用新加坡特别行政区1个孔。人们可能会立即将模型从一个原子扩展到全部156个原子。然而,这种匆忙计算的结果并不好:156个原子中只有32个位于0.5°以内,几乎没有任何碎片可以被识别为正确的碎片,因此排除了应用手动编辑的可能性。由于使用新加坡特别行政区当模型仍然非常不完整时,用1个孔表示缺失原子的位置。因此,如上所述,正确的策略是在开始时只扩展几个原子。稍后,当模型变得更完整时,可以在每批全局最小化步骤中使用更多原子进行扩展。事实证明,从1到10到30到80到156个原子的序列是解决样品3结构的一个很好的策略。

7.单元格内容的不准确估计对结构解决方案的影响

在晶体学中,细胞含量的最初估计常常是错误的(不准确)。随着细胞含量的初步估计下降了约20%(或多或少),我们用新加坡特别行政区1计算。这些测试的详细信息见支持信息。我们发现新加坡特别行政区当细胞含量的初始估计值关闭时,1方法仍然有效。当细胞含量被低估时,所得到的模型是正确的,只不过有些原子丢失了,并且很清楚哪些原子丢失了。当细胞含量被高估时,可以确定正确的模型,但应删除附加的虚假原子。无论哪种情况,用户最终都可以确定正确的内容和正确的结构。如果进行数学分析,当单元格内容关闭时F类o个2(香港特别行政区)将关闭。计算F类c(c)2(香港特别行政区)也将关闭,最终的绝对值为R(右)1将关闭。但是,探针原子仍然可以正确检测新加坡特别行政区1个孔,因为这种检测取决于R(右)1和探针的位置。可以理解,当探针移动到缺失原子的位置时,R(右)1仍将下降,即使R(右)1关闭。因此新加坡特别行政区当细胞含量估计错误时,1种方法可以正确定位缺失的原子。

当单元格内容的初始估计值关闭时F类o个2(香港特别行政区)将相应关闭,但新加坡特别行政区1方法仍能正常工作。人们可能会想:如果单元格内容的初始估计是正确的,但是F类o个2(香港特别行政区)它自己关闭了吗?为此,我们进行了测试(有关详细信息,请参阅支持信息),发现新加坡特别行政区1方法仍然可以正确工作,即使缩放是两倍或减半。虽然整体计算仍然正确,但在计算过程中需要删除更多的重影原子。一般来说,最佳缩放比例是我们一直使用的缩放比例,也就是说,应缩放强度,使其和等于Σ香港特别行政区Σj个(f)j个2(香港特别行政区). 原因是新加坡特别行政区即使在关闭缩放时,1种方法也能正常工作:新加坡特别行政区1方法仅取决于其检测能力新加坡特别行政区1个孔,当缩放关闭时,新加坡特别行政区当探测器在缺失原子的位置上移动时,1仍然正确地下降。

8.将反射数据分辨率截断为1º对结构求解策略的影响

上述所有计算均使用原始反射数据。原始数据分辨率为:样本1,10.4–0.84º;样品2,12.39–0.73º;样品3,15.02–0.77º。

如果数据分辨率被截断为1º,则使用成批全局最小化步骤,这些步骤是通过新加坡特别行政区1个洞,样品1和样品2的结构可以得到解决,尽管它确实需要额外的周期来删除虚原子并重新扩展回完整模型。然而,处理样本3很棘手。如图5所示的第一步所示[链接]正常情况下,从单个原子到完整模型进行一个循环,从(0.3,0.3,0.3)处的单个C原子开始,然后扩展到10个,30个,80个和156个原子,得到的模型基本上无法识别。要解决这个难题,必须尝试识别或猜测结构中可能正确的小片段。一旦识别出这样的碎片,所有其他原子都可以被删除。如果这个片段是正确的片段,或者几乎是正确的,那么新加坡特别行政区从这个碎片中得到的1个空穴比从单个起始原子中得到的空穴能更准确地表示缺失的原子。因此,继续从这个片段扩展模型更有可能得到正确的解决方案。如图5第二步所示[链接],选择了四个C原子的小碎片;该片段的中心原子在步骤1和步骤2中都被标记为C33。这个小片段被认为是正确的片段。确实,如图5的步骤3和4所示[链接]通过从该片段扩展,可以归纳并改进正确的模型。

[图5]
图5
在将数据分辨率截断为1º后,尝试求解样本3的结构(使用成批全局最小化步骤,这些步骤从通过新加坡特别行政区1个孔)。步骤1:从单个C原子开始,将模型扩展到10个、30个、80个和156个原子。第二步:选择一个小片段。步骤3:将模型扩展到10个、30个、80个和156个原子,并删除虚原子。第四步:将模型扩展到156个原子。

9.扩展新加坡特别行政区1概念到更一般的概念局部结构 R(右)1 (公共关系1)

对于分辨率被截断的样品3的困难情况,启动全局最小化步骤的一个策略是使用正确定向的单个苯环。为了正确定位像苯环一样的碎片,有必要扩展新加坡特别行政区1个概念到一个更一般的概念,称为局部结构 R(右)1 (公共关系1). 相同的方程式(5)[链接]用于定义公共关系1.定义时新加坡特别行政区1,原子间1到j个,仅限j个是唯一缺失的原子。用于定义公共关系1,有多个缺失原子:1到−1是已知原子,而j个是缺失的原子。缺失的原子j个形成片段,或局部结构,或部分模型。这个碎片的结构是已知的。例如,碎片可能是键长为1.39Ω的苯环。如果片段包含单个原子,公共关系1转为新加坡特别行政区1.就像新加坡特别行政区我可以通过新加坡特别行政区1个三维位置空间的地图,通常是公共关系我可以通过公共关系1个六维定向定位空间的地图(如果碎片是线性的,则为五维)。在一种特殊情况下,当碎片是独立的,也就是说,没有已知的原子时,那么这个独立碎片的位置是无关紧要的,这个碎片的正确方向可以通过公共关系一张三向或二维定向空间的地图。找到最深的公共关系在定向空间中设置1个孔,在旋转角度上设置步长为5°的粗网格。的价值公共关系1是在所有网格点上计算的,并且网格点具有最小值公共关系1表示全局最小点(与最深孔相同)。通过在本地将步长减半五倍(更多技术细节见支持信息),可以进一步提高定位此最小点的精度。将此方法应用于样品3,将一个苯环放置在其中心位于(0.3,0.3,0.3)处,其正确方向由公共关系1张独立苯的地图。正确定向的苯环如图6的步骤1所示[链接].从这个正确定向的苯环开始,应用批量全局最小化新加坡特别行政区1’s,结合手动删除坏原子或不确定原子,如图6中的步骤2至5所示[链接],最终得到样本3的正确模型。

[图6]
图6
将数据分辨率截断为1º后,再次尝试求解样本3的结构。步骤1:放置一个苯环,其中心位于(0.3,0.3,0.3),其方向由公共关系1三维定向空间的地图。步骤2:使用新加坡特别行政区将模型扩展到30个和80个原子,并保留可识别的碎片。第三步:重复第二步。步骤4:使用新加坡特别行政区1、将模型扩展到30、80和156个原子,并删除虚原子。步骤5:使用新加坡特别行政区将模型扩展到156个原子。

10.使用的一般策略新加坡特别行政区1用于解决晶体结构

这个新加坡特别行政区1映射在缺失原子的位置有洞,最深的洞定位最重的缺失原子(在避免聚集虚原子和排除三角键之后)。作为一个新加坡特别行政区当一个新的新加坡特别行政区1是通过将新定位的原子包含为已知原子来定义的,不需要重新发现一组新的新加坡特别行政区1个孔。相反,新的新加坡特别行政区通过测试旧洞的位置,可以发现1张地图。然而新加坡特别行政区当模型非常不完整时,1个洞是缺失原子位置的不准确表示。当模型变得更加完整时,它们将变得更加准确。所以,一开始,在找到新加坡特别行政区1个孔,第一批使用最深新加坡特别行政区扩展模型的1个孔应该只扩展模型几个原子;在以后的阶段,每批计算中被扩展的原子数可能会迅速增加。最后,应始终检查生成的模型的化学稳定性,并删除不具有化学意义的原子。为了最大限度地减少错误的传播,最好尽早纠正任何可识别的错误。

删除重影原子后,恢复计算。事实上,事实上,新加坡特别行政区1还可以用于提高模型的质量。模型的任何变形部分,例如变形的苯环,都可以删除并重建以获得更好的质量。有时,在将数据分辨率截断为1º后,可能会遇到像样本3这样的困难情况。在这些困难的情况下,生成的模型大多无法识别。在这种情况下,有必要寻找一个看起来更可能正确的小片段。或者,可以将已知碎片及其本地来源放在(0.3,0.3,0.3)处(有关碎片本地来源的更多技术细节,请参阅支持信息),并使用公共关系1张独立碎片的地图,以确定其正确方向。从正确的片段扩展模型会导致更容易识别的片段。通过保留这些可识别的碎片并从中延伸,最终达到完整的结构。

总之,申请的一般流程图新加坡特别行政区图7显示了用于求解未知结构的1[链接].

[图7]
图7
应用新加坡特别行政区一种求解未知结构的方法。步骤1:初始模型,要么是任意定位的单个原子,要么是也任意定位但正确定向的已知片段公共关系一块独立碎片。定义新的新加坡特别行政区1计算转到步骤2:在单元格内设置网格,步长为0.4°。请注意,每当定义新的新加坡特别行政区1使用到该点为止的已知模型。第三步:发现新加坡特别行政区1个孔。带有新加坡特别行政区小于其所有六个相邻值(红色)的1值表示新加坡特别行政区1个孔。步骤4:使用步长减半的局部网格来细化新加坡特别行政区1个孔。最低的本地网格点新加坡特别行政区1被接受为孔的改进位置。再次重复步骤4后,5N个采用最深孔的作为候选位置;在这里N个是预期的原子数晶胞。第五步:定位原子j个首先,通过应用排除虚原子的规则来筛选候选位置。过滤后的候选位置显示为彩色球。计算新加坡特别行政区1覆盖这些候选位置,并指定一个(蓝色)最小的新加坡特别行政区1对原子j个。此位置的精度精确到0.001°。定义新的新加坡特别行政区1重复步骤5。总共执行了步骤5N个次。请注意N个表示一组中的一个数字N个1,N个2,N个,…,此集合构成计算策略。例如,对于样本3N个是9、20、50、76。请注意N个1+N个2+N个+ … =N个N个0,其中N个0是起始模型中的原子数。完成后N个步骤5的循环,新定义新加坡特别行政区1,计算返回到步骤2、3、4,然后执行下一步N个步骤5的循环。重复此操作,直到完成N个在集合中N个1,N个2,N个,…,已完成。至此,我们进入了第六步:试探性的完整模型。在用户删除重影原子的帮助下,我们进入第7步:中间部分模型。定义新的新加坡特别行政区1,计算返回到步骤2、3、4,然后对特定循环重复步骤5,然后再次返回步骤2.,直到产生新的暂定解决方案。如果新的试探性解决方案仍然有许多重影原子,上述计算将再次重复。一旦新的试探性解决方案具有高质量,就可以进入第8步:最终模型。

11.与其他方法的比较

Patterson反褶积技术(Richardson&Jacobson,1987)[Richardson,J.W.&Jacobson,R.A.(1987)。Patterson and Pattersons,编辑:J.P.Glusker,B.K.Patterson&M.Rossi,第310-317页。牛津大学出版社。]; 帕维尔契克,1988年[帕维尔契克,F.(1988),《结晶学报》A44724-729。]1994年[帕维尔契克(Pavelík,F.)(1994),《水晶学报》A50,467-474.]; 布拉等。, 2004【Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.&Polidori,G.(2004),《应用结晶学杂志》37,258-264。】, 2006【Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2006a),《应用结晶杂志》39,527-535。】,b【Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2006b),《应用结晶杂志》39,728-734。】, 2007【Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2007),《应用结晶杂志》,第40期,第211-217页。】; 卡利安德罗等。, 2008【Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Mazzone,A.&Siliqi,D.(2008),《应用结晶杂志》第41期,第548-553页。】)成功地为小分子到蛋白质结构提供初始阶段。然而,Patterson反褶积技术通常只能起到初始阶段的作用,因为它们自身的能力不足以解决一个完整的结构。相比之下新加坡特别行政区1方法可以独立求解一个完整的结构。这是由于其逐渐揭示结构的力量。从任意位置的单个原子开始,新加坡特别行政区1在开头揭示了一点结构。一旦知道一点点,就可以揭示更多,然后才能揭示更多。最后,我们展示了一个完整的结构。必要时,可以删除并重建结构中确定不正确的部分。所有这些能力都已通过小型结构的试验计算得到证明。未来,我们将测试新加坡特别行政区1方法可以满足蛋白质结构的挑战。

对角线最小二乘法在执行从头算小分子的相位(Burla等。, 2018【Burla,M.C.,Carrozzini,B.,Cascarano,G.L.,Giacovazzo,C.&Polidori,G.(2018),《水晶学报》A74,123-130。】). 数学上,最小二乘法要求初始解接近正确解才能收敛,因为它使用泰勒展开将模型线性化。因此,最小二乘法的成功依赖于一种多解策略,即尝试多次初始猜测,再加上它辨别哪些原子是坏原子的能力,因此哪些原子需要被新的随机猜测所取代。相比之下新加坡特别行政区1方法是确定性的。然而,它的初始结果可能包含幽灵原子;因此,它要求用户识别并删除虚原子,然后通过恢复新加坡特别行政区1计算。

LLGI的最大化目标成功地在含有2525个非氢原子的蛋白质结构中定位了多达10个S原子(McCoy等。, 2017【McCoy,A.J.、Oeffner,R.D.、Wrobel,A.G.、Ojala,J.R.、Tryggvason,K.、Lohkamp,B.和Read,R.J.(2017)。美国国家科学院院刊,114,3637-3641。】). LLGI的理论基础是统计假设检验(Read,2001[Read,R.J.(2001),《水晶学报》,D571373-1382。])这在理论上是合理和复杂的,但LLGI的公式很复杂,具有需要估计和/或优化的未知参数。相比之下新加坡特别行政区1最小化目标是简单的数学直觉:正确的模型具有最小的R(右)1个因素。这就是新加坡特别行政区1个目标,生成没有未知参数的简单透明公式(除了单元格内容)。令人惊讶的是,这样一个简单的想法可以有效地解决晶体结构。这一成功的一个主要原因是与缺失原子的影响有关的部分j个+1至N个R(右)1个独立于其位置的因素,即:,[f_{j+1}^2(hkl)+\ldots+f_N^2(hkl)],保留在方程式(5)中[链接]本部分说明了这些缺失原子对R(右)1个因素。因为探测原子的作用j个R(右)1为弱,如果不考虑此基线效应,则探头的弱效应将在噪声中消失。尽管探针的作用很弱,但其变化与(x个j个,j个,z(z)j个)是一致的,所以所有缺失的原子在新加坡特别行政区1张地图。就因为丢失的原子在新加坡特别行政区1张地图新加坡特别行政区1种方法证明是成功的。(回想起来,我们仍然惊讶于新加坡特别行政区一个想法可以解决晶体结构,因为它采用了一个过于简化的模型:原子电子密度呈球形,没有任何热效应。这样一个过于简化的模型不可能模拟真实的电子密度。然而,神奇的是,尽管该模型永远无法拟合真实电子密度,但它可以准确地定位每个真实原子的真实电子密度的中心部分,从而在不拟合完整的电子密度图的情况下很好地定位原子。)

就我们所见新加坡特别行政区1方法是其逐渐揭示未知结构的能力,其主要缺点是计算速度慢。从概念上讲,计算时间与原子数、网格点数和反射数的乘积成正比。所有这些数字都与N个,单元中的原子数。因此,大致来说,计算时间与N个。我们尚未实现并行计算。然而新加坡特别行政区1方法非常适合并行计算。例如,可以同时对所有网格点执行计算。我们期望通过并行编程新加坡特别行政区1方法可以变成有用的工具。到目前为止,我们只测试了新加坡特别行政区1使用小分子,没有并行编程。对于样品3,新加坡特别行政区1使用Python程序求解结构大约需要1小时,而无需在Surface Pro 7上进行并行计算。相比之下SHELXT公司项目(Sheldrick,2015年[Sheldrick,G.M.(2015),《水晶学报》A71,3-8。])可以在几秒钟内解决。显然新加坡特别行政区1方法,正如我们到目前为止所实现的那样,对于求解小型结构没有实际优势。它只能用于浓缩目的:通过新加坡特别行政区1方法。很可能新加坡特别行政区1可以找到解决蛋白质结构的实际应用。然而,该地区仍在等待勘探。在这一点上,现在猜测新加坡特别行政区1方法可以满足蛋白质结构的挑战。

12.未来方向

在当前使用的实现中新加坡特别行政区1来解决晶体结构,不需要关于晶体对称性的先验知识。解决结构后晶体对称性可以通过检查单位电池(见第2节[链接]). 然而,当对称性的先验知识确实存在时,可以利用这一事实来缩短计算时间。考虑到晶体对称性(包括定心),一组对称相关原子被分配在一起,位于A类第页+d日,用于=0至n个−1,其中A类0是单位矩阵d日0=(0,0,0)。整个团队完全取决于第页= (x个,,z(z)),从而减少3n个维到三维。由于一组对称相关原子被分配在一起公共关系应使用1。算法应注意特殊位置:在对称相关原子组中,如果两个或多个原子聚集在一起,即原子间距离小于,例如0.5º,则这些原子应在其平均位置被一个原子取代。现在第页= (x个,,z(z))第一组对称相关原子中的原子应该由相应原子的最深空穴决定公共关系1张地图。然后,这组原子作为起始已知原子。一旦有了已知的原子,可以使用新加坡特别行政区1张地图,用于预测第页= (x个,,z(z))用于下一批与对称性相关的原子基团。只有这些预测位置需要进行检查,以确定最深处公共关系1个孔,用于定位一组对称相关原子。

有一件事阻碍了新加坡特别行政区1计算是用户识别和删除虚原子的手动帮助的要求。积累了应用新加坡特别行政区1种方法,未来模式识别人类智能最终可以实现自动化。目前,我们正在测试一种自动化策略:新加坡特别行政区我完成了构建第一个试验完整模型的初始步骤,然后重复以下步骤:随机删除一半模型并重新构建回完整模型。该过程由R(右)1个值。最初,R(右)1滴。后来,它保持在平均水平,出现了一些涟漪。此状态表示计算结束。该策略已经过测试,并被发现在本文中报告的所有三个示例中都是成功的。将进行更多研究。或者,识别幽灵原子的技术可以从已发表的研究中借鉴(Kinneging&Graaff,1984)【Kinneging,A.J.&de Graaff,R.A.G.(1984),《应用结晶杂志》,第17期,第364-366页。】; Shi&Schenk,1988年【Shi,J.&Schenk,H.(1988)。Proc.Kon.Ned.Akad.Wet.B91,237-244。】)并将在未来的探索中进行尝试。

最后局部结构 R(右)1 (公共关系1) 提供了一种新的分子置换计算方法。独立碎片的正确方向,或局部结构,或者有时称为部分模型,可以通过公共关系1三维定向空间的地图。当模型中的一些原子已经确定时,缺失碎片的方向和位置可以通过公共关系一张六维定向定位空间的地图。在确定碎片后公共关系1可以通过将碎片中的原子定义为已知原子,以及新碎片中最深的洞来定义公共关系1张地图确定了下一个缺失片段的方向和位置。这样,就可以按顺序确定缺失的片段。在此实施中公共关系1用于进行分子置换计算,事先不知道晶体对称性是必需的。类似于使用新加坡特别行政区1,如果事先知道晶体对称性确实存在,同样可以利用该事实来减少计算时间。(在撰写本文时,我们已经测试了公共关系1,用于小结构上的分子置换计算并取得成功,并且正在计划用蛋白质结构进行进一步测试。)

支持信息


致谢

罗伯特·帕斯卡教授亲切地提供了样本2和样本3的数据集。感谢Igor V.Rubtsov教授、Brent Koplitz教授和Mark Sulkes教授进行了有益的讨论。

工具书类

第一次引用Abrahams,J.P.和Leslie,A.G.W.(1996)。《水晶学报》。52, 30–42. 交叉参考 计算机辅助系统 科学网 IUCr日志 谷歌学者
第一次引用Brünger,A.T.,Adams,P.D.,Clore,G.M.,DeLano,W.L.,Gros,P.,Grosse-Kunstleve,R.W.,Jiang,J.-S.,Kuszewski,J.,Nilges,M.,Pannu,N.S.,Read,R.J.,Rice,L.M.,Simonson,T.&Warren,G.L.(1998)。《水晶学报》。54, 905–921. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Buerger,M.J.(1959年)。向量空间。纽约:Wiley。 谷歌学者
第一次引用Burla,M.C.、Caliandro,R.、Carrozzini,B.、Cascarano,G.L.、De Caro,L.、Giacovazzo,C.和Polidori,G.(2004)。J.应用。克里斯特。 37, 258–264. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2006年)).J.应用。克里斯特。 39, 527–535. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2006年)b).J.应用。克里斯特。 39, 728–734. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Burla,M.C.,Caliandro,R.,Carrozzini,B.,Cascarano,G.L.,De Caro,L.,Giacovazzo,C.,Polidori,G.&Siliqi,D.(2007年)。J.应用。克里斯特。 40, 211–217. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Burla,M.C.、Carrozzini,B.、Cascarano,G.L.、Giacovazzo,C.和Polidori,G.(2000年)。J.应用。克里斯特。 33, 307–311. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Burla,M.C.、Carrozzini,B.、Cascarano,G.L.、Giacovazzo,C.和Polidori,G.(2018年)。《水晶学报》。A类74, 123–130. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Caliandro,R.、Carrozzini,B.、Cascarano,G.L.、De Caro,L.、Giacovazzo,C.、Mazzone,A.和Siliqi,D.(2008)。J.应用。克里斯特。 41,548–553页科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Caliandro,R.、Carrozzini,B.、Cascarano,G.L.、De Caro,L.、Giacovazzo,C.和Siliqi,D.(2007年)。J.应用。克里斯特。 40, 883–890. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Cowtan,K.D.和Zhang,K.Y.(1999)。掠夺。生物物理学。分子生物学。 72, 245–270. 科学网 交叉参考 公共医学 计算机辅助系统 谷歌学者
第一次引用Crowther,R.A.(1972年)。分子置换法由M.G.Rossmann编辑,第173–178页。纽约:Gordon&Breach。 谷歌学者
第一次引用Dauter,Z.、Dauter、M.、de La Fortelle,E.、Bricogne,G.和Sheldrick,G.M.(1999)。分子生物学杂志。 289, 83–92. 科学网 交叉参考 公共医学 计算机辅助系统 谷歌学者
第一次引用Dauter,Z.、Dauter、M.和Dodson,E.J.(2002年)。《水晶学报》。58, 494–506. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用DeTitta,G.T.、Weeks,C.M.、Thuman,P.、Miller,R.和Hauptman,H.A。(1994).《水晶学报》。A类50, 203–210. 交叉参考 计算机辅助系统 科学网 IUCr日志 谷歌学者
第一次引用Dodson,E.(2003)。《水晶学报》。59, 1958–1965. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Egert,E.(1983年)。《水晶学报》。A类39, 936–940. 交叉参考 计算机辅助系统 科学网 IUCr日志 谷歌学者
第一次引用Hendrickson,W.A.(1991年)。科学类,254, 51–58. 交叉参考 公共医学 计算机辅助系统 科学网 谷歌学者
第一次引用Hendrickson,W.A.和Teeter,M.M.(1981年)。自然,290, 107–113. 交叉参考 计算机辅助系统 公共医学 科学网 谷歌学者
第一次引用Hoppe,W.(1957)。《水晶学报》。 10,750–751谷歌学者
第一次引用Kendrew,J.C.,Bodo,G.,Dintzis,H.M.,Parrish,R.G.,Wyckoff,H.&Phillips,D.C.(1958年)。自然,181, 662–666. 交叉参考 公共医学 计算机辅助系统 科学网 谷歌学者
第一次引用Kinneging,A.J.和de Graaff,R.A.G.(1984)。J.应用。克里斯特。 17, 364–366. 交叉参考 计算机辅助系统 科学网 IUCr日志 谷歌学者
第一次引用Leslie,A.G.W.(1988年)。CCP4研究周末会议记录。改善蛋白质相由S.Bailey、E.Dodson和S.Phillips编辑。沃灵顿:达斯伯里实验室。 谷歌学者
第一次引用McCoy,A.J.、Oeffner,R.D.、Wrobel,A.G.、Ojala,J.R.、Tryggvason,K.、Lohkamp,B.和Read,R.J.(2017)。程序。国家。阿卡德。科学。美国,114, 3637–3641. 科学网 交叉参考 计算机辅助系统 公共医学 谷歌学者
第一次引用Miller,R.、DeTitta,G.T.、Jones,R.、Langs,D.A.、Weeks,C.M.和Hauptman,H.A.(1993年)。科学类,259, 1430–1433. CSD公司 交叉参考 计算机辅助系统 公共医学 科学网 谷歌学者
第一次引用Pavelík,F.(1988年)。《水晶学报》。A类44, 724–729. 交叉参考 科学网 IUCr日志 谷歌学者
第一次引用Pavelík,F.(1994年)。《水晶学报》。A类50, 467–474. 交叉参考 科学网 IUCr日志 谷歌学者
第一次引用Perutz,M.F.(1956年)。《水晶学报》。 9,867–873页交叉参考 计算机辅助系统 IUCr日志 科学网 谷歌学者
第一次引用Read,R.J.(2001)。《水晶学报》。57, 1373–1382. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Richardson,J.W.和Jacobson,R.A.(1987年)。帕特森和帕特森由J.P.Glusker、B.K.Patterson和M.Rossi编辑,第310-317页。牛津大学出版社。 谷歌学者
第一次引用Rossmann,M.G.(1972年)。编辑。分子置换法。纽约:Gordon&Breach。 谷歌学者
第一次引用Rossmann,M.G.和Arnold,E.(1993)。国际结晶学表,卷。B类,倒数空间由U.Shmueli编辑,第230–263页。多德雷赫特:Kluwer学术出版社。 谷歌学者
第一次引用Rossmann,M.G.和Blow,D.M.(1962)。《水晶学报》。 15, 24–31. 交叉参考 计算机辅助系统 IUCr日志 科学网 谷歌学者
第一次引用Schneider,T.R.和Sheldrick,G.M.(2002)。《水晶学报》。58, 1772–1779. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.(2015)。《水晶学报》。A类71, 3–8. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.&Gould,R.O.(1995年)。《水晶学报》。B类51, 423–431. 交叉参考 计算机辅助系统 科学网 IUCr日志 谷歌学者
第一次引用Sheldrick,G.M.、Hauptman,H.A.、Weeks,C.M.、Miller,R.&Uson,I.(2001)。国际结晶学表,卷。F类,由E.Arnold和M.Rossmann编辑,第333–351页。多德雷赫特:Kluwer学术出版社。 谷歌学者
第一次引用Shi,J.&Schenk,H.(1988)。程序。科恩。内德·阿卡德。潮湿。B类91, 237–244. 谷歌学者
第一次引用Smith,J.L.(1998)。求解高分子结构的直接方法由S.Fortier编辑,第211-225页。多德雷赫特:Kluwer学术出版社。 谷歌学者
第一次引用Spek,A.L.(2020年)。《水晶学报》。电子76, 1–11.  科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Terwilliger,T.C.(2002)。《水晶学报》。58, 1937–1940. 科学网 交叉参考 计算机辅助系统 IUCr日志 谷歌学者
第一次引用Wang,B.-C.(1985)。方法酶学。 115, 90–112. 交叉参考 计算机辅助系统 公共医学 谷歌学者
第一次引用Weeks,C.M.、DeTitta,G.T.、Miller,R.和Hauptman,H.A.(1993)。《水晶学报》。49,179–181交叉参考 计算机辅助系统 科学网 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标基础
进展
编号:2053-2733