研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标结构
生物学
编号:2059-7983

从深度TLS验证到基于元素运动构建的原子模型集合。二、。TLS分析精细化明确解释的结果

十字标记_颜色_方形_文本.svg

美国加利福尼亚州伯克利市劳伦斯伯克利国家实验室分子生物物理和集成生物成像部,b条上海大学物理系和国际量子与分子结构中心,上海200444,中华人民共和国,c(c)美国加州大学伯克利分校生物工程系,d日法国伊利科奇洛朗·弗里斯街1号CNRS–INSERM–UdS,BP 10142,67404,Génétique et de Biologie Moléculaire et Cellulaire生物研究所综合生物中心e(电子)法国诺兰大学科学与技术学院,BP 239,54506 Vandouvre-les-Nancy
*通信电子邮件:pafonine@lbl.govsacha@igbmc.fr

英国剑桥大学R.J.Read编辑(2017年8月1日收到; 2018年4月12日接受; 在线2018年6月8日)

TLS模型由Schomaker和Trueblood开发,用于通过原子群的协调(刚体)谐波运动来描述原子位移参数[Schomake和Trueblot(1968[Schomaker,V.&Trueblood,K.N.(1968),《水晶学报》,B24,63-76。]),阿克塔·克里斯特。B类24, 63–76]. TLS的结果精细化T型L(左)S公司为属于该组的所有原子提供单个各向异性原子位移参数(ADP)的矩阵。这些ADP可以使用将TLS矩阵元素与原子参数关联的公式进行分析计算。或者,ADP可以从对应于TLS矩阵的协调原子运动参数中数值获得。这两个程序预计会产生相同的ADP值,因此可以用于评估TLS的结果精细化。这里,此方法在菲尼克斯描述和几个插图,包括PDB中所有受TLS约束的型号的使用精细化,提供了。

1.简介

1.1。晶体结构中的原子位置

用笛卡尔坐标描述晶体结构中的原子位置是一种数学抽象。原子位置是衍射数据收集时间和晶体中所有晶胞的平均值。位置的变化可能从代表离散构象的大到反映围绕中心位置的原子运动的小。

如果运动是谐波的(特别是,这意味着运动幅度很小),则原子移动的概率n个通过向量n个=Δx个n个+Δn个j个+Δzn个k个由单个各向同性定义(B类n个)或各向异性(U型n个)原子位移参数(ADP):

[{\bf U}_{n}=\left(\matrix{\langle\Delta x_{n{n}^{2}\rangle和\langle\ Delta x_{n}\Delta y_{n}\range&langle\Delta x_}n}\ Delta z_{n}\rangle\cr\langle\sDelta xe_{n}\ Delta y_}\rangle\cr\langle\Delta x_{n}\Delta z_{nneneneep \rangle&\langle\ Delta y_{n{\Delta z_{n}\rangle&\langle\Delta z{n}^{2}\range}\right)。\等式(1)]

原子迁移率的这些特征是与晶体结构模型相关的结构信息的一部分。如文献所述(例如,见Dunitz&White,1973【Dunitz,J.D.&White,D.N.J.(1973),《晶体学报》,A29,93-94。】; 穆尔舒多夫等。, 1999【Murshudov,G.N.,Vagin,A.A.,Lebedev,A.,Wilson,K.S.&Dodson,E.J.(1999),《结晶学报》D55,247-255。】; 优胜者等。, 2001[Winn,M.D.、Isupov,M.N.和Murshudov,G.N.(2001),《结晶学报》D57122-133。])原子位移是不同来源产生的各种运动的叠加。这些包括作为一个群体的一部分的原子位移和个体振动。群体运动本身可以有几个来源,例如整个分子的运动、其域的运动、侧链平动通常,现代精细化程序使用三个独立的组件处理这些运动:整个晶体的运动(建模为整体各向异性比例因子)、被认为是刚性的非重叠组的运动以及单个原子的运动。

1.2. 刚体组运动

刚体运动引起的原子位移可以用TLS模型来解释(Schomaker&Trueblood,1968[Schomaker,V.&Trueblood,K.N.(1968),《水晶学报》,B24,63-76。]). 这种模型基于简单的几何考虑,允许用三个矩阵来描述原子群的基本谐波运动T型L(左)S公司(有关审查,请参阅Urzhumtsev等。, 2013【Urzhumtsev,A.,Afonine,P.V.和Adams,P.D.(2013),《晶体学》第19版,230-270页。】). 这提供了一种方便的数学方法,用单个各向异性ADP表示这些运动,

[{\bf U}_{\rm TLS},n}={\bf-T}+{\bfA}_n{\bf1L}{\bf2 A}_n^{\tau}+{\bf A}_n{\bfsS}+{\ bf S}^{\tao}{\baf A}-n,\eqno(2)]

哪里

[{\bf A}_n=\left(矩阵{0&z_n&-y_n\cr-z_n&0&x_n\cry_n&-x_n&0}\right)\eqno(3)]

是使用笛卡尔坐标表示的反对称矩阵(x个n个n个zn个)原子的n个关于TLS组的起源。符号τ表示矩阵转置。TLS方法可视为一种统计模型,用于分析根据给定元素运动参数变化的原子位置的平均值。常见运动的最简单例子是一个组的各向同性振动,它等效于相同的分配B类组中所有原子的值。在TLS模型中,对称矩阵L(左)对应于群的平动,对称矩阵T型对应于它的常见振动1(还包括平动轴位置的修正)和矩阵S公司反映了运动之间的相关性以及轴的位置。

一组TLS矩阵由21个参数定义(6个用于T型,六个L(左)还有九个S公司). 对角线元素有线性约束S公司矩阵(Schomaker&Trueblood,1968)[Schomaker,V.&Trueblood,K.N.(1968),《水晶学报》,B24,63-76。]),得出20个独立参数。如果可以忽略单个原子位移,并且可以接受原子运动纯粹是刚性的假设(例如,在低分辨率下),那么使用TLS建模原子位移可以显著减少拟合参数的总数。在下文中,我们将使用基本刚体运动参数作为直接参数化,并使用T型L(左)S公司矩阵,如(2)[链接],作为间接参数化。

与直接参数化相比,间接参数化在数学上和计算上更简单。这是因为T型L(左)S公司矩阵与原子位移参数U型使用(2)[链接]相反,直接参数化需要大量的数学步骤,这些步骤将原子运动的参数(例如振动和平动的振幅)联系起来等。)TLS矩阵的元素(例如,请参见Urzhumtsev等。, 2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】). 因此,毫不奇怪,诸如菲尼克斯定义(黄嘌呤等。, 2012[Afonine,P.V.、Grosse Kunstleve,R.W.、Echols,N.、Headd,J.J.、Moriarty,N.W.、Mustyakimov,M.W.、Terwilliger,T.C.、Urzhumtsev,A.、Zwart,P.H.和Adams,P.D.(2012)。晶体学报,D68,352-367。])和REFMAC公司(穆尔舒多夫等。, 1997【Murshudov,G.N.,Vagin,A.A.&Dodson,E.J.(1997),《结晶学报》D53,240-255。】)由于TLS的简单性,使用间接参数化;也就是说,它们细化了TLS矩阵的元素,而不是原子运动的实际参数。这种方法本身就存在问题,因为不受约束或不受约束精细化TLS矩阵不能保证原子运动的导出参数在物理上是真实的或符合TLS理论(例如,参见Zucker等。, 2010[Zucker,F.,Champ,P.C.和Merritt,E.A.(2010年),《晶体学报》D66889-900。]; Merritt,2012年【Merritt,E.A.(2012),《水晶学报》,D68,468-477。】; 乌尔珠姆塞夫等。, 2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】). 这与无约束非常相似精细化在典型的“大分子分辨率”下的原子坐标(例如2–3奥):事实上,这样精细化几乎肯定会导致立体化学扭曲。

1.3. TLS模型的两种可能解释

人们可以想出至少两种可能的方法来解释TLS的结果精细化。一种解释认为,如果TLS建模能够改善R(右)因子和原子位移参数U型TLS、,n个使用(2)从精化的TLS矩阵导出[链接]是真实的(例如,它们在相邻原子之间平滑变化)。如果TLS参数除了有意义的ADP和改进的模型-数据拟合外,还符合Schomaker&Trueblood(1968)提出的相应理论的基本假设,则更保守的方法认为TLS建模是成功的[Schomaker,V.&Trueblood,K.N.(1968),《水晶学报》,B24,63-76。]). 当使用TLS参数建模的原子运动用于描述分子运动时,这一附加要求非常重要(Trueblood,1978【Trueblood,K.N.(1978),《水晶学报》,A34,950-954。】; Trueblood&Dunitz,1983年【Trueblood,K.N.和Dunitz,J.D.(1983),《结晶学报》B39,120-133。】; 或漫反射X射线散射数据(Van Benschoten等。, 2015【Van Benschoten,A.H.、Afonine,P.V.、Terwilliger,T.C.、Wall,M.E.、Jackson,C.J.、Sauter,N.K.、Adams,P.D.、Urzhumtsev,A.和Fraser,J.S.(2015)。晶体学报D71,1657-1667。】),或进行生物学意义分析(Kuriyan&Weis,1991[Kuriyan,J.&Weis,W.I.(1991),美国国家科学院院刊,88,2773-2777.]; 哈里斯等。, 1992【Harris,G.W.,Pickersgill,R.W.、Howlin,B.&Moss,D.S.(1992),《结晶学报》,B48,67-75。】; Šali公司等。, 1992【Šali,A.,Veerapandian,B.,Cooper,J.B.,Moss,D.S.,Hofmann,T.&Blundell,T.L.(1992),《蛋白质》,第12期,第158-170页。】; Wilson&Brunger,2000年【Wilson,M.A.&Brunger,A.T.(2000),《分子生物学杂志》3011237-1256。】; Raaijmakers公司等。, 2001【Raaijmakers,H.,Törö,I.,Birkenbihl,r.,Kemper,B.&Suck,D.(2001),《分子生物学杂志》,308,311-323.】; 你自己等。2002年【Yousef,M.S.,Fabiola,F.,Gattis,J.L.,Somasundaram,T.&Chapman,M.S(2002),《结晶学报》D582009-2017年。】; 帕皮兹等。, 2003【Papiz,M.Z.,Prince,S.M.,Howard,T.,Cogdell,R.J.&Isaacs,N.W.(2003),《分子生物学杂志》3261523-1538.】; 乔杜里等。, 2004【Chaudhry,C.,Horwich,A.L.,Brunger,A.T.&Adams,P.D.(2004),《分子生物学杂志》342,229-245。】); 另见Merritt(1999)中的讨论【Merritt,E.A.(1999),《晶体学报》,D551997-2004年。】).

1.4. TLS模型ADP的分析和数值计算

TLS的解释精细化基本运动的结果(例如,参见豪林等。1993年【Howlin,B.,Butler,S.A.,Moss,D.S.,Harris,G.W.&Driessen,H.P.C.(1993),《应用结晶杂志》,第26期,第622-624页。】; 乌尔珠姆塞夫等。, 2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】,2016年【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2016),《水晶学报》第72期,第1073-1075页。】)提供了验证相应运动参数是否符合TLS理论的机会。这可以通过以下两个步骤执行。首先,从细化的TLS矩阵中提取的基本群运动参数可以用于获得对这些运动进行采样的模型集合。反过来,(1)[链接]可用于将系综转换回单个模型,使用相应的ADP值描述原子位置的不确定性,U型合奏,n个第二,(2)[链接]可用于计算不确定性U型TLS、,n个直接来自TLS矩阵的原子位置。可以直观地预期U型TLS、,n个U型合奏,n个将在一定公差内匹配。公差需要考虑舍入误差和集合中有限数量的模型。两者之间的差异U型TLS、,n个U型合奏,n个超出此容差可能表示相应TLS集合存在各种问题。

自当前使用以来精细化程序使用不使用约束或约束的间接TLS参数化,可能在数学上无法从细化的TLS矩阵中提取运动参数(Urzhumtsev等。, 2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】,2016年【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2016),《水晶学报》第72期,第1073-1075页。】). 最简单的例子是T型L(左)矩阵是非正定的。一个更微妙的例子是,元素运动的参数可以从TLS矩阵中提取,但可能不满足关于TLS模型的基本假设(例如,平动振幅太大,导致原子运动不和谐;见图1[链接]和§[链接]2).

[图1]
图1
()沿垂直轴纯振动的原子位移示意图(浅蓝色和深蓝色箭头)和(b条)用于围绕垂直于视图的轴(亮红色和暗红色箭头)进行平动,如五原子虚拟模型(黑点)所示。颜色较浅的箭头对应振幅较大的位移。振动和平动的位移在小振幅下相似,在大振幅下不同(b条). 大振幅振动位移的曲率(b条)使它们不和谐。

当可以从TLS矩阵中提取运动参数时U型合奏,n个U型TLS、,n个需要对上述公差进行测量和阈值(在§[链接]2.1). U型合奏,n个根据集合中模型的数量,我们使用一个简单的测试系统来估计需要多少个模型才能准确地对群体运动进行采样,还可以估计各个矩阵相似性的可能阈值(§[链接]2.2). 然后使用更真实的蛋白质模型(§[链接]2.3). 这些测试强调了U型TLS、,n个U型合奏,n个矩阵并促进TLS分析的进一步改进(§[链接]2.4). 在§[链接]3我们讨论了将我们的程序应用于PDB中所有模型的结果(伯恩斯坦等。, 1977[Bernstein,F.C.,Koetzle,T.F.,Williams,G.J.,Meyer,E.F.Jr,Brice,M.D.,Rodgers,J.R.,Kennard,O.,Shimanouchi,T.&Tasumi,M.(1977),《分子生物学杂志》,第112期,第535-542页。]; 伯曼等。, 2000[Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。核酸研究28,235-242。])包含TLS信息的。相应的工具已添加到菲尼克斯套房(亚当斯等。, 2010【Adams,P.D.等人(2010),《水晶学报》,D66,213-221。】).

2.各向异性位移矩阵和相应的模型集合

2.1. 矩阵比较指标

为了评估两组各向异性位移矩阵的相似性,U型TLS、,n个U型合奏,n个,对于由N个原子,n个= 1, 2, …,N个,我们任意选择使用简单的R(右)-工厂类型指标,

[R_{\bf U}({\bfU}_1,&{\bf-U}_2)=2{{\textstyle\sum\limits_n\sum\limits_{i,j=1}^3\left|{\bv U}_{1,n}^{(i,j)}-{\bf U}_2,n}^}{(i,j){\right|}\over{\texttyle\sum\rimits_n\sum\limits _{i \bf U}_{1,n}^{(i,j)}\right|+\left|{\bf U}_{2,n}^{

哪里U型1,n个=U型TLS,n个U型2,n个=U型合奏,n个在这里,求和是对矩阵的所有元素和群的所有原子进行的。也可以使用其他指标(Dunitz&White,1973【Dunitz,J.D.&White,D.N.J.(1973),《晶体学报》,A29,93-94。】; 扎克等。, 2010【Zucker,F.,Champ,P.C.&Merritt,E.A.(2010),《水晶学报》,D66889-900。】). 具体而言,Kullback–Liebler(KL)分歧(Kullback&Leibler,1951【Kullback,S.&Leibler,R.A.(1951),《数学年鉴》第22卷,第79-86页。】; 穆尔舒多夫等。, 2011【Murshudov,G.N.,Skubák,P.,Lebedev,A.A.,Pannu,N.S.,Steiner,R.A.,Nicholls,R.A..,Winn,M.D.,Long,F.&Vagin,A.A..(2011),《晶体学报》,D67,355-367。】; Merritt,2011年【Merritt,E.A.(2011),《水晶学报》,A67,512-516。】, 2012【Merritt,E.A.(2012),《水晶学报》,D68,468-477。】)和相关系数(抄送紫外线; 梅里特,1999【Merritt,E.A.(1999),《晶体学报》,D551997-2004年。】)这似乎是最突出的,但需要注意的是,它们需要矩阵求逆,这在只考虑一个运动的数值测试中并不总是可能的。

(4)的计算[链接]取决于用于获得U型合奏,n个这是一个随机过程,取决于随机种子值和集合中模型的数量。下面,我们分析这些参数如何影响U型合奏此外,我们还检查是否使用KL紫外线或CC紫外线得出的结论与使用R(右)U型.

2.2. 使用单原子模型的插图

为了简单起见,在本节中,我们删除了下标n个U型合奏U型TLS公司因为只考虑单个原子。

2.2.1. 振动的影响

在这个测试中,我们考虑一个由单个原子沿公牛轴。对于每次试验,均方根偏差(r.m.s.d.,我们称之为振幅t吨),我们生成了M(M)这个原子的随机拷贝,然后取所有这些拷贝来计算U型合奏使用(1)[链接]。然后我们使用(4)[链接]进行比较U型合奏具有相应的U型TLS公司=T型使用(2)进行解析计算[链接]具有L(左)=S公司= 0. 每次试验t吨我们用不同的随机种子重复了100次这些计算。显然,对于不同的试验U型TLS公司保持不变U型合奏变化。图2([链接])显示平均值(超过100次试验)R(右)U型对于不同的试验值t吨M(M).结果基本上独立于t吨。这是自〈Δx个2〉英寸(1)[链接]与…成比例T型xx个=t吨x个2在(2)中[链接]对于足够多的模型。我们观察到R(右)U型当信号群的大小达到约10时,接近0.01000个型号。

[图2]
图2
双方协议U型合奏U型TLS公司为单原子模型计算的矩阵。R(右)U型(100次随机运行的平均值)显示为数字对数的函数M(M)不同型号的()振动和(b条)平动r.m.s.d.值。(c(c))R(右)U型(实线)和KL紫外线(虚线)= 10−6作为振动r.m.s.d.值的函数d日用于由5000个生成模型组成的信号群。(d日)R(右)U型作为振动r.m.s.d.值的函数d日放大了d日= 0.0–0.1rad范围,显示平均值(黑色曲线)以及从用于平均值的100次跑步中选择的三次单独跑步(褐红色、蓝色和绿色)。(e(电子))抄送紫外线计算了几个值(10−2, 10−4, 10−6和10−8). ((f))吉隆坡紫外线计算相同值和小d日价值观;曲线值为10−6和10−8无法区分。详见正文。
2.2.2. 平动效应

在这里,我们使用了与上述相同的单原子模型和相同的计算流程,只是我们改变了平动r.m.s.d.值d日类似于前面的例子,R(右)U型作为集合大小的函数,在大约5000–10年内达到一个平台集合中有1000个模型(图2[链接]b条); 然而,高原水平取决于d日。然后我们采样了大量d日将集合大小固定在5000个模型上的值(图2[链接]c(c)和2[链接]d日). 我们观察到R(右)U型保持大约恒定(~0.02),直到d日0约0.15rad,然后开始单调增加。这个d日0此数值实验中获得的值对应于Urzhumtsev中讨论的小旋转的线性近似极限等。(2013【Urzhumtsev,A.,Afonine,P.V.&Adams,P.D.(2013),《结晶学》第19版,第230-270页。】)以及其中引用的其他作品,例如Cruickshank(1956[克鲁克申克,D.W.J.(1956),《水晶学报》,第9期,第757-758页。]). 由于舍入误差以及旋转运动和直线运动之间的差异R(右)U型即使非常小,值也不会达到零d日和大型合奏(图2[链接]c(c)). 此外,虽然几个试验的平均值是稳定的,但在各个试验之间可能会有所不同(图2[链接]d日). 这些结果使我们得出了两个结论。首先,发电量约5000-10000个模型足以进行估算U型合奏可靠(§[链接]2.3我们表明,对于现实的大分子模型,情况仍然如此)。其次,我们可以考虑U型合奏同意U型TLS公司对于特定TLS集,如果R(右)U型约为0.05或更小。

2.2.3. 检查其他指标

为了说明在以前的测试中获得的结果与矩阵比较指标无关,我们重复了§[链接]2.2.2使用其他指标,如KL紫外线和CC紫外线。由于这些度量需要矩阵求逆,因此我们必须进行一个小的修改,包括为各个矩阵的所有对角元素添加一个小值U型合奏和相应的U型TLS公司这是一个与各向同性振动的卷积。例如,修改后的KL紫外线公制为KL紫外线=信托收据(U型V(V)−1+V(V)U型−1− 2)带有U型=U型+V(V)=V(V)+.比例因数before‘tr’用于将结果放在类似的尺度上(以便于比较)。经过反复试验,我们发现在10范围内−8–10−6允许计算KL紫外线和CC紫外线但对结果没有显著影响。总的来说,吉隆坡紫外线,抄送紫外线R(右)U型不要相互矛盾(图2[链接]c(c)),带CC紫外线表现出对(图2[链接]e(电子))和两个KL紫外线和CC紫外线显示出不太明显的下降(图2[链接]e(电子)和2[链接](f))位于d日0约0.10–0.15拉德(见克鲁克申克,1956[克鲁克申克,D.W.J.(1956),《水晶学报》,第9期,第757-758页。])与…相比R(右)U型。在下面我们使用R(右)U型因为原始矩阵可以在不修改的情况下使用,并且与KL不同,它具有可预测的值范围紫外线.

2.3. 使用蛋白质模型的插图

作为一个更现实的例子,我们选择了IgG结合结构域III的模型(PDB条目2 igd(集成电路); S.Butterworth、V.L.Lamzin、D.B.Wigley、J.P.Derrick和K.S.Wilson,未发表作品),精炼为1.1使用单个各向异性ADP值的分辨率。我们选择这个模型的核心作为一个含有6–61残基的单一TLS基团(去掉了灵活的N末端)。

我们考虑了从这些数据导出的两个模型。一个模型包含Cα只有原子(总共56个),而另一个模型包括所有主链原子(Cα、O、C和N)。两种模型均被视为一个TLS组。对于每个模型,我们将TLS矩阵拟合到各个各向异性U型n个使用菲尼克斯.tls工具;我们将这些矩阵称为TLS加利福尼亚州和TLS国会议员分别是。然后,使用两个TLS集合(TLS加利福尼亚州和TLS国会议员)我们计算了一下U型TLS、,n个使用(2)[链接]并生成U型合奏,n个如Urzhumtsev所述等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】). 类似于§[链接]2.2,我们对每个集合的不同数量的模型进行了采样。

图3中的蓝色虚线曲线[链接]()显示了对于Cα-仅型号(TLS加利福尼亚州)R(右)U型当集合包含大约5000个模型时,变得小于0.05;使用更大的合奏不会改变R(右)U型明显地。这与§[链接]2.2. 对于主链模型R(右)U型对于包含相同数量模型的集合,达到了一个平台,但R(右)U型不会降低到0.09以下(图3中的红色虚线[链接]). 为了调查R(右)U型我们进行了以下测试。

[图3]
图3
协议R(右)U型之间U型合奏U型TLS公司矩阵是为蛋白质数据计算的生成模型数量的函数。()的结果2个igd由所有主链原子(红色)和C组成的模型α仅原子(蓝色)使用不同的方法提取元素运动:(10)的虚线[链接]和(11)的完整行[链接](b条)的结果400万模型使用(10)[链接]显示为虚线和(11)[链接]显示为一整行。

首先,我们注意到两个模型之间的唯一区别是它们的组成和TLS矩阵(图4[链接]). 为了确定两者中的哪一个,即组成或TLS矩阵R(右)U型值,我们使用C重复了上述计算α-只有配备TLS的型号国会议员矩阵与TLS主链模型加利福尼亚州矩阵。在第一种情况下R(右)U型为0.09,第二例为0.05。这表明R(右)U型是由于TLS矩阵,而不是由于模型组成。了解TLS的哪些功能国会议员对增加的R(右)U型,我们进行了进一步的分析。

[图4]
图4
为计算的TLS矩阵2个igd所有主链原子(右)和C的模型α仅原子(左)。矩阵根据PDB约定给出:T型单位为奥2L(左)单位为度2S公司单位为奥度。

TLS矩阵编码的基本运动是三个螺旋振动(围绕三个相互正交的轴x个z)与三个振动耦合,也大约是三个相互正交的轴v(v)x个v(v)v(v)z在下文中,d日x个d日d日z代表平动振幅,t吨x个t吨t吨z代表振幅,x个z代表相应的螺杆参数和w个x个w个w个z代表属于各自平动轴的点(有关正式定义,请参见Urzhumtsev等。, 2013【Urzhumtsev,A.,Afonine,P.V.&Adams,P.D.(2013),《结晶学评论》,第19期,第230-270页。】). 如§所述[链接]2.2,条件U型合奏,n个U型TLS、,n个(对于集合中足够多的模型)可能由于振动不足而非振动而发生故障。为了分离振动和平动的贡献,我们首先推导了基本运动的参数集

[{\rm MP_{all}}=(d_x,d_y,d_z\semi-s_x,s_y,s_z\semit_x,t_y,t_z)\eqno(5)]

根据Urzhumtsev中描述的相应TLS矩阵等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】). 在这里和下面,为了简化文本,我们删除了参数x个z;w个x个w个w个z;v(v)x个v(v)v(v)z从(5)中的列表[链接]因为它们在这些测试中是不变的。然后,使用(5)中的参数[链接](表2[链接])和Cα-只有模型,我们计算U型合奏,n个U型TLS、,n个用于以下不同的场景。

表2
基本运动的组成部分

上面的四个块对应于PDB条目的TLS矩阵2个igd为C计算α仅原子(TLS加利福尼亚州)对于主链原子(TLS国会议员). TLS矩阵用(10)分解[链接]或(11)[链接]使用Urzhumtsev中描述的约束等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015)。晶体学报D71,1668-1683。】). 底部的两个块对应于PDB入口的模型400万.矢量v(v)x个v(v)v(v)zx个z振动基和平动基分别以主基的笛卡尔坐标给出[M(M)]原点位于组质心,轴平行于晶体轴。要点w个x个w个w个z(以Å为单位)在正交基中给出[L(左)]由主平动轴组成x个z并描述这些轴从原点的偏移。振动幅度d日x个d日d日z以弧度和振幅表示t吨x个t吨t吨z和螺钉组件x个z单位为奥。有关定义的详细信息,请参阅Urzhumtsev等。(2013【Urzhumtsev,A.,Afonine,P.V.&Adams,P.D.(2013),《结晶学评论》,第19期,第230-270页。】).

TLS公司 t吨x个t吨t吨z v(v)x个v(v)v(v)z d日x个d日d日z x个z w个x个w个w个z x个z
PDB条目2igd
TLS公司加利福尼亚州(10)[链接] 0.163 (−0.085, 0.437, 0.896) 0.011 (−0.262, 0.915, −0.308) (−12.67, −0.39, 16.71) −2.07
  0.278 (0.905, 0.410, −0.114) 0.019 (−0.067, 0.301, 0.951) (1.65, 0.97, 8.55) −0.88
  0.304 (−0.417, 0.801, −0.430) 0.027 (0.963, 0.270, −0.017) (−4.67, −3.47, 0.76) 0.80
TLS公司国会议员(10)[链接] 0.089 (−0.082, 0.334, 0.939) 0.010 (−0.272, 0.943, −0.193) (−14.16, −1.74, 22.42) −5.70
  0.277 (0.948, 0.316, −0.030) 0.020 (−0.113, 0.168, 0.979) (0.49、0.11、11.77) −0.24
  0.314 (−0.306, 0.888, −0.343) 0.027 (0.956, 0.288, 0.061) (−4.92, −3.54, −0.25) 0.89
TLS公司加利福尼亚州(11)[链接] 0.163 (−0.085, 0.433, 0.897) 0.011 (−0.262, 0.915, −0.308) (−12.67, −0.39, 16.71) −0.09
  0.279 (0.902, 0.417, −0.116) 0.019 (−0.067, 0.301, 0.951) (1.65, 0.97, 8.55) −0.30
  0.305 (−0.424, 0.799, −0.426) 0.027 (0.963, 0.270, −0.017) (−4.67, −3.47, 0.76) 1.12
TLS公司国会议员(11)[链接] 0.083 (−0.078, 0.332, 0.940) 0.010 (−0.272, 0.943, −0.193) (−14.16, −1.74, 22.42) −0.43
  0.282 (0.931, 0.362, −0.051) 0.020 (−0.113、0.168、0.979) (0.49、0.11、11.77) 0.97
  0.314 (−0.357, 0.871, −0.337) 0.027 (0.956, 0.288, 0.061) (−4.92, −3.54, −0.25) 1.58
PDB入门级4muy
TLS公司全部的(10)[链接] 0 (0.951, 0.286, −0.117) 0.001 (0.649, 0.500, −0.573) (−219.91, −11.67, −256.03) 303.63
  0.257 (−0.220, 0.893, 0.393) 0.008 (−0.633, 0.773, −0.042) (−49.29、57.65、−1.63) 2.90
  0.363 (0.216, −0.348, 0.912) 0.014 (0.421, 0.390, 0.819) (−72.36, −52.48, −124.89) −3.11
TLS公司全部的(11)[链接] 0.241 (0.227, 0.947, 0,225) 0.001 (0.649、0.500、−0.573) (−219.91, −11.67, −256.03) 0.11
  0.321 (−0.582, −0.053, 0.811) 0.008 (−0.633, 0.773, −0.042) (−49.29, 57.65, −1.63) −3.38
  0.396 (0.780, −0.316, 0.540) 0.014 (0.421, 0.390, 0.819) (−72.36, −52.48, −124.89) −5.14

首先,我们考虑了一个场景,其中所有三个振动一起使用,包括它们的螺杆组件,而振动被排除在外:

[{\rm MP_{no\,\,V}}=(d_x,d_y,d_z\semis_x,s_y,s_z\semi0,0,0).\eqno(6)]

排除振动导致R(右)U型对于两个TLS国会议员和TLS加利福尼亚州; 中的值R(右)U型表1中的(无V)列[链接]大约1.5倍2比那些R(右)U型(全部)。

表1
分析两者之间的差异U型合奏,n个U型TLS、,n个使用R(右)U型

用于PDB条目2个igd,两个TLS集,称为TLS加利福尼亚州和TLS国会议员,源自C的各向异性ADPα仅原子或主链原子。对于每一组,元素运动的参数使用(10)确定[链接]或(11)[链接]使用Urzhumtsev中描述的约束等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】). 对于两个TLS集,由C组成的相同模型α原子仅用于生成U型合奏,n个并将其与各自的U型TLS、,n个。对于400万模型所有原子都用于确定TLS矩阵和生成U型合奏,n个; 元素运动由以下任一项决定(10)[链接]或(11)[链接]. TheR(右)U型(all)列显示了使用整套运动(平动和振动)时的比较结果(5)[链接]. TheR(右)U型(无V)列表示在排除振动部件的情况下仅使用三次振动的情况(6)[链接].接下来的三列[R(右)U型(d日x个x个),R(右)U型(d日)和R(右)U型(d日zz)]显示了仅使用一个振动和相应螺钉的情况下的结果(7)[链接].最后三列[R(右)U型(d日x个),R(右)U型(d日)和R(右)U型(d日z)]表示纯平动(8)[链接].

TLS公司 方法 R(右)U型(全部) R(右)U型(无V) R(右)U型(d日x个x个) R(右)U型(d日) R(右)U型(d日zz) R(右)U型(d日x个) R(右)U型(d日) R(右)U型(d日z)
PDB条目2个igd
TLS公司加利福尼亚州 (10)[链接] 0.04 0.07 0.14 0.05 0.03 0 0.02 0.01
TLS公司国会议员 (10)[链接] 0.09 0.15 0.28 0.01 0.03 0 0.02 0.01
TLS公司加利福尼亚州 (11)[链接] 0.01 0.02 0.01 0.02 0.04 0 0.02 0.01
TLS公司国会议员 (11)[链接] 0.01 0.02 0.03 0.04 0.04 0 0.02 0.01
PDB条目400万
TLS公司全部的 (10)[链接] 0.61 0.85 0.89 0.25 0.27 0.01 0.01 0.01
TLS公司全部的 (11)[链接] 0.05 0.11 0.02 0.27 0.42 0.01 0.02 0

其次,我们计算了R(右)U型每个单独的振动,包括其相应的螺钉组件(表1[链接],第5-7列),

[\eqalignno{{rm MP}_{d_x,s_x}&=(d_{x},0,0\semi-s_{x},0,0 \semi-0,0),\cr{rm MP}_{dy,s_y}&=半0,0,0),&(7)}]

没有它,

[\eqalignno{\rm MP}_{d_x}&=(d_{x},0,0\semi 0,0,0\semi 0,0),\cr{\rm MP}_{d_y}&=(0,d_{y},0\semi 0,0,0\semi 0,0,0),\cr{\rm MP}_{d_z}&=(0,0,d_{z}\semi 0,0,0\semi 0,0)。&(8)}]

(表1[链接],第8-10列)。对于螺钉振动,R(右)U型对于旋转来说很大x个(表1[链接]),这可能是由于螺杆组件的数量较大x个。此组件是TLS的2.5倍国会议员与TLS相比加利福尼亚州(−5.70−2.07;表2[链接]),导致大约两倍大R(右)U型值。拆下所有螺钉组件会导致R(右)U型所有振动均为0.01量级[R(右)U型(d日x个),R(右)U型(d日)和R(右)U型(d日z)表1中的列[链接]].

这些测试让我们得出两个结论。首先,可靠计算U型合奏,n个不依赖于模型大小,与单原子情况类似(§[链接]2.2), 5000–10000个型号就足够了。其次,螺杆组件的大值导致了U型合奏,n个U型TLS、,n个和大规模的重建R(右)U型这一结论促使我们重新审视Urzhumtsev中描述的TLS分解算法等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】).

2.4. TLS分解的改进

在将TLS矩阵分解为基本运动的过程中,明确定义了一些参数,包括振动振幅和轴。然而,螺钉参数是使用S公司矩阵,它不是唯一的,而是用任意常数定义的σ可以在其对角线元素上加减(Schomaker&Trueblood,1968)[Schomaker,V.&Trueblood,K.N.(1968),《水晶学报》,B24,63-76。]). 这种自由的定义S公司不会改变ADP,并为TLS矩阵的替代(可能更好)分解提供了可能性。在Urzhumtsev等。(2013【Urzhumtsev,A.,Afonine,P.V.&Adams,P.D.(2013),《结晶学评论》,第19期,第230-270页。】)我们讨论了传统选择σ从条件

[{\rm tr}(S)=(S_{xx}-\sigma)+(S_{yy}-\sigma)=0。\等式(9)]

在这里S公司xx个S公司S公司zz(嗡嗡声)是矩阵的对角元素S公司在基础上表示[L(左)]主要平动方向;这些方向是矩阵的特征向量L(左).在Urzhumtsev等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】)我们证明了(9)[链接]可能导致TLS矩阵与元素运动不对应,为了解决这个问题,我们建议更好地选择t吨值,

[|{\rm tr}(S)|=|(S_{xx}-\sigma)+(S_{yy}-\σ)+(S{zz}-\sigma)|\to\min\limits_\sigma\eqno(10)]

在某些附加约束下σ在那篇论文中讨论过。

如前一段所示,过大的螺钉参数会导致U型合奏,n个U型TLS、,n个这表明(9)的更好替代方案[链接]和(10)[链接]可能是选择σ使螺旋向量的范数最小||. 新的条件是

[\eqaligno{|{\bfs}|^2=&\s_x^2+s_y^2+s_z^2=L_{xx}^{-2}(s_{xx}-\sigma)^2+L_{yy}^{-2-}(s_{y}-\sigma

这里,根据Urzhumtsev中的方程式(5)和(8)等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】),S公司xx个σ=x个d日x个2〉和L(左)xx个= 〈d日x个2〉(以及其他四个项的类似表达式)是矩阵的对角元素S公司L(左)在基础上给出[L(左)].

为了测试调整S公司矩阵,我们使用了§[链接]2.3. 对于每组矩阵,TLS国会议员或TLS加利福尼亚州,我们使用(11)提取元素运动[链接],生成U型合奏,n个使用相应的模型,然后计算R(右)U型使用先前获得的值U型TLS、,n个.表1[链接]显示更新的R(右)U型使用(11)计算的值[链接]调整S公司对于TLS而言,不仅总运动,而且每个单独的组件都可以接受的低加利福尼亚州和用于TLS国会议员.图3[链接]()显示R(右)U型图作为生成模型数量的函数。这两种模型的曲线几乎相同,显示出更低的值R(右)U型比C的原始曲线α-仅模型。

将新的校正方法应用于实际示例PDB条目时,获得了更显著的结果400万(跨度等。, 2014【Span,I.,Wang,K.,Eisenreich,W.,Bacher,A.,Zhang,Y.,Oldfield,E.&Groll,M.(2014),美国化学学会杂志136,7926-7932.】). 在所有测试中,按照PDB文件中的定义使用TLS组。这个400万该模型由40个TLS基团组成,我们重点关注6号基团(链中的65–77残基A类). 使用上述方法将报告的TLS矩阵分解为运动参数(Urzhumtsev等。, 2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】)建议删除σ= 10−5从对角线元素S公司矩阵(用Ω表示拉德)。这个R(右)U型对应于这些矩阵的值非常高,为0.61,表明U型合奏,n个U型TLS、,n个(图5[链接]和5[链接]b条图3中的虚线[链接]b条). 我们怀疑,这种分歧是由于螺杆参数值非常大造成的x个对于绕轴旋转的螺钉,为303.6x个(表1[链接]). 申请(11)[链接]调整S公司矩阵产生于σ增加到42×10−5反过来又减少了x个并将相应的R(右)U型从0.89到0.02。图5[链接](c(c))显示了使用(11)提取的螺旋振动参数获得的热椭球[链接]:很明显,U型合奏,n个U型TLS、,n个更相似(与图5相比[链接]). 图6[链接]显示了R(右)U型和,共||作为的函数σ价值;事实上R(右)U型观察到σ使用(11)获得[链接]. TheR(右)U型整体运动减小到可接受的值0.05,仅平动一项,从0.85减小到0.11。后一个值仍然很高,可能是因为x个该程序增加了z(分别从2.90到−3.38和从−3.11到−5.14;表1[链接]和2[链接]). 此测试显示了新方法的优点(11)[链接]与(9)相比[链接]和(10)[链接]以及它的局限性。在本测试中,使用其他规范,尤其是最大值{|x个|, ||, |z|},在(11)中[链接]没有改善结果。一般来说,不能保证(11)[链接]始终会得到最佳的螺杆参数,可能需要进一步改进,例如,通过在σ通过(11)获得的值[链接].

[图5]
图5
这个U型椭球体显示为PyMOL公司(德拉诺,2002【DeLano,W.L.(2002),PyMOL。https://www.pymol.org。])对于400万模型。()U型TLS公司矩阵。(b条)U型合奏用(10)获得的基本运动计算矩阵[链接](c(c))U型合奏用(11)获得的基本运动计算矩阵[链接].
[图6]
图6
向量范数的变化|| (11)[链接](栗色)和R(右)U型值(黑色)作为参数的函数σ从的所有对角线元素中同时减去S公司TLS矩阵分解为元素运动参数时的矩阵(400万数据;参见§[链接]2.4). 中的小振荡R(右)U型说明其随机性。

图3[链接](b条)显示R(右)U型作为集成大小的函数400万使用通过(10)获得的参数生成的模型[链接]和(11)[链接]它显示了两种方法在校正S公司矩阵,也证实了之前的观察结果,即5000–10000个型号就足够了。

3.PDB分析和TLS分解的改进

3.1. 模型选择和分析设置

PDB(截至2016年11月14日)包含123个954项,其中32项162包含TLS记录。由于每个PDB条目可能包含多个TLS记录,因此总共有260条PDB中提供了353个TLS组。对于每一组,我们都试图确定相应的元素运动。这是使用执行的菲尼克斯.tls_as_xyz如Urzhumtsev所述等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】).

88697个基团可以用元素运动来解释。在263种情况下,所有三个矩阵都是由零组成的。另外314个组被排除在外,因为存放的TLS信息以多种不同的方式损坏(缺少TLS组源、无法解释的原子或TLS记录等。).

其余88人120个TLS集合经过三轮独立的分解成元素运动,每轮都对S公司矩阵使用(9)[链接], (10)[链接]和(11)[链接]分别是。使用(10)时[链接]和(11)[链接]对的约束σ在Urzhumtsev中描述等。(2015【Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015),《水晶学报》第71期,1668-1683页。】)已应用。对于每组提取的参数值,我们分析了以下运动。

  • (i) 三个螺杆旋转和振动部件的组合,整体运动(5)[链接].

  • (ii)螺杆旋转与无振动部件的组合(6)[链接].

  • (iii)三个螺钉分别旋转(7)[链接].

  • (iv)三次纯旋转中的每一次(8)[链接].

我们计算了每一个运动U型TLS、,n个。然后,我们使用菲尼克斯.tls_as_xyz我们用这个系综来计算U型合奏,n个。最后,我们比较了U型合奏,n个具有U型TLS、,n个使用R(右)U型该分析的详细信息见表3[链接]下面对和进行了评论。

表3
具有ADP矩阵且可通过显式组运动再现的TLS组数(R(右)U型≤ 0.05)

PDB内容(2016年11月):32162个条目包含TLS记录,260总计353个TLS组。对于263个TLS组,所有三个矩阵都为零,这些组被排除在进一步的工作之外。使用(9)将TLS矩阵分解为元素运动的参数[链接],(10)[链接]和(11)[链接]。“提取的组”列显示可以提取参数的TLS组的总数,“提取的条目”显示所有组都可以提取的PDB条目数`“错误内容”表示由于技术原因无法生成随机模型的组数,“未定义的平动”表示所有平动矩阵为零的组数。其他列:整体运动(5)[链接],整体平动(6)[链接],对组的三个振动中的每一个进行条件验证,包括其螺钉组件(7)[链接]以及组(8)的三个纯平动中每一个的验证条件[链接].

方法 提取的条目 提取的组 错误的内容 整体运动 振动未定义 整体平动 单个螺钉 单个平动
方程式(9)[链接]
总计 4290 88434 314 88120 167 87953 87953 87953
R(右)U型≤ 0.05       45093   23042 6107 87908
方程式(10)[链接]
总计 4826 95152 332 94820 167 94653 94653 94653
R(右)U型≤ 0.05       46627   24163 7478 94596
方程式(11)[链接]
总计 4826 95150 332 94818 167 94651 94651 94651
R(右)U型≤ 0.05       57463   31395 11238 94590

3.2. 使用(9)分析基本运动

表3[链接]显示了总体统计信息和具有的TLS组数R(右)U型≤ 0.05. 将所有基本组件组合在一起的整体运动(5)[链接],我们可以提取运动参数的TLS组中大约有一半通过了测试条件R(右)U型≤0.05(约占沉积TLS组总数的17%)。仅考虑平动组件时适用的相同条件(6)[链接]将可接受的群体数量大约减少了一半。如果单独考虑振动(方程式7[链接]和8[链接])标准R(右)U型≤0.05仅选择2.3%的TLS组(6107组)。

使用纯旋转可以得到45组R(右)U型>0.05,所有这些都对应于较大的振动振幅。因此U型合奏,n个U型TLS、,n个是螺钉组件。

我们检查了(图7[链接])TLS组的分布与R(右)U型计算整体运动(5)[链接],对于不包括振动的运动(6)[链接]并分别用于螺钉组件(7)[链接]。第一个分布(褐红色全矩形)在0.02–0.05之间有一个峰值,对应于符合基础研究的TLS矩阵。然而,对于大量设置,该值高于0.05。主要问题来自螺钉组件,许多TLS组都有一个R(右)U型高于0.10或甚至高于0.20(蓝色的完整矩形)。

[图7]
图7
TLS组在PDB中的分布。()具有的TLS组数R(右)U型给定间隔内的值;显示了总运动(褐红色)、不包括振动分量的总运动(绿色)和单个螺杆旋转(蓝色)的分布。使用(9)时显示直方图[链接](全矩形)和(11)[链接](开放矩形)。(b条)作为螺杆参数函数的螺杆转数||; 使用(9)时显示直方图[链接](蓝色矩形),(10)[链接](浅蓝色矩形)和(11)[链接](开放矩形)。R(右)U型计算所有独立螺杆振动的值(7)[链接](c(c))不同TLS组的数量R(右)U型给定间隔的值||. 通过使用(9)的程序提取螺钉参数[链接];R(右)U型值的计算方法如下(b条). 参见§[链接]3了解详细信息。

最大的价值||在所有TLS组中观察到的值大于1000Å. 如此大的值意味着对于0.01的旋转拉德,大约0.6°,旋转的原子将移动10沿着旋转轴的方向,这显然是不现实的。图7[链接](b条)显示有许多组具有较大的值||. 螺杆参数越大||,越大R(右)U型值(图7[链接]c(c)). 然而,由于特定的螺杆运动还取决于振动振幅和轴的位置,因此仅使用该值无法明确区分非简谐旋转(图7[链接]c(c)).

3.3. 使用(10)分析基本运动[链接]和(11)[链接]

使用(10)中的方法[链接]与(9)相比,允许提取6700多个TLS集合的运动参数[链接].表3[链接]和图7[链接](b条)表明R(右)U型值和螺杆参数||类似于使用(9)[链接].

使用(11)重复相同的计算[链接]与使用(10)相比,显示出更大的差异[链接](表3[链接]). 综合考虑所有运动R(右)U型≤0.05增加结果超过12000组与使用组相比(9)[链接].仅考虑螺杆振动,满足条件的组数R(右)U型≤0.05是使用(9)的两倍[链接](表3中的“单个螺钉”列[链接]). 图7[链接](b条)显示了螺杆参数值较大时的旋转次数||显著减少。最大的价值||降至700以下?(仍然过大)。

图7[链接]()表明使用(11)中的方法[链接]而不是(9)中的内容[链接]显著地将所有三个分布向左移动(比较图7中的开放矩形和完整矩形[链接]),它提高了U型合奏,n个U型TLS、,n个特别是,R(右)U型仅分析总运动矩阵时,大多数TLS集合≤0.10(5)[链接]然而,仅考虑振动,R(右)U型>三分之一以上的模型为0.10,即使使用改进的分解为基本运动(11)[链接].

4.讨论

原子模型的验证现在是大分子晶体学中的例行工作,并且是提交给蛋白质数据库(Read等。, 2011[Read,R.J.等人(2011),《结构》,第19期,第1395-1412页。]; 戈尔等。, 2017[Gore,S.等人(2017),《结构》,第25期,1916-1927年。]). 它需要符合命名法并适合实验数据。原子坐标经过验证,包括立体化学和分子包装分析。原子位移参数(ADP)也要进行验证。对于各向同性ADP,现有的验证标准相当简单:它们的值必须为正值,不得过大,且相邻原子之间的变化不太大。对于各向异性ADP值,标准有些复杂(Hirshfeld,1976【Hirshfeld,F.L.(1976),《结晶学报》,A32,239-244。】; 施耐德,1996【Schneider,T.R.(1996)。CCP4研究周末会议记录。大分子精炼,E.Dodson,M.Moore,A.Ralph&S.Bailey编辑,第133-144页。沃灵顿:达斯伯里实验室。https://purl.org/net/epubs/work/35264。]). 与原子坐标和位移参数类似,TLS矩阵是模型参数,因此应进行某种形式的验证。根据公认的范例(§[链接]1.3)TLS验证的范围可能涉及两个问题:(i)TLS近似如何解释实验数据,以及它如何描述原子位移参数(例如,参见Merritt,2011)【Merritt,E.A.(2011),《水晶学报》,A67,512-516。】, 2012【Merritt,E.A.(2012),《水晶学报》,D68,468-477。】)和(ii)是TLS模型的特定描述符,除(i)外,还与TLS形式主义一致。解决第一个问题不需要分析TLS矩阵本身,只需要分析导出的ADP值。这包括确保ADP是正定的,并且在相邻原子和TLS基团之间平稳变化(Winn等。, 2001[Winn,M.D.、Isupov,M.N.和Murshudov,G.N.(2001),《结晶学报》D57122-133。]; 扎克等。, 2010【Zucker,F.,Champ,P.C.&Merritt,E.A.(2010),《水晶学报》,D66889-900。】; Merritt,2011年【Merritt,E.A.(2011),《水晶学报》,A67,512-516。】, 2012【Merritt,E.A.(2012),《水晶学报》,D68,468-477。】). 当前的工作解决了第二个问题,该问题专门关注TLS矩阵及其编码的群运动参数的分析。自现代原子模型以来精细化包使用间接TLS参数化(§[链接]1.3),他们细化了TLS矩阵的元素,而不是群运动的参数,毫不奇怪,发现一些TLS矩阵不符合TLS建模理论所基于的谐波运动假设。这种情况的数量可能因所使用的不同度量或阈值而异。例如,使用上述标准,我们发现PDB中报告的TLS组中只有2.3%可以根据元素谐波运动进行解释。我们设想了两个原因。首先,TLS的验证精细化这些结果,集中于TLS矩阵和相应的群运动,从未得到实施。其次,TLS的实现精细化在现代精细化软件包不允许通过约束或约束来控制群体运动的参数(参见Painter&Merritt,2006年的讨论【Painter,J.&Merritt,E.A.(2006),《水晶学报》,D62,439-450。】)因为这些参数是间接优化的。毫不奇怪,如此无拘无束精细化不保证TLS矩阵可以根据谐波元素运动进行解释。

在这项工作中,我们在菲尼克斯套件来分析TLS改进的结果。这些方法基于从TLS矩阵分析计算的单个原子位移参数与使用从TLS阵提取的元素运动参数数值推导的ADP的比较。我们认为,这些矩阵之间的巨大差异表明TLS参数存在问题。特别是,这可能表明TLS组或精细化协议。我们表明,对沉积的TLS矩阵进行后细化校正,可以精确处理一些但不是所有有问题的TLS组。

本工作中的分析取决于特定标准(指标和阈值)的选择。这些标准可能会进一步优化,这是一个非常重要的项目,可能有助于诊断问题,但仍无法解决问题。可能更好的投资是改进TLS精细化协议,使其根据先前提出的运动的基本参数进行操作(Tickle&Moss,1999[Tickle,I.&Moss,D.S.(1999)。高分子晶体结构细化中的刚体热运动建模。https://people.cryst.bbk.ac.uk/~tickle/iucr99/iucrcs99.html。]). 这将使直接控制再融资参数成为可能精细化因此,在不需要进行后期细化修正的情况下,保持它们的物理真实性。这在数学和算法上都是一项重大任务,可以视为对菲尼克斯 精细化软件。

本手稿中讨论的方法和工具已经实施,可在菲尼克斯1.12及更高版本。可用于复制图形和表格的数据和脚本可在https://phenix-online.org/phenix_data/afonine/tls2/.

脚注

1传统上,术语翻译用于表示无旋转组的纯移位。我们更喜欢用这个词振动,使用该术语时更连贯平动,而不是旋转。这允许T型要区分的矩阵:由于适当振动和由于明显位移而产生的矩阵。

2U型TLS,振动U型合奏,振动(4)分子中的振动相互抵消[链接]因为TLS模型中的纯振动总是谐波的。因此,(4)的分母[链接]全尺寸更大U型与仅用于平动的矩阵相比,矩阵更容易在坐标系中看到U型TLS,振动为对角线;所有的对角线元素U型矩阵总是非负的)。这意味着R(右)U型对于整体运动可以在排除振动分量后增加。

致谢

我们感谢N.W.莫里亚蒂博士对手稿的批判性阅读和有益的讨论。

资金筹措信息

该研究得到了NIH(拨款GM063210)和Phenix工业联合会的支持。根据合同DE-AC02-05CH11231,这项工作得到了美国能源部的部分支持。非盟感谢法国综合结构生物学基础设施(FRISBI;ANR-10-INBS-05)和Instruct-ERIC的支持和资源使用。

工具书类

第一次引用P.D.亚当斯。等。(2010).阿克塔·克里斯特。D类66,213–221科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Afonine,P.V.、Grosse-Kunstleve,R.W.、Echols,N.、Headd,J.J.、Moriarty,N.W.、Mustakimov,M.W.、Terwilliger,T.C.、Urzhumtsev,A.、Zwart,P.H.和Adams,P.D.(2012)。阿克塔·克里斯特。D类68, 352–367. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000年)。核酸研究。 28, 235–242. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Bernstein,F.C.,Koetzle,T.F.,Williams,G.J.,Meyer,E.F.Jr,Brice,M.D.,Rodgers,J.R.,Kennard,O.,Shimanouchi,T.&Tasumi,M.(1977年)。分子生物学杂志。 112, 535–542. CSD公司 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Chaudhry,C.、Horwich,A.L.、Brunger,A.T.和Adams,P.D.(2004年)。分子生物学杂志。 342, 229–245. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Cruickshank,D.W.J.(1956年)。阿克塔·克里斯特。 9, 757–758. 交叉参考 IUCr日志 科学网 谷歌学者
第一次引用DeLano,W.L.(2002)。PyMOL公司.https://www.pymol.org谷歌学者
第一次引用Dunitz,J.D.&White,D.N.J.(1973)。阿克塔·克里斯特。A类29, 93–94. 交叉参考 IUCr日志 科学网 谷歌学者
第一次引用戈尔,S。等。(2017年)。结构25, 1916–1927. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Harris,G.W.、Pickersgill,R.W.和Howlin,B.&Moss,D.S.(1992年)。阿克塔·克里斯特。B类48, 67–75. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Hirshfeld,F.L.(1976年)。阿克塔·克里斯特。A类32, 239–244. 交叉参考 IUCr日志 科学网 谷歌学者
第一次引用Howlin,B.、Butler,S.A.、Moss,D.S.、Harris,G.W.和Driessen,H.P.C.(1993)。J.应用。克里斯特。 26, 622–624. 交叉参考 科学网 IUCr日志 谷歌学者
第一次引用Kullback,S.&Leibler,R.A.(1951年)。安。数学。斯达。 22, 79–86. 交叉参考 科学网 谷歌学者
第一次引用Kuriyan,J.&Weis,W.I.(1991)。程序。美国国家科学院。科学。美国88, 2773–2777. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Merritt,E.A.(1999年)。阿克塔·克里斯特。D类55, 1997–2004. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Merritt,E.A.(2011年)。阿克塔·克里斯特。A类67, 512–516. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Merritt,E.A.(2012年)。阿克塔·克里斯特。D类68, 468–477. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Murshudov,G.N.、Skubák,P.、Lebedev,A.A.、Pannu,N.S.、Steiner,R.A.、Nicholls,R.A、Winn,M.D.、Long,F.&Vagin,A.(2011)。阿克塔·克里斯特。D类67, 355–367. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Murshudov,G.N.、Vagin,A.A.和Dodson,E.J.(1997)。阿克塔·克里斯特。D类53, 240–255. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Murshudov,G.N.、Vagin,A.A.、Lebedev,A.、Wilson,K.S.和Dodson,E.J.(1999)。阿克塔·克里斯特。D类55, 247–255. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Painter,J.&Merritt,E.A.(2006年)。阿克塔·克里斯特。D类62, 439–450. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Papiz,M.Z.、Prince,S.M.、Howard,T.、Cogdell,R.J.和Isaacs,N.W.(2003)。分子生物学杂志。 326, 1523–1538. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Raaijmakers,H.、Törö,I.、Birkenbihl,r.、Kemper,B.和Suck,D.(2001)。分子生物学杂志。 308, 311–323. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用里德·R·J。等。(2011).结构19, 1395–1412. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Šali,A.,Veerapandian,B.,Cooper,J.B.,Moss,D.S.,Hofmann,T.&Blundell,T.L.(1992)。蛋白质12, 158–170. 公共医学 科学网 谷歌学者
第一次引用Schneider,T.R.(1996)。CCP4研究周末会议记录。高分子精制,由E.Dodson、M.Moore、A.Ralph和S.Bailey编辑,第133–144页。沃灵顿:达斯伯里实验室。https://purl.org/net/epubs/work/35264(网址:https://purl.org/net/epubs/work/35264)谷歌学者
第一次引用Schomaker,V.&Trueblood,K.N.(1968年)。阿克塔·克里斯特。B类24, 63–76. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Span,I.、Wang,K.、Eisenreich,W.、Bacher,A.、Zhang,Y.、Oldfield,E.&Groll,M.(2014)。美国化学杂志。Soc公司。 136, 7926–7932. 科学网 交叉参考 谷歌学者
第一次引用Tickle,I.&Moss,D.S.(1999年)。高分子晶体结构精细化中刚体热运动的建模。 https://people.cryst.bbk.ac.uk/~tickle/iucr99/iucrcs99.html谷歌学者
第一次引用特鲁布拉德,K.N.(1978)。阿克塔·克里斯特。A类34, 950–954. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Trueblood,K.N.和Dunitz,J.D.(1983年)。阿克塔·克里斯特。B类39, 120–133. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Urzhumtsev,A.、Afonine,P.V.和Adams,P.D.(2013)。结晶器。版次。 19, 230–270. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2015)。阿克塔·克里斯特。D类71, 1668–1683. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Urzhumtsev,A.,Afonine,P.V.,Van Benschoten,A.H.,Fraser,J.S.&Adams,P.D.(2016)。阿克塔·克里斯特。D类72, 1073–1075. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Van Benschoten,A.H.、Afonine,P.V.、Terwilliger,T.C.、Wall,M.E.、Jackson,C.J.、Sauter,N.K.、Adams,P.D.、Urzhumtsev,A.&Fraser,J.S.(2015)。阿克塔·克里斯特。D类71, 1657–1667. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Wilson,M.A.和Brunger,A.T.(2000)。分子生物学杂志。 301, 1237–1256. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Winn,M.D.、Isupov,M.N.和Murshudov,G.N.(2001年)。阿克塔·克里斯特。D类57, 122–133. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Yousef,M.S.、Fabiola,F.、Gattis,J.L.、Somasundaram,T.和Chapman,M.S(2002)。阿克塔·克里斯特。D类58, 2009–2017. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Zucker,F.、Champ,P.C.和Merritt,E.A.(2010年)。阿克塔·克里斯特。D类66, 889–900. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标结构
生物学
编号:2059-7983