2.方法
该研究遵循Oeffner描述的方法等。(2013年). 在这里,我们总结了Oeffner及其同事用于X射线模型大规模分子置换试验的步骤。早期工作的扩展包括NMR模型,如下所述。
2.2. 使用核磁共振模型生成分子重定位数据
核磁共振模型使用了一种类似于使用X射线模型生成分子重定位数据的协议。保留了上述目标,本研究未考虑新的目标。
2.2.3. 分子置换刚体精细化
序列覆盖率超过50%的核磁共振模型使用格萨姆特使用MR_RNP模式进行了总共20973次分子置换刚体细化相位器(麦考伊等。, 2007)独立地使用来自修剪的NMR系综的每个模型。实际上,最好将核磁共振模型用作系综,但系综统计加权的成功取决于对系综每个单独成员的有效误差进行最佳估计(Read,2001).
2.4. 推导方程式以预测精炼VRMS
在拟合这两个数据集时,对数据进行了检查,以确定哪些属性与改进的VRMS相关性最高。通常,一次只包含一个属性。在拟合数据时,对添加了该属性的方程进行了不同的函数形式的测试,并选择了能够最小化优化和估计VRMS之间偏差的函数形式。为了选择要包含在数据拟合中的下一个属性,计算了残差相关性(与精炼VRMS和估计VRMS之间的归一化差异的相关性)。当添加新属性对配合质量几乎没有影响时,该过程终止。
4.讨论
当序列一致性小于30%时,X射线模型VRMS的Oeffner估计系统地高估了误差。该人工制品在精确VRMS和估计VRMS之间的比率分布中显示为肩部(图3和图5b条在Oeffner等。, 2013). 对填充此肩部的病例的检查表明,这是由于使用序列一致性来测量远缘同源物之间序列相似性的局限性。
在目标序列和模型序列经过最佳对齐后,序列标识表示对齐中每个位置的二进制(真/假)分数,这对于序列标识较低的远距离同源序列来说是一个相当粗略的度量。序列恒等式也无法区分保守替换和非保守替换。因此,我们考虑了表1中列出的20个矩阵得分并在Vogt的评论中进行了讨论等。(1995),这有望对序列同源性低于50%的同源物之间的序列相似性进行敏感评估。当我们考虑全序列一致性(10–100%)时,BLOSUM30、BLOSUM35、BLOSOM40、BLOSUM45(Henikoff&Henikoft,1992))、本纳22、本纳74(本内特等。, 1994)和Gonnet得分(Gonnet等。, 1992)均与VRMS密切相关,相关系数为−0.70至−0.71。序列一致性给出的相关性稍弱,为-0.67(表2). 然而,在序列一致性逐渐降低的情况下,MR更具挑战性,一些评分矩阵开始表现更好。对于序列一致性低于30%的模型,Benner22、Benner74和Gonnet得分均产生-0.38的相关性;对于序列一致性低于20%的模型,Gonnet评分给出的相关性为-0.15,略好于Benner74的-0.14和Benner22的-0.11。我们的观察结果与早先的发现一致,即Gonnet评分是评估远缘同源序列相似性的前三个矩阵之一(Vogt等。, 1995). 通过用Gonnet评分代替序列一致性,我们解决了系统高估远距离同源区误差的问题。
虽然我们希望找到与模型分辨率的相关性,但我们惊讶地发现目标分辨率反而与VRMS相关非对称单元体积,威尔逊B因子和马修斯系数也与VRMS相关,但它们都彼此相关,并且与目标分辨率相关。一旦在VRMS估计中考虑到目标的分辨率,就不会存在与这些其他目标属性的剩余相关性。这一发现表明,如果晶体衍射到较低的分辨率,则应期望较高的r.m.s.d。可以通过注意到衍射到较低分辨率的晶体在本质上有序性较差,并且具有大量构象状态来解释这一点,而单一模型对此解释得很差。在两者之间的差距方面也得出了类似的结论R(右)晶体和R(右)合并(霍尔顿等。2014年).
在评估模型质量所考虑的属性中,模型的分辨率,R(右)自由的、碎屑岩和摩尔概率评分均与VRMS相关摩尔概率得分相关性最高。这些措施都相互关联,一旦摩尔概率分数已被计算在内,与模型的其他属性没有剩余相关性。考虑到摩尔概率得分(陈等。, 2010)结合了碎屑核、Ramachandran异常值和轮调异构体异常值的贡献,令人惊讶的是摩尔概率尽管与Ramachandran和rotamer离群值的相关性很小,但分数是一个明显优于clashscore的预测因子。这大概表明摩尔概率尽管如此,score综合了所有三个衡量标准的影响,以评估模型构建的质量和精炼比任何单独的措施都要好。
对于X射线模型,与VRMS相关的属性也与核磁共振模型的VRMS相关。然而,这些因素的相对重要性不同。对于X射线病例,最重要的因素是通过Gonnet评分测量的序列相似性,其次是模型中的残留物数量、目标的分辨率和摩尔概率模型的得分。然而,模型中的残基数量是NMR案例的主导因素,相关系数为0.5,其次是Gonnet分数、目标分辨率和NMR集成一致性(测量为模型之间的平均相对标准偏差)。使用X射线方程估计核磁共振模型的VRMS将系统地低估误差(图3),导致次优的分子置换计算,因此对核磁共振模型进行了单独的非线性最小二乘拟合。
使用新的函数形式,我们获得了更好的精度和更好的估计误差分布(更加对称和单峰)。新的估计对X射线和核磁共振模型都有更好的表现。
以图形的形式表示和查询高度互联的数据简化了数据分析。图形数据库使我们能够克服数据中的冗余,并提供了扩展现有X射线数据和核磁共振数据的简单方法。它提供了一个平台,可以快速、一致地比较多个分子置换试验的结果。未来还可能进一步扩展数据,例如包括低温电子显微镜相关数据。
通过在误差估计中包含目标的属性,我们正在突破分子置换通过对给定数据集的模型进行个性化设置。数据驱动的模型生成将为处理具有多个域或亚单位的结构的复杂分子置换搜索策略铺平道路。
新的VRMS估计值将作为移相器运行新版本的管道相位器,相位rtng(麦考伊等。, 2020)目前正在开发中。
资金筹措信息
本研究得到了CCP4(KSH)的资助,获得了Marie Skłodowska-Curie赠款(MDS;790122)下的欧盟地平线2020研究与创新项目的奖学金支持,Wellcome Trust首席研究奖学金(RJR;赠款209407/Z/17/Z)和NIH(RJR赠款P01GM063210)的支持,对此我们深表感谢。
工具书类
Abraham,M.J.、Murtola,T.、Schulz,R.、Páll,S.、Smith,J.C.、Hess,B.和Lindahl,E.(2015)。软件X,1–2, 19–25. 交叉参考 谷歌学者
Altschul,S.F.(1991)。分子生物学杂志。 219, 555–565. 交叉参考 中国科学院 公共医学 谷歌学者
Baty,F.、Ritz,C.、Charles,S.、Brutsche,M.、Flandrois,J.-P.和Delignete-Muller,M.-L.(2015)。J.统计软件。 66(5), 1–21. 谷歌学者
Bennet,S.A.、Cohen,M.A.和Gonnet,G.H.(1994年)。蛋白质工程设计。选择。 7, 1323–1332. 交叉参考 谷歌学者
Berman,H.M.、Westbrook,J.、Feng,Z.、Gilliland,G.、Bhat,T.N.、Weissig,H.、Shindyalov,I.N.和Bourne,P.E.(2000)。核酸研究。 28, 235–242. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Bibby,J.、Keegan,R.M.、Mayans,O.、Winn,M.D.和Rigden,D.J.(2013)。《水晶学报》。D类69, 2194–2201. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Bunkóczi,G.和Read,R.J.(2011年一).《水晶学报》。D类67,303–312科学网 交叉参考 IUCr日志 谷歌学者
Bunkóczi,G.&Read,R.J.(2011)b条).计算。结晶器。新闻。 2, 8–9. 谷歌学者
Chen,V.B.、Arendall,W.B.、Headd,J.J.、Keedy,D.A.、Immormino,R.M.、Kapral,G.J.,Murray,L.W.、Richardson,J.S.和Richardsson,D.C.(2010)。《水晶学报》。D类66, 12–21. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Chen,Y.W.、Dodson,E.J.和Kleywegt,G.J.(2000)。结构,8,R213–R220科学网 交叉参考 公共医学 中国科学院 谷歌学者
Chothia,C.&Lesk,A.M.(1986年)。EMBO J。 5, 823–826. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Finn,R.D.、Clements,J.和Eddy,S.R.(2011年)。核酸研究。 39,W29–W37科学网 交叉参考 中国科学院 公共医学 谷歌学者
Fox,N.K.、Brenner,S.E.和Chandonia,J.-M.(2014)。核酸研究。 42,D304–D309科学网 交叉参考 中国科学院 公共医学 谷歌学者
Gonnet,G.H.、Cohen,M.A.和Benner,S.A.(1992年)。科学类,256, 1443–1445. 交叉参考 公共医学 中国科学院 谷歌学者
Henikoff,S.和Henikoft,J.G.(1992年)。程序。美国国家科学院。科学。美国,89, 10915–10919. 交叉参考 公共医学 中国科学院 科学网 谷歌学者
Holton,J.M.、Classen,S.、Frankel,K.A.和Tainer,J.A.(2014)。FEBS J公司。 281, 4046–4060. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Keegan,R.M.和Winn,M.D.(2008年)。《水晶学报》。D类64, 119–124. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Kleywegt,G.J.、Harris,M.R.、Zou,J.、Taylor,T.C.、Wählby,A.和Jones,T.A.(2004)。《水晶学报》。D类60, 2240–2249. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Krissinel,E.(2012年)。分子生物化学杂志。 1, 76–85. 中国科学院 公共医学 谷歌学者
Liebschner,D.,Afonine,P.V.,Baker,M.L.,Bunkóczi,G.,Chen,V.B.,Croll,T.I.,Hintze,B.,Hung,L.-W.,Jain,S.,McCoy,A.J.,Moriarty,N.W.,Oeffner,R.D.,Poon,B.K.,Prisant,M.G.,Read,R.J.,Richardson,J.S.,Richadson,D.C.,Sammito,M.D.,Sobolev,O.V.,Stockwell,D.H.,Terwilliger,T.C.,Urzhumtsev,A.G.,Videau,L。L.、Williams、C.J.和Adams,P.D.(2019年)。《水晶学报》。D类75, 861–877. 科学网 交叉参考 IUCr日志 谷歌学者
Mao,B.、Guan,R.和Montelione,G.T.(2011年)。结构,19, 757–766. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
A.J.麦考伊。等。(2020). 正在准备中。 谷歌学者
McCoy,A.J.、Grosse-Kunstleve,R.W.、Adams,P.D.、Winn,M.D.、Storoni,L.C.和Read,R.J.(2007年)。J.应用。克里斯特。 40, 658–674. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
McCoy,A.J.、Oeffner,R.D.、Wrobel,A.G.、Ojala,J.R.M.、Tryggvason,K.、Lohkamp,B.和Read,R.J.(2017)。程序。美国国家科学院。科学。美国,114, 3637–3641. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Milán,C.,Sammito,M.&Usón,I.(2015)。IUCrJ大学,2,95–105科学网 交叉参考 公共医学 IUCr日志 谷歌学者
Montelione,G.T.,Nilges,M.,Bax,A.,Güntert,P.,Herrmann,T.,Richardson,J.S.,Schwieters,C.D.,Vranken,W.F.,Vuister,G.W.,Wishart,D.S.,Berman,H.M.,Kleywegt,G.J.&Markley,J.L.(2013)。结构,21, 1563–1570. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Murzin,A.G.、Brenner,S.E.、Hubbard,T.和Chothia,C.(1995年)。分子生物学杂志。 247,536–540交叉参考 中国科学院 公共医学 科学网 谷歌学者
Oeffner,R.D.、Afonine,P.V.、Millán,C.、Sammito,M.、Usón,I.、Read,R.J.和McCoy,A.J.(2018)。《水晶学报》。D类74, 245–255. 科学网 交叉参考 IUCr日志 谷歌学者
Oeffner,R.D.、Bunkóczi,G.、McCoy,A.J.和Read,R.J.(2013)。《水晶学报》。D类69, 2209–2215. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
R核心团队(2018年)。R统计计算基金会.https://www.r-project.org/. 谷歌学者
Read,R.J.(1986年)。《水晶学报》。A类42, 140–149. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Read,R.J.(2001)。《水晶学报》。D类57, 1373–1382. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Read,R.J.和McCoy,A.J.(2016)。《水晶学报》。D类72, 375–387. 科学网 交叉参考 IUCr日志 谷歌学者
Rigden,D.J.、Keegan,R.M.和Winn,M.D.(2008)。《水晶学报》。D类64, 1288–1291. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Sievers,F.、Wilm,A.、Dineen,D.、Gibson,T.J.、Karplus,K.、Li,W.、Lopez,R.、McWilliam,H.、Remmert,M.、Söding,J.、Thompson,J.D.和Higgins,D.G.(2011年)。摩尔系统。生物。 7, 539. 科学网 交叉参考 公共医学 谷歌学者
汤普森,J.D.、希金斯,D.G.和吉布森,T.J.(1994)。核酸研究。 22, 4673–4680. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Vogt,G.、Etzold,T.和Argos,P.(1995)。分子生物学杂志。 249, 816–831. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Wickham,H.(2016)。ggplot2:用于数据分析的优雅图形纽约:Springer。 谷歌学者
Zimmermann,L.,Stephens,A.,Nam,S.-Z.,Rau,D.,Kübler,J.,Lozajic,M.,Gabler,F.,Söding,J.(2018)。分子生物学杂志。 430, 2237–2243. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
| 结构 生物学 |
国际标准编号:2059-7983
打开访问