1.简介
尽管正在努力实现模型构建的自动化,但分子图形在使用X射线晶体数据确定蛋白质结构方面仍然发挥着重要作用。诸如侧链放置、环、配体和片段拟合、结构比较、分析和验证等功能通常使用分子图形进行。较低分辨率(d日最小值低于2.5 数据尤其需要交互式拟合。
介绍FRODO公司(琼斯,1978年)然后O(运行)(琼斯)等。, 1991)对于蛋白质晶体学领域来说,在每一种情况下都是革命性的,每一种都在他们的时间里开拓了新的领域,展示了当前硬件的可能。这些工具使蛋白质晶体学家能够享受到他们工作中最激动人心的部分:诞生一种新的蛋白质结构。这个中央对手方清算所4程序套件(协作计算项目,编号41994)是高分子晶体学软件的集成集合,范围从数据处理到结构精炼以及验证。直到最近,分子图形才成为套件的一部分。随着相对廉价硬件最近的计算和图形性能,时机已经到来中央对手方清算所4在灵活的可扩展包中使用强大的现代语言为基于知识的(半)自动构建提供图形功能。CCP4mg(波特顿等。2004年)是由中央对手方清算所4提供库和分子图形应用程序,这是一个用于表示、建模、,结构测定,分析和验证。其目的是为希望将高分子计算与分子-颗粒界面集成在一起的开发人员提供一个易于使用的系统和平台。这种图形功能有几个模块;这里描述的蛋白质建模/地图构建工具只是其中的一部分。这些工具作为独立的软件包提供,库特.
地图绘制程序必须提供分子显示程序不需要的某些功能。这些功能包括对称坐标、电子密度图轮廓和以各种方式移动坐标的能力,例如模型理想化或根据侧链旋转体概率。
此处描述的地图填充和建模功能与以下程序的功能大致相似O(运行),Xtalview公司从Xfit公司(麦克雷,1999年)或量子(美国加利福尼亚州圣地亚哥Accelrys)。然而,本着中央对手方清算所4程序套件,其他人可以阅读和修改程序。
库特试图(一般来说)提供更透明、易用、更好的可扩展性、(半)自动化建模方法以及与中央对手方清算所4套房。
2.程序功能
库特基本上是围绕两个主要库构建的:mmdb(Krissinel等。, 2004),一个处理大分子坐标的库,和Clipper(Cowtan,2002, 2003),晶体对象及其计算的库。的各种功能库特从某种意义上说,是为了尽量减少类对除上述库以外的任何其他库的依赖性,将这些类划分为“独立”类。考虑到可移植性,我们做出了特别的努力,不将GUI依赖性引入到接口中库特的工具库。
库特是事件驱动的;函数仅在用户操作(通常是移动或单击鼠标)时运行。
2.1. 对称性
坐标对称性在每次重中心事件时都会重新计算和显示。对于用户希望显示对称性的每个分子,对称原子显示在显示中心的特定距离标准内。通过使用一组标记分子范围的预先计算的引导点,并对这些引导点应用对称算符和单元位移,生成一组可能包含靠近屏幕中心的对称相关原子的算符索引和单元位移(其中“close”由用户可设置的参数定义)。对于这些集合中的每一个,分子中的所有原子都会被变换,并对每个原子进行检查,以查看其是否在屏幕中心位置的对称显示半径内。因此,对称保持当前状态,并与当前显示中心相关。
2.2. 电子密度
因为库特基于Clipper库,通过读取包含相位信息的结构因子文件(通常是MTZ文件)很容易生成贴图。密度不限于单位细胞;使用Clipper功能自动生成(然后绘制轮廓)相关的对称相关密度。电子密度图可以使用预定的增量以不同的级别简单地重新绘制(由脚本、键盘或鼠标事件引发)。每个地图(显示或未显示)都会重新生成并绘制轮廓:此过程不是最快的,但简化了用户界面。
2.3. 与的接口REFMAC公司
在读取MTZ文件时,可以有选择地为运行指定参数REFMAC公司(穆尔舒多夫等。, 1997).REFMAC公司是的一个程序中央对手方清算所最大类锂基大分子的4套精细化。经过一段时间的交互式模型构建,用户可以选择使用REFMAC公司优化当前坐标(结合MTZ参数)。库特阻止,直到REFMAC公司已终止,然后自动读取新生成(优化)的坐标和MTZ文件,从中生成(并显示)地图。
2.4. 刚体细化
Clipper库函数可以轻松访问地图渐变。对于选定的坐标集,将平均原子中心处的贴图渐变。移动应用于(所有选定的原子),即平均梯度的简单部分。刚体的转动部件精炼按以下方式生成:要计算的旋转(αx个,α年和αz(z))是围绕坐标轴(旋转中心)的(小)旋转(V(V))是旋转原子的中心。让V(V)第页我是投射到XY公司原子位置之间的矢量平面我和V(V),单位向量为.梯度的点积提供d日V(V)第页我.
所需角度为。这些角度可用于每个原子,并对其进行平均,以获得三个垂直旋转:αx个,α年和αz(z)这些角度变换应用于坐标。变换的应用一直持续到平均移位长度小于0.0005 Å.
对于蛋白质的大部分结构来说,这是一种合理的方法,但如果存在相对较重和较轻原子的组合,例如硫酸盐或蛋氨酸,则可能会表现得很糟糕。这个问题可以通过原子量加权原子密度得分来解决。
2.5. 旋转器
用于库特是Dunbark&Cohen(1997)的主干独立图书馆). 它由一个相当大的样本集(850条链)组成,是最新的(2002年5月),可以更准确地估计稀有旋转体的数量。
这个库特函数“Auto fit Rotamer”为特定侧链获取一组最可能的旋转异构体,并为每个旋转异构体生成坐标。然后对每个试验转子进行刚体精炼,并根据密度拟合度对最终位置进行评分(残留物的骨架原子包含在精炼原子集合中)。选择最合适的旋转摄像机并替换先前的坐标。
2.6. 规范化和精细化
分子-颗粒模型构建需要能够规范(“理想化”)模型的坐标。为了做到这一点,应该知道大分子几何结构的理想值。这些理想值可以有多种形式。中的接口库特阅读mmCIF字典REFMAC公司定义了键长、角度、扭转平面和手性中心的理想值和估计标准偏差。库特使用BFGS(Broyden–Fletcher–Goldfarb–Shanno)共轭梯度多变量函数极小器的Polak–Ribiere变量来优化坐标。
附录中描述了分析梯度推导A类.
2.6.1. 适应地图
如上所述,贴图渐变由Clipper函数提供。这些映射梯度(在原子中心的位置)简单地乘以(用户可更改的)比例因子,并添加到几何项中,以定义目标函数(这在库特).
2.7. 寻找配体
地图可以被一组坐标(通常是蛋白质模型中当前确定的原子的坐标)掩盖。这种方法在没有原子表示密度的地方留下了正密度的地图(实际上类似于F类o个−F类c(c)地图)。在这张遮罩的地图上搜索特定水平以上的密度“簇”。The clustering of the grid points of the非对称单元使用图的递归邻域搜索方便地执行到潜在配体位点。根据大小和电子密度值对簇进行分类。计算每个网格点簇的特征值和特征向量。
类似地,计算搜索配体(当然可能只有一个搜索配体)的特征值和特征向量(参数是原子中心的位置)。配体的特征值与每个电子密度簇的特征值进行比较,如果它们足够相似,则通过匹配测试配体的中心和簇的中心将配体放入簇中。配体在四个不同方向中的每一个方向上定向,这四个方向提供了一致的特征向量,然后对刚体进行细化和评分。分数只是原子中心处电子密度的总和。比较每个不同配体在每个位置的分数,并选择最佳拟合(刚性体细化后,具有足够正密度原子分数的最高分数)。最后一项检查确保超大配体不会装配到小簇中。
2.7.1. 柔性配体
搜索配体可以由具有可旋转键的单个配体生成,而不是有一系列不同的配体化合物。配体字典提供了配体几何结构的描述,包括扭转。这些扭转被随机取样进行多次试验(默认为1000次),以提供可根据上述潜在配体位点进行检查的坐标。一项改进是允许根据扭转次数确定试验次数。
2.7.2. 寻找水分子
电子密度如配体所述聚集。对于体积低于特定上限(4.2)的群集 Å三,这将阻止水分子被放置在多原子配体位置)起始位置由簇的网格坐标的平均位置确定。然后通过将位置细化到由贴图的立方插值确定的局部最大值来优化此位置。然后应用映射球度测试;0.3、0.6和0.9点处三次插值电子密度的方差 沿着x个,年和z(z)轴已确定。方差相加,必须小于用户可更改的截止值(默认值0.07 e(电子)2 Å−6). 然后将成功的位置与蛋白质的O和N原子的坐标进行比较。如果距离介于用户可更改的标准之间(默认值为2.4–3.4 然后将该位置作为溶剂O原子接受并(可选)添加到蛋白质模型中。
2.8. 添加终端残留物
考虑到终端残留物的选择(也可能仅仅是未定位残留物间隙的开始),随机选择了两个独立的残留物类型φ/ψ成对是由Clipper的Ramachandran分布φ/ψ对。这些角度用于生成C、C的位置α相邻两个残基的O和N主链原子使用肽几何结构。然后这组原子经历刚性体精炼以优化与地图的匹配。记录拟合分数和原子位置。然后重复该过程多次(默认为100次)。然后提供相邻残基最合适原子的主链原子作为相邻残基的位置(丢弃下一个相邻残基原子)。