跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
晶体学报D生物晶体。2010年4月1日;66(第4部分):486–501。
2010年3月24日在线发布。 数字对象标识:10.1107/S090744910007493
预防性维修识别码:项目经理2852313
PMID:20383002

的特点和发展库特

库特是一个分子颗粒学程序,旨在帮助构建蛋白质和其他大分子模型。介绍了当前的开发状态和可用功能。

关键词:库特,模型构建

摘要

库特是一种用于生物大分子建模和验证的分子图谱应用程序。该程序显示电子密度图和原子模型,并允许进行模型操作,如理想化、真实空间细化、手动旋转/平移、刚体拟合、配体搜索、溶剂化、突变、旋转体和拉马钱德朗理想化。此外,还提供了用于模型验证的工具以及用于细化、验证和图形的外部程序接口。该软件旨在让新手用户易于学习,这是通过确保常见任务的工具可以通过熟悉的用户界面元素(菜单和工具栏)或直观的行为(鼠标控制)“发现”来实现的。最近的发展重点是为专家用户提供工具,包括可定制的键绑定、扩展和广泛的脚本界面。该软件正在快速开发中,但已经在晶体学界得到了非常广泛的应用。本文介绍了软件的当前状态,并描述了可用的设施和使用的一些底层方法。

关键词:库特,模型构建

1.简介

利用X射线数据建立大分子模型是一项交互式任务,涉及各种优化算法的迭代应用,以及科学家对模型的评估和电子密度的解释。库特是一个交互式三维分子建模程序,专门设计用于通过简化过程的步骤来构建和验证蛋白质结构。

近年来,蛋白质链的初始构建通常使用自动建模工具进行,例如ARP协议/弯曲(兰格等。, 2008),解决方案/RESOLVE(解决)(王)等。, 2004)以及最近海盗(Cowtan,2006年). 因此,与以前相比,更多的时间和重点放在了模型验证上(Dauter,2006). 对于分辨率较低的数据,细化和验证步骤变得越来越重要,也越来越耗时。库特旨在提供尽可能多的工具,用于迭代细化和验证大分子结构,以促进无法自动执行的过程。一个主要的设计目标是使软件易于学习,以便为开始使用X射线数据的科学家提供一个低障碍。虽然并不是每个功能都达到了这个目标,但它在塑造软件的许多设计决策中发挥了重要作用。

该软件的主要任务是可视化大分子结构和数据、建立电子密度模型以及验证现有模型;这些将在接下来的三节中进行考虑。本文的其余部分将讨论软件的更多技术方面,包括与外部软件的交互、脚本编写和测试。

2.程序设计

该程序由一系列现有的软件库和一个专门编写的库特该库提供了一系列特定于模型构建和可视化的工具。OpenGL和其他图形库,如X Window System和GTK+,提供图形用户界面功能,GNU科学库(GSL)提供数学工具,如函数最小化器和Clipper(Cowtan,2003)和MMDB(Krissinel等。, 2004)库提供晶体学工具和数据类型。在这些工具之上是库特库,用于操作模型和地图并以图形方式表示它们。

此功能的大部分可以从脚本层访问(参见§8) ,它允许以编程方式访问所有底层功能。最后,图形用户界面构建在脚本层之上,尽管在某些情况下图形用户界面直接访问底层类更方便(图1).

保存图片、插图等的外部文件。对象名称为d-66-00486-fig1.jpg

库特体系结构,显示从用户界面到一些低级库的功能层。图书馆在正文中有更详细的描述(§§3.4,3.5,4.3和4.4).

3.可视化

Coot提供了用于显示分为三类的三维数据的工具。

  • (i) 原子模型(通常显示为连接键合原子的向量)。
  • (ii)电子密度图(通常使用线框晶格绘制轮廓)。
  • (iii)通用图形对象(包括单元-细胞盒、非晶体旋转轴等)。

用户界面和一组控件允许用户与图形显示交互,例如移动或旋转视点,选择要显示的数据以及这些数据的显示模式。

目前用户界面的主要目标是使应用程序易于学习。当前的用户界面设计强调了高质量图形用户界面(GUI)的一些特征。这些特征包括可学习性、生产力、宽容性(如果用户犯了错误,应该很容易恢复)和美观性(应用程序应该看起来不错,并提供愉快的体验)。为设计用户界面时库特,我们的目标是尊重这些问题;然而,这可能并不总是可以实现的,GUI经常需要重新设计。理想情况下,用户对晶体学数据基本熟悉,但从未使用过库特之前应该能够在没有任何指令的情况下启动软件、显示其数据和执行一些基本操作。为了使软件易于学习,有必要发现软件的核心功能,用户应该能够在不查阅文档的情况下了解如何执行常见任务。这可以通过三种方式中的任何一种实现。

  • (i) 行为是直观的,用户界面元素的行为可以通过一些实验来预测或确定。这方面的一个例子是视图的旋转,只需用鼠标拖动即可完成。
  • (ii)行为熟悉且一致,用户界面元素的行为与其他通用软件类似。其中一个例子是使用包含“打开…”选项的“文件”菜单,导致传统的文件选择对话框。
  • (iii)界面是可探索的,如果用户需要额外的功能,他们可以通过检查界面快速找到。这方面的一个例子是使用有组织的菜单,可以访问程序的大部分功能。此外,大多数菜单和按钮都提供了工具提示,信息小部件解释了它们的功能。

3.1. 用户界面

主要库特用户界面窗口如图2所示由以下元素组成。

  • (i) 主窗口的中心是三维画布,上面显示原子模型、地图和其他图形对象。默认情况下,此区域具有黑色背景,但如果需要,可以进行更改。
  • (ii)窗口顶部是菜单栏。这包括以下菜单:“文件”、“编辑”、“计算”、“绘制”、“测量”、“验证”、“HID”、“关于”和“扩展”。“文件”、“编辑”和“关于”菜单履行其正常职责“计算”提供了对模型操作工具的访问Draw“实现显示选项。”度量“表示对几何信息的访问”验证“提供对验证工具的访问。”HID“允许自定义人机界面行为。”Extensions”提供了对一系列可选功能的访问,高级用户可以自定义和扩展这些功能。可以使用脚本界面添加其他菜单。
  • (iii)在菜单栏和画布之间是一个工具栏,它提供了两个非常常用的控件:“重置视图”在分子视图之间切换,“显示管理器”打开一个额外的窗口,允许以不同的方式显示单个映射和分子。此工具栏可自定义,可以添加其他按钮。
  • (iv)窗口右侧是一个图标工具栏,允许修改原子模型。默认情况下,这些图标显示为图标,尽管提供了工具提示,也可以显示文本。
  • (v) 画布下方是一个状态栏,其中显示有关当前操作状态的简短文本消息。

用户界面是使用GTK+2小部件堆栈实现的,尽管通过一些工作,这在将来可能会有所改变。

保存图片、插图等的外部文件。对象名称为d-66-00486-fig2.jpg

这个库特主窗口。主显示区显示分子和电子密度。窗口顶部是一个菜单栏,可以访问大多数工具。常用的模型操作工具也可以通过右侧的工具栏获得。菜单栏下方是用户定义按钮的区域。三维画布下方显示状态栏。

3.2. 控制

用户对程序的输入主要是通过鼠标和键盘,尽管也可以使用一些拨号设备,如“Powermate”拨号。鼠标可以按正常方式选择菜单选项和工具栏按钮。

此外,可以使用鼠标和键盘,使用图3所示的控件来操作三维画布中的视图.

保存图片、插图等的外部文件。对象名称为d-66-00486-fig3.jpg

鼠标控件:鼠标示意图显示,单击的按钮为灰色。要按下的其他键显示在鼠标左侧。右侧是鼠标控制操作的示意图以及说明。

在大型程序中,软件易于学习和易于使用之间往往存在紧张关系。一个易于使用的程序提供了广泛的快捷方式,允许以最少的用户输入执行常见任务。键盘快捷键、自定义和宏语言是常见的示例,并且经常被各类软件的专家用户使用。库特现在为所有这些提供了工具。现在可以从Python和(http://www.python.org(英文))和计划(Kelsey等。, 1998)脚本语言,可用于使用现有功能的组合构建更强大的工具。一个例子是分子替换后经常使用的一种功能,它将遍历蛋白质中的每一个残基,替换任何缺失的原子,找到最合适的侧链旋转异构体,并执行实际空间的精细化。此函数又绑定到菜单项,尽管也可以将其绑定到键盘上的键。

3.3. 照明模型

中使用的照明模型库特偏离了大多数分子粒度软件中采用的方法。很难用物体的二维表示来说明三维形状。传统的方法是使用所谓的“深度剪切”:靠近用户的对象看起来更明亮,而距离较远的对象更像背景色(通常较深)。库特然而,模型中最明亮的特征正好位于旋转中心的前方。这项创新是偶然的,但被保留了下来,因为它似乎提供了一个更自然的图像,并且在用户习惯了新的行为后,也产生了积极的反馈。现在可以为这个结果提供一个解释。

深度剪切是一种算法,它根据图形对象与观看者的距离来调整其颜色。深度切割有几种方式。渲染室外场景时,它用于冲洗远处特征的颜色,以模拟中间空气中的光散射效果。渲染变暗的场景时,可以使用相同的效果使远处的对象变暗,以创建这样的效果:观看者携带的光源比远处的对象照亮得更明亮。请注意,这两种用法都采用“第一人称”视角:观察者被放置在三维环境中。操纵视图的控件也证明了这一点:当视图旋转时,整个环境通常围绕观察者旋转。

然而,将三维原子模型拟合到X射线数据是另一种情况。将观察者放在模型内并围绕其旋转模型是没有用的,尤其是因为科学家通常更感兴趣的是从外部观察分子或电子密度。因此,正常的做法是旋转视图,而不是围绕观察者,而是围绕所研究特征的中心。由于中心特征最令人感兴趣,如果它是最亮的实体,则有助于可视化。以这种方式适当照亮模型相对较慢,因此库特使用近似值,垂直于观察者的平面(包含中心特征)被最明亮地照亮。

3.4. 原子模型

库特将原子模型的原子显示为三维画布上的点。如果这些点在键距离内,则在原子点之间画一条表示键的线;否则原子显示为十字。默认情况下,原子按元素着色,包括碳黄色、氧红色、氮蓝色、硫绿色和氢白色。键有两种颜色,其中一半对应于每个连接的原子。其他原子模型通过不同的颜色编码进行区分。旋转色轮,相应地调整元素颜色。然而,可以选择固定非碳元素的颜色,并且可以单独调整每个分子的色轮位置。此外,库特允许用户通过分子、链、二级结构给原子模型着色,B类因子和占用率。除了显示原子模型之外,库特也可以显示Cα(或主干)链。同样,模型可以通过链、二级结构或从N端到C端的彩虹色以不同的模式着色。目前,库特以不同的键宽或球棒表示形式为选定的残基提供了一些额外的原子表示。

关于单个原子的信息可以以标签的形式可视化。它们显示原子名、残基数、残基名称和链标识符。标签显示在班次+用鼠标左键单击或双击原子(最靠近旋转/屏幕中心的原子可以使用键盘快捷键标记)’). 此操作不仅显示了三维画布中原子旁边的标签,还提供了原子的更多详细信息,包括占用率、,B类状态栏中的因子和坐标。

原子模型的对称8个等效原子可以显示在库特在一定半径内,或者作为整个链,或者作为该半径内的原子。为原子或C着色和显示的不同选项α提供主干。对称等效模型可以如上所述进行标记。此外,标签将提供有关用于生成选定模型的对称操作符的信息。

围绕原子模型的导航主要是通过GUI实现的(“转到原子…”)。这允许通过选择模型、链ID、残数和原子名称,将视图集中在特定原子上。提供了移动到下一个或上一个残留物的按钮,也可以使用通过键盘快捷键(空格键Shift空格键)。此外,每条链都显示为其残留物的可扩展树,其中包含可选择用于居中的原子。此外,鼠标可以用于导航,因此鼠标中键的点击集中在所单击的原子上。视图以C为中心的键盘快捷方式α通过使用Ctrl-g键然后输入链标识符和残数(以结尾输入).

与其他显示对象相比,所有原子模型都可以通过单击原子中心上的鼠标按钮进行访问。例如,这允许重新定心、选择和标记模型。

3.5. 电子密度

使用三维网格显示电子密度图,以使用“marching-cubes”型算法可视化高于选定电子密度值的电子密度区域的表面(Lorensen&Cline,1987). 网格的间距由采样电子密度的网格的间距决定。由于电子密度图通常是根据结构因子来描述的,因此用户可以在将电子密度读入程序时修改采样。可以使用鼠标上的滚轮(如果可用)或使用键盘('+'和'-’). 在大多数情况下,这避免了同时显示多个轮廓级别的需要,尽管如果需要,可以显示额外的轮廓级别。

电子密度图的颜色可由用户选择。默认情况下,读入程序的第一张地图是蓝色轮廓,随后的地图在色轮周围采用连续的颜色色调。默认情况下,差异贴图分为两个级别,一个是正值,另一个是负值(分别为绿色和红色)。

电子密度在一个关于当前屏幕中心的方框中绘制轮廓,并在视图中心改变时以交互方式重新控制。默认情况下,此框包含从当前屏幕中心向每个方向延伸至少10度的音量。这是操作肽或核苷酸链的单个单位的合适尺度,即使在较旧的计算机上也能提供良好的交互性能。在速度更快的机器上可以形成更大的体积。“动态音量”选项允许轮廓音量随当前缩放级别变化,以便轮廓区域始终充满屏幕。“动态采样”选项允许在子采样网格上绘制地图轮廓(例如沿每个轴每第二个或第四个点)。当使用溶剂掩模来可视化晶体中分子的堆积时,这很有用。

3.6. 显示对象

有多种非交互式显示对象,它们也可以叠加在原子模型和电子密度上。这些包括单位细胞的边界、电子密度脊线(或骨架)、表面、三维文本注释和点(用于摩尔概率接口)。这些不能被选择,但有助于可视化电子密度和其他实体的特征。

3.7. 文件格式

库特识别各种文件格式,可以从中读取原子模型和电子密度。以这些不同格式存储的信息的差异意味着用户必须做出一些选择。这是通过提供几个读取电子密度的选项来实现的,必要时还可以向用户请求其他信息。将依次考虑可用于原子模型和电子密度的文件格式。

除了从本地存储中获取数据外,还可以直接从蛋白质数据库(Bernstein等。, 1977)通过输入沉积结构的PDB代码。类似地,对于已经存储了实验数据的结构,可以从电子密度服务器(Kleywegt)获得模型和相位反射等。, 2004).

3.7.1. 原子模型

原子模型被读入库特从“文件”菜单中选择“打开坐标…”选项。这提供了一个标准文件选择器,可用于选择所需的文件。库特识别以下三种格式存储的原子模型。

  • (i) 蛋白质数据库(PDB)格式(带文件扩展名.pdb文件.ent接口; 具有扩展名的此格式的压缩文件.gz格式也可以读取)。最新版本提供了与PDB格式版本3的兼容性。
  • (ii)高分子晶体信息文件(mmCIF;Westbrook等。, 2005)格式(扩展名到岸价格).
  • (iii)SHELX公司由生成的结果文件SHELXL公司细化软件(扩展.res文件.ins文件).

在每种情况下,都会从文件中读取unit-cell和space-group信息(在架子输出空间组是从对称操作符推断出来的)。读取原子模型,包括原子名称、交替构象代码、单体名称、序列号和插入代码、链名称、坐标、占有率和各向同性/各向异性原子位移参数。PDB和mmCIF文件使用MMDB库(Krissinel等。, 2004),也用于内部模型操作。

3.7.2. 电子密度

电子密度表示是软件设计的一个重要元素。库特采用电子密度的“晶体空间”表示法,根据晶体的晶格重复和胞对称性,电子密度实际上是无限的。因此,无论视点位于何处,都可以始终表示密度。该设计决策是通过使用Clipper库实现的(Cowtan,2003).

另一种方法是仅在输入电子密度图所描述的有界框中显示电子密度。这种方法更简单,在某些特定情况下可能更合适(例如显示低温电子显微镜实验或某些类型的NCS地图的密度时)。然而,它有一个局限性,即对称性相关分子没有可用的密度,如果初始图谱的计算范围错误,则必须重新计算才能查看所需的区域。

这种区别很重要,因为它影响了电子密度数据在库特.准备的文件O(运行)PyMOL公司可能不适合用于库特。为了将地图文件读入库特,它应该覆盖非对称单元或单元单元。相反,为O(运行)(琼斯)等。, 1991)或PyMOL公司(德拉诺,2002)通常覆盖分子周围有边界的盒子。虽然可以从非对称单元导出任何有界盒,但并不总是可以走另一条路;因此,在某些情况下,使用为其他软件准备的地图文件可能会导致意外结果,最常见的是对地图标准偏差的错误计算。如果使用更先进的掩蔽技术,电子密度图必须与相关模型分子具有相同的对称性。

可以读取电子密度库特要么以结构因子(具有可选权重)和相位的形式,要么以电子密度图的形式。为什么首选的方法是读取反射数据而不是地图,原因有很多。

  • (i)库特始终可以获得完整的非对称数据单元,从而避免上述问题。
  • (ii)结构因子文件通常小于电子密度图。
  • (iii)一些结构因子文件,特别是MTZ文件,在单个文件中提供多组数据。因此,可以读取单个文件并获得(例如)最佳映射和差异映射。

用FFT计算电子密度图的开销对现代计算机来说是微不足道的。

3.7.3. 从反射数据文件读取电子密度

提供了两个选项,用于从反射数据文件读取电子密度。这些是“文件”菜单中的“自动打开MTZ…”和“打开MTZ、mmcif、fcf或phs…”。

  • (i) “自动打开MTZ…”将打开一个包含最佳和差异图系数的MTZ文件,自动选择FWT/PHWT和DELFWT/DELPHWT标签对,并显示两个电子密度图。目前,合适的文件由以下软件生成:相位器(斯托罗尼等。, 2004),REFMAC公司(穆尔舒多夫等。, 1997),菲律宾精制(亚当斯等。, 2002),DM公司(张)等。, 1997),鹦鹉(Cowtan,2010年),海盗(考坦,2000年)和巴斯特(布兰科等。, 2004).
  • (ii)“Open MTZ、mmcif、fcf或phs…”将以任何指定格式打开反射数据文件。请注意XtalView(X塔尔视图) .phs个文件不包含空间组和单元格信息:在这些情况下,必须首先读取PDB文件以获取相关信息,或者必须手动输入信息。MTZ文件可能包含多组贴图系数,因此有必要选择要使用的贴图系数。在这种情况下,为用户提供了一个附加窗口,允许选择贴图系数。一些常见晶体软件的标准数据名称如表1所示.

    表1

    由通用晶体学软件输出的地图数据标签,包括DM公司(张)等。, 1997),鹦鹉(Cowtan,2010年),海盗(考坦,2000年)和自动SHARP(冯海因等。, 2007)
    MTZ来源“最佳”映射的列标签
    DM公司FDM、PHIDM
    鹦鹉鹦鹉。F_phi.(_phi)。F、 鹦鹉。F_phi.phi(法语)
    海盗海盗。F_phi.(_phi)。F、 海盗。F_phi.phi
    自动SHARP(分阶段)FP、PHIB(或仅适用于轻原子的Fcent、PHIcent)
    自动SHARP(职位-所罗门群岛)FBsol、PHIBshasol(或Fcentshasol、PHIcentshasol,如果仅为轻原子)

SHELX公司 .fcf文件文件转换为mmCIF格式,然后从对称操作符推断出空间组。

4.建模

从实验阶段开始的蛋白质结构的初始构建通常由自动化方法完成,例如ARP协议/弯曲,RESOLVE(解决)(王)等。, 2004)和海盗(Cowtan,2006年). 然而,这些方法大多依赖于优于2.5º的分辨率,并且分辨率越高,生成的模型越完整。主要关注点库特因此,通过分子替换或自动建模以及构建低分辨率结构生成的初始模型的完成。然而,以下描述的功能是为初始模型不可用的情况提供的。

4.1. 通用建模工具

4.1.1. C类α指挥棒模式

巴顿大厦,由Kleywegt&Jones(1994)引入),通过使用3.8º的“接力棒”定位连续的C来构建蛋白质主链α原子的间距正确。库特,该设备与电子密度脊道骨架相耦合(Greer,1974). 首先,根据电子密度脊线计算骨架。然后,用户选择指挥棒构建模式,将初始指挥棒的一端放置在当前屏幕中心。下一个α-碳的候选位置突出显示为从骨架上与起点距离正确的点中选择的十字。用户可以使用“Try Another”按钮循环浏览候选位置列表,也可以使用鼠标自由旋转接力棒。此外,指挥棒的长度可以改变,以适应α-碳位置的适度变化。一旦一个新的位置被接受,接力棒就会移动,使其基础位于新的α-碳上。这样,可以以每分钟1到10个残留物的速度手动追踪链条。

4.1.2. C类α区域→主链

放置了Cα原子,其余的主链原子可以自动生成。该工具使用一组62个高分辨率结构作为主链片段库的基础。选择六肽和五肽片段以匹配CαC的每个连续五肽的位置α按照Esnouf(1997)的方法依次追踪)这与Jones&Thirup(1986年). 与候选C最匹配的片段α合并位置以提供完整跟踪。在这一步之后,通常会对随后的主链模型进行实际空间细化。

4.1.3. 查找二级结构

蛋白质的二级结构元素,包括α-螺旋和β-链,可以通过其重复的电子密度特征来定位,从而导致相对于连续C的特征位置上的高电子密度值和低电子密度值α原子。“查找二级结构”工具执行六维旋转和平移搜索,以查找电子密度内螺旋和链元素的可能位置。为了实现中等尺寸结构的交互性能,此搜索已进行了高度优化,因此,与自动建模软件包中使用的相应工具相比,它没有那么详尽:但是,它可以非常快速地指示地图质量和模型构建的起点。

4.1.4. 在此处放置螺旋线

在低分辨率下,当Cα位置并不明显。在这种情况下,库特可以自动拟合α螺旋线。这个过程涉及几个阶段。

  • (i) 对起始位置进行局部优化,以最大化5°球体上电子密度的积分。这会使起点靠近螺旋轴。
  • (ii)通过积分半径为2.5º、长度为12º的圆柱体中的电子密度,进行搜索以获得螺旋的方向。执行二维方向搜索以优化圆柱体的方向。这给出了螺旋的方向。
  • (iii)理论α螺旋模型(包括C、Cα,N和O原子)按照已经找到的位置和方向放置在密度中。必须考虑模型绕螺旋轴的不同旋转。每个生成的模型都由原子中心的密度之和进行评分。在这个阶段,螺旋的方向是未知的,因此两个方向都要测试。
  • (iv)接下来,通过比较C处的电子密度,在每个螺旋方向的最佳拟合模型之间进行选择β位置。如果两个方向都不适合Cβ原子,两个螺旋都呈现给用户。
  • (v) 最后,尝试使用理想的ψ、ψ值从N和C端延伸螺旋线。

4.1.5. 在此处放置钢绞线

在电子密度中放置β链碎片也使用了类似的方法。然而,与螺旋放置相比,有三个不同之处:首先省略了初始步骤,其次需要由用户提供片段的长度(残基数量),最后从数据库中获得放置的片段。由于圆柱体半径较小,第一步(优化起始位置)对钢绞线不可靠,主链,以及来自侧链的较大密度偏差。因此,它被省略,在这种情况下,用户必须提供起始位置。用于确定钢绞线方向的积分圆柱半径为1º,长度为20º。蛋白质中β链的ψ、ψ扭转角偏离理想值,导致链弯曲和扭曲。这种绞线不能用理想的ψ和ψ值很好地建模;因此,与请求长度相对应的候选链片段取自链“数据库”(top100或top500;Word、Lovell、LaBean等。, 1999)并在搜索中使用。

4.1.6. 理想的DNA/RNA

库特具有生成给定核苷酸序列的单链或双链a型或B型RNA或DNA的理想原子结构的功能。该函数是菜单驱动的,通过单击单个按钮,可以从给定的输入序列中生成任何所需的螺旋核酸坐标,并使用标准Watson–Crick碱基配对的PDB格式。由于大多数DNA和RNA结构至少由规则的近理想螺旋结构元素的局部区域组成,因此能够动态生成核酸螺旋模型对于分子替换具有特殊价值。

最近,一组短的理想a型RNA螺旋片段在库特被用于通过分子替换解决结构复杂的连接酶核酶(Robertson&Scott,2008). 使用库特与强大的分子置换程序一起相位器(斯托罗尼等。, 2004)不仅可以在不借助重原子方法的情况下解决这种新型RNA结构,而且还可以使用这种方法测定其他几种RNA和RNA/蛋白质复合物(Robertson&Scott,2007). 库特相位器可以使用嵌入式Python组件编写脚本,这是一个自动化和集成的阶段化系统,可以在当前的软件框架内进行开发。

4.1.7. 查找配体

配体自动拟合到电子密度图是一种常用的技术,对药物晶体学家特别有用(例如,见Williams等。, 2005). 中的机制库特解决了许多配体匹配场景,是之前描述的算法的改进形式(Oldfield,2001). 在“片段筛选”中,通常将不同配体浸泡在同一晶体中(布伦德尔等。, 2002). 使用库特可以在空间中指定一个区域,也可以在整个不对称单元中搜索单个或多个不同的配体类型。在“whole-map”方案中,通过残差图的聚类分析找到候选配体位点。候选配体依次拟合到每个位点(通过将配体的特征向量与簇的特征向量相匹配来生成候选方向)。对每个候选配体进行拟合,并根据电子密度进行评分。选择候选配体的最佳拟合方向。

配体通常含有许多可旋转的键。考虑到这种灵活性,库特样本围绕这些可旋转键的扭转角度。这里,每个可旋转键都是从独立的概率分布中采样的。构象的数量由用户控制,建议具有更多可旋转键的配体应允许更多的构象候选。在一定数量的可旋转键之上,使用“核心+碎片-碎片”方法更有效(例如,参见Terwilliger等。, 2006).

4.2. 重建和完善

重建和细化工具是中模型操作的主要手段库特和都分组在“模型/拟合/优化”工具集中。可以通过工具栏(通常停靠在主窗口的右侧)或包含每个工具栏功能按钮的单独“模型/拟合/优化”窗口访问这些工具。

重建和精化工具的核心是真实空间精化(RSR)引擎,它处理原子模型对电子密度图的精化和原子模型对几何约束的正则化。优化可以在用户执行时以交互方式调用,也可以作为某些自动装配工具的一部分以非交互方式调用。细化和正则化工具由一系列旨在帮助蛋白质链拟合的附加工具进行补充。下面讨论这些功能。

4.3. 移动现有原子的工具

4.3.1. 真实空间细化区域

真实空间优化工具是最常用的原子模型优化和重建工具,也是许多其他工具的最后一个阶段,例如“添加终端残留物…”。在交互模式下,用户选择RSR按钮,然后选择绑定一系列单体(氨基酸或其他)的两个原子。或者,可以选择单个原子,然后选择“A类“提炼单体及其邻接物的关键。选定单体范围内的所有原子都将被精制,包括任何侧翼残基。侧翼残基的原子标记为“固定”,但需要添加到细化中,以便几何结构(例如固定和运动部件之间的肽键、角度和平面)也进行了优化。

根据由两个项组成的目标对选定的原子进行细化:第一项是原子序数(Z轴)所有原子中心的电子密度值的加权和,第二个是立体化学约束。精炼的过程显示为一组新的原子以白色/浅色显示。当达到收敛时,用户会看到一个带有一组χ的对话框2分数和彩色“红绿灯”,表示每个几何标准中的当前几何分数(图4). 此外,如果优化范围包含任何新的顺式-肽键。

保存图片、插图等的外部文件。对象名称为d-66-00486-fig4.jpg

错位残留物的真实空间细化。彩色键显示了原始结构。白色的键显示了经过拖动和细化的原子。弹出窗口中的彩色框表示新模型遵守各种几何约束的程度。单击“接受”按钮将使彩色原子移动到新位置。

在这个阶段,用户可以通过用鼠标选择一个原子并拖动它来调整模型,这样其他原子就会随着拖动的原子移动。或者,可以通过按住Ctrl键键。一旦释放原子,选定的原子将从拖动位置细化。可选地,在精炼开始之前,可以选择在精炼过程中固定原子(除了侧翼残基的原子之外)。

4.3.2. 球体细化

上述精化模式的一个问题是,它只考虑残差的线性范围。这可能会造成困难,一些侧链被不适当地细化为相邻残基的电子密度,特别是在较低分辨率下。此外,线性残基选择排除了二硫键等实体的精细化。因此,引入了一种新的剩余选择机制来解决这些问题:所谓的“球体细化”。此模式选择原子在指定位置的给定半径内(通常在屏幕中心4°范围内)的残留物。所选的残留物与字典和任何用户定义的链接(通常来自mon_lib_list.cif文件在中REFMAC公司字典),例如二硫键、糖苷键和甲酰化赖氨酸。如果发现了这样的链接,并且(假定的)键合原子彼此之间的距离在3º以内,那么这些额外的链接约束将添加到细化中。

4.3.3. Ramachandran约束

在较低分辨率下,有时很难获得可接受的模型密度拟合,同时也很难获得高质量的Ramachandran图(大多数残差位于有利区域,离群值小于1%)。如果将Ramachandran分数添加到目标函数中,则可以改进Ramachandran图。

扭转梯度的分析形式x个 1等等)x个z(z)以前曾报道过四个原子的位置对扭转角的影响(Emsley&Cowtan,2004)(如果是Ramachandran约束,θ扭转将为和ψ)。按照以下方式延伸用作Ramachandran约束装置的扭转梯度。

首先,二维对数Ramachandran图生成表格(Pro、Gly和非Pro或Gly残留类型各一个)。当拉马钱德兰概率变为零时,对数概率变为无穷大,因此它被值所取代,这些值随着距离最近的非零值的距离而变得越来越负。这在不允许的区域中向最近的允许区域提供弱渐变。对数Ramachandran图提供了以下值和导数:

方程式图像

的导数添加到目标几何体时需要坐标,并生成为

方程式图像

(以此类推x个z(z)原子在扭转中的位置)。

将Ramachandran分数添加到几何目标函数并非没有结果。Ramachandran图长期以来一直被用作验证标准,因此,如果将其用于几何优化,其作为验证指标的信息量就会减少。Kleywegt&Jones(1996))在使用X-PLOR公司(布伦格,1992年)并报告称,使用中等力常数,Ramachandran异常值的数量减少了约三分之一。然而,将力常数增加两个数量级以上只会略微减少异常值的数量。因此,Kleywegt和Jones注意到,Ramachandran图作为验证工具仍然具有重要价值,即使它也被用作约束。使用中实施的Ramachandran约束库特使用默认权重,输出者的数量可以从10%左右减少到5%(典型值)。

4.3.4. 规则化区域

“正则化区域”选项的功能与“真实空间优化区域”相同,只是在这种情况下,模型是根据立体化学约束进行优化的,但没有参考任何电子密度。

4.3.5. 刚体配合区

“Rigid-Body Fit Zone”选项也遵循与其他优化选项类似的接口约定。选择一系列原子,并细化所选基团的方向,以最适合密度。在这种情况下,密度是目标函数的唯一贡献者,因为碎片的几何形状没有改变。键原子没有约束。如果原子在细化后被拖动,则不会对碎片执行进一步的细化。

4.3.6. 旋转/平移区域

使用此工具,可以通过在屏幕上拖动或使用用户界面滑块来平移和旋转选定的残留物选择。没有参考地图。旋转中心可以指定为选定的最后一个原子或旋转碎片的质量中心。此外,可以转换整个链或分子的选择。

4.3.7. 旋转器工具

有四种工具可用于安装氨基酸侧链。对于氨基酸类型已经正确分配的侧链,可以自动或手动选择适合密度的最佳旋转异构体。如果选择自动选项,则从摩尔概率图书馆(Lovell等。, 2000)选择在原子中心产生最高电子密度值的原子,并对其进行刚体精炼(包括残基的主链原子)。否则,将向用户显示数据库中按频率排序的侧链类型的旋转异构体列表。然后,用户可以使用键盘或用户界面按钮滚动旋转摄像机列表,选择所需的旋转摄像机。旋转器根据摩尔概率系统。简言之,χ角是根据扭转角给出的字母:“t”表示约180°,“p”表示约60°,“m”表示约−60°(Lovell等。, 2000).

其他两个选项(“突变和自动适配”和“简单突变”)允许分配或更改氨基酸类型。“Mutate&Auto Fit Rotamer”选项允许从列表中选择氨基酸类型,然后立即执行上述自动适配旋转异构体操作。“简单突变”选项可改变氨基酸类型,并在最常见的旋转异构体中构建侧链原子,无需进一步精制。

4.3.8. 扭转编辑(“编辑X角度”、“编辑脊椎扭转”、“扭转常规”)

库特有不同的工具来编辑主链和副链(或配体)扭转角度。可以使用“编辑主干扭转……”编辑主链扭转角,即⌀和ψ。使用两个滑块,可以调整肽和羰基扭转角。显示Ramachandran图的一个单独窗口,其中两个残基形成改变的肽键,残基的位置随着角度的变化而更新。编辑前必须定义侧链(或配体)扭转角。用户可以手动定义构成扭转角的四个原子(“扭转通用”),也可以自动确定扭转角,然后用户选择要编辑的原子。在后一种情况下,对所选扭转角进行编辑的结合处进行视觉标记。使用鼠标,可以自由旋转角度。

4.3.9. 其他蛋白质工具(“翻转肽”、“侧链180°翻转”、“顺式→反式”)

还有其他三种工具可以对蛋白质模型进行常见修正。”翻转肽'将肽群中的平面原子围绕连接边界C的矢量旋转180°α原子(琼斯等。, 1991). ‘侧链180°翻转将侧链的最后一次扭转旋转180°(例如交换Asn的OD1和ND2侧链原子)顺式→反式'将肽键扭转180°,从而将肽键从反式顺式反之亦然.

4.4. 用于向模型中添加原子的工具

4.4.1. 寻找水源

中的找水机制库特使用与配体拟合相同的聚类分析。但是,只有低于特定卷的集群(默认为4.2º)被认为是水分子的候选位置。计算每个簇的中心,然后对蛋白质分子(或其他水)中潜在的氢键供体或受体进行距离检查。可接受氢键长度的距离标准由用户控制。此外,还对可接受的电子密度球形度进行了测试。

4.4.2. 添加终端残留物

这个摩尔概率ψ,ψ分布用于生成一组随机选择的ψ,Ψ对。

为了在蛋白质链的N端和C端构建额外的残基摩尔概率ψ,ψ分布用于生成N,C的一组位置α接下来两个残基的O和C原子。然后根据电子密度图对这些新原子的构象进行评分并记录下来。此过程执行多次(默认为100次)。将最合适的构象作为候选构象提供给用户(只保留两个残基中最接近的一个)。

4.4.3. 添加备用构造

通过将残基分裂为两组构象来生成交替构象(A类B类). 默认情况下,残留物的所有原子都是分裂的,或者只分裂Cα侧链原子被分开。如果选择的残留物是标准蛋白质残留物,则还显示上述旋转体选择对话框,以及指定新构象占用率的滑块。

4.4.4. 将原子放在指针上

这是一个简单的界面,可以将键入的原子放置在屏幕中心的位置。它可以在未建模的电子密度峰值中放置额外的水或溶剂分子,并与“查找斑点”工具结合使用,该工具允许依次访问最大的未建模峰值。

4.5. 处理非晶体对称性(NCS)的工具

非晶体学对称性(NCS)可以在原子模型的建立和现有模型的分析中得到利用。库特提供了五种工具来帮助构建和可视化NCS相关分子。

  • (i) NCS鬼分子。为了可视化NCS相关分子之间的相似性和差异,可以在模型中的特定链上叠加任何或所有NCS相关链的“幻影”副本。“幻影”复制品以细线显示,颜色不同,也一致,以将其与原件区分开来。叠加可以通过二级结构匹配自动执行(Krissinel&Henrick,2004)或通过最小二乘叠加。图5显示了NCS鬼分子的示例.
    保存图片、插图等的外部文件。对象名称为d-66-00486-fig5.jpg

    带有NCS幻影的模型。厚键代表蛋白质链中的原子。薄键表示NCS相关链转化为叠加在第一链上。在屏幕底部,原子重合;在顶部,主链偏离,侧链处于不同的构造。

  • (ii)NCS地图。NCS相关分子的电子密度可以叠加,以便显示电子密度的差异。这是通过变换三维轮廓网格的坐标而不是电子密度本身来实现的,以便提供良好的交互性能。操作符通常参考遵循相同NCS关系的现有原子模型来确定。NCS地图示例如图6所示.
    保存图片、插图等的外部文件。对象名称为d-66-00486-fig6.jpg

    同一型号的NCS电子密度图,方向与上图相同。蓝色密度表示原始链。洋红色轮廓表示NCS相关链转换回原始链的电子密度,并清楚显示差异。

  • (iii)NCS平均地图。除了查看与NCS相关的电子密度副本外,还可以计算和查看相关区域的平均密度。在嘈杂的地图中,这可以为模型构建提供更清晰的起点。
  • (iv)NCS重建。使用NCS构建分子的原子模型时,通常更方便的方法是在一条链上工作,然后复制该链的每个NCS相关副本中所做的更改(至少在模型构建的早期阶段)。这可以通过选择两条相关链并用第一条链的NCS转化拷贝替换整个或特定残基范围内的第二条链来实现。
  • (v) NCS“跳跃”。视图中心跳转到下一个NCS相关对等链,同时考虑NCS操作员,以便相对视图保持不变。这为NCS相关实体的快速可视化比较提供了一种方法。

5.验证

库特结合了一系列验证工具,从模型与电子密度的比较,到蛋白质结构的全面几何检查,以及针对核苷酸的其他工具。

它还为外部验证工具提供了方便的接口:最显著的是摩尔概率套房(戴维斯等。, 2007),但也适用于REFMAC公司精炼软件(Murshudov等。, 1997)和字典(Vagin等。, 2004).

许多内部验证工具以彩色编码条形图的形式提供统一的界面,例如“密度拟合分析”图(图7)。此窗口包含结构中每个链的一个条形图。每个图表包含链中每个残留物的一个条形图。条形图的高度和颜色表示残留物的模型质量,绿色小条形图表示良好或预期/常规构象,红色大条形图表示质量较差或“非常规”残留物。图表处于活动状态,将指针移动到工具栏上时,工具提示会提供相关统计信息,单击工具栏会更改主图形窗口中的视图,使其以所选残留物为中心。通过这种方式,可以快速了解模型质量,并可以调查问题区域。为了获得子任务的良好结构,用户可以简单地循环验证选项,纠正发现的任何问题。

保存图片、插图等的外部文件。对象名称为d-66-00486-fig7.jpg

典型的验证图。棒材代表链中的单个残留物,通过棒材的尺寸和颜色来指示残留物的质量。情节是互动的,点击一个条带用户到相应的剩余。

以下各节将详细介绍可用的验证工具。

5.1. 拉马钱德兰阴谋

Ramachandran绘图工具(图8)启动一个新窗口,在其中显示活性分子的Ramachandran图。该图中显示了蛋白质中每个残基的数据点,用不同的符号区分Gly和Pro残基。该图的背景使用理查森的数据(洛维尔)显示了拉马钱德兰角的频率数据等。, 2003).

保存图片、插图等的外部文件。对象名称为d-66-00486-fig8.jpg

经典Ramachandran图的屏幕截图显示了所有残留物,轴定义了ψ和ψ角(角度以度为单位)。首选区域为粉红色,允许区域为黄色,不允许区域的背景为灰色。标准残留物显示为深蓝色方块,Pro残留物表示为浅蓝色方块,Gly残留物为浅蓝色开放三角形。不允许区域的残留物为红色。

绘图是交互式的:单击数据点会将三维画布中的视图移动到相应残留物的中心。类似地,在模型中选择原子会高亮显示相应的数据点。将鼠标移动到与Gly或Pro残基对应的数据点上会显示该残基类型的Ramachandran频率数据。

5.2. Kleywegt图

Kleywegt图(Kleywegt,1996; 图9)是Ramachandran图的变体,用于突出两条链之间的NCS差异。显示了蛋白质两条链的Ramachandran图,两条链中NCS相关残基的数据点由前50个(默认)最不同的¼、ψ角的线连接。相应图中的长线对应于NCS相关链之间主干构象的显著差异。

保存图片、插图等的外部文件。对象名称为d-66-00486-fig9.jpg

Kleywegt地块截图(Kleyyegt,1996)通过连接线(角度)显示两条NCS相关链之间的Ramachandran差异。标签、颜色和符号如上图所示。箭头连接NCS相关残留物。

5.3. 手性体积不正确

单体的字典定义可以包含手性中心的描述。手性中心被描述为“正”、“负”或“两者”。库特可以将蛋白质结构中的残基与字典进行比较并识别离群值。

5.4. 未建模的blob

“未建模Blobs”工具可以在不尝试匹配特定配体的情况下找到候选配体结合位点(如上所述)。

5.5. 差异峰

可以搜索正峰值和负峰值的差异图。然后根据峰值高度对峰值列表进行排序,并根据与更高峰值的接近程度进行过滤(只有不接近先前峰值的峰值才被识别)。

5.6. 检查/删除水

水可以通过几个标准进行验证,包括与氢键供体或受体的距离、温度因子或电子密度水平。未通过这些标准的水域将被识别并显示为列表或自动删除。

5.7. 通过差异图差异检查水域

该工具用于识别密度为其他原子或分子的水。通过在半径为0.5、1.0和1.5°的每个球体上生成20个点来分析每个水位置的差异图,并通过三次插值找到每个点的电子密度水平。计算每组点的密度水平的平均值和方差。例如,如果水被错误地放置在甘油的密度中,那么(给定水分子的各向同性密度模型)差异图将是各向异性的,因为沿着甘油中其他原子的键会有未解释的正密度。当精炼程序试图补偿额外的电子密度时,垂直方向上也可能存在一些负密度。将差异相加并与参考值进行比较(默认为0.12 e2Å−6). 请注意,只有在由倒数空间细化生成的差异映射上运行此测试才有意义(例如,从REFMAC公司菲律宾精制)这包括温度系数的改进。

5.8. 几何分析

将所选分子中每个残基的几何结构(键、角、平面)与字典值(通常由mmCIF提供REFMAC公司字典)。未分析扭角偏差(因为有其他验证工具;参见§5.9).

几何图形中显示的统计值是平均值Z轴该残基的每个几何项的值(肽几何畸变在相邻残基之间共享)。几何图形上的工具提示描述了产生最高Z轴值。

5.9. 肽ω分析

这是分析肽ω扭转角的验证工具。它生成一个图形,标记肽ω角偏离180°。偏差分配给包含肽链的C和O原子的残基,因此90°的肽ω角非常差。可选地,0°ω角可视为理想(对于有意ci公司s肽键)。

5.10. 温度系数方差分析

绘制了每个残基原子温度因子的变化曲线。这有时有助于突出显示构建错误的区域。在一个不合适的残留物中,往复空间细化将倾向于扩大低密度或负密度原子的温度因子,从而导致高方差。然而,带有长侧链的残留物(例如Arg或Lys)通常自然会有很大的差异,即使原子位置正确,这也会导致此图中出现“噪音”。这一缺点将在今后的发展中加以解决。在温度系数方差分析中忽略了氢原子。

5.11. Gln和AsnB类-因子异常值

这是另一个分析往复空间细化结果的工具。一项措施z(z)计算结果为NE2和OE1原子之间的温度因子差(在Gln的情况下)除以残渣中剩余原子的温度因子的标准偏差的一半。我们对高分辨率结构的分析表明,当z(z)大于+2.25,OE1和NE2有90%以上的机会需要翻转(P.Emsley,未发表的结果)。

5.12. 转子分析

旋转异构体统计数据是通过分析摩尔概率旋转体概率分布(洛弗尔等。, 2000)并显示为条形图。图中条形的高度与旋转器的概率成反比。

5.13. 密度四分析

密度拟合图中的条形与平均值成反比Z轴-原子中心的加权电子密度和地图的网格采样(在其他条件相同的情况下,具有粗网格采样的地图将比网格更精细的地图具有更低的条形)。考虑到网格采样,较低分辨率的地图可以有一个信息丰富的密度拟合图,而不会因为原子的密度通常较低而将许多或大多数残留物标记为令人担忧。

5.14. 探测器碰撞

“探针冲突”是摩尔概率工具减少(Word、Lovell、Richardson)等。, 1999)将H原子添加到模型中(从而提供了分析潜在侧链翻转的方法),以及探查(Word、Lovell、LaBean等。, 1999),分析原子堆积接触点的生成探查这些显示在库特并根据交互类型进行着色。

5.15. NCS差异

非晶体学对称性差异图显示了所选链转换为参考链后残基中原子的均方根误差。这有助于突出显示原子位置差异异常大的残基(最大差异通常出现在侧链原子中)。

6.模型分析

6.1. 几何测量

可以在模型上执行几何测量,并使用“测量”菜单中的选项在三维视图中显示。这些测量包括键长、键角和扭角,可以通过连续点击相关原子来选择。也可以测量一个原子到一组三个或更多其他原子定义的最小二乘平面的距离。“环境距离”选项允许显示选定残留物的任何原子在一定距离内的所有邻居。极地邻国之间的距离与其他所有国家的颜色不同。这在氢键的初始分析中是特别有用的。

6.2. 叠加

比较几个在序列或折叠方面相似的相关分子通常很有用。为了做到这一点,分子必须在空间中放置在相同的位置和方向,以便可以清楚地看到差异。为此提供了两种工具。

  • (i)SSM公司叠加(Krissinel&Henrick,2004)).二级结构匹配(SSM公司)是一种叠加蛋白质的工具,其折叠通过将一种蛋白质的二级结构元素与另一种蛋白质相匹配而关联。这种方法是自动的,不依赖于两种蛋白质之间的任何序列一致性。叠加可以包括一个完整的结构,也可以只是一个单链。
  • (ii)LSQ叠加。最小二乘(LSQ)叠加涉及到寻找旋转和平移,这将使两个模型中相应原子之间的距离最小化,因此取决于两个结构的原子之间具有预定义的对应关系。这种方法速度很快,但需要指定一个结构的残差范围,并与另一个结构中的相应残差范围相匹配。

7.与其他程序的交互

除了内置工具外,例如用于细化和验证,库特为外部程序提供接口。为了细化REFMAC公司SHELXL公司提供。验证可以通过与程序交互来完成探查减少来自摩尔概率一套。此外,通过与(分子)图形程序的通信提供用于制作公开质量图形的接口中央对手方清算所4毫克光线追踪光栅.

7.1.REFMAC公司

库特提供与中使用的对话类似的对话中央对手方清算所4用于运行REFMAC公司(穆尔舒多夫等。, 2004).REFMAC公司是来自中央对手方清算所4套用于基于最大lihood的大分子精制。完成一轮交互式模型构建后,用户可以选择使用REFMAC公司以完善当前模型。用于细化的反射可以从计算当前显示贴图的MTZ文件中使用,也可以从选定的MTZ文档中获取。大多数REFMAC公司参数设置为默认值;然而,一些可以在GUI中指定,例如细化循环数、孪生细化和NCS的使用。一次REFMAC公司已终止,将自动读入(并显示)生成地图的新生成(优化)模型和MTZ文件。如果REFMAC公司在精化结束时检测到几何异常值,将显示一个交互式对话,每个残差都有两个按钮,其中包含异常值:一个按钮用于将视图集中在残差上,另一个按钮则用于进行实际空间精化。

7.2.SHELXL公司

对于高分辨率细化,SHELXL公司可以直接从库特.一个新的SHELXL.ins公司文件可以从SHELXL.res公司文件,包括对模型的任何操作或添加。可以向文件中添加其他参数,也可以在GUI中对其进行编辑。一旦细化SHELXL公司完成后,将读取并显示优化的坐标文件。生成的反射文件(.fcf文件)转换为mmCIF文件,然后读取并显示电子密度。几何专家的互动对话(不愉快的约束和发现的其他问题SHELXL公司)可以通过解析.lst号输出文件来自SHELXL公司.

7.3.摩尔概率

库特与来自摩尔公信力套件有多种方式,其中一些已经描述过了。此外,摩尔概率可以提供库特以Python或Scheme格式的“待办事项表”的形式列出需要解决的可能的结构问题;这可以读入库特(“计算”→“脚本…”)。

7.4.中央对手方清算所4毫克

库特会写字中央对手方清算所4毫克图片定义文件(Potterton等。, 2004). 这些文件是可读和可编辑的,并定义了由中央对手方清算所4毫克。当前,视图和所有显示的坐标模型和地图都在库特-生成的定义文件。因此,中显示的场景库特当保存文件与中的相同时中央对手方清算所4毫克读取图片定义文件后。为方便起见,提供了一个按钮,可自动生成图片定义文件并在中打开中央对手方清算所4毫克.

7.5.光栅/光线追踪

光栅(Merritt&Bacon,1997年)和光线追踪(Persistence of Vision Pty Ltd,2004年)是高分子晶体学中制作公开质量图形的常用程序。库特为这两个程序写入输入文件以显示当前视图。然后,外部程序可以在外部或直接在内部渲染和光线跟踪这些对象库特使用“default”参数。由此产生的图像显示了以球棒表示的分子模型和以线框表示的电子密度。

8.脚本

大多数内部功能库特可以访问通过脚本语言Python的SWIG(简化包装器和接口生成器)接口(http://www.python.org(英文))和Guile(Scheme口译员;Kelsey等。, 1998;http://www.gnu.org/software/guile/guile.html).通过相同的界面,一些库特的图形小部件可用于脚本层(例如主菜单栏和主工具栏)。两个脚本界面的可用性为用户提供了更大的灵活性,并促进了库特其他应用程序。

除了可用的库特的内部函数,脚本界面由许多提供的脚本(通常在两种脚本语言中都可用)进行了丰富。其中一些脚本使用GUI,或者通过使用库特图形小部件或通过脚本语言的GTK+2扩展。在额外的“扩展”菜单中提供了许多可用的脚本和函数。脚本不仅为用户提供了运行内部库特功能和脚本,以及读写自己的脚本和自定义菜单的功能。

9.建造和测试

什么时候?库特向公众开放时,三个首要考虑因素是它应该是跨平台的、健壮的和易于安装的。这些考虑仍然是一个挑战。为了帮助满足这些要求,我们开发了一个自动化的定时构建和测试系统,从而几乎可以持续部署预发布软件。

颠覆版本控制系统(网址:http://svnbook.red-bean.com/)用于管理源代码修订。“集成机”每小时检查几次最新的源代码,编译软件并生成源代码tar文件。不太常见的是,构建机器的异构阵列复制源tar文件并为主机体系结构编译它。成功构建后,软件将在测试套件上运行,只有通过测试,软件才能捆绑并可从网站下载。所有构建和测试日志都可以在库特网站。幸运的是,预发布代码的用户报告问题时似乎没有过度的愤怒。开发人员的目标是对此类报告作出快速反应。

9.1. 计算机操作系统兼容性

库特根据GNU通用公共许可证(GPL)发布,并依赖于许多其他GPL和开源软件组件。库特的GUI和图形显示基于相当标准的基础设施,包括X11窗口系统、OpenGL和相关软件,如源自GIMP项目的跨平台GTK+2堆栈。此外,库特依赖开源晶体学软件组件,包括Clipper库(Cowtan,2003)、MMDB库(Krissinel等。, 2004),的SSM公司图书馆(Krissinel&Henrick,2004))和中央对手方清算所4个库。原则上,库特它的依赖性可以安装在任何现代GNU/Linux或Unix平台上,而无需大张旗鼓。基于Windows的版本库特也可以使用。

9.2.库特在GNU/Linux上

编译和安装库特在GNU/Linux操作系统上可能是最简单的选择。GNU/Linux本质上是与大多数计算机硬件兼容的Unix操作系统的自由软件/开源协作实现。库特的基础设施依赖项,如GTK+2和其他GNU库,以及它的所有晶体软件依赖项,都是基于可移植性而选择的。大多数所需的依赖项要么与GNOME桌面一起安装,要么随时可以安装通过特定于每个分发的包管理系统。

未来有可能库特(及其所有依赖项)将可用通过几个主要GNU/Linux发行版的官方软件包分发系统。当最终用户选择安装库特包,全部库特所需的依赖项将在一个简单而无痛的过程中与之一起安装。

一位官员库特包目前存在于Gentoo发行版中(由Donnie Berkholz维护),Fedora包(由Tim Fenn维护)在编写时正在开发,非官方的Debian和rpm库特软件包也可用。二元的库特最流行的GNU/Linux平台的版本可从库特网站:http://www.ysbl.york.ac.uk/~emsley/software/二进制文件/.

有关安装的其他信息库特在GNU/Linux上,作为预编译的二进制文件或源代码,可以在库特维基:http://strucbio.biologie.uni-konstanz.de/ccp4wiki/index.php/COOT.

9.3. 苹果Mac OS X上的Coot

随着苹果Mac OS X(一种基于Unix的操作系统)的发布,在苹果电脑上使用大多数(如果不是全部)标准晶体学软件成为可能。OSX本机不使用X11窗口系统,而是使用名为Quartz的专有窗口技术。与X11相比,此系统具有一些优点,但不支持基于X11的Unix软件。然而,X11窗口系统可以在OS X中运行(在无根模式下),从OS X 10.5版本开始,这已经成为默认选项,并以相当无缝的方式运行。

与GNU/Linux不同,Apple不提供基于X11的依赖项(GTK+2、GNOME库)以及安装和运行所需的许多其他开源组件库特然而,第三方软件包管理系统似乎填补了这一空白,他们的使命是将其他基于Unix的系统的用户可以免费使用的所有最重要的软件移植到OS X。最流行的两个软件包管理系统是芬克MacPorts公司其中,芬克为科学家提供了大量有用的软件,包括大量晶体软件。因此,芬克已被采纳为安装的首选选项库特在Mac OS X上。芬克使用了许多与Debian GNU/Linux包管理系统相同的软件工具,并提供了方便的前端。

实际上,这需要最终用户做三件事来准备安装库特在OS X下。

  • (i) 安装Apple的X-code Developer工具。这是一个苹果提供的免费千兆字节大小的下载。
  • (ii)安装最新版本的X11。这一点至关重要,因为需要运行许多错误修复程序库特.
  • (iii)安装第三方包管理系统芬克并使“不稳定”软件树能够访问最新的软件。

库特然后可以通过安装芬克使用命令fink安装coot.

9.4.库特在Microsoft Windows上

由于Microsoft Windows操作系统是使用最广泛的计算机平台库特已提供在Microsoft Windows上运行的版本(温库特). 所有库特的依赖项可以在Windows系统上轻松编译(尽管有些需要小的调整),也可以通过GPL/开源二进制下载获得。适用于Windows的GTK+2(动态链接)库(DLL)的可用性使编译成为可能库特无需X11窗口系统,这将依赖于仿真层(例如Cygwin). 库特由于操作系统体系结构的差异,例如文件系统(Lohkamp等。, 2005). 目前温库特默认情况下,只使用Python作为脚本语言,因为Guile GTK+2扩展模块在Windows上不够健壮。温库特对于GNU/Linux系统,二进制文件是定期自动构建和测试的。该程序是使用批处理脚本执行的,并已在Windows 98、NT、2000、XP和Vista上运行。

温库特二进制文件(稳定版本和预发布版本)可以作为自解压缩文件从http://www.ysbl.york.ac.uk/~lohkamp/coot/.

10.讨论

库特尝试将高分子模型构建和验证的现代方法与对现代GUI应用程序的关注相结合,如易用性、生产力、美观性和容错性。这是一个持续的过程,尽管仍有改进的余地,但我们认为库特有一个易于学习的直观图形用户界面,结合了高度的晶体学意识,为初学者和经验丰富的人提供了有用的工具。

然而,库特有许多局限性:NCS平均映射实现得很差,仅对单元单元(或晶体)的有限部分有意义。使用低温电子显微镜数据的地图时,也存在对称性不匹配(库特错误地将晶体对称性应用于EM贴图)。库特编译起来一点也不容易,有很多依赖项:这对开发人员和高级用户来说是个问题。

10.1. 未来

库特正在不断发展。几乎每天都会添加新功能和错误修复。预计将添加更多工具,用于验证、核苷酸和碳水化合物模型构建以及完善。通过与中央对手方清算所4数据库,使用注释和交互式笔记本,并将注释表示添加到验证图中。嵌入式脚本语言提供了与建模工具进行复杂通信的潜力,例如海盗,果皮/弯曲菲尼克斯; 将来,这可能会扩展到包括密度修改。

从长远来看,计划使用工具处理EM地图,包括建立和完善模型的可能性。适当的数据结构已在Clipper库中实现,但在中尚不可用库特.

验证工具的集成将得到扩展,特别是在以下方面摩尔概率,以及到检查内容(_C)验证程序(Hooft等。, 1996)将添加。WHAT_检查提供机器可读的输出,可以由库特提供交互式描述和导航,以及(需要更多工作)自动修复有问题的几何体的模式。

证据中添加的注释:Ian Tickle注意到χ2实际空间细化产生的值。库特将被修改,以代替表示每个几何项的r.m.s.偏离理想值。

致谢

KC感谢皇家学会和英国BBSRC(BBF0202281)的资助。BL承认英国BBSRC(BB/D522403)提供资金。PE承认CCP4提供资金。

工具书类

  • Adams,P.D.、Grosse-Kunstleve,R.W.、Hung,L.-W.、Ioerger,T.R.、McCoy,A.J.、Moriarty,N.W.,Read,R.J.、Sacchettini,J.C.、Sauter,N.K.和Terwilliger,T.C.(2002年)。《水晶学报》。58, 1948–1954. [公共医学]
  • Bernstein,F.C.,Koetzle,T.F.,Williams,G.J.B.,Meyer,E.F.Jr,Brice,M.D.,Rodgers,J.R.,Kennard,O.,Shimanouchi,T.&Tasumi,M.(1977年)。分子生物学杂志。112, 535–542. [公共医学]
  • Blanc,E.、Roversi,P.、Vonrhein,C.、Flensburg,C.、Lea,S.M.和Bricogne,G.(2004)。《水晶学报》。60, 2210–2221. [公共医学]
  • Blundell,T.L.,Jhoti,H.&Abell,C.(2002)。Nature Rev.药物发现。1, 45–54. [公共医学]
  • Brünger,A.T.(1992)。X-PLOR公司v.3.1版。X射线晶体成像和核磁共振系统。纽黑文:耶鲁大学出版社。
  • Cowtan,K.(2000年)。《水晶学报》。56, 1612–1621. [公共医学]
  • Cowtan,K.(2003)。IUCr计算。Commun公司。新闻。2, 4–9.
  • Cowtan,K.(2006)。《水晶学报》。62, 1002–1011. [公共医学]
  • Cowtan,K.(2010年)。《水晶学报》。66, 470–478.[PMC免费文章][公共医学][谷歌学者]
  • Dauter,Z.(2006)。《水晶学报》。62, 1–11. [公共医学]
  • Davis,I.W.、Leaver Fay,A.、Chen,V.B.、Block,J.N.、Kapral,G.J.、Wang,X.、Murray,L.W.、Arendall,W.B.III、Snoeyink,J.、Richardson,J.S.和Richardson,D.C.(2007年)。核酸研究。35,W375–W383。[PMC免费文章][公共医学]
  • DeLano,W.L.(2002)。PyMOL分子查看器。http://www.pymol.org。
  • Emsley,P.&Cowtan,K.(2004)。《水晶学报》。60, 2126–2132. [公共医学]
  • 埃斯努夫,R.M.(1997)。《水晶学报》。53, 665–672. [公共医学]
  • Greer,J.(1974)。分子生物学杂志。82, 279–301. [公共医学]
  • Hooft,R.W.W.,Vriend,G.,Sander,C.&Abola,E.E.(1996)。自然(伦敦),381, 272. [公共医学]
  • Jones,T.A.和Thirup,S.(1986年)。EMBO J。5, 819–822.[PMC免费文章][公共医学]
  • Jones,T.A.、Zou,J.Y.、Cowan,S.W.和Kjeldgaard,M.(1991)。《水晶学报》。A类47, 110–119. [公共医学]
  • Kelsey,R.,Clinger,W.&Rees,J.(1998)。高阶和符号计算,11, 7–105.
  • Kleywegt,G.J.(1996)。《水晶学报》。52, 842–857. [公共医学]
  • Kleywegt,G.J.、Harris,M.R.、Zou,J.、Taylor,T.C.、Wählby,A.和Jones,T.A.(2004)。《水晶学报》。60, 2240–2249. [公共医学]
  • Kleywegt,G.J.&Jones,T.A.(1994年)。CCP4研究周末会议记录。从第一张地图到最终模型由S.Bailey、R.Hubbard和D.Waller编辑,第59-66页。沃灵顿:达斯伯里实验室。
  • Kleywegt,G.J.&Jones,T.A.(1996年)。结构,4, 1395–1400. [公共医学]
  • Krissinel,E.和Henrick,K.(2004年)。《水晶学报》。60, 2256–2268. [公共医学]
  • Krissinel,E.B.,Winn,M.D.,Ballard,C.C.,Ashton,A.W.,Patel,P.,Potterton,E.A.,McNicholas,S.J.,Cowtan,K.D.&Emsley,P.(2004)。《水晶学报》。60, 2250–2255. [公共医学]
  • Langer,G.、Cohen,S.X.、Lamzin,V.S.和Perrakis,A.(2008年)。自然协议。, 1171–1179.[PMC免费文章][公共医学]
  • Lohkamp,B.、Emsley,P.和Cowtan,K.(2005)。CCP4新闻。42,贡献7。
  • Lorensen,W.E.和Cline,H.E.(1987)。ACM SIGGRAPH计算。图表。21, 163–169.
  • Lovell,S.C.、Davis,I.W.、Arendall,W.B.III.、de Bakker,P.I.W、Word,J.M.、Prisant,M.G.、Richardson,J.S.&Richardsson,D.C.(2003)。蛋白质,50, 437–450. [公共医学]
  • Lovell,S.C.、Word,J.M.、Richardson,J.S.和Richardsson,D.C.(2000)。蛋白质,40, 389–408. [公共医学]
  • Merritt,E.A.和Bacon,D.J.(1997年)。方法酶制剂。277, 505–524. [公共医学]
  • Murshudov,G.N.、Vagin,A.A.和Dodson,E.J.(1997)。《水晶学报》。53, 240–255. [公共医学]
  • Oldfield,T.J.(2001)。《水晶学报》。57, 696–705. [公共医学]
  • Vision Pty Ltd的执着(2004)。POV-Ray–视觉光线跟踪器的持久性。http://www.povray.org。
  • Potterton,L.、McNicholas,S.、Krissinel,E.、Gruber,J.、Cowtan,K.、Emsley,P.、Murshudov,G.N.、Cohen,S.,Perrakis,A.和Noble,M.(2004)。《水晶学报》。60, 2288–2294. [公共医学]
  • Robertson,M.P.和Scott,W.G.(2007年)。科学类,315, 1549–1553. [公共医学]
  • Robertson,M.P.和Scott,W.G.(2008)。《水晶学报》。64, 738–744.[PMC免费文章][公共医学]
  • Storoni,L.C.、McCoy,A.J.和Read,R.J.(2004)。《水晶学报》。60, 432–438. [公共医学]
  • Terwilliger,T.C.、Klei,H.、Adams,P.D.、Moriarty,N.W.和Cohn,J.D.(2006)。《水晶学报》。62, 915–922.[PMC免费文章][公共医学]
  • Vagin,A.A.、Steiner,R.A.、Lebedev,A.B.、Potterton,L.、McNicholas,S.、Long,F.和Murshudov,G.N.(2004)。《水晶学报》。60, 2184–2195. [公共医学]
  • Vonrhein,C.、Blanc,E.、Roversi,P.和Bricogne,G.(2007年)。方法分子生物学。364, 215–230. [公共医学]
  • Wang,J.W.,Chen,J.R.,Gu,Y.X.,Zheng,C.D.,Jiang,F.,Fan,H.F.,Terwilliger,T.C.&Hao,Q.(2004)。《水晶学报》。60, 1244–1253. [公共医学]
  • Westbrook,J.D.、Yang,H.、Feng,Z.和Berman,H.M.(2005)。国际结晶学表,卷。G公司由S.R.Hall和B.McMahon编辑,第539–543页。海德堡:施普林格。
  • Williams,S.P.、Kuyper,L.F.和Pearce,K.H.(2005年)。货币。操作。化学。生物。9, 371–380. [公共医学]
  • Word,J.M.,Lovell,S.C.,LaBean,T.H.,Taylor,H.C.,Zalis,M.E.,Presley,B.K.,Richardson,J.S.&Richardsson,D.C.(1999)。分子生物学杂志。285, 1711–1733. [公共医学]
  • Word,J.M.、Lovell,S.C.、Richardson,J.S.和Richardsson,D.C.(1999)。分子生物学杂志。285, 1735–1747. [公共医学]
  • Zhang,K.Y.J.,Cowtan,K.&Main,P.(1997)。方法酶制剂。277, 53–64. [公共医学]

文章来自结晶学学报D辑:生物结晶学由以下人员提供国际晶体学联合会