跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
蛋白质。作者手稿;PMC 2009年6月9日发布。
以最终编辑形式发布为:
预防性维修识别码:PMC2693897型
NIHMSID公司:NIHMS115213
PMID:18393395

MolAxis:高效准确地识别大分子通道

摘要

通道和空腔在大分子功能中起着重要作用,是底物/产物、辅因子和药物结合、催化位点以及配体/蛋白质的进出通道。此外,由跨膜蛋白形成的通道作为转运蛋白和离子通道。MolAxis是一种新的灵敏、快速的工具,用于识别和分类大分子中各种大小和形状的通道和空腔。MolAxis构造走廊,这是代表小分子通过通道的可能路径。分子的外中轴是具有多个最近原子的点的集合。它由二维表面补丁组成,可以看作是分子补体的骨架。我们在MolAxis中实现了一种新的算法,该算法使用最先进的计算几何技术来近似和扫描外中轴的有用子集,从而降低了问题的维数,从而使该算法非常有效。MolAxis旨在识别连接埋地空腔的通道并识别蛋白质中的跨膜通道。我们将MolAxis应用于酶腔和跨膜蛋白。我们进一步利用MolAxis监测人类细胞色素P450分子动力学轨迹上的通道尺寸。MolAxis以皮秒时间尺度间隔为快照构建了高质量的通道,证实了2e基板接入通道中的选通机制。我们将我们的结果与以前的工具在准确性、性能和找到所需路径的潜在理论保证方面进行了比较。MolAxis作为网络服务器和独立的易于使用的程序在线提供(http://bioinfo3d.cs.tau.ac.il/MolAxis网站/).

关键词:分子动力学MD,细胞色素P450 3A4 CYP3A4,大孔通道LPC,三磷酸腺苷结合盒ABC,跨膜TM,中轴

介绍

蛋白质中的空腔、通道、口袋和表面凹槽是与药物、配体、核酸和蛋白质结合和相互作用的潜在场所。相互作用决定了蛋白质的功能。因此,人们开发了大量的计算方法和算法来检测和表征蛋白质功能位点。17大多数方法通常指向最大的空腔或口袋作为结合或活性部位。在许多情况下,尤其是在包括环羟基化双加氧酶在内的酶中,8卤代烷烃脱卤酶,9神经溶素,10细胞色素P450家族11,乙酰胆碱酯酶12此外,在蛋白的埋藏核心中发现了最大的空腔活性位点。为了使反应发生,底物或配体必须从蛋白质外部进入活性位点。然而,这些工具并没有找到或预测从蛋白质表面到达口袋的方式。底物特异性不仅受结合位点上的相互作用的影响,还受结合位点的通路选择性的影响,通路选择性由通路的大小、形状和物理化学性质决定。底物选择性问题在生物化学和药物化学、理解催化机制和药物设计中具有重要意义。

空穴和空腔发现算法在检测跨膜(TM)蛋白质通道的能力方面受到限制。许多药物靶点,如离子通道13,14,运输工具15、和受体16包括跨膜通道,并测定其内表面,预计将有助于开发更具选择性、副作用更少的药物。程序HOLE17分析并显示离子通道的孔径,主要适用于近直通道。然而,对于曲率更大的通道和从腔体发射的通道,孔非常有限。一种名为CAVER的新工具18是为了探索蛋白质裂缝和空洞的途径而开发的。它的基本算法基于使用三维网格的骨架搜索。给定一个起点,该程序识别并可视化从蛋白质内部到散装溶剂的路径。蛋白质被映射到一个3D网格上,每个网格细胞被加权,使加权最低的细胞被空白包围。搜索算法检测所有加权最低的细胞,并找到从起点到蛋白质表面的最低成本路径。一种改进的工具,称为MOLE19也是由同一小组最近开发的。它将CAVER的众多网格顶点替换为较少数量的顶点,这些顶点位于原子中心的Voronoi图上。这导致了一个高效的算法,其结果与CAVER获得的结果类似。

计算几何领域的工具经常用于结构生物学。特别是,发展了计算几何技术和范式,有助于表征和分析分子结构。阿尔法形状理论20用于描述分子的拓扑和几何特征,例如测量口袋的表面积和体积。21然而,分子的α络合物不足以描述通道的特征,例如其骨架或直径。我们依赖alpha形状和另一个几何概念:中轴线一般曲面的中轴是曲面上具有多个最近点的三维点的集合。例如,圆柱体表面的中轴就是圆柱体的轴。中轴在运动规划、逆向工程、特征提取、网格生成等方面都有应用。22这里,手边的曲面是范德瓦尔斯(VDW)分子的表面。它整齐地分为内中轴和外中轴,即分子内部的中轴点和分子外部的点(补充分子)。分子的内中轴可以看作是分子的骨架,它由平面或平面组成。另一方面,分子的外中轴是分子外部具有多个最近原子且由双曲线补丁组成的点的集合,这使得很难精确计算。

我们使用走廊走廊是小分子通过通道的可能路线。为了给人一个生动的比喻,想象一座火山在分子体积之外的某一点喷发(例如,位于分子室内)。熔岩从火山口流出,形成一系列溪流,在通道较宽的地方流速更快,而在通道较窄的地方流速较慢。每当水流到达无法绕过的障碍物(如分子VDW表面或另一条水流)时,它就会停止流动。溪流往往在长度和净空之间保持平衡,在这个类比中,它们代表走廊。走廊是定义明确的几何实体,我们在下面的理论和算法部分中对其进行了定义。

MolAxis是一种新工具,可以快速识别分子补体中的走廊。MolAxis采用了一种新的算法23基于α形状,以近似分子补体中轴的有用子集。据我们所知,这是第一次尝试近似和分析分子补体的中轴,以构建通道。我们的方法最显著的优点是,中轴由二维曲面片组成,即我们将三维问题转换为二维问题,这大大提高了算法的性能。MolAxis可以以较高的成功率自动计算主空隙中心的震源点,或允许用户指定震源点。

在本文中,我们将MolAxis应用于四种静态蛋白质结构:大孔通道(LPC),一种细菌膜蛋白;ABC转运蛋白;细菌细胞色素P450(P450);和人类P450。ABC转运蛋白的应用表明,中轴形状是光滑的,反映了小分子运动通过通道时产生的通路。在P450案例研究中,我们确定并描述了从蛋白质主腔中的源点到其表面的路径,其速度比CAVER快一百倍。例如,在网格分辨率为0.4º的情况下,CAVER可以找到大多数先前确定的通道11在大约64小时内,在前十条已确定的路径内,而MolAxis在不到两秒的时间内发现了更多具有类似分辨率的通道(参见表1). 与CAVER相比,MOLE软件提高了运行时间,与MolAxis类似。此外,在人类P450 3A4中,我们检测到前十个已识别通路中几乎所有已知的通道,其中一些几乎是闭合的,因此未被CAVER和MOLE检测到。例如,CAVER和MOLE没有检测到基板进出通道2c、2f和3以及之前描述的水道W11在前十个确定的路径中。在搜索更多频道时运行CAVER和MOLE后,仍然没有检测到所有已知频道。MolAxis通常会发现独特的几何路径,即每个通道只报告一次,不需要像MOLE那样进行聚类。

表1

每个CYP的次数凸轮使用四种运行模式在不同的分辨率下识别底物或水通道类型:用户/自动/Caver和鼹鼠b条(最后一行)

通道类型c(c)

研究(奥数)d日运行时间e(电子)12a个2亿2厘米第二版第2页S公司W公司其他

0.16.97秒/19.31秒/不适用1/2/01/1/00/0/01/1/01/1/01/1/01/1/01/1/01/2/02/0/0
0.23.95s/9.58s/NA(不适用)2/2/01/1/00/0/01/1/01/1/01/0年1月1/1/01/1/02/1/00/1/0
0.31.77s/3.77s/NA2/2/01/1/01/1/01/1/01/1/01/1/01/1/00/0/01/1/01/1/0
0.41.67s/3.62s/64小时2/2/21/1/21/1/01/1/01/1/21/1/11/1/00/0/11/1/21/1/0
0.51.71s/3.68s/15小时2/2/41/1/21/1/01/1/01/1/11/1/01/1/10/0/11/1/11/1/0
0.61.70秒/3.70秒/6小时2/2/21/1/21/1/01月1日1/1/11/1/01/1/10/0/21/1/11/1/0
0.71.74s/3.78s/1.5小时2/2/31/1/11/1/01/1/11/1/11/1/01/1/10/0/11/1/11/0年1月
0.81.66s/3.66s/57米2/2/51/1/21/1/01/1/01/1/11/1/01/1/10/0/11/1/01/1/0

鼹鼠b条10秒1101101101

显示了前10个已识别的通道。

在用户模式下,用户提供MolAxis的起点。在自动模式下,MolAxis识别最大型腔的中心,并将其设置为源点。在Caver模式下,运行在用户指定的点启动Caver。
b条在Mole模式下,在与MolAxis相同的用户指定点启动Mole时执行运行。
c(c)通道表示如下Cojocaru等人11分类。通道1、2a、2b、2c、2e、2f、3为底物通道;S是溶剂通道,可以是衬底通道;W代表水道。
d日左列指定分辨率。CAVER的分辨率是网格单元大小。

MolAxis的分辨率在理论和算法部分中定义。

e(电子)NA——不适用;s–秒;m–分钟;h–小时。

此外,我们将MolAxis应用于人类P450 3A4的6 ns显式水分子动力学(MD)模拟生成的一系列快照,证实了2e基板接入通道中的选通机制。MolAxis可以应用于巨大的数据集,例如从长MD轨迹中获得的快照,以获得代表小分子通过通道的可能路线的路径。

理论与算法

我们使用一组三维球体(每个原子一个球体)对分子建模,并为每个球体指定相应的VDW半径。分子的外中轴可视为分子补体的骨架。寻找路径是一个自然的起点,因为它往往远离分子表面,但它与分子的补体具有相同的形状(技术术语是“同伦等价物”),正如最近显示的一般形状家族。24可以精确地计算分子的外中轴。25我们采用近似方案有两个主要原因:实现简单和计算效率。由于分子模型一开始是近似的,因此产生的误差可以忽略不计。

在我们的近似方案中,我们首先缩放原子,使最小的原子是一个单位球。然后用一个集合替换每个原子单元我们称之为近似球原子的。从变半径球到同半径球的转换需要构造更简单的对象:我们只需要处理空间中的多边形,而不用处理弯曲的代数曲面。此外,我们计算的路径图包含在近似球中心的标准Voronoi图中,而这又是一个经过充分研究的结构,因此存在健壮高效的实现。我们将所有近似球的集合称为近似分子.VDW表面是分子的界面。这个近似VDW表面是近似分子的边界表面。用户提供一个分辨率参数ε,MolAxis保证VDW曲面的每个点在近似VDW曲面中都有一个对应点,这样两点之间的距离最多为ε。近似一个分子所需的单位球数主要取决于最大原子和最小原子之间的比率。其他地方23我们详细描述了我们的近似方法,并给出了算法所需的近似球数的界,以保证所需的逼近质量ε。我们将Voronoi图中不与近似分子相交的近似球的中心部分称为路径图(图1).

保存图片、插图等的外部文件。对象名称为nihms115213f1.jpg

一个相同大小的圆(浅蓝色)集合的示例,近似于不同大小的圆,以及它们中心的路径图。它们中心的Voronoi图中被丢弃的部分用虚线表示。

A类通路π是一条位于近似分子外部的空间曲线,包含在路径图中。设π为通路第页成为重点间隙c(第页)第页,共页第页是之间的最小距离第页和近似VDW表面。这个衬球属于第页是指(一个或多个)距离最小的近似球的集合第页.我们称之为原子A类衬里原子属于第页如果至少有一个衬球第页近似值A类.A型炉衬残渣属于第页是含有一个或多个衬里原子的残渣第页.

这个轮廓属于π是上各点的间隙π作为路径距离的函数。这个路径球属于第页inπ是半径为的球c(c)(第页)以…为中心第页. The通道表面π的是π的所有路径球的并集的边界(包络)面。这个瓶颈半径π是路径上的最小间隙瓶颈点π是π中达到瓶颈半径的点。这个瓶颈原子(分别为。瓶颈残留物)是瓶颈点的衬里原子(分别是衬里残留物)。

准确的间隙c(c)(第页)一个点的第页在分子的补体中是第页和(精确的)VDW表面。我们在这里声明了在别处证明的引理:23

引理1对于任何第页在路径图中c(p)>ε它认为|c(第页)–c(c)(第页)|≤ ε.

这个引理证明了我们使用间隙函数作为理想精确间隙函数的近似。

路径图构造

路径图由二维补丁组成(参见图1). 为了将问题简化为一维问题,我们创建了一个仅包含顶点和边的图。首先,我们放弃了路径图的所有方面。由于点的Voronoi图的几何特性,有界面的边之一F类始终具有比端面内侧更高的间隙F类因此,丢弃刻面有利于路径清除(以增加路径长度为代价)。一种更稳健的方法可能是在面内对顶点进行采样,但我们没有发现这种改进的必要性。其次,路径图的一些边缘是射线,走向无穷远。我们通过将路径图与边界球相交,用线段替换光线,如下所述。

成为一个大型的用户专用边界球。对于每个Voronoi边缘e(电子)= (v(v),v(v)o个)相交的,使用v(v)里面v(v)o个外部,我们构造一个新的顶点v(v)e(电子)那是e(电子)。我们打电话给v(v)e(电子)边界顶点。我们还构造了一个边界边缘e’ = (v(v),v(v)e(电子)),它是的一部分e(电子)位于内部的。我们定义V(V)是路径图中Voronoi顶点的集合以及所有边界顶点。以类似的方式,我们定义E类是路径图中完全位于其中的Voronoi边的集合以及所有边界边。我们构造一个图G公司=G公司(V(V),E类)我们称之为路径图从这一点出发,我们将自己限制在路径图中包含的路径。

走廊树施工

路径不是唯一的,两点之间可以存在多条路径。有几种方法可以定义两点之间的最佳路径。一条路是两点之间的最短路径。另一种方法是只关注路径的清除。两个给定点之间的最短路径通常具有不需要的特性,即它可以任意靠近分子的边界,因此瓶颈半径接近于零。另一方面,高清除路径可能非常长。因此,我们有兴趣找到在长度和间隙之间平衡的路径。

对于任何顶点v(v)V(V)位于第页R(右)我们将其间隙定义为c(c)(v(v)) =c(c)(第页). 对于每个边缘e(电子)(v、 v’)∈E类,的边缘间隙c(e)定义于方程式1:

c(c)(e(电子))=最小值(C类最大值,c(c)(v(v))2+c(c)(v(v)')2),
(1)

哪里C类最大值是用户定义的常量,用作间隙的上限。我们定义了一个权重函数w个(e(电子))在边缘上,该边缘的长度和沿边缘的点的间隙方程式2:

w个(e(电子))=d日(v(v),v(v))(c(c)(e(电子)))2,
(2)

哪里d日(v、 伏)是之间的欧几里得距离v(v)v(v)’. 我们在图上使用最小权重优化算法G公司然后计算一棵树。重量函数w(e)支持短而宽的路径,可以被视为流量优化。权重函数可以很容易地修改和调整以优化其他准则。我们选择一个根顶点以下面描述的方式,计算以使用Dijkstra算法26G公司重量由定义w(e)。我们称这棵树为走廊树分子的。

在计算树的每个顶点时v(v)分配了一个通量重量W(v),它是路径上边的权重之和v(v)我们这么说u个V(V)是一个祖先属于v(v)V(V)如果它包含在从根顶点开始的(单个)路径中v(v)在走廊树上。顶点v(v)V(V)称为叶顶点如果它是走廊树中的一片叶子,即。,v(v)不是中任何顶点的祖先V(V).A型走廊π是道路树中到达叶子顶点的路径v(v)π.我们将走廊π的通量权重定义为通量权重W公司(v(v)π)其叶顶点的v(v)π.

查询道路树

道路树构建作为预处理完成,并保存到文件中。我们支持各种查询,以允许用户识别、显示和分析道路树中的单个道路。用户可以查询走廊树,以识别通量权重最小且通过用户指定球体的走廊π。MolAxis将走廊轮廓、衬里原子、衬里残留物、瓶颈半径、瓶颈原子和瓶颈残留物作为输出。出于可视化目的,MolAxis将通道的道路曲面构造为球集合或网格曲面(请参见结果部分)。

MolAxis支持针对两种场景设计的特殊查询,即腔室通道(例如P450酶)和跨渠道(变速箱通道)。腔室通道是将内腔连接到外部的通道。MolAxis通过报告将根顶点(放置在腔室内部)连接到边界顶点的走廊来识别腔室通道,如下所述。交叉通道是蛋白质从一边到另一边的通道,就像跨膜通道一样。在这种情况下,MolAxis将两条走廊串联在一起,共同代表如下所述的通道。

腔室通道

在第一个场景中,处理腔室通道时,我们选择根顶点成为房间内的顶点之一。这可以通过选择最靠近用户指定点的顶点或自动计算蛋白质中最大腔室的中心来完成。后一个选项称为自动模式最大的腔室是使用与Edelsbrunner使用的类似的持久拓扑技术推导出来的等。27。如果近似球以均匀方式充气,则它是最后一个剩余空隙中心的顶点。我们区分两种类型的室内走廊。到达边界顶点的道路称为出口走廊因为他们离开了会议室,而所有其他走廊都被称为空走廊我们使用出口走廊来代表分子通道。

我们定义分叉顶点v12)两条走廊的π12是路径中的最后一个相同顶点到π的叶顶点1和π2(分叉顶点也称为最小共同祖先π的叶顶点1和π2). 顶点v(v)( π12)可能位于电离室的外面,甚至可能位于分子凸面外壳的外面,这意味着这两条走廊实际上代表着同一个通道。在这种情况下,应丢弃其中一条走廊。我们引入了一个用户特定的参数F类最大值打电话分叉阈值控制何时丢弃走廊,如下所述。我们定义距离d(v(v))顶点的v(v)是连接根顶点的边的长度之和v(v)在走廊树上。

首先,我们给中的所有顶点上色V蓝色.我们按π顺序穿过所有出口走廊12,…,按通量权重的升序排序,即从通量权重最佳(最低)的出口走廊开始。设π成为序列中的出口走廊。分叉距离π的对于>1是所有分叉顶点相对于序列中先前道路的最小距离:(f)(π)=最大值0<j个<(d日(v(v)(π,πj个)))。我们设置(f))最后一次的距离红色π中的顶点(在第一次迭代中,没有顶点是红色的,所以我们简单地设置(f)1)=0)。我们向用户报告走廊π仅当其分叉距离小于分叉阈值时F类最大值.如果π的分叉距离不小于分叉阈值,我们认为π与之前报告的出口走廊相似,因此将其丢弃。然后我们将π的顶点着色红色,然后继续到序列中的下一个出口走廊(参见“讨论”部分)。

跨渠道

在这种情况下,我们的主要目的是识别跨膜(TM)通道。我们添加一个假想顶点v(v)在无穷远处,将其与所有边界顶点的边连接,并将这些新边的权重设置为零。我们设置根成为v(v)并计算道路树。用户必须指定横截面,这是一个将边界顶点拆分为两组的平面:顶点上方顶点以下.给出优势e=e(v(v)1,v(v)2)∈E类那就是在走廊树中,我们称之为e(电子)交叉边缘如果祖先边界顶点u个1属于v(v)1是上面的顶点和祖先边界顶点u个2属于v(v)2是一个下顶点。在这种情况下,我们定义交叉走廊πe(电子)是从u个1向下至v(v)1在走廊树中,边缘e(电子)以及从v(v)2高达u个2在走廊树上。可能存在绕过跨膜通道的交叉走廊。因此,我们放弃不通过用户特定球体的交叉走廊。如果没有交叉通道,我们报告通道已关闭。如果交叉走廊有多个候选者,我们报告具有最小流量权重的交叉走廊。

结果

所有测试都是在Pentium IV 3.0 GHz机器上进行的,该机器具有1GB RAM,运行LINUX本机操作系统。我们用相同的原子VDW半径运行MolAxis、CAVER、MOLE和HOLE。在所有运行中,用户定义的常量C类最大值设置为1.4°,即水分子半径的惯例。

CGAL28开源项目旨在使大量理论算法和数据结构适用,同时注重可靠性和性能。我们使用CGAL库实现了MolAxis程序,从而获得了良好的性能和健壮性。MolAxis输出可以通过VMD进行可视化和操作29软件。续集中显示的频道图形是使用VMD创建的(http://www.ks.uiuc.edu/Research/vmd).

跨膜(TM)蛋白

TM蛋白在结构上分为三个亚型:a)球状蛋白,通过单个α螺旋固定在膜上;b) 包含几个TMα螺旋和c)β结构膜蛋白的蛋白质。我们使用MolAxis计算TM通道的轮廓和瓶颈残留物。在TM通道的情况下,瓶颈残留物被认为是形成通道门的残留物。我们对β膜蛋白和α螺旋蛋白运行MolAxis,并将结果与程序HOLE的结果进行比较。

A.大孔道

大孔通道(LPC)是位于细菌外膜上的膜蛋白,分子(如糖)通过它流向细胞质。LPC结构(PDB代码1PRN)由形成直通道的β-桶组成。通道在中间变窄,两端有宽阔的开放构象(见图2a). 变窄有助于分子的选择性通过,并决定离子的导电性。30从中可以看出图2,HOLE和MolAxis的结果一致,两者都发现了一条几乎相同的路径,运行时间大约为5秒。最窄点处的半径为3.9º,对应的残基为Y96,一侧为负电荷D90,另一侧为正电荷R32。MOLE节目也找到了主频道。

保存图片、插图等的外部文件。对象名为nihms115213f2.jpg

a) 由MolAxis(蓝色)和HOLE(红色)计算的LPC通道表面。LPC显示在功能区中。b) 通过MolAxis(蓝色)和HOLE(红色)计算出沿Z轴的LPC孔半径。

B.ABC运输车

三磷酸腺苷(ATP)结合盒(ABC)转运体通过将底物与ATP水解偶联来催化底物相对于浓度梯度的移位。31ABC转运体(PDB代码2NQ2)由四个域组成,两个α螺旋TM域(图3a)和位于细胞质中的两个核苷酸结合域(NBD)图3a). 在原核生物和真核生物中,这些转运体的一个亚群参与疏水性药物的流出,导致抗微生物和化疗多药耐药(MDR)。32衬底退出时的构象变化尚不清楚。至少基板的极性部分可以定向以通过TM域和NBD域之间的腔室退出。32通常,HOLE和MolAxis都有类似的输出:内腔连接到通向细胞外部的TM通道。腔室上方的通道从7Å变窄到4Å(见图3c)极性残留物R88和N89形成腔室顶部。然后,该通道以5.5°(局部最大值)的半径打开,最后在TM区域末端附近关闭。尽管HOLE和MolAxis计算出了相似的孔径分布,但通道的轴线却大不相同(图3b和3c). 如图所示图3b,HOLE(红色)找到的路径具有“之字形”模式,而MolAxis(蓝色)检测到通道的更平滑路径,这是一种更合理的退出药物运动,更好地代表了通道几何结构(参见讨论)。值得注意的是,MOLE发现了主通道以及其他非相关通道。

保存图片、插图等的外部文件。对象名称为nihms115213f3.jpg

a) 由MolAxis(蓝色)和HOLE(红色)计算的ABC输送器通道表面。ABC运输车用色带表示。b) 图(A)由MolAxis(蓝色)和HOLE(红色)获得的通道表面和中线的近距离观察。c) 根据MolAxis(蓝色)和HOLE(红色)计算的沿Z轴的ABC转运器孔半径。Z轴从细胞质指向细胞外部。

酶腔(细胞色素P450家族)

细胞色素P450(P450)蛋白是一个含有血红素的单氧化酶大家族,可氧化微生物、植物和哺乳动物中的各种化合物。33,34底物的氧化通过催化循环发生在蛋白质的疏水核心,该催化循环被认为是所有血红素单加氧酶(包括P450)共同的。35活性位点被埋藏在蛋白质内部,以防止电子供体和单氧化之间的解偶联,从而使酶无法生产。36底物进入和产品出口路线的差异可能决定底物特异性概况。37因此,通过MD模拟,静态和动态地识别和表征连接活性位点与本体溶剂的所有通道,具有重要的机械和生物化学意义。我们运行MolAxis并将结果与CAVER和MOLE在两个P450上的结果进行比较:a)一种氧化底物樟脑(CYP)的细菌P450凸轮)38和b)人细胞色素P450 3A4(CYP3A4)39——41导致近50%口服药物氧化的酶。42河道分类基于形成河口的二级结构元素,遵循Cojocaru和同事的命名法11(请参见图4,表1,表2表3). C和H螺旋之间的基板通道1出口;基板通道2a位于FG环附近,2b位于G螺旋BC环和β1片之间,2c位于G螺旋和BC环之间(与BC环的2b通道相对),2e穿过BC环,2f类似于2a通道,但更靠近F螺旋。基板通道3在F和G螺旋之间延伸。水通道(表示为W)穿过血红素和BC环的N末端之间。溶剂通道(用S表示)位于I和F螺旋之间。我们无法使用HOLE程序检测此类通道,因此在这些案例研究中没有使用HOLE。

保存图片、插图等的外部文件。对象名为nihms115213f4.jpg

CYP表面凸轮根据MolAxis(蓝色)和CAVER(红色)检测到的通道,分辨率为0.6º。CYP公司凸轮用缎带表示,血红素假体组用VDW和橙色表示。二级结构元素如C螺旋、F螺旋、G螺旋、H螺旋、I螺旋和BC环分别表示为色带和粉红色、紫色、黄色、灰色、黑色和绿色。

表2

使用四种运行模式在不同分辨率下识别每个CYP3A4基板或水道类型的次数:用户/自动/Caver和鼹鼠b条(最后一行)。

通道类型c(c)

研究(奥数)d日运行时间e(电子)2a个2亿2厘米第二版第2页S公司W公司其他

0.18.29s/24.49s/NA(北美)1/0年1月1/1/01/1/01/1/00/2/00/1/01/1/00/0/03/2/0
0.24.60/12.30s/NA(不适用)1/1/01/1/01/1/01/1/01/2/01/1/01/1/01/0/0年1月2/2/0
0.32.02s/4.55s/11.30小时1/1/01/1/61/1/01/1/41/2/02/1/01/1/00/1/02/1/0
0.41.96s/4.45s/2.06小时1/1/01/1/61/1/01/2/41/0年1月1/1/01/1/01/1/02010年2月1日
0.51.99秒/4.53秒/35.00米1/1/11/1/61/1/01/2/32/1/01/1/01/1/01/1/01/1/0
0.61.96s/4.43s/14.00米1/1/21/1/51/1/01/2/31/1/01/0年1月1/1/01/1/02/1/0
0.71.94s/4.47s/6.00米1/1/01/1/51/1/01/2/32/1/02/1/01/1/20/1/01/1/0
0.81.97s/4.45s/3.00米1/1/31/1/51/0年1月1/2/21/1/01/1/01/0年1月1/1/02/1/0

鼹鼠b条8秒50100100
在用户模式下,用户提供MolAxis起点。在自动模式下,MolAxis识别最大型腔的中心,并将其设置为源点。在Caver模式下,从用户指定的点开始使用Caver执行运行。User和Caver的运行具有可比性。使用前10个已识别的通道。
b条在Mole模式下,在与MolAxis相同的用户指定点启动Mole时执行运行。鼹鼠的前十个确定的通道被聚集成四个不同的通道。
c(c)通道表示如下Cojocaru等人11通道2a、2b、2c、2e、2f、3是底物通道,S是溶剂通道,可以是底物渠道,W代表水通道。
d日CAVER的分辨率是网格单元大小。MolAxis的分辨率在理论和算法部分中定义。
e(电子)NA——不适用;s–秒;m–分钟;h–小时。另请参见图例表1.

表3

前10条已确定途径的排名根据按降序排序的相应走廊的流量权重b条在CYP3A4中,通过MolAxis、CAVER和Mole运行模式c(c)0.4ºd日分辨率。

频道排名

运行模式1245678910
用户第二版2亿2厘米2a个S公司第2页其他W公司其他
自动第二版2亿2a个2厘米第二版第2页S公司其他W公司
洞穴探险者第二版2亿2亿第二版2亿2亿第二版2亿2亿第二版
鼹鼠第二版2亿2亿2亿2a个2a个2亿2a个2亿S公司
根据Cojocaru等人。11符号。参见图例表1表2.
b条第一条通道的走廊(编号为1)是最短、最宽的走廊等。
c(c)参见图例表1表2。使用前10个识别的通道。
d日MolAxis的分辨率在理论和算法部分中定义。

如果走廊穿过通道的相关二级结构元素,则将其与通道匹配。我们发现走廊和通道之间的对应关系很高,但不是一对一的。首先,一些渠道没有相应的走廊。当通道关闭时,或者当通道几乎关闭且其出口靠近更宽的通道时,都可能发生这种情况。我们称之为后一种现象遮蔽,因为另一个频道正在隐藏相关频道;请参阅下面的讨论部分中的更多详细信息。其次,多条道路可以匹配同一通道。我们允许用户通过调整分叉阈值来解决这个问题。第三种可能是没有相应通道的走廊。这要么表示可能新发现的通道,要么表示在MD模拟期间短时间打开的随机出口路线。

A.细菌CYP凸轮

对于细菌CYP凸轮(PDB代码1AKD)我们比较了三种不同分辨率的MolAxis配置。在CAVER中,分辨率由网格单元的大小定义,而在MolAxis中,分辨率定义为VDW表面到近似VDW表面的最大距离的界限,表示为ε首先,我们在“自动”模式下运行MolAxis,在该模式下,MolAjax识别最大腔体的中心,并将其设置为源点。我们还运行了MolAxis、CAVER和MOLE,使用放置在C上的用户指定点启动4樟脑基质的原子。在所有跑步中,分叉阈值F类最大值设置为6。MolAxis用户特定的起点运行、MolAssis自动模式运行、CAVER和MOLE运行分别表示为user、Auto、CAVER和MOLE(表1,表2表3). 我们将MolAxis用户与Caver和Mole运行进行了比较。检测到的运行时间和通道类型总结在表1一般来说,我们观察到CYP中发现的CAVER、MOLE和MolAxis通道之间的一致性凸轮除2b通道外,CAVER和MOLE在前10个已确定的通路中根本没有检测到该通道。该通道仅在以0.8º的网格分辨率长时间运行两个小时后被CAVER检测到,并识别出21条通路。然而,MolAxis和MOLE的运行时间比CAVER快得多,尤其是在MolAjax中具有更高的分辨率时。在0.4º的网格分辨率下,CAVER发现了大多数先前识别的通道11而MolAxis在不到两秒钟的时间内发现了所有先前确定的具有类似分辨率的通道。在最低计算网格分辨率为0.8º的情况下,CAVER在57分钟内找到了大多数通道,而MolAxis在不到两秒的时间内完成了计算(请参见表1). 请注意,某些通道以不同的分辨率显示和消失。CAVER发现基底通道2c的分辨率仅为0.6º和0.7º,基底通道2f的分辨率为0.4º,水通道(表示为W)的分辨率为0.4-0.7º(参见表1). MolAxis结果更加一致:在一个分辨率下找到的通道通常也在其他分辨率下找到。MOLE工具的固定分辨率约为0.4º。应该注意的是,通道2b是由MolAxis从0.3°和更低的分辨率发现的,而在0.1°和0.2°中未被识别(参见表1). 这源于这样一个事实,即通道2b很窄,非常接近较宽的通道2a,并且在高分辨率下,它会被通道2a遮住(参见讨论)。溶剂通道(表示为S)在用户模式下从分辨率0.3Ω和更低的第十一通道检测到,因此不会出现在表1.

B.人类CYP3A4

MolAxis、CAVER和MOLE在人类CYP3A4(PDB代码1W0E)上运行,与CYP中一样凸轮所有运行的输出总结如下表2CYP之间的主要区别凸轮CYP3A4是后者具有更大的活性位点,可以氧化许多具有不同化学结构的底物,并且没有CYP那么特异凸轮所有工具的用户起点都在活性部位中心血红素铁之上4º。我们再次将User与Caver和Mole的运行情况进行比较,如细菌P450示例中所示。在前10个已识别的途径中,MolAxis识别了所有通道,MOLE和CAVER在所有运行中识别了通道2a、2b、2e,通道S仅在0.7Å分辨率和MOLE中识别了两次(见表2). CAVER和MOLE在所有运行中均未检测到通道2c、2f、3和W,即使在运行CAVER与MOLE试图找到40条通道后,仍有一些通道未被检测到。然而,CAVER在分辨率0.3º和0.4º中分别检测到通道2b和2e六次和四次,MOLE在前10个已识别的通道中分别检测出通道2b、2e三次和五次。CAVER和MOLE倾向于多次识别同一通道,这使得用户很难识别更封闭的通道。相比之下,MolAxis报告的道路是唯一的几何图元。表3以0.4º的分辨率列举了CYP3A4的MolAxis、MOLE和CAVER识别走廊。通道根据其相应通道的通量权重按降序排序,即第一个通道的通道(编号为1)是最短和最宽的通道等。在MolAxis用户模式中,通道2e是第一个通道,然后是通道2b、2c、2a、3等。可以看出,MolAxis输出中通道的顺序在User和Auto运行中大致保持不变。MolAxis的前10条已确定途径通常是唯一的,而CAVER和MOLE的通道2b和2e被多次报告。MOLE通过聚类相似的通道来克服这个问题。然而,为了丰富P450中多通道系统的通道类型,用户需要搜索多个通道。如前所述,标记为“其他”的走廊是几何上可行的路线,因此可能是新的和迄今为止未知的通道。

此外,MolAxis发现了以前未发现的新通道。例如,在0.8°分辨率下,MolAxis在用户模式下发现两个通道,在自动模式下发现一个之前未报告的通道。目前尚不清楚这些几何上可行的新通道是否与生物学相关。MolAxis检测到的所有已知CYP3A4通道如所示图5。在使用三个不同的起点(包括自动模式自动找到的MolAxis起点)运行CAVER和MOLE后,结果保持不变(未显示数据)。

保存图片、插图等的外部文件。对象名称为nihms115213f5.jpg

根据MolAxis,CYP3A4的表面检测到通道。CYP3A4以色带表示,血红素假体组以VDW和橙色表示。为了清晰起见,每个通道表面都用不同的颜色着色。

MolAxis对人CYP3A4的C.MD模拟分析

CYP3A4酶可以催化多种反应,例如对给定底物的羟基化、环氧化或杂原子氧化、脱烷基。43CYP3A4在蛋白质核心内有一个大的活性位点,可以氧化许多具有不同化学结构的底物。这种酶有几个底物通道将活性部位连接到本体溶剂11基板进入产品退出。由于CYP3A4代谢了大量药物,因此尝试和了解底物/产品如何进入/退出酶,从而更好地控制药物发现中的药代动力学参数,这一点非常重要。在静态晶体结构中,可能控制通道打开和关闭的酶动力学和运动并不明显,在结构分析中可能会遗漏。此外,可视频道的尺寸变化可能会被忽略。MD模拟是一个很好的工具,可用于评估通道沿时间的运动,并用于理解通道选通机制及其打开和关闭过程中残基的(合作)行为。在P450中,最灵活的区域是BC环和FG螺旋,它们形成多个基板通道(参见图4)它们的运动允许底物进入活性部位,产品离开活性部位。44MolAxis的效率和准确性使我们研究了人类CYP3A4亚型(PDB代码1TQN)中的通道动力学。我们之前对底物结合的人CYP3A4进行了6 ns模拟45在具有CHARMM力场的使用周期性边界条件的显式溶剂水分子的盒子中。46将酶加热至310K,并施加1fs的时间步长。我们使用MD模拟的标准NVT,并使用粒子网格Ewald求和应用了完整的静电计算。47每10ps拍摄一次轨迹快照,作为MolAxis的输入结构。我们使用自动模式来找到最大的空腔(即活性位点),并检测从空腔到本体溶剂的所有通道。同样,所有检测到的通道都表示为前面的P450示例(图5).

在大多数模拟快照中(~95%),MolAxis检测到人类CYP3A4活性位点的中心是最大的空隙。其余的快照被忽略了,因为它们检测到的最大空洞没有放在活动部位的中间,因此没有生物学意义。由于有许多基板通道,我们将重点放在一个基板通道上,该通道表示为2e,贯穿所有P450中的BC环路(参见图4,图6)尽管可以对每个基底或水道的结果进行分析。该分析的主要目标是更好地了解2e基板接入通道的选通机制。我们计算了通道2e沿时间的走廊表面、瓶颈半径和衬砌残留物。形成通道2e瓶颈的三个主要浇口残留物是BC回路的R105、F108和S119(图7a). 从中可以看出图7b,2e信道在模拟开始时更为开放;随后,经过700ps的模拟,其尺寸平均减小到1°半径左右。通道2e的整个表面如所示图6.模拟370ps后发现最大瓶颈半径为1.81°,该结构表示为“开放”;最小值为0.68Ω,在3150ps之后,表示为“闭合”(图7c).图7d描述了F108侧链可旋转二面角χ1沿模拟值。我们叠加了开放(370ps快照)和闭合(3150ps快照)结构的Cα原子,以了解哪些结构决定因素控制瓶颈半径大小的差异。根据图8,R105和S119在开放和闭合快照中都具有相似的构象。F108形成了打开快照和关闭快照之间的主要差异,并体现了不同的旋转侧链角度。F108是2e通道闸门的最大残留物,这种残留物的不同旋转器可以在2e通道的开启和关闭之间移动(图8). 信道2e半径大小波动与模拟过程中的F108χ1值相关(图7b、7d)似乎在这个角度稳定后,通道2e半径值减小并保持在1.0°左右。

保存图片、插图等的外部文件。对象名称为nihms115213f6.jpg

由MolAxis计算的CYP3A4蛋白中2e通道的表面。蛋白质被表示为带状物。BC回路为黄色。血红素以VDW和红色表示,瓶颈残留物(R105、F108和S119)以VDW半径和橙色表示。半径小于2.7°的通道曲面贴片为绿色,否则为蓝色。

保存图片、插图等的外部文件。对象名称为nihms115213f7.jpg

a) 6ns MD模拟后CYP3A4通道2e瓶颈残留倾向。b) CYP3A4通道2e沿模拟的瓶颈半径剖面。c) 370ps(蓝色-打开)和3150ps(绿色-关闭)模拟后快照中的通道2e半径剖面。d) F108χ1角度值沿6ns模拟。

保存图片、插图等的外部文件。对象名称为nihms115213f8.jpg

MD模拟370ps后的打开快照(蓝色)和3150 ps模拟后的关闭快照(黄色)的Cα叠加。蛋白质结构用缎带表示。血红素以其VDW半径和红色表示,瓶颈残留物以棒状表示。

我们得出的结论是,通过改变F108的可旋转扭转角,F108可以通过将其苯基部分定位在通道2e瓶颈内外来控制2e底物通道的打开。在活性部位内存在抑制剂的情况下,先前的模拟支持了这一观察结果48其中,观察到F108是一个门卫,抑制剂通过通道2e从活性部位流出。F108残基的定点突变改变了咪唑安定羟基化的区域选择性,即使残基远离反应中心。49这些发现进一步支持F108是一种残基,它通过通道2e向CYP3A4中的活性位点传递时与底物相互作用。

讨论

渠道和走廊通信

回想一下,走廊可能没有相应的河道,也就是说,没有已知的生物相关数据,因此可能指向新发现的潜在河道。有趣的是,相反的情况也可能发生。在通道关闭或几乎关闭的情况下,通过该通道的走廊实际上可能是封闭走廊。我们称这种现象为遮蔽当窄水道的河口靠近宽水道的河口时,就会发生这种情况。在这种情况下,我们说宽通道掩盖了窄通道。

例如,让我们考虑一种构象,其中有两个通道,一个宽,一个窄,它们使腔室的方向大致相同。让我们关注路径图中位于狭窄通道口的一个顶点,这样任何通过狭窄通道的路径都必须通过它;看见图9以进行说明。假设有两条路径到达路径图中的顶点。第一条路径穿过狭窄的通道并到达顶点。另一条路径穿过宽通道,然后靠近分子外表面,最后到达顶点。这种迂回可能发生在分子的凸面外壳内,即沿着凹槽。如果最佳路径(以通量权重计算)是通过窄通道的路径,则窄通道将被报告为开放,否则将被报告为由关闭。这解释了CYP通道2b的观察结果凸轮在某些运行中报告为打开(请参阅表1). 通道2b较窄,其口靠近较宽通道2a的口。在某些分辨率下,通道2a遮住了通道2b,使通过通道2b的走廊成为死胡同,因此报告通道2b关闭。这个遮蔽这种现象可以解释为方法的一种伪影,可以通过微调我们使用的参数来解决。事实上,它为未来的工作指出了一个主要问题:如何调整我们的方法,以便在搜索算法中纳入有关路径的各种生物学见解。例如,在权衡树边缘时,我们可能会在路径宽度和路径长度之间寻找另一种平衡。

保存图片、插图等的外部文件。对象名为nihms115213f9.jpg

阴影通道的图示。走廊树用黑线表示,S公司是根顶点,A类是靠近窄右通道口的顶点B类是一个边界顶点。由于左侧通道较宽,因此到达顶点的最短走廊A类穿过左边的宽通道。因此,没有边界走廊穿过右侧河道,报告为关闭。

几何收敛性

MolAxis发现的走廊靠近分子补体的中轴。我们发现,在不同的分辨率下,计算出的道路并不总是相同的。这是因为中轴是由表面补丁组成的,这给选择一维路径留下了一些自由。即使在中轴上移动,也可能有许多路径穿过通道,具有类似的通量权重。我们观察到,在低于0.05°的高分辨率下,走廊树似乎会收敛(数据未显示)。尽管如此,我们注意到,在低分辨率下获得的看似不同的走廊具有相似的特征,例如,它们通过接近相同的氨基酸,并且具有相似的轮廓。因此,我们得出结论,MolAxis可以在低分辨率(例如0.1–0.5º)下运行。

与CAVER的比较

我们将我们的方法与CAVER工具中实现的基于网格的方法进行了比较。CAVER定义了一个三维网格,覆盖给定分子的凸面外壳(由球的并集表示)。然后将每个网格单元标记为内部的外面的根据网格单元的中心,对分子进行定位。所有内部网格单元都将被丢弃。外部网格单元的中心被设置为图形的顶点。CAVER用一条边连接相邻的网格顶点,并根据顶点到分子表面的距离为顶点赋予权重,对距离分子VDW表面较远的点赋予较小的权重。道路是使用Dijkstra算法的一个版本计算的,与我们使用的算法类似。与我们的方法的主要区别在于近似所需的顶点数量。虽然将我们限制在二维实体的中轴上,但我们构造了更少的顶点,这解释了两个程序之间运行时间的巨大差异(从程序的几秒钟到CAVER的几个小时,在相同的输入下,请参见表1表2). 这种巨大的差异使得我们可以沿着分子动力学轨迹应用MolAxis,从而跟踪通道动力学。CAVER发现的路径靠近中轴,这意味着实际上不需要在远离中轴的地方采样网格点。即使如此,请注意,这并不是所有权重函数的属性。例如,如果目标是最小化用户特定的能量功能,则所需路径可能不一定靠近中轴。基于网格的方法可以处理这种情况,而我们的方法可能会错过所需的路径。

与孔的比较

HOLE方法可以找到球挤压通道的可能路径(在球经过时改变其半径)。给定通道腔中的起点和信道向量,即通道方向的向量,HOLE移动平面P(P)(t吨)使用参数沿矢量步长与信道矢量正交t吨。我们表示为S公司选择(t吨)以为中心的最大球体P(P)(t吨)可以容纳在通道中,而不与分子的VDW表面重叠。对于每个平面P(P)(t吨)HOLE使用蒙特卡罗模拟退火程序来构建球体S公司(t吨)在飞机上P(P)(t吨)接近S公司选择(t吨). 此过程沿通道向量的方向迭代,直到生成一系列表示通道的球体位置。

请注意S公司选择(t吨)实际上是以平面为中心的中轴点P(P)(t吨)具有最高的间隙。我们从两个理论方面分析了HOLE。首先,由于蒙特卡罗程序的不确定性,S公司(t吨)实际上可能离S公司选择(t吨). 其次,由于对每个平面分别进行优化,计算出的路径可能不稳定或“曲折”,如图3b此外,即使我们假设HOLE设法找到了S公司选择(t吨)由此产生的路径可能会表现出不想要的行为。为了便于讨论,让我们扩展该函数S公司选择(t吨)从离散的t吨值转换为连续的实值范围。由于中轴的特性,函数S公司选择(t吨)在中不一定连续t吨这解释了有时在由HOLE计算的路径中发生的“跳跃”。我们得出的结论是,通过HOLE进行的优化可以被视为一种纯粹的优化。相反,MolAxis构建的路径是连续的,并且由于全局优化方法,路径在长度和间隙之间实现了平衡。

与MOLE的比较

当手稿准备提交时,一篇新发表的论文向MOLE提交了19方法。因此,我们对这两种方法进行了比较。MOLE方法利用原子中心的Voronoi图。它使用图的顶点和边来构建图形,并以与我们相似的方式在每条边上设置权重,同时考虑边的长度和间隙。我们的方法和MOLE方法之间的两个主要差异如下所述:

(1) MOLE方法没有用户定义的分辨率;相反,它将原子视为一个固定的大小,引入一个误差,该误差取决于最大和最小输入原子之间的差异。在氢原子被丢弃的情况下,误差可能小至0.4º,而在包括重元素和轻元素组合的情况下误差可能高达2º。相反,我们的方法允许用户控制分辨率,对算法的效率几乎没有任何影响,因此可以从这个意义上看,它是CAVER和MOLE优点的结合。

(2) 在MOLE算法中,在报告通道后,通过向每个通道添加“惩罚”权重来更新其边缘,以减少再次报告这些边缘的机会。然后,再次应用Dijkstra算法并报告新的最短路径。这个新的最短路径可能与以前报告的最短道路之一类似(请参阅表3). 这导致需要在输出通道上应用集群技术,让用户决定哪些输出通道实际上是同一个通道。相反,我们的方法在一次Dijkstra算法运行中计算所有信道,并且使用理论和算法部分中描述的分叉阈值丢弃类似信道(参见图10(如图所示)。

保存图片、插图等的外部文件。对象名为nihms115213f10.jpg

分叉阈值的功能说明。走廊树用黑线表示S公司作为其根顶点。我们用两个虚线圈出分子的边界圆和半径等于用户定义的分叉阈值的同心圆。三条路径表示为第1页、第2页第3页根据通量权重进行分类。的分叉顶点第1页第2页表示为F类.由于距离F类大于分叉阈值,路径第2页被认为类似于第1页因此被丢弃。通过增加分叉阈值,用户可能会导致第2页也要进行报告,从而提高了详细程度。

结论

本文介绍了MolAxis,一种有效识别分子补体中通道的工具。我们描述了理论背景和在MolAxis中实现的算法。这里利用MolAxis沿着MD模拟轨迹分析静态蛋白质和快照。与以前开发的工具相比,我们的方法在大分子通道检测方面既有效又最灵敏。MolAxis考虑了蛋白质的全局几何形状。它准确地检测到LPC蛋白和ABC转运蛋白中的TM通道,从而产生相对平滑的途径,并指向主要的生物TM通道。MolAxis被发现可以有效地检测从P450s同工酶活性位点到其表面的开放到几乎封闭的底物和水通道。它识别独特的几何通道,因此不受多重性的影响,并生成连接酶活性位点与其表面的通道的非冗余形状和结构。我们已将MolAxis应用于大量人类CYP3A4酶的MD模拟快照,以了解通道动力学和随时间变化的选通机制。我们观察到,底物通道2e中F108的苯基可旋转二面角的扰动控制着该通道的打开和关闭,这使我们能够提出一种涉及F108的机制来控制该通道的选通。此前曾建议F108担任2e频道的门卫。我们预计,MolAxis将用于理解底物选择性,以及更好地了解转运机制和药物设计。

鸣谢

作者感谢Isaiah Arkin和Itamar Kass在跨膜蛋白背景下讨论了这种计算工具的规格。这项工作也得到了欧盟IST计划的部分支持,即合同号为IST-006413(ACS-复杂形状的算法)下的共享成本RTD(FET Open)项目,以色列科学基金会(批准号236/06),以及特拉维夫大学赫尔曼·明科斯基·米内瓦几何中心。该项目的全部或部分资金来自国家癌症研究所、国家卫生研究院的联邦资金,合同编号为N01-CO-12400。本出版物的内容不一定反映卫生与公众服务部的观点或政策,提及商品名称、商业产品或组织也不意味着美国政府的认可。这项研究(部分)得到了NIH、国家癌症研究所、癌症研究中心的院内研究计划的支持。

工具书类

1拉斯科夫斯基RA。SURFNET:一个可视化分子表面、空腔和分子间相互作用的程序。J摩尔图。1995;13:323–330.[公共医学][谷歌学者]
2Hendlich M、Rippmann F、Barnini G.LIGSITE:蛋白质中潜在小分子结合位点的自动高效检测。J摩尔图模型。1997;15:359–363。[公共医学][谷歌学者]
三。莱维特DG,Banaszak LJ。口袋:一种识别和显示蛋白质空腔及其周围氨基酸的计算机图形方法。J摩尔图。1992;10:229–234。[公共医学][谷歌学者]
4Kleywegt GJ,Jones TA。检测、描绘、测量和显示大分子结构中的空腔。晶体学报D。1994;50:178–185.[公共医学][谷歌学者]
5Liang J,Edelsbrunner H,Woodward C.蛋白质囊和腔的解剖:结合位点几何形状的测量和配体设计的意义。蛋白质科学。1998;7:1884–1897. [PMC免费文章][公共医学][谷歌学者]
6Venkatachalam CM,Jiang X,Oldfield T,Waldman M.配体适配:配体与蛋白质活性位点形状定向快速对接的新方法。J摩尔图模型。2003;21:289–307.[公共医学][谷歌学者]
7Laurie ATR,Jackson RM。Q-SiteFinder:一种基于能量的蛋白质结合位点预测方法。生物信息学。2005;21:1908–1916.[公共医学][谷歌学者]
8Jakoncic J,Jouanneau Y,Meyer C,Stojanoff V。鞘氨醇CHY-1环羟基化双加氧酶的晶体结构。FEBS J公司。2007;274:2470–2481.[公共医学][谷歌学者]
9Verschueren KH,Seljee F,Rozeboom HJ,Kalk KH,Dijkstra BW。卤代烷脱卤酶催化机理的结晶分析。自然。1993;363:693–698.[公共医学][谷歌学者]
10Brown CK、Madauss K、Lian W、Beck MR、Tolbert WD等。神经溶素的结构揭示了限制底物进入的深通道。美国国家科学院程序。2001;98:3127–3132。 [PMC免费文章][公共医学][谷歌学者]
11Cojocaru V、Winn PJ、Wade RC。细胞色素P450的进出。Biochim生物物理学报。2007;1770:390–401.[公共医学][谷歌学者]
12Axelsen PH、Harel M、Silman I、Sussman JL。乙酰胆碱酯酶活性位点峡谷的结构和动力学:分子动力学模拟和X射线晶体学的协同应用。蛋白质科学。1994;:188–197. [PMC免费文章][公共医学][谷歌学者]
13斯蒂芬森FA离子通道。当前操作结构生物。1991;1:569–574. [谷歌学者]
14Barnard EA公司。受体类别和传递门控离子通道。生物化学科学趋势。1992;17:368–374.[公共医学][谷歌学者]
15赛尔MH。用于运输蛋白分类的功能系统发育系统。细胞生物化学杂志。1999;75:84–94.[公共医学][谷歌学者]
16Savarese TM,Fraser CM。体外诱变和G蛋白偶联受体之间结构-功能关系的研究。生物化学杂志。1992;283:1–19。 [PMC免费文章][公共医学][谷歌学者]
17Smart OS,Goodfellow JM,Wallace BA。革兰氏菌素A的孔隙尺寸。生物物理杂志。1993;65:2455–2460. [PMC免费文章][公共医学][谷歌学者]
18Petrek M、Otyepka M、Banas P、Kosinova P、Koca J等人。CAVER:探索蛋白质裂缝、口袋和空穴路径的新工具。BMC生物信息学。2006;7:316–324. [PMC免费文章][公共医学][谷歌学者]
19Petrek M、KosinováP、Koca J、Otyepka M等。MOLE:基于Voronoi图的分子通道、孔隙和隧道探险家。结构。2007;15:1357–1363.[公共医学][谷歌学者]
20Edelsbrunner H,穆克EP。三维alpha形状。ACM Trans Graphics公司。1994;13:43–72. [谷歌学者]
21Edelsbrunner H,Facello MA,Liang J.关于大分子囊的定义和构建。离散应用数学。1998;88:83–102.[公共医学][谷歌学者]
22Attali D,Boissonnat JD,Edelsbrunner H.中轴线的稳定性和计算:最新报告。收件人:Möller BHT,Russel B,编辑。科学可视化、计算机图形学和海量数据探索的数学基础。Springer-Verlag,数学与可视化;2007[谷歌学者]
23亚菲·E。硕士学位论文。特拉维夫大学;2007年,R中球联合补足路径的有效构建.在网址:http://www.cs.tau.ac.il/~eitanyaf/thesis.pdf.[谷歌学者]
24队长A.R的任何开放子集n个与中轴具有相同的同伦类型。实体建模与应用研讨会的会议记录。2003:65–75. [谷歌学者]
25Boissonnat JD、Delage C.凸壳和附加加权点的Voronoi图。欧空局会议记录。收录:Brodal GS,Leonardi S,编辑。计算机科学讲义。斯普林格:2005年。第367-378页。[谷歌学者]
26Dijkstra东部。关于与图有关的两个问题的注记。数字数学。1959;1:269–271。 [谷歌学者]
27Edelsbrunner H,Letscher D,Zomordian A.拓扑持久性和简化。离散和计算几何。2002;28:511–533. [谷歌学者]
28CGAL手册。2007年第3.3版,网址:www.cgal.org.
29Hamphrey W,Dalke A,Schulten K.VMD-可视化分子动力学。摩尔图形杂志。1996;14:33–38.[公共医学][谷歌学者]
30Bransburg-Zabary S,Gutman ENM公司。离子通量通过大孔道的最可能轨迹。固态离子。2004;168:235–243. [谷歌学者]
31Locher KP。ABC转运体的结构和机制。当前操作结构生物。2004;14:426–431.[公共医学][谷歌学者]
32van Meer G.MsbA的结构:对ABC转运体介导的多药外排的洞察。FEBS信函。2006;580:1042–1048.[公共医学][谷歌学者]
33《细胞色素P450:结构、机制和生物化学》。收录:Ortiz de Montellano公关,编辑。第三版。纽约:全会出版社;2005年,第377-531页。[谷歌学者]
34Wrighton SA、Stevens JC。人肝细胞色素P450参与药物代谢。毒理学评论。1992;22:1–21.[公共医学][谷歌学者]
35Shaik S,Kumar D,de Visser SP,Altun A,Thiel W.细胞色素P450酶结构和机制的理论观点。化学版次。2005;105:2279–2328.[公共医学][谷歌学者]
36Loida PJ,Sligar SG.细胞色素P450中的分子识别:解耦联反应的控制机制。生物化学。1993;32:11530–11538.[公共医学][谷歌学者]
37Schleinkofer K、Sudarko、Winn PJ、Lüdemann SK、Wade RC。哺乳动物细胞色素P450是否显示多种配体通路和配体通道?EMBO。2005;6:584–589. [PMC免费文章][公共医学][谷歌学者]
38Schlichting I,Jung C,Schulze H。细胞色素P-450cam与(1S)-樟脑对映体络合的晶体结构。FEBS信函。1997;415:253–257。[公共医学][谷歌学者]
39Yano JK,Wester MR,Schoch GA,Griffin KJ,Stout CD,等。用X射线晶体学测定2.05奥分辨率的人微粒体细胞色素P450 3A4的结构。生物化学杂志。2004;279:38091–38094.[公共医学][谷歌学者]
40Williams PA、Cosme J、Vinkovic DM、Ward A、Angove HC等。人类细胞色素P450 3A4与甲吡拉酮和孕酮结合的晶体结构。科学。2004;305:683–686。[公共医学][谷歌学者]
41Ekroos M,Sjögren T.细胞色素P450 3A4配体杂合的结构基础。美国国家科学院程序。2006;103:13682–13687. [PMC免费文章][公共医学][谷歌学者]
42Wrighton SA、Schuetz EG、Thummel KE、Shen DD、Korzekwa KR等。人类CYP3A亚家族:实际考虑。药物Metab Rev。2000年;32:339–361.[公共医学][谷歌学者]
43Guengerich FP.与代谢和化学毒性相关的常见和罕见细胞色素P450反应。化学研究毒物。2001;14:611–650.[公共医学][谷歌学者]
44Poulos TL.细胞色素P450的灵活性。美国国家科学院程序。2003;100:13121–13122. [PMC免费文章][公共医学][谷歌学者]
45Fishelovitch D,Hazan C,Shaik S,Wolfson HJ,Nussinov R.人类细胞色素P450 3A4中有机分子协同结合的结构动力学。美国化学学会杂志。2007;129:1602–1611.[公共医学][谷歌学者]
46MacKerell AD,Jr、Bashford D、Bellott M、Dunbrack RL,Jr和Evanseck JD等。蛋白质分子建模和动力学研究的阿拉托姆经验潜力。物理化学杂志B。1998;102:3586–3616.[公共医学][谷歌学者]
47Petersen股份有限公司。粒子网格Ewald方法的准确性和效率。化学物理杂志。1995;103:3668–3679. [谷歌学者]
48Li W,Liu H,Luo X,Zhu W,Tang Y,等。甲吡拉酮从细胞色素P450 3A4活性位点的可能途径:分子动力学模拟。药物Metab处置。2007;35:689–696.[公共医学][谷歌学者]
49Khan KK,He YQ,Domanski TL,Halpert JR。细胞色素P450 3A4和活性位点突变体对咪唑安定的氧化作用:对多重结合位点和导致酶失活的代谢途径的评估。摩尔药理学。2002;61:495–506.[公共医学][谷歌学者]