跳到主要内容

DockRMSD:通过图形同构对对称分子进行原子映射和RMSD计算的开源工具

摘要

蛋白质-配体对接程序产生的配体位置的比较通常是在配体结构之间直接原子对应的假设下进行的。然而,这种对应关系在化学上并不一定与对称分子有关,并且可能导致配体位姿距离度量的人为膨胀,特别是那些依赖于受体叠加(而非配体叠加)的度量,例如对接均方根偏差(RMSD)。几种常用的修正分子对称性的RMSD计算算法没有考虑分子的键结构,因此可能导致非物理原子映射。在这里,我们提出了DockRMSD,这是一个对接位姿距离计算器,它将对称性校正转换为图同构搜索问题,其中通过对配体结构图的所有同构进行穷举和快速匹配搜索来执行最佳原子映射和RMSD计算。通过对AutoDock Vina在CSAR Hi-Q集合上生成的对接姿态的评估,我们表明DockRMSD能够确定地识别最小对称修正RMSD,并且与其他方法相比,能够在不显著降低计算效率的情况下实现。开源的DockRMSD程序可以方便地与各种对接管道集成,以帮助精确的原子映射和RMSD计算,从而有助于提高对接性能,特别是对于具有复杂结构对称性的配体分子。

介绍

计算机辅助药物设计,特别是蛋白质-配体对接,带来了许多生物活性药物的发现[1,2]. 在许多蛋白质-配体对接程序中,柔性小分子结构与刚性蛋白质受体结构对接,以在蛋白质结合袋中找到小分子的最佳结合构象和亲和力。由于这些程序准确评估结合亲和力的能力取决于它们在蛋白质结合袋中找到配体最佳构象的能力,因此对接程序通常以它们从蛋白质-配体复合物晶体结构中复制配体天然结合姿态的能力为基准。假设蛋白质受体结构叠加,用于评估预测姿势和自然姿势之间的距离的常用度量是它们各自原子之间的均方根偏差(RMSD)(等式1):

$$RMSD=\sqrt{\frac{1}{N}\mathop\sum\limits_{i=1}^{N}d_{i}^{2}}$$
(1)

哪里N个是配体中的原子数d日第对相应的原子。

对接RMSD可以通过直接原子对应的假设进行最幼稚的计算,也就是说,假设给定结构文件中配体结构之间的原子标签是有序的,并且在对接过程中应该保持不变。这一假设适用于咖啡因等不对称分子(图1a) ,但这种对应关系并不总是与具有对称官能团的分子实际相关(例如布洛芬,图1b) 或全分子对称性(例如HIV-1蛋白酶的吡咯烷基抑制剂[]在图中1c) 因为它们可以产生化学上相同但不对应的束缚姿势。这里,布洛芬和HIV-1蛋白酶吡咯烷基抑制剂被选为示例,尽管还有许多其他具有对称结构的分子,其中天真的对应可能导致RMSD的虚假膨胀(例如抑制剂BEA403[4],c-di-GMP[5]等)。例如,如果一个分子与两个苯分子完美重叠,那么它们对接的RMSD值将为零。如果一个分子沿着其对称轴之一旋转,直到两个结构再次完全重叠,则由于重叠的化学特性,其对接RMSD应为零;由于在本例中,重叠原子在两个分子之间的标记不同,因此幼稚对接RMSD将具有非零值。因此,需要考虑分子对称性,以便得出准确的对接RMSD值。

图1
图1

以下示例不对称配体(PDB配体ID:CFF);b条略微对称的配体(PDB配体ID:IBP);c一种高度对称的配体(PDB配体ID:QN3)。d日示例配体结构(左)和根据匈牙利方法(右)生成的最佳查询模板原子对应关系重新排序原子时产生的配体结构。由于匈牙利方法只考虑原子类型,而不考虑原子之间的键,因此匈牙利对应提出的假设分子在物理上是不可能的

一些对接程序实现了对接RMSD模块,以适应配体对称性。自动对接Vina[6]是第一个在对接RMSD计算中实现对称校正的公司之一,它提供了一个模块,通过将一个姿势的每个原子映射到另一个姿势中同一类型的最近原子来创建对应关系。然而,这种方法允许两种结构之间距离较近的原子重复使用,而距离较远的原子则完全不使用。对此,艾伦和里佐[7]在DOCK6中实现了他们自己的对接RMSD计算器[8]它将原子对应映射表示为一个成本最小化分配问题,使用匈牙利算法解决[9,10]. 然而,以这种方式考虑映射问题会忽略配体的键结构,并可能提供非物理赋值(图1d) 和停靠低于物理上可能的RMSD值。其他几个对接程序,如GOLD[11],琥珀色工具[12]和Glide[13,14]也包含计算对称校正RMSD的模块,但这些模块通常不会公开提供对其对称校正算法的彻底详细解释,并要求用户安装更大的软件包来计算对称校正RMSD。最后,OpenBabel[15]包含一个C++开源工具,对象rms,将对称校正视为一个图同构问题,由VF2算法解决[16],但目前还要求用户安装整个OpenBabel才能使用此工具。这些模块计算的对接RMSD与LS-align等程序计算的构象距离度量不同[17]和RDKit[18],因为这些指标是基于配体结构本身的叠加,而不是它们对接的受体。由于没有考虑配体相对于受体的位置和方向,这种叠加不适合评估对接姿势;它更适合于纯化学信息学问题,例如配体结构相似性比较。因此,需要一个通用的对接RMSD计算模块,该模块适当考虑分子对称性,并对其方法进行清晰、详细的描述。

在这里,我们提出了一个新的开源模块DockRMSD,用于通过图同构解决对称分子结构的原子映射问题,其中最佳对接RMSD是通过搜索两个分子结构之间所有同构映射的剪枝状态空间来计算的。在DockRMSD网站上免费提供C语言的源代码、编译的二进制文件和DockRMSDWeb服务器实现[19].

实施

DockRMSD算法的概述如图所示2首先,用户提供一对MOL2格式的结构文件,每个文件包含同一配体的特定姿势。为了便于描述,第一个文件被任意定义为“查询”结构,第二个文件被定义为“模板”结构。从结构文件中读取每个结构中存在的重(非H)原子的元素、这些原子的坐标以及原子对之间的键网络。随后,比较原子和键组,以确保这两种结构具有相同的配体分子。键由一个对称的二维数组表示,该数组包含与键合原子之间的键类型(单=“1”、双=“2”、芳香=“ar”等)相对应的字符串j个在阵列位置[,j个],否则包含空字符串。如果两个文件中的键类型不一致,则键网络中的键将被剥离,只保留键合的原子。

图2
图2

DockRMSD算法。DockRMSD计算同一配体任何给定姿势对的最佳原子映射和RMSD值,作为一对MOL2结构文件输入

提取配体结构信息后,下一步是确定每个查询原子在化学上相同的模板原子集,称为原子身份搜索。对于查询结构的每个原子,同一元素的模板结构的所有原子最初被认为是候选映射伙伴。然后,对照模板中每个候选映射伙伴存在的原子和键的集合来评估查询原子所键合的原子集合以及它们之间的键类型;如果候选模板原子的键结构与查询原子不匹配,则将其删除。重复这个过程,不仅检查它们的键合相邻原子集之间的身份,还检查这些相邻原子的相邻原子之间的身份。如果这些集不相同,则再次删除候选原子。试图对更多相邻原子进行更深入的搜索,但发现包含更多相邻原子最终不会改变最终的最优对应。因此,身份搜索停止在这个相邻原子深度,以最小化不必要的相邻集比较并优化运行时。如果仍有多个候选,则模板中可能有多个原子与查询原子在化学上相同,这意味着配体具有一定程度的对称性。一旦原子身份搜索完成,每个查询原子都将有一组与该查询原子化学等价的模板原子。对于完全不对称的分子(图1a) ,每个查询原子将只有一个对应的模板原子。因此,计算这些不对称分子的最佳RMSD是一项简单的任务,即将每个查询原子与其各自的模板原子进行匹配,并返回根据此对应关系计算出的RMSD。然而,对于对称分子,必须搜索所有可能的模板原子赋值,才能找到RMSD最小的映射。该搜索的假定计算费用计算为可能映射的总数,即每个查询原子的候选原子集长度的乘积。

为了找到查询原子和模板原子之间的确定最优映射,一种类似于VF2算法的穷举赋值搜索[16]结合死端消除(DEE)[20]已实现。在这个过程中,查询原子被迭代地分配给模板标签,该模板标签提供了最小的平方插入距离,并且可以添加到现有的分配中。第一个可行性标准是,如果正在分配的候选模板原子已分配给前一个查询原子,则不允许进行此分配。此限制确保所有映射都是一对一的,这样就不会将任何模板原子映射到多个查询原子。其次,如果当前正在映射的查询原子与已经映射的原子绑定,则检查模板绑定网络,以确保模板中从查询中为这些原子提供的标签之间也存在绑定。如果通过查询原子赋值形成的键不应该根据模板形成,则建议的赋值是不可行的。最后,最后一个可行性标准是DEE,如果所有后续可行分配将导致RMSD大于迄今为止观测到的最小RMSD(如果尚未观测到RMSD,则为无穷大),则DEE将停止指定特定原子。查询原子按照可能的模板标签数量(最小的先)的顺序映射,然后按照键的数量映射到已映射的查询原子(最大的先),最后按照它们在查询文件中的出现顺序映射(最小的后)。一旦将所有查询原子分配给模板原子,此对应关系将用于计算RMSD。然后程序打印所有映射的最小RMSD以及产生该RMSD的映射。此外,还会打印可能的映射数。

结果和讨论

对接构造数据集和生成

为了评估DockRMSD的对称性校正和贪婪搜索启发式的可靠性,我们基于CSAR Hi-Q蛋白-甘露数据集生成了对接构象[21]. 该数据集包含343个蛋白质结构,每个结构都与各自的配体复合,其中对接诱饵构象由我们使用AutoDock Vina程序生成[6]. 对于每个蛋白-配体对,使用OpenBabel构象随机化去除天然配体结构[15],并使用AutoDock Vina重新装入装订袋[6]. OpenBabel执行输入PDBQT文件的生成以进行对接,以及输出文件从PDBQT-MOL2的转换。对接RMSD是在单个再锁定实验产生的前五个姿势的所有10个可能的成对组合之间进行计算的,导致总共3430个RMSD计算(每个蛋白质-配体对10个,总共343个蛋白质-配子对)。所有3430次计算都是在Red Hat Enterprise Linux机器上使用不同程序列表进行的,该机器具有3.30 GHz的Intel i5-4590 CPU。对于DockRMSD、幼稚RMSD和对象rms,分别(参见“DockRMSD运行时比较”部分以获得更详细的运行时分析)。

此处,未计算相对于天然晶体结构姿势的原始RMSD计算,因为AutoDock Vina配体制备过程删除了氧化还原配体和天然配体之间的直接原子对应关系。AutoDock Vina根据配体的扭转树对配体的原子进行重新排序,因此,所有Vina姿势彼此直接对应,但与原始的天然配体结构无关。因此,只有能够找到文件之间原子对应关系的程序才能用于比较Vina姿势和原生晶体结构姿势。这就是为什么用于评估程序的数据集只包含停靠姿势的原因;天然晶体结构和Vina生成的姿势之间不能直接对应。配体结构已使用UCSF Chimera可视化[22].

通过DockRMSD对接RMSD计算

为了检查对接RMSD计算中对称校正的影响,我们在图中进行了比较a根据DockRMSD计算的对称修正RMSD和根据结构文件的默认原子顺序计算的原始RMSD。虽然3430个案例中有2109个不需要对称校正,但其余1321个案例(38.5%)是坚持原始RMSD人为地将对接RMSD膨胀,其中54个案例中膨胀了2º以上(表1). 这方面最极端的例子是配体分子较大且具有镜像对称平面,以及配体构成大致重叠。对于这些情况,确定最佳映射至关重要,因为错位的对应将导致原子间距离过大,特别是与相对较小的“真实”RMSD相比。石杉碱a基乙酰胆碱酯酶配体的实例[23]如图所示b、 其中分子的两半在化学上彼此相同,并且肉眼应具有相对较小的RMSD值。DockRMSD的计算与这一粗略评估一致,计算出的RMSD值为3.42Å。然而,由于查询是相对于模板翻转的,天真的RMSD认为这种重新定向是一个重要区别,因此计算出RMSD为10.74º。

图3
图3

DockRMSD计算的配体RMSD与1321个对称结构配体分子的幼稚RMSD计算结果进行比较。b条由于分子对称性(配体PDB ID:E10;受体PDB ID:1H22),天真的RMSD计算无法提供最佳RMSD的一对姿势示例[23]). 通过不同的方法绘制氧原子之间的插入对应关系来表示RMSD分歧的来源

表1相对于确定性DockRMSD计算的误差为零、小(非零但小于2.0°)或大(大于2.0°)的3430个RMSD计算总数

在图中4a、 我们将DockRMSD的RMSD与匈牙利算法计算的RMSD进行了比较,匈牙利算法已被一些已建立的方法所采用,例如DOCK6[8]. 在匈牙利算法中,映射是通过对成本矩阵(即原子间距离矩阵)的迭代操作生成的,从而出现对应于最优分配的零值模式。匈牙利算法的性能是使用对接RMSD计算程序的Python实现进行评估的,与Allen和Rizzo所描述的类似[7]. 该脚本使用Python Munkres包[24]生成查询模板原子对应,以便只能在同一元素的原子之间进行赋值。如上所述,此算法的松懈导致它过度优化并生成低于可能值的RMSD值。因此,在几乎所有分析的案例中,匈牙利算法生成的RMSD值都低于DockRMSD找到的最佳答案(3430个RMSD计算中的3269个,95.3%;表1). 这意味着匈牙利算法引入的过校正问题并不简单。

图4
图4

对匈牙利算法低估RMSD的3112个分子,将匈牙利算法与DockRMSD进行比较。b条匈牙利算法与DockRMSD比较190个分子,其RMSD在天然配体姿势基准中被匈牙利算法低估。c匈牙利算法由于对全局分子拓扑不敏感而严重纠正对称性的一对姿势示例(配体PDB ID:BEG;受体PDB ID:1D4I[25]). 绘制了中心碳原子和氮原子之间的插入对应关系,以表示RMSD分歧的来源。匈牙利的对应关系用红色绘制,以证明根据键合到对中每个原子的原子的化学不平等性,不应允许对应关系

与DockRMSD和幼稚RMSD之间的比较不同,DockRMSS和匈牙利算法之间的最大差异出现在几乎完全重叠的近镜像对称分子中。作为一个示例,我们在图4c来自HIV-1蛋白酶抑制剂BEA425[25],其中呈现的姿势看起来几乎完全相同,因此可以预计RMSD值应该很低。然而,由于分子中心附近有一个羟基,这个分子并不是真正对称的,因此,这两种姿势在化学上并不完全相同。由于匈牙利算法只考虑单个原子类型,而不考虑全局化学恒等式,因此此类情况会愚弄算法,使其接受局部对应区域,而代价是要正确考虑哪些原子是键合的。尽管该算法生成的RMSD值较低,但这些值并不能反映配体键合结构衍生的原子映射的正确对应。

这里需要注意的是,上述RMSD计算是在AutoDock Vina对接构象上进行的,选择该构象纯粹是为了通过直接通信比较不同的RMSD计算程序。事实上,配体RMSD计算最常见的应用之一是用于基准测试,评估对接程序生成与天然构象极为相似的配体姿势的能力。在此类实验中,如果姿势相对于本地姿势的RMSD≤2.0º,则通常认为姿势是“近本地”的。为了检查与此任务相关的不同程序的性能,使用DockRMSD和匈牙利算法,将343个蛋白质-配体对中每一个的排名靠前的AutoDock Vina姿势与CSAR Hi-Q集合提供的配体晶体结构姿势进行了比较,其结果如图所示4b和表2结果表明,在343个案例中的190个案例中,匈牙利算法得出的值低于DockRMSD确定的最佳值,其中10个案例会导致“近似自然”姿势的假阳性分类。这些结果表明,使用不正确的原子对应关系通过RMSD值评估对接算法可能会导致对接结果的人为膨胀。

表2通过DockRMSD和匈牙利算法计算的对接配体位置和各自天然晶体结构配体位置之间343 RMSD计算的列联表

DockRMSD运行时比较

为了评估DockRMSD的运行效率,将所有3430个姿势对的初始和对称修正RMSD计算与对象rms. The对象rms包是OpenBabel的一个工具,它通过使用与DockRMSD类似的算法解决图同构问题来计算RMSD。计算值介于对象rms和DockRMSD(如果DockRMSP中未使用债券类型信息)相同;因此,这两个程序之间最深刻的比较是确定它们分别以多快的速度得出正确的答案。实验结果总结如图所示5,将运行时转换为更接近正态分布的日志。如图所示,DockRMSD执行的每个计算都比对象rms,这与它们的平均运行时间之间的统计显著差异一致(t=310.6,p<10−20,000通过单尾配对t检验)。对称校正和非对称校正运行时之间的差异也具有统计学意义(t=43.9,p<10−400通过单尾配对t检验),但DockRMSD和对象rms(1.04对数10(秒))比对称校正和天真运行时(0.21 log10(秒))。该数据表明,虽然对称性校正对RMSD计算时间的影响是可以观察到的,但相对于对象rms将执行类似对称校正的最小化。

图5
图5

壁时分布的盒形图和晶须图(对数10(秒))对于由对称修正的DockRMSD、对称修正的初始RMSD和对称修正的对象rms

虽然这种运行时差异很大程度上可以归因于以下事实对象rms是使用OpenBabel的面向对象框架实现的,因此导致实例化比这个问题所需的计算密集型数据结构,DEE也有助于提高DockRMSD的效率。作为DEE功效的一个说明性例子,巴克敏斯特富勒烯(C60)分子与tRNA鸟嘌呤转糖苷酶对接[26]使用AutoDock Vina,然后,使用不带DEE的DockRMSD、带有DEE的DuckRMSD计算前五个姿势之间的对接RMSD,以及对象rms用于运行时分析。在本实验中,受体的选择是随机和任意的;与该受体对接只是为配体生成假想姿势的一种手段,并不意味着有更大的生物学相关性。然而,选择巴克敏斯特富勒烯分子作为配体的原因是,它是自然界中观察到的最高度对称的分子之一:分子中每个碳的化学性质都与其他碳相同,导致总状态空间为6060可能的映射,比宇宙中原子的数量还要多。因此,对映射搜索空间进行适当的剪枝对于有效地找到该分子的最小RMSD至关重要。反映出这一点,没有DEE的DockRMSD需要相对较长的时间(每个配体对平均93.3±0.9 ms)才能找到最佳解决方案,因为所做的唯一修剪是实现中描述的基于键的重复标准;由于巴克敏斯特富勒烯的对称性,原子身份搜索不提供任何信息。这个对象rms由于该工具直接实现了VF2可行性标准,因此修剪效率更高(每个配体对平均59.6±0.9 ms),但仍需要枚举每个有效映射以找到最佳映射,因此需要更长的时间才能获得最佳答案。然而,由于DEE根据映射的累积平方距离修剪映射,因此DockRMSD能够在与对象rms在大多数其他分子上(每个配体对平均8.7±0.7ms)。

结论

幼稚的RMSD计算无法解释分子对称性,这对我们评估蛋白质-配体对接产生的配体姿势产生了负面影响。在我们分析的数据集中,大约每五个配体中就有两个配体需要进行某种对称校正,以获得准确的对接RMSD值,其中一些配体的RMSD校正值超过2.0º。虽然已经进行了多次尝试来满足这一需求,但在没有考虑原子连接性的情况下寻找映射的实现,如DOCK6和AutoDock Vina中的实现,最终未能考虑到配体的特性,而配体的性质是找到真正的最佳对称校正RMSD所必需的。虽然来自商业程序(如GOLD和Glide)的模块也能够找到最佳解决方案,并且如果评估的姿势是由这些程序生成的,则可能更方便,但希望使用这些程序的用户必须购买许可证或安装大型软件包才能执行RMSD计算。最后,即使与类似的开源模块相比,例如对象rms由于其轻量级实现,DockRMSD在所有情况下(尤其是高对称情况下)的计算速度都快得多。除了对称校正外,DockRMSD的原子对应搜索还促进了基准研究中对接程序之间更容易的比较。由几个程序生成的配体姿势不一定具有直接的原子对应关系,因此DockRMSD可以用作通用分析模块,以确保所有程序都能够进行比较,并且比较是公平的。

尽管DockRMSD能够计算对称校正RMSD,但该程序仍存在一些缺点。例如,由于原子身份搜索步骤,DockRMSD要求提供的两个分子是相同的分子。这可以通过实现最大公共子结构搜索来解决。然而,如果被分析的分子是对称的,一个共同的亚结构可能对应于分子中的几个位置,导致几个不同的潜在RMSD值。此外,DockRMSD目前仅通过对接RMSD评估配体姿势距离,因为该指标很受欢迎。然而,RMSD远远不是一个完美的度量标准,特别是因为它无法捕获具有高结合亲和力的基本蛋白质-配体相互作用的守恒。到目前为止,DockRMSD不包括解决RMSD这些缺点的指标,因为它们需要考虑蛋白质受体结构,但该软件的未来迭代可以将此信息与典型RMSD计算结合起来。

数据和材料的可用性

当前研究期间生成和分析的数据集以及DockRMSD源代码可在DockRMSDWeb服务器上获得,https://zhangab.ccmb.med.umich.edu/DockRMSD/.

工具书类

  1. Tuccinardi T(2009)《基于对接的虚拟筛选:最新进展》。梳状化学高通量筛12:303–314。https://doi.org/10.2174/138620709787581666

    第条 中国科学院 公共医学 谷歌学者 

  2. ŚledźP,Caflisch A(2018)蛋白质结构药物设计:从对接到分子动力学。当前操作结构生物48:93–102。https://doi.org/10.1016/j.sbi.2017.10.10

    第条 中国科学院 公共医学 谷歌学者 

  3. Blum A,Böttcher J,Heine A等人(2008)基于吡咯烷支架的C2-对称HIV-1蛋白酶抑制剂的结构导向设计。医学化学杂志51:2078–2087。https://doi.org/10.1021/jm701142s

    第条 中国科学院 公共医学 谷歌学者 

  4. Lindberg J、Pyring D、Löwgren S等(2004)对称的氟取代二醇基HIV蛋白酶抑制剂:正氟和偏氟P1/P1′-苄氧基侧基显著提高抗病毒活性并保持结合功效。《欧洲生物化学杂志》271:4594–4602。https://doi.org/10.1111/j.1432-1033.20044.04431.x

    第条 中国科学院 公共医学 谷歌学者 

  5. Benach J、Swaminathan SS、Tamayo R等人(2007)《PilZ结构域对环二胍酸信号转导的结构基础》。EMBO杂志26:5153–5166。https://doi.org/10.1038/sj.emboj.7601918

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  6. Trott O,Olson AJ(2010)AutoDock Vina:通过新的评分函数、高效优化和多线程提高对接的速度和准确性。《计算化学杂志》31:455–461。https://doi.org/10.1002/jcc.21334

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  7. Allen WJ,Rizzo RC(2014)匈牙利算法的实现,以说明基于结构设计中的配体对称性和相似性。化学信息杂志54:518–529。https://doi.org/10.1021/ci400534h

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  8. Allen WJ、Balius TE、Mukherjee S等人(2015)DOCK 6:新功能和当前对接性能的影响。计算机化学杂志36:1132–1156。https://doi.org/10.1002/jcc.23905

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  9. Kuhn HW(1955)分配问题的匈牙利方法。导航Res Logist Q 2:83–97。https://doi.org/10.1002/nav.3800020109

    第条 谷歌学者 

  10. Munkres J(1957)分配和运输问题的算法。《工业应用数学杂志》5:32–38。https://doi.org/10.1137/0105003

    第条 谷歌学者 

  11. Jones G、Willett P、Glen RC等人(1997年)柔性对接遗传算法的开发和验证。分子生物学杂志267:727–748。https://doi.org/10.1006/jmbi.1996.0897

    第条 中国科学院 公共医学 谷歌学者 

  12. D.A.Case、I.Y.Ben-Shalom、S.R.Brozell、D.S.Cerutti、T.E.Cheatham、III、V.W.D.Cruzeiro TAD、R.E.Duke、D.Ghoreishi、M.K.Gilson、H.Gohlke、A.W.Goetz、D.Greene、R Harris、N.Homeyer YH、S.Izadi、A.Kovalenko、T.Kurtzman、T.S.Lee、S.LeGrand、P.Li、C.Lin、J.Liu、T.Luchko、R.Luo DJ等,2018年AMBER;2018

  13. Friesner RA、Banks JL、Murphy RB等人(2004)《滑翔:快速、准确对接和得分的新方法》。对接精度的方法和评估。医学化学杂志47:1739–1749。https://doi.org/10.1021/jm0306430

    第条 中国科学院 公共医学 谷歌学者 

  14. Halgren TA、Murphy RB、Friesner RA等人(2004)《滑行:快速、准确对接和得分的新方法》。数据库筛选中的富集因素。医学化学杂志47:1750–1759。https://doi.org/10.1021/jm030644

    第条 中国科学院 公共医学 谷歌学者 

  15. O'Boyle NM、Banck M、James CA等人(2011)《开放巴别塔:开放化学工具箱》。《化学杂志》3:33。https://doi.org/10.1186/1758-2946-33

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  16. Vento M,Cordella LP,Foggia P,Sansone C(2004)用于匹配大型图的(子)图同构算法。IEEE Trans-Pattern Ana Mach Intell公司26:1367–1372

    第条 谷歌学者 

  17. Hu J,Liu Z,Yu DJ,Zhang Y(2018)LS-align:一种用于高通量虚拟筛选的原子级柔性配体结构对齐算法。生物信息学34:2209–2218。https://doi.org/10.1093/bioinformatics/bty081

    第条 中国科学院 公共医学 谷歌学者 

  18. RDKit:开源化学信息学。网址:http://www.rdkit.org

  19. DockRMSD:对接姿势距离计算。https://zhangab.ccmb.med.umich.edu/DockRMSD/

  20. Desmet J,De Maeyer M,Hazes B,Lasters I(1992)死链消除定理及其在蛋白质侧链定位中的应用。自然356:539–542。https://doi.org/10.1038/356539a0

    第条 中国科学院 公共医学 谷歌学者 

  21. Dunbar JB、Smith RD、Yang CY等(2011)2010年CSAR基准测试:蛋白质-甘氨酸复合物的选择。化学信息杂志,型号51:2036–2046。https://doi.org/10.1021/ci200082t

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  22. Pettersen EF、Goddard TD、Huang CC等(2004)UCSF Chimera——探索性研究和分析的可视化系统。《计算化学杂志》25:1605–1612。https://doi.org/10.1002/jcc.20084

    第条 中国科学院 公共医学 谷歌学者 

  23. Wong DM、Greenblatt HM、Dvir H等(2003)乙酰胆碱酯酶与石杉碱A相关的二价配体复合:物种依赖性蛋白质-配体互补性的实验证据。美国化学学会杂志125:363–373。https://doi.org/10.1021/ja021111w

    第条 中国科学院 公共医学 谷歌学者 

  24. munkres-Python的munkres实现。http://software.clapper.org/munkres/index.html

  25. Andersson HO、Fridborg K、Löwgren S等人(2003)对称和不对称HIV-1蛋白酶抑制剂中P1-P3组的优化。《欧洲生物化学杂志》270:1746–1758。https://doi.org/10.1046/j.1432-1033.2003.03533.x

    第条 中国科学院 公共医学 谷歌学者 

  26. Biela I、Tidten-Luksch N、Immekus F等人(2013年)对细菌tRNA-鸟嘌呤转糖苷酶特异性决定簇的研究表明,其真核生物对应物的底物奎因是抑制剂。公共科学图书馆ONE 8:e64240。https://doi.org/10.1371/journal.pone.0064240

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

下载参考资料

致谢

我们要感谢Wallace Chan博士对这份手稿的批评。利用加州大学旧金山分校生物计算、可视化和信息学资源开发的UCSF Chimera执行分子图形,得到NIH P41-GM103311的支持。

可用性和要求

项目名称:DockRMSD。

项目主页:https://zhangab.ccmb.med.umich.edu/DockRMSD/.

操作系统:Linux中的二进制,源代码平台无关。

编程语言:C。

其他要求:GCC 4.3.1或更高版本或兼容Linux操作系统。

许可证:GNU GPL。

基金

该研究得到了国家普通医学科学研究所[GM070449、GM083107、GM116960]、国家过敏和传染病研究所[AI134678]和国家科学基金会[DBI1564756]的部分支持。

作者信息

作者和附属机构

作者

贡献

EWB设计并实现了DockRMSD。YZ作为首席研究员监督了整个过程,并大量参与了手稿的修订。两位作者阅读并批准了最终手稿。

通讯作者

与的通信杨章.

道德声明

竞争性利益

作者声明,他们没有相互竞争的利益。

其他信息

出版说明

Springer Nature在公布的地图和机构关联中的管辖权主张方面保持中立。

权利和权限

开放式访问本文根据Creative Commons Attribution 4.0 International License的条款分发(http://creativecommons.org/licenses/by/4.0/),它允许在任何媒体上不受限制地使用、分发和复制,前提是您对原始作者和来源给予适当的信任,提供知识共享许可的链接,并指明是否进行了更改。知识共享公共领域专用豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有说明。

转载和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用这篇文章

Bell,E.W.,Zhang,Y.DockRMSD:一个开源工具,用于通过图形同构对对称分子进行原子映射和RMSD计算。化学杂志 11, 40 (2019). https://doi.org/10.1186/s13321-019-0362-7

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/s13321-019-0362-7

关键词