跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2010年7月1日;38(Web服务器问题):W622–W627。
2010年5月5日在线发布。 doi(操作界面):10.1093/nar/gkq325
预防性维修识别码:PMC2896087型
PMID:20444874

Frog2:高效的小分子化合物三维构象集成生成器

摘要

Frog是一个专门用于小型复合3D生成的web工具。在这里,我们提出了新版本Frog2,它允许从化合物的1D、2D或3D描述开始生成小分子的构象集合。从SMILES、SDF或mol2格式之一的复合描述中,服务器将返回使用二面体空间中的两阶段蒙特卡罗方法生成的各种异构体的集合。当从化合物的1D或2D描述开始时,Frog2能够检测不明确的立体异构体的位置,从而对不同的立体异构物进行采样。Frog2还嵌入了新的能量最小化和环生成设施,解决了Frog1环库中一些缺失环结构的问题。最后,优化的Frog2构象系综生成器使计算时间增加,允许Frog2比Frog1快20倍,同时在结构质量和构象多样性方面产生令人满意的构象。生成的构象集合速度快、质量好,因此可以使用Frog2处理较大的化合物集合。服务器和文档可从以下网站免费获得:http://bioserv.rpbs.univ-paris-didero.fr/Frog2.

简介

处理药物样小分子的三维结构对于一些计算方法(如电子筛选)至关重要(1,2),基于配体(3–5)或基于受体结构(6–9)在实验筛选之前使用,或用于补充实验筛选,以进行命中识别、铅优化或化学生物学目的。此外,对于某些方法,如刚性配体对接或基于3D配体的筛选,需要多构象集成。化合物通常由化学品供应商以1D SMILES(简化的分子输入行输入系统)、1D cansmiles(规范SMILES)的形式分发(10)或在2D SDF中(11)(结构数据文件)格式。为小型化合物生成精确的3D结构是一项复杂的任务(12). 使用基于规则或基于数据的方法的不同技术,在预先生成的碎片或随机过程上构建链接区域,直到量子力学方法(12,13)已开发。为了比较现有的方法并分析实验观察到的小分子构象,已经进行了许多研究(14,15). 他们发现,为了对构象空间进行满意的采样,需要优化的最重要参数是相对于全局最小值和均方根偏差(RSMD)值的能量窗。一些成熟的商业软件包,如Corina(Corina Molecular Networks,GmbH Computerchemie Langemarckplatz 1,Erlangen,Germany,2000)、Omega、Catalyst(14)或MED-3DMC(16)生成小分子的多重系综构象。此外,一些公用设施,如锌(17)、FAF-药物(18)或pubChem(18)利用商业软件提出3D中预先生成的化合物集合。然而,很少有免费工具可用于生成单个或多个构象。例如,气球(13)使用多目标遗传算法方法和Multiconf-DOCKhttp://dock.compbio.ucsf.edu/Contributed_Code/index.htm(20)使用系统搜索是免费的。开源程序DG-AMMOS(21)最近报道了基于距离几何方法和分子力学优化的研究。独立软件包的一个实用替代方案,尤其是对于非高级用户来说,是可以提供直接从1D/2D到3D设施的web服务,例如OpenEye的Omega、Molsoft、Corina和哥伦比亚广播公司(CBS)等一些学术网站。然而,此类服务通常一次只处理一个分子。三年前,我们开发并报告了网络服务Frog(22) (http://bioserv.rpbs.univ-paris-didero.fr/Frog.html)提供了类药物化合物的3D构象的单个或集合的在线生成。Frog是一种基于Frowns(化学信息学工具包,可在http://browsks.sourceforge.net/)已经向其添加了若干功能以允许从SMILES或SDF数据输入开始生成3D结构。

在此,我们描述了一种新版本的Frog,即Frog2,它能够(i)从1D/2D或3D输入结构开始生成单个或多个低能到中等能量的3D构象,(ii)完全或部分消除化合物立体化学的歧义,包括具有用户定义的最大生成构象数目的手性位点,以及(iii)使用AMMOS最小化生成的构象的能量(18)如果用户需要。与Frog1相比,Frog2实现了以下重要改进:(i)使用DG-AMMOS生成Frog1片段数据库中不可用的化合物环(17); (ii)显著改善了生成的一致性系综的多样性,以及(iii)显著提高了计算速度。此外,还提供了一些辅助工具,例如使用OpenBabel进行格式转换(23)或通过AMMOS实现3D构象的能量最小化(24). 在正在开发的多重确认生成过程中,Frog2仍然不允许环的灵活性。

在本研究中,除了描述网络服务Frog2之外,我们还验证了Astex数据集中化合物的Frog2(25). Frog2、Frog1和商业包装Omega的比较(http://www.eyesopen.com(英文))显示了青蛙2的说服力。

方法

概念

有关Frog2服务的概述,请参见图1。Frog2的新模块和优化模块显示在灰白色框中。总的来说,青蛙内部3D生成是基于化合物的图形分解(22)再加上对手性未知的立体中心的识别。一旦确定了这些位置,就生成了明确异构体的组合,其中所有已确定立体中心的手性都是完全指定的,但随机截断到最多八个手性中心以生成3D。对于其中的每一个,都会生成一个开始的3D构象。在此生成过程中,Frog2利用DG-AMMOS动态生成缺失的环,并将其添加到环库中,从而避开了Frog1的主要限制。青蛙没有明确地管理质子化。相反,它依赖OpenBabel(23)生成标准质子化状态的氢坐标。

Frog2的另一个主要改进来自构象集成生成引擎的优化。然而,与Frog1一样,环保持刚性,只考虑二面体变化。Frog2引擎嵌入了一个改进的两阶段蒙特卡罗程序。第一阶段基于有限数量的代表性二面角值(取决于原子类型)探索构象灵活性。此Monte-Carlo步骤包括一个避免构象冗余的过程:禁止与之前访问的二面体值组合对应的新构象。此外,还介绍了根据二面体值相对于化合物中心的位置,对二面体数值的探索产生偏差的可能性。因此,台阶影响特定二面体的概率并不均匀,而是取决于每侧侧翼原子的数量,使用以下权重:保存图片、插图等的外部文件。对象名称为gkq325i1.jpg,其中保存图片、插图等的外部文件。对象名称为gkq325i2.jpg(分别为。保存图片、插图等的外部文件。对象名称为gkq325i3.jpg)是正在旋转的键左侧(相对右侧)的原子数,保存图片、插图等的外部文件。对象名称为gkq325i4.jpg是原子总数,因此与每侧原子数平衡的二面体相比,位于末端位置的二面体具有较小的重量。第二阶段蒙特卡罗统一考虑第一阶段构象中的小旋转,以便对其进行细化。为了精简组合探索,默认情况下,第二阶段仅对足够高能量的构象有效。

这个描述的构象集成生成引擎由一个标准的划分层次聚类进行补充,该聚类使用的方法在本质上类似于用于指纹的方法(26). 这种方法保证了一个类中的所有构象都低于固定的RMSD阈值,并且所选构象之间的RMSD始终高于该阈值。

最后,为了加快计算速度,构象的秩基于Frog2的内部分数,仅考虑范德瓦尔斯相互作用,这可能不足以防止组装过程中的一些几何畸变。为了克服这一限制,可以使用AMMOS中实现的AMMP力场来最小化构象(24).

输入/输出

Frog2接受社区广泛使用的三种格式作为输入:SMILES、SDF和mol2格式。使用OpenBabel工具可以转换为其中之一。由于SDF和mol2格式可以对应于化合物的2D或3D描述,因此用户必须在两种可能的输入类型中保持精确:1D/2D或三维。指定1D/2D类型时,输入的所有3D信息将被丢弃,3D生成将从头开始。指定3D类型后,Frog2只需调用构象集成生成引擎,而不考虑立体异构性,并将输入坐标作为构象集成产生的起点。与系综生成相关的参数对应于最大构象数,能量阈值用于定义允许的能量窗,即生成的最低能量构象。还可以为异构体的几何聚类指定最小RMSD值,并调用化合物的最小化。最小化仅适用于发电退出。能量最小化考虑了化合价、角度和范德瓦尔斯分量,而不考虑静电项。Frog2结果的内部格式为mol2。然而,由于OpenBabel,可以在mol2、SDF或PDB格式之间进行选择。

结果

我们首先评估了Frog2在生成的多信息集成中发现与生物活性构象相似构象的性能。图2显示了生成Astex数据集的多信息集合的结果(25)使用Frog2、Frog1和Omega 2含有85种不同的类药物分子(http://www.eyesopen.com(英文))]. 相同的输入参数用于运行Frog2、Frog1和Omega,即:多达50个构象,RMSD阈值为0.8.o。为了能够与Frog1进行比较,激活了Frog2消歧选项。从中可以看出图2a、 使用这些输入参数,对立体异构体进行消歧,并允许第二阶段Monte-Carlo,对于大多数Astex分子,Frog2的构象比Frog1更接近生物活性构象。平均而言,青蛙2生物活性物质的最接近构象为保存图片、插图等的外部文件。对象名称为gkq325i5.jpg¦RMSD值,而Frog1显示的平均RMSD为保存图片、插图等的外部文件。对象名称为gkq325i6.jpgÅ. 有趣的是,即使没有采用第二阶段蒙特卡罗法,平均RMSD为保存图片、插图等的外部文件。对象名称为gkq325i7.jpg分别为。在使用Frog2和Omega时,在Astex数据集上生成了最多50个符合物,与Omega相比,其表现稍好,平均值为保存图片、插图等的外部文件。对象名称为gkq325i8.jpg(Wilcoxon符号秩检验无显著差异)。对于每个分子最多50个构象,Omega和Frog2在RMSD内发现了构象,85种化合物中的82种和79种化合物的生物活性构象分别为1.5Å。考虑到聚类相似构象所需的RMSD设置为0.8º,这可以被视为可接受的精确度。最后,图2c说明了将最大构象数增加到100的影响。有人注意到一个微小但有效的改进。平均而言,Frog2在保存图片、插图等的外部文件。对象名称为gkq325i9.jpg奥·RMSD。示例显示了Frog2和Omega在Astex数据集的两个分子生成50个构象时实现的构象多样性图3根据计算的RMSD值和视觉分析,可以得出结论,Frog2和Omega都能很好地探索构象空间,并且能够生成接近生物活性构象的构象。此外,用户可以通过Frog2将生成的构象能量最小化,或在3D中最小化自己的化合物库。我们对最小化对Frog2生成的Astex构象的影响的评估表明,通过发现生物活性构象,并没有显著改善。平均而言,生物活性构象的RMSD为保存图片、插图等的外部文件。对象名称为gkq325i10.jpg?,即与Frog2获得的结果相似,但没有最终最小化阶段。此外,我们在从PDBbind数据库中提取的更大的化合物集合上验证了Frog2的性能(27). 我们提取了所有PDBbind配体,X射线分辨率高于2º。保留了含有多达15个可旋转键的化合物,不包括大的桥联环(超过30个原子,请参阅上面关于Frog2限制的讨论)。最后,对962种化合物进行了处理。根据可旋转键的数量,得到的测试化合物的分布在补充数据。最佳生成结构和实验结构之间的RMSD结果也在补充数据。最多生成50个构象的构象系综,实现第二阶段蒙特卡罗,且不应用最小化。正如可以预期的那样,性能(就RMSD而言)随着分子柔韧性的增加而降低。实验构象的RMSD中位数低于1º,最多7个可旋转键,而Frog2结果仍然可以接受,最多15个可旋转的键。

保存图片、插图等的外部文件。对象名为gkq325f2.jpg

最佳拟合构象和X射线构象结构之间的RMSD由以下因素产生:()多达50个构象系列的Frog1与Frog2;(b条)Frog2与Omega对多达50种构象的系列进行比较。PDB代码表示(i)相对性能最差的化合物,即偏离对角线最多的化合物(1y6b,1xoz)和(ii)青蛙和欧米茄表现最好的化合物(1 gpk,1 u4d,1sqn);和(c(c))Frog2用于最多50个构象的序列,而Frog2则用于最多100个构象序列。

保存图片、插图等的外部文件。对象名为gkq325f3.jpg

Frog2(全原子色,碳为黄色)和Omega(全原子颜色,碳为浅粉色:()PDB代码1jla;和(b条)PDB代码1meh。还显示了共结晶配体的实验结构(所有原子颜色,碳为洋红)。

最后,我们评估了青蛙2相对于青蛙1的速度增益。在配有2 GHZ intel Xeon处理器的计算机上,Omega在6分钟内为所有Astex集合生成构象。使用Frog2生成需要11分钟。使用可比较的参数,Frog1在103分钟内生成相同的集合。此外,如果运行Frog2而不使用两个Monte Carlo阶段,计算时间可以减少到5分钟。总之,在严格可比的条件下,Frog2比Frog1产生更好的构象质量和多样性,并且比Frog1快9倍。在构象多样性方面,如果采用无两阶段蒙特卡罗的更快方法,则Frog2仍优于Frog1,并且速度快20倍。这种在不影响生成构象质量的情况下执行时间的显著减少证明了在Frog2中实现的优化的影响。我们应该注意到,激活最小化选项会导致计算时间显著增加。在Astex集合中,使用消歧选项和第二阶段蒙特卡罗,计算时间从11分钟增加到207分钟,即慢了近20倍。然而,对于检测到结构不精确的一些生成的结构,或者对于少量化合物,可能需要最小化能量。

讨论和未来方向

青蛙2开发的主要目标是克服青蛙1的几个局限性,提高整体质量和速度性能。在这些问题上,戒指是一个核心问题。实际上,由于Frog2利用DG-AMMOS动态生成丢失的环,因此Frog2对环库的依赖性就不那么重要了。此外,Frog2解决了与现在通过OpenBabel标准生成的环质子化有关的Frog1问题。因此,Frog2生成构象物的失败率很低。从ChemBrdge潜水员的约40万cmps中随机选择使用超过10000种化合物(http://www.chembridge.com网站/),Frog2仅未能为<2%的化合物生成构象。从对Astex集合的测试中可以看出,Frog2达到了良好的结构质量。

第二个重点是构象多样性。Frog2的发展使其能够更好地控制构象集合生成中的多样性,并且Frog2达到了广泛的构象多样性。预计会有进一步的改进。特别是,正在研究如何更好地考虑对称性。

最后一个焦点与所需的计算时间有关。事实上,在虚拟筛选实验中,可以考虑数百万种化合物,生成库的时间可能会成为一个问题。可以假设,一旦以3D生成,化学化合物集合就可以在不同项目中进行电子筛选,然而,为了提高发现程序的效率,需要越来越多的目标库或配体库。在这方面,Frog2带来了显著的改进,因为它能够以比Frog1快20倍的速度生成令人满意的质量构象。我们应该注意到,根据项目目的和待处理化合物的数量,可以在速度和构象多样性之间实现平衡。停用服务器上运行的第二阶段Monte Carlo将导致更快的生成,但会降低构象多样性。因此,对于需要最佳探索构象空间的应用,建议保持该阶段活跃。最后,Frog2利用AMMOS提供了最小化构象的可能性,这种构象在某些特定情况下非常有用,即使使用它也会大大增加计算成本。

青蛙2中仍然存在一些限制。第一个与环刚度有关,在某些情况下,环刚度会影响构象的质量或多样性。特别是,灵活性影响构象搜索的化合物(包括大型桥接环)目前不在Frog的研究范围内。此外,环库策略的一个副作用是,Frog2目前无法正确处理某些涉及环中立体中心的立体异构情况。最后,由于Frog2在单个原子级别从头构建链接器,即不组合预生成的片段,因此目前可以观察到一些特定组生成中的一些错误。现在的工作重点是为这些群体执行具体规则。此外,一些环灵活性的实现正在开发中。

尽管存在较小的电流限制,但青蛙2的评估显示了令人信服的性能。Frog2的使用可以帮助进行各种各样的电子研究,从基于配体或基于结构的虚拟筛选,到领导化合物优化等。因此,Frog2服务器提供了一个非常有价值的工具,可以为社区提供高效的功能,以满足极为竞争激烈的计算时间。

补充数据

补充数据可从NAR Online获取。

基金

开放存取费用资金:INSERM UMR-S 973经常性资金。

利益冲突声明。未声明。

致谢

作者感谢O.Sperandio、M.Petitjean、D.Lagorce和J.Maupetit的许多有益讨论和建议。

参考文献

1Shoichet BK。化学库的虚拟筛选。自然。2004;432:862–865. [PMC免费文章][公共医学][谷歌学者]
2克拉克·D·虚拟筛查对药物发现做了什么?专家。操作。毒品。发现。2008;:841–851.[公共医学][谷歌学者]
三。基于Douget D.Ligand的虚拟筛选方法。当前。计算。辅助药物设计。2008;4:180–190. [谷歌学者]
4Pajeva IK、Globisch C、Wiese M.ABCB1和ABCC1转运蛋白抑制剂的药效团建模、对接和3D QSAR联合研究。化学医药化学。2009;4:1883–1896.[公共医学][谷歌学者]
5Bender A、Jenkins JL、Scheiber J、Sukuru S.CK、Glick M、Davies JW。相似性搜索方法有多相似?分子描述符空间的主成分分析。化学杂志。信息模型。2009;49:108–119.[公共医学][谷歌学者]
6Kuntz ID。药物设计和发现的基于结构的策略。科学。1992;257:1078–1082.[公共医学][谷歌学者]
7Villoutreix BO、Renault R、Lagorce D、Sperandio O、Montes M、Miteva MA。用于协助基于结构的虚拟配体筛选实验的免费资源。货币。蛋白质肽。科学。2007;8:381–411.[公共医学][谷歌学者]
8Betzi S、Restouin A、Opi S、Arold ST、Parrot I、Guerlesquin F、Morelli X、Collette Y。结合高通量和虚拟筛选的蛋白质-蛋白质相互作用抑制(2P2I):应用于HIV-1 Nef蛋白。程序。美国国家科学院。科学。美国。2007;104:19256–19261. [PMC免费文章][公共医学][谷歌学者]
9Seifert MHJ公司。虚拟筛选的目标评分功能。药物研发。今天。2009;14:562–569.[公共医学][谷歌学者]
10魏宁格D、魏宁格A和魏宁格JL。微笑。2.生成唯一SMILES符号的算法。化学杂志。Inf.计算。科学。1989;29:97–101. [谷歌学者]
11Dalby A、Nourse JG、Hounshell WD、Gushurst AK、Grier DL、Leland BA、Laufer J.分子设计有限公司开发的计算机程序使用的几种化学结构文件格式的描述。化学杂志。Inf.计算。科学。1992;32:244–255. [谷歌学者]
12Sadowski J,Gasteiger J。从原子和键到三维原子坐标:自动模型生成器。化学。版次。1993;93:2567–2581. [谷歌学者]
13Vainio MJ,Johnson MS。使用多目标遗传算法生成同构系综。化学杂志。信息模型。2007;47:2462–2474.[公共医学][谷歌学者]
14Kirchmair J,Wolber G,Laggner C,Langer T。构象模型生成器omega和催化剂的比较性能评估:蛋白质结合配体构象检索的大规模调查。化学杂志。信息模型。2006;46:1848–1861.[公共医学][谷歌学者]
15Brameld KA,Kuhn B,Reuter DC,Stahl M.从晶体结构数据得出的小分子构象偏好。以药物化学为重点的分析。化学杂志。信息模型。2008;48:1–24.[公共医学][谷歌学者]
16Sperandio O,Souaille M,Delfaud F,Miteva MA,Villoutreix BO。MED-3DMC:一种通过构象空间的蒙特卡罗采样生成小分子三维构象集合的新工具。欧洲医学化学杂志。2009;44:1405–1409.[公共医学][谷歌学者]
17Irwin JJ,Shoichet BK。ZINC–用于虚拟筛选的商用化合物的免费数据库。化学杂志。信息模型。2005;45:177–182. [PMC免费文章][公共医学][谷歌学者]
18Miteva MA、Violas S、Montes M、Gomez D、Tuffery P、Villoutreix BO。FAF-drugs:化合物集合的免费adme/tox过滤。核酸研究。2006;34:W738–W744。 [PMC免费文章][公共医学][谷歌学者]
19Wheeler DL、Barrett T、Benson DA、Bryant SH、Canese K、Chetvernin V、Church DK、DiCuccio M、Edgar R、Federhen S等。国家生物技术信息中心的数据库资源。核酸研究。2007;35:D5–D12。 [PMC免费文章][公共医学][谷歌学者]
20.Sauton N,Lagorce D,Villoutreix BO,Miteva MA。MS-DOCK:多步虚拟配体筛选的精确多构象发生器和刚性对接协议。BMC生物信息学。2008;9:184. [PMC免费文章][公共医学][谷歌学者]
21Lagorce D,Pencheva R,Villoutreix BO,Miteva MA。Dg-ammons:一种使用距离几何和自动分子力学优化来生成小分子3D构象的新工具,用于硅内筛选。BMC化学生物。2009;9:6. [PMC免费文章][公共医学][谷歌学者]
22Bohme Leite T、Gomes D、Miteva MA、Chomilier J、Villoutreix BO、Tufféry P.Frog:免费在线药物3D构象生成器。核酸研究。2007;35:W568–W572。 [PMC免费文章][公共医学][谷歌学者]
23Guha R、Howard MT、Hutchison GR、Murray-Rust P、Rzepa H、Steinbeck C、Wegner J、Willighagen EL。化学信息学中的蓝色方尖碑互操作性。化学杂志。信息模型。2006;46:991–998. [PMC免费文章][公共医学][谷歌学者]
24Pencheva T、Lagorce D、Pajeva I、Villoutreix BO、Miteva MA。Ammos:用于电子筛选的自动分子力学优化工具。BMC生物信息学。2008;9:438. [PMC免费文章][公共医学][谷歌学者]
25Hartshorn MJ、Verdonk ML、Chessari G、Brewerton SC、Mooij WTM、Mortenson PN、Murray CW。用于验证蛋白质和对接性能的多种高质量测试集。医学化学杂志。2007;50:726–741.[公共医学][谷歌学者]
26Haigh JA、Pickup BT、Grant JA、Nicholls A.小分子形状纤维蛋白。化学杂志。信息模型。2005;45:673–684.[公共医学][谷歌学者]
27Wang R,Fang X,Lu Y,Wang S.PDBbind数据库:收集具有已知三维结构的蛋白-甘氨酸复合物的结合亲和力。医学化学杂志。2004;47:2977–2980.[公共医学][谷歌学者]

来自的文章核酸研究由以下人员提供牛津大学出版社