Creation of a free, Internet-accessible database: the Multiple Target Ligand Database

Chen, Chao; He, Yang; Wu, Jianhui; Zhou, Jinming

doi:10.1186/s13321-015-0064-8

数据库
开放式访问
出版：2015年4月15日

创建一个免费的、可上网的数据库：多目标配体数据库

化学信息学杂志 体积 7，物品编号：14(2015)引用这篇文章

4619访问
6引文
2海拔高度
韵律学细节

摘要

背景

多药理学在药物发现中发挥着重要作用，也是药物开发中的一大挑战。确定药物的潜在多药性，以及开发多药性药物，已成为制药行业和学术界的重要问题。

描述

在此，通过对蛋白质数据库（PDB）进行数据挖掘，这是一个免费的、可上网访问的数据库，称为多靶点配体数据库（MTLD）；网址：www.mtdcadd.com)建造完成。MTLD包含1732个多目标配体（MTL），与从12759个PDB结构中提取的14996个结合位点结合。在MTL中，222个条目是批准的药物，1334个条目是药物类化合物。MTLD可能是开发多药药物的一个非常有用的工具。它还通过预测药物的多种功能和多靶点结合位点的相似性，揭示了药物的副作用。整个数据库可以免费进行在线搜索、浏览和下载。

结论

作为PDB的一个关键扩展，MTLD中将包括越来越多的MTL。最终，它将成为一个有效的平台，以获取有关MTL及其潜在复音医学的有用信息。

背景

“多药理学”（也称为“药物滥交”）是指一种药物通过一条或多条途径对多个靶点的作用。这种现象被认为是自20世纪90年代以来批准的几种药物产生严重不良反应或毒性的主要原因[1-三]. 基于分子数据的指数增长和药物开发的快速进展，证据表明多药学对药物疗效也很重要。例如，氯氮平是“金标准”抗精神病药物，显示出有益的效果通过多目标网络的复杂交互[4]. 一些高效药物，如水杨酸盐、二甲双胍或伊马替尼，通过与多个靶点同时相互作用，显示出增强的疗效。

一般来说，对于涉及多种致病因素（例如癌症、糖尿病、神经退行性综合征、心血管疾病）的复杂疾病，针对单一目标的活动是不够的。重要的是，一些不希望出现的副作用是由于药物没有达到目标，这可以为这些药物提供潜在的重新调整用途的机会，并为药物设计提供新的策略。

综上所述，多药学在药物发现中发挥着重要作用，并且仍然是药物开发的主要挑战之一。它为合理设计新制剂开辟了道路，新制剂比其前辈更有效、毒性更低[5-10]. 使用多药理学方法发现药物已成为制药行业和学术界的热门话题[5-7,11].

有数百个关于药物发现的公开数据库蛋白质数据库（PDB）[12]，DrugBank[13]《京都基因和基因组百科全书》（KEGG）[14]，锌[15]，欧洲分子生物学实验室化学数据库[16]和治疗靶点数据库[17]. 这些数据库是整合各种信息的关键资源，如分子途径、晶体结构、结合实验、副作用和药物靶点。这些信息在使用多药生态学方法的前瞻性药物设计中也非常有用。然而，由于此类数据库中包含大量信息，因此很难找到有关多药制剂的信息。因此，需要开发一种新的数据挖掘方法来归档多臂医学信息。

PDB是蛋白质和其他分子的详细三维（3D）结构信息的存储库，包括配体和蛋白质之间的结合信息。这对解释配体杂乱性非常有用。最近，根据从PDB获得的信息，证据表明，多种蛋白质结合位点的相似性和配体的分子复杂性可能是药物多药性的原因[18,19]. 因此，通过比较结合位点的相似性（例如，Kahraman、Extended Kahrama、Huang），建立了从PDB衍生的多目标配体（MTL）的几个数据集[20,21]. 然而，这些数据集中MTL的总条目≤100。通过基于PDB的配体杂合性分析，生成了另外两个数据集，分别包含164个条目和247个条目[18,19]. 然而，这些数据集并不包括PDB中的所有潜在MTL，并且这些数据集中的信息不够充分。因此，需要一个包含PDB中所有潜在MTL的数据库。

其中，一个数据库被称为多目标配体数据库（MTLD，网址：www.mtdcadd.com)基于从PDB中提取的三维结构数据，构建了该模型。MTLD包含所有与MTL结合的配体，并通过预测其多功能以及多靶点结合部位的相似性来揭示其副作用。整个数据库可以免费进行在线搜索、浏览和下载。总的来说，MTLD对多药药物的开发非常有用，并为进一步优化提供了各种潜在候选药物。

结构和内容

原始结构数据集是使用脚本“rsyncPDB.sh”从PDB的文件传输协议（FTP）存档（版本：2012年12月）下载的。数据集是通过用Perl语言编写的命令程序逐步自动挖掘的数据（图1).

可以推断出分辨率≥3.0Ω的原子结构。因此，从PDB中选择分辨率<3.0Å（67793个条目）的X射线蛋白质结构用于提取配体及其结合位点。为了避免溶剂分子的选择，从选定的PDB文件中提取含有8个以上重原子的配体。结果，获得了62423个配体坐标文件。结合位点定义为结合配体中每个原子半径为6.0º内的所有蛋白质残基。输出了5个以上残基的结合位点，提取了54936个结合位点，可与12138个配体结合。在这些配体中，发现3371个配体与一个以上的PDB结构结合，并选择这些配体进行下一次过滤。为了消除与同一配体结合的晶体结构条目的冗余，蛋白质对之间的序列一致性限制在<35%。最终，从PDB中提取了1732个MTL并存档在MTLD中。

每个配体条目包含五条信息。首先，提供了直接从已知晶体结构中提取的配体的3D结构。其次，给出了已转换为“SMILES”格式的配体的二维结构。第三，详细描述了根据配体坐标输出的结合位点的结构。第四，给出了配体结合的PDB的原始晶体结构。最后，从PDB或Universal Protein Resource（UniProt；网址：www.uniprot.org)提供了。

总的来说，MTLD包含1732个MTL，约占未复制提取配体总数（12138个条目）的14.3%，与12759个晶体结构中的14996个结合位点结合。总的来说，MTLD（表1)与其他现有的MTL数据库相比，是最全面、详细和完整的MTL数据。

表1MTLD与其他多靶点配体数据集的比较

全尺寸桌子

MTLD的统计分析

为了更好地了解MTLD中MTL的构成，对MTLD进行了统计分析（图2). 首先，使用KEGG数据库（小分子、生物聚合物和其他与生物系统有关的化学物质数据库）分析MTLD条目与生物过程之间的关系。总的来说，MTLD中的815个MTL条目也属于KEGG数据库（≈47.1%的总条目；图2A），包括各种氨基酸、糖、核苷酸和脂质。同样，与DrugBank中列出的已知药物相比，MTLD中发现222种批准的药物（≈12.8%的总条目；图2B） ●●●●。特别是，通过使用分子操作环境（加拿大蒙特利尔化学计算小组）中包含的模块“QuaSAR-Descriptor”，根据Lipinski的五法则，预测1334个条目为类药物化合物（≈76.9%的总条目；图2C） ●●●●。MTL分子量在MTLD中的分布分析表明，大多数MTL的分子量<500 Da，而极少数MTL的相对分子量>1000 Da（图2D） ●●●●。因此，统计分析表明，MTLD可能与生物过程和药物作用机制高度相关。

在1732个MTL中，≈45.9%的配体（795个条目）与两种不同的蛋白质结合（图2E）这低于No-Sturm等人报告的结果（65%）[19]. 这可能是由于他们采用sc-PDB（一个源自PDB的数据库）时使用了不同的数据集源造成的。值得注意的是，222种配体与10多种蛋白质结合，包括批准的药物，如异维甲酸、亚精胺和水杨酸。配体的杂乱性与其构象的灵活性有关[19]. 因此，通过使用结构生物学多尺度建模工具（美国加利福尼亚州圣地亚哥斯克里普斯研究所）的结构比对，对每个配体的提取PDB结构的构象复杂性进行了分析。排列后计算结构对的均方根偏差（RMSD）。将结构对的最大RMSD值作为构象变化的判据。大多数MTL（1270个条目，≈73.3%）的计算RMSD值<2.0º（图2F）表明大多数MTL可以通过采用类似的构象与不同的蛋白质结合。然而，需要进行进一步的综合分析，以确定其他参数的影响，例如：MTL的分子大小和灵活性；潜在目标数量；MTL和目标之间的交互模式。

MTLD的互联网接口

MTLD的互联网服务器(mtdcadd.com网站)是从PDB的数据挖掘中获得的MTL的免费、可访问的数据库。互联网服务器是使用MySQL、Java、Javascript和HTML语言在带有四个2.13-GHz处理器的机器上构建的。Java和Javascript启用搜索功能。需要在客户端/客户端安装Java Runtime Environment。配体和蛋白质的3D结构使用开源Java查看器Jmol可视化。配体的结构相似性通过开源化学工具包open Babel使用FP2指纹计算。

MTLD是一个易于使用且完全可搜索的数据库，具有许多内置工具。在MTLD主页和“关于”网页上，简要介绍了MTLD。“下载”网页提供了所有数据的下载选项，包括批准的药物、KEGG配体和一些激酶抑制剂。所有内容都可以方便地下载。在“统计”网页上，提供了统计分析的结果（如上所述），未来将在该页面上显示更多统计结果。

“搜索”链接提供了三个选项。第一个是“蛋白质”选项，可以根据蛋白质的名称、PDB-ID或UniProt-ID进行搜索。例如，提交了一个使用蛋白质名称“雄激素受体”的查询。结果页面上有五个条目以表格形式显示：配体的3D结构；配体的名称、公式、分子量；PDB的配体ID。还可以使用指向其他数据库（如PDB、KEGG、DrugBank和UniProt）的超链接访问每个条目的每个对应网页（图三A） ●●●●。可以通过PDB的配体ID、配体名称或InChI键搜索“Lig”选项。例如，使用水杨酸（配体ID:SAL）进行搜索，结果页面上获得了16个与其结合的非冗余蛋白质靶点（图三B） ●●●●。“结构”选项允许用户在Journal Molecular Editor窗口中绘制所查询的配体结构。例如，用户将二氢睾酮绘制为Tanimoto分数截止值为0.8的查询复合物（Tanimoton分数截止值可以从下拉菜单中选择）。结果页面上以表格形式显示了15个“点击”（图三C） ●●●●。

讨论

我们已经证明，MTLD为MTLs提供了易于访问的信息（例如，从PDB结构中提取的结合位点、类药物信息、配体的结构相似性），以及到UniProt、DrugBank、KEGG和PDB等数据库的方便超链接。此外，冗余在PDB中非常常见。例如，在PDB中，已发现二氢睾酮与37种蛋白质结合，这些蛋白质仅属于三个靶点（表2). 在这种情况下，MTLD通过过滤冗余信息来清晰地显示MTL的目标信息。然而，过滤会导致一些重要信息的丢失，特别是对于一些氨基酸序列非常相似的激酶家族。在这种情况下，关闭搜索网页中的“35%序列识别过滤”选项会显示配体结合的蛋白质的完整列表。

表2MTLD中选定药物和天然产品的多个靶点

全尺寸桌子

带有结合配体的晶体结构不一定意味着牢固的结合。配体的结合亲和力或结合能是反映配体与蛋白质之间相互作用是否特异的重要参数，有助于判断配体的“真正”靶点。因此，在配体网页上添加了BindingDB的链接，人们可以在链接页面上找到关于结合亲和力的报告数据。此外，关于配合物结合亲和力的大多数数据都不可用。因此，根据复坐标使用X-Score方法评估结合自由能[22]并在网页上显示了复合物的结合自由能的值。此外，与其他目标类别（例如g蛋白偶联受体）相比，可以更容易地获得一些目标类别（如激酶）的晶体结构。在这种情况下，可能会在MTLD中添加一个偏差，因为如果目标的晶体结构尚未解决，目标将不会显示在数据库中。需要进一步加强，以将此类目标纳入MTLD。

实用性

MTLD中的大多数条目都是基于药物的。因此，MTLD应该有助于开发多药制剂，并可能为进一步优化提供潜在的候选者。例如，雌激素受体α是治疗乳腺癌的药物靶点，17-羟基类固醇脱氢酶（17HSD1）是激素依赖性乳腺癌内分泌治疗的假定靶点[23]. 通过搜索MTLD，发现了一种配体，即与17HSD1（PDB-ID:1FDS）和雌激素受体（PDB-ID：3Q95）结合的雌激素（配体-ID:EST）。因此，可以根据雌激素的结构设计对这两个靶点都起作用的多药药物。相反，开发了名为Binding Site Match Maker的软件，该软件可以根据相似的物理化学性质对齐结合位点并生成通用位点。Binding Site Match Maker可能是设计多药药物的另一种选择。

MTLD可以阐明药物或天然产物的多种作用机制。例如，伊马替尼是治疗慢性粒细胞白血病（CML）的有效药物。伊马替尼阻止Bcr-Abl蛋白在CML致癌途径中发挥作用[24]. 通过搜索MTLD，除Bcr-Abl外，发现伊马替尼与丝裂原活化蛋白激酶14、核糖二氢烟酰胺脱氢酶、酪氨酸蛋白激酶Syk和c-Kit激酶结合。天然产物白藜芦醇（存在于红酒中）具有相当大的化学多样性和生物活性[25]. 在MTLD中，发现白藜芦醇与七个靶点结合。表中列出了更多药物和天然产品示例2.

从MTLD获得的信息可用于解决药物不良副作用的作用机制。例如，甲基黄嘌呤衍生物茶碱（用于治疗可逆气流阻塞的症状）可能导致头痛、躁动和其他不良的神经副作用。通过MTLD的搜索，发现吡哆醛激酶是茶碱的靶点之一，这可能是茶碱神经毒性作用的潜在机制[26]. 同样，吡格列酮（用于治疗2型糖尿病）也表现出神经副作用，包括中枢神经系统（CNS）抑郁。通过搜索MTLD，发现吡格列酮可以与单胺氧化酶B结合，这可能是中枢神经系统抑制的原因[27].

结合位点的相似性在复合体学中具有重要作用[18]. 开发了几种方法来评估绑定站点的相似性，例如SiteComp[28]和MultiBind[29]. 这些方法为预测蛋白质结合位点的相似性提供了有用的工具，但由于其不完整性，需要改进[30]. 在这种情况下，MTLD可以提供各种结合位点作为训练集或测试集，用于开发新的结合位点比较方法。

结论

在这里，我们描述了基于从PDB中提取的数据集开发一个综合的、可访问Internet的数据库MTLD。迄今为止，MTLD包含1732个MTL，与从12759个PDB结构中提取的14996个结合位点结合。在MTLD中，222个条目是批准的药物，1334个条目是药物类化合物。因此，MTLD可能对开发多药药物非常有帮助，并可能为进一步优化提供潜在候选药物。此外，MTLD可能会揭示：药物的副作用；生物小分子的多重功能；靶蛋白结合位点的相似性。作为PDB的重要扩展，MTLD中将包含越来越多的MTL，这将成为获取MTL有用信息的有效平台。

可用性和要求

MTLD可在http://www.mtdcadd.comMTLD中的数据可免费搜索、下载和进一步分析。

缩写

PDB（PDB）：: 蛋白质数据库
MTL:: 多靶配体
MTLD:: 多目标配体数据库
KEGG公司：: 京都基因和基因组百科全书
TTD（时间）：: 治疗靶点数据库
数据源：: 探索工作室
RMSD：: 均方根偏差
MMTSB公司：: 结构生物学的多尺度建模工具
ERα：: 雌激素受体α
17-HSD1：: 17-羟基类固醇脱氢酶1型

工具书类

Connolly HM、Crary JL、McGoon MD、Hensrud DD、Edwards BS和Edwards WD等。芬氟拉明相关的瓣膜性心脏病。《新英格兰医学杂志》1997；337(9):581–8.
第条中国科学院谷歌学者
Hutcheson JD、Setola V、Roth BL、Merryman WD。血清素受体与心脏瓣膜病——它的意思是2B。药理学治疗。2011;132(2):146–57.
第条中国科学院谷歌学者
Rothman RB、Baumann MH、Savage JE、Rauser L、McBride A、Hufeisen SJ等。5-HT（2B）受体可能参与芬氟拉明和其他5-羟色胺药物相关心脏瓣膜病的证据。循环。2000;102(23):2836–41.
第条中国科学院谷歌学者
Kane J、Honigfeld G、Singer J、Meltzer H.氯氮平治疗难治性精神分裂症。与氯丙嗪的双盲比较。《普通精神病学档案》。1988;45(9):789–96.
第条中国科学院谷歌学者
Costantino L，Barlocco D.设计的多配体：基础研究与临床结果。当前医学化学。2012;19(20):3353–87.
第条中国科学院谷歌学者
Medina-Franco JL、Giulianotti MA、Welmaker GS、Houghten RA。药物发现从单目标范式转向多目标范式。今日毒品发现。2013;18(9–10):495–501.
第条谷歌学者
Morphy R，Rankovic Z.设计了多种配体。一种新兴的药物发现范式。药物化学杂志。2005;48(21):6523–43.
第条中国科学院谷歌学者
彼得斯JU。多药学——敌人还是朋友？医学化学杂志。2013;56(22):8955–71.
第条中国科学院谷歌学者
Proschak E.重新考虑设计的多靶点药物的药物发现管道。今日毒品发现。2013;18(23–24):1129–30.
第条谷歌学者
Reddy AS，Zhang S.多药理学：未来的药物发现。临床药理学专家评论。2013;6(1):41–7.
第条中国科学院谷歌学者
Moya-Garcia AA、Ranea JA。毒品领域协会对多药理学的见解。生物信息学。2013;29(16):1934–7.
第条中国科学院谷歌学者
Rose PW、Beran B、Bi C、Bluhm WF、Dimitropoulos D、Goodsell DS等。RCSB蛋白质数据库：重新设计的网站和web服务。核酸研究，2011；39（数据库问题）：D392–401。
第条中国科学院谷歌学者
Knox C、Law V、Jewison T、Liu P、Ly S、Frolkis A等。DrugBank 3.0：药物“组学”研究的综合资源。核酸研究2011；39（数据库问题）：D1035–41。
第条中国科学院谷歌学者
Kanehisa M、Goto S、Sato Y、Kawashima M、Furumichi M、Tanabe M。数据、信息、知识和原理：回到KEGG中的新陈代谢。核酸研究2014；42（1）：D199–205。
第条中国科学院谷歌学者
Irwin JJ、Sterling T、Mysinger MM、Bolstad ES、Coleman RG。ZINC：一个免费的工具，用于发现生物化学。化学信息模型杂志。2012;52(7):1757–68.
第条中国科学院谷歌学者
Gaulton A、Bellis LJ、Bento AP、Chambers J、Davies M、Hersey A等。ChEMBL：用于药物发现的大规模生物活性数据库。《核酸研究》2012；40（数据库问题）：D1100–7。
第条中国科学院谷歌学者
朱峰，石忠，秦C，陶磊，刘旭，徐凤，等。2012年治疗靶点数据库更新：促进靶向药物发现的资源。《核酸研究》2012；40（数据库问题）：D1128–36。
第条中国科学院谷歌学者
Haupt VJ，Daminelli S，Schroeder M.PDB中的药物混杂：蛋白质结合位点的相似性是关键。公共科学图书馆一号。2013;8（6），e65894。
第条中国科学院谷歌学者
Sturm N，Desaphy J，Quinn RJ，Rognan D，Kellenberger E.配体杂乱分子基础的结构见解。化学信息模型杂志。2012;52(9):2410–21.
第条中国科学院谷歌学者
Hoffmann B，Zaslavskiy M，Vert JP，Stoven V。基于3D原子云比较的新蛋白质结合囊相似性度量：在配体预测中的应用。BMC生物信息学。2010;11:99.
第条谷歌学者
Sael L，Kihara D.通过表面补丁比较检测非同源蛋白质中的局部配体结合位点相似性。蛋白质。2012;80(4):1177–95.
第条中国科学院谷歌学者
Wang R，Lai L，Wang S.进一步开发和验证基于结构的结合亲和力预测的经验评分函数。J计算机辅助模具设计。2002;16(1):11–26.
第条中国科学院谷歌学者
Day JM、Foster PA、Tutill HJ、Parsons MF、Newman SP、Chander SK等。17β-羟基类固醇脱氢酶1型而非12型是激素依赖性乳腺癌内分泌治疗的靶点。国际癌症杂志。2008;122(9):1931–40.
第条中国科学院谷歌学者
Sacha T.伊马替尼治疗慢性髓系白血病：综述。地中海血液传染病杂志。2014;6（1）：e2014007。
第条谷歌学者
Joseph JD，Lu N，Qian J，Sensintaffar J，Shao G，Brigham D等。一种临床相关雄激素受体突变导致对第二代抗雄激素药物苯扎鲁胺和ARN-509产生耐药性。癌症发现。2013;3(9):1020–9.
第条中国科学院谷歌学者
Gandhi AK、Desai JV、Ghatge MS、di Salvo ML、di Biase S、Danso-Danquah R等。人吡哆醇激酶与神经毒素、银杏毒素和茶碱复合体的晶体结构：吡哆醇酶抑制的见解。公共科学图书馆一号。2012;7（7），e40954。
第条中国科学院谷歌学者
Binda C、Aldeco M、Geldenhuys WJ、Tortorici M、Mattevi A、Edmondson DE。格列他宗抗糖尿病药物抑制人单胺氧化酶B的分子研究。ACS医学化学快报。2011;3(1):39–42.
第条谷歌学者
Lin Y，Yoo S，Sanchez R.SiteComp:蛋白质结构中配体结合位点分析的服务器。生物信息学。2012;28(8):1172–3.
第条中国科学院谷歌学者
舒尔曼·佩莱格A、沙茨基M、努西诺夫R、沃尔夫森HJ。MultiBind和MAPPIS：用于蛋白质3D结合位点及其相互作用的多重比对的网络服务器。核酸研究2008；36（Web服务器问题）：W260–4。
第条中国科学院谷歌学者
罗格南EKCSD。如何测量蛋白质配体结合位点之间的相似性？当前计算机辅助药物设计。2008;4(3):12.
谷歌学者

下载参考资料

致谢

我们感谢中国北京中国医学科学院医药生物技术研究所的李瑞明先生对网站建设的亲切帮助。这项工作得到了中国自然科学基金（81311120299，81271844）和中央高校基本科研基金（3142014100）的部分资助。

作者信息

作者和附属机构

中国北京华北科学技术学院
赵晨
中国医学科学院医药生物技术研究所，北京
杨河、周金明
加拿大魁北克省蒙特利尔市犹太总医院戴维斯夫人医学研究所
吴建辉

作者

赵晨
查看作者出版物
您还可以在中搜索此作者公共医学谷歌学者
杨河
查看作者出版物
您还可以在中搜索此作者公共医学谷歌学者
吴建辉
查看作者出版物
您还可以在中搜索此作者公共医学谷歌学者
周晋明
查看作者出版物
您还可以在中搜索此作者公共医学谷歌学者

通讯作者

与的通信周晋明.

其他信息

竞争性利益

作者声明，他们没有相互竞争的利益。

作者的贡献

JHW和JMZ构思了这项研究。CC和JMZ构建了数据库并起草了手稿。CC和JMZ设计并开发了该网站。YH、CC、JMZ参与了数据集的收集和处理。所有作者阅读并同意最终手稿。

权利和权限

开放式访问本文是根据Creative Commons Attribution 4.0国际许可证授权的，该许可证允许以任何媒体或格式使用、共享、改编、分发和复制，只要您对原始作者和来源给予适当的信任，提供指向Creative Commons许可证的链接，并指出是否进行了更改。

要查看此许可证的副本，请访问https://creativecommons.org/licenses/by/4.0/.

转载和许可

关于本文

引用这篇文章

Chen，C.，He，Y.，Wu，J。等人。创建一个免费的、可上网的数据库：多目标配体数据库。化学杂志 7, 14 (2015). https://doi.org/10.1186/s13321-015-0064-8

下载引文

收到:2014年5月28日
认可的:2015年3月30日
出版:2015年4月15日
内政部:https://doi.org/10.1186/s13321-015-0064-8

创建一个免费的、可上网的数据库：多目标配体数据库

摘要

背景

描述

结论

背景