跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
英国药理学杂志。2007年9月;152(1): 38–52.
2007年5月29日在线发布。 数字对象标识:10.1038/sj.bjp.0707307
预防性维修识别码:项目经理1978269
PMID:17533416

合理药物设计的化学组学方法

摘要

药物设计和发现领域的范式正在发生重大变化。在对180多个基因组进行测序的同时,化学合成的高通量微型化以及对基因/蛋白质表达和功能的多种化合物的生物评估为全球药物发现方法开辟了道路,不再关注单个靶点,而是关注整个相关蛋白家族或完整的代谢途径。化学组学是一个新兴的研究领域,旨在系统地研究各种小分子配体对各种大分子靶点的生物效应。由于现有数据(化合物、靶点和分析)和产生的信息(基因/蛋白质表达水平和结合常数)的数量太大,无法人工操作,信息技术在规划、分析和预测化学基因组数据方面发挥着关键作用。本次审查将侧重于预测生物信息学化学基因组学方法促进合理的药物设计,并从多个靶点上的多个化合物的同时生物评估中获取信息。将介绍在配体或靶空间导航的最新方法,并将提及具体的药物设计应用。

关键词:化学基因组学,配体,靶点,虚拟筛选

介绍

直到最近的人类基因组测序(着陆器., 2001;通风口., 2001)长期以来,药物发现一直是一项多学科的工作,旨在优化配体特性(效价、选择性、药代动力学)以达到单一大分子目标。据估计,在2万到25 000个人类基因中,约有3000个可被药物靶点编码(Russ和Lampel,2005年)目前,制药业只对该药理学空间的一个子集(约800个蛋白质)进行了研究(保利尼., 2006). 值得注意的是,随着化合物合成的小型化和并行化,药物化学也得到了平行的推进,以至于超过1000万个非冗余化学结构覆盖了实际的化学空间,其中约1000个结构已被批准为药物。因此,只有一小部分描述当前化学空间的化合物在整个目标空间的一小部分上进行了测试。化学组学是一门新兴的交叉学科,它试图完全匹配靶点和配体空间,并最终识别所有靶点的所有配体(卡隆., 2001). 已经提出了重叠领域的各种定义(化学遗传学、化学基因组学)。在此,我们将考虑包含化学蛋白质组学的化学基因组学的广义定义,即对基因/蛋白质功能的小分子候选药物的研究。从该领域的定义来看,人们很容易理解,化学基因组学将处于化学、生物学和信息学的界面,因为需要数据挖掘来提取可靠的信息。此外,化学和生物学(药物化学)、化学和信息学(化学信息学)、生物学和信息学的方法学(生物信息学)也将在将这些主要学科结合在一起方面发挥重要作用。药物发现的化学组学方法至少依赖于三个组成部分,每个组成部分都需要进行艰苦的实验工作:(1)化合物库,(2)具有代表性的生物系统(目标库、单细胞和整个生物体),以及(3)可靠的读出(例如,基因/蛋白质表达、高通量结合或功能分析)。根据定义,分析化学基因组数据是一个永无止境的学习过程,旨在完成二维(2-D)矩阵,其中目标/基因通常报告为列,化合物报告为行,报告的值通常是结合常数(K(K),集成电路50)或功能影响(例如EC50). 只要所有可能的化合物尚未在所有可能的基因/蛋白质上进行测试,该基质就很稀少。因此,预测化学基因组学将试图通过预测化合物-基因/蛋白质的关系来填补现有的漏洞。生物信息学预测此类数据的方法(各种配体的目标选择性和各种靶点的配体选择性)将跨越纯配体方法(比较已知配体以预测其最可能的靶点)和纯靶点方法(比较靶点或配体结合位点以预测其最大可能的配体)或最终基于目标的方法(使用实验和预测的结合亲和矩阵)。

配体和靶空间的描述

任何基于化学基因组的方法的基本假设都是双重的:(i)具有某些化学相似性的化合物也应该共享靶点,(ii)具有类似配体的靶点应该共享相似的模式(结合位点)。因此,填充完整的理论化学基因组矩阵意味着应从最近的“配体”相邻靶点收集关于“未连接”靶点的数据,并且应从最近“靶点”配体收集关于“非目标”配体的数据。真正的问题是如何测量两个配体或两个目标之间的距离。

配体空间

为了在配体空间中有效导航,首先需要使用适当的属性(描述符)描述化合物,然后使用主方程测量两个化合物之间的距离(相似性度量)。

描述符通常根据其一维(1-D)到三维(3-D)属性的维度进行分类(本德和格伦,2004年) (图1表1)一维描述符计算简单快捷。它们描述了全局属性(例如分子量、原子数和键数),这些属性可以从化学公式中导出,并结合使用来预测吸收、分布、代谢、排泄和毒性属性,如水溶性(沃塔诺., 2004),1-辛醇-水分配系数(克拉克,2005),血浆蛋白结合或生物利用度(., 2006),也可以对化合物进行分类(例如,药物与非药物(Sadowski和Kubinyi,1998年))或来自不同靶家族的配体(墨菲,2006)通过线性或非线性定量结构-活性关系/定量结构-性质关系(QSAR/QSPR)方法。为了便于比较,通常使用化合物的一维线性表示法。这种简化字符串中最流行的是“简化分子输入行输入系统”或SMILES(魏宁格,1988).

保存图片、插图等的外部文件。对象名称为0707307f1.jpg

小分子配体的分子描述符示例

表1

配体描述符

尺寸自然示例
一维全球的分子量、原子数和结合数(例如,氢键供体数、环数)、极表面积、极化率、对数P(P))
二维拓扑拓扑和连接性指数、碎片、子结构(例如,最大公共子结构)、拓扑指纹(例如,结构键)
三维构象的n个-点药效团、形状、场、光谱和指纹

大多数配体描述符都属于二维拓扑描述符家族,其中连接表(原子和键列表)被解析为对原子和键属性进行编码。表示这种信息最直观的方法是结构的二维草图(图1),可以浏览配体库以查找共享特定二维基序(片段、子结构)的化合物。将二维结构转换为分子图(原子为节点)的基于图的方法在子结构搜索和将化合物聚类为子家族方面相对流行(雷蒙德., 2003)但存在计算速度慢的明显缺点。基于指纹的方法速度更快(威利特,2006年)其中,预定义结构事件(原子、片段、环、子结构和2-D药效团)的发生被编码为位串(“0”和“1”数字的序列),称为“指纹”,易于推导、处理和比较。尽管受体识别是一个三维事件,但人们一再发现二维指纹更适合于相似性搜索的真实三维指纹(Sheridan和Kearsley,2002年). 后期描述符编码构象特定属性(原子坐标、三维药效团、形状、电位、场、光谱;表1)因此,通常需要在同一三维笛卡尔空间中比较分子的共同排列(尤其是在必须比较基于网格的场或势的情况下)以及每个配体可访问的构象空间的相关采样。为了避免在虚拟屏幕中出现可能导致误报的对齐步骤,可以将三维信息转换为位字符串,该字符串存储所有可能的药效团元组(双元组、三元组和四元组)的出现及其相应的特征(例如氢键受体、正离子原子等)和特征间距离。因此,比较位串比比较结构容易得多。大多数相似性搜索倾向于使用二维或三维属性的二进制表示来导出简单的相似性指数,最常见的是Tanimoto系数(方程式1)

方程式图像

是化合物A中的位计数,b条是复合B中的位计数c(c)是化合物A和B中的位计数。

因此,Tanimoto系数的范围将从两个完全不同的结构的0到两个相同的化合物的1。

目标空间

蛋白质通常根据其序列和结构分类(表2). 完整的氨基酸序列是第一个有趣的信息(图2),它已经能够通过家族(例如G蛋白偶联受体(GPCR)和激酶)对靶点进行可靠的聚类。然而,在一个蛋白质家族中,序列长度可能会有很大差异(例如,人类GPCR的序列长度从290到6200个残基不等),因此,分析相似性和差异首先需要氨基酸序列的比对,这在大插入/缺失的情况下可能会很棘手。因此,人们可以关注特定的主题(阿特伍德., 2003),是一个蛋白质家族特有的连续残基的集合(例如,视紫红质样GPCR的TM III中的DRY基序)。为了考虑目标的结构组织,可以考虑二维结构(映射α-螺旋线,β-薄片、线圈和随机结构),甚至更适合三维结构(X射线衍射、核磁共振或分子模型提供的原子坐标)和/或相应的折叠。在化学基因组学相关方法中,人们通常关注配体结合位点,其中相关靶点之间的结构相似性通常比考虑完整的一维序列或三维结构时要高得多。

保存图片、插图等的外部文件。对象名为0707307f2.jpg

使用1-D到3-D属性的蛋白质的各种表示。

表2

蛋白质的结构分类

尺寸分类方案数据库
一维顺序UniProt公司(., 2006)和Pfam(芬兰., 2006)
 模式打印(阿特伍德., 2003)和PROSITE(Hulo(呼罗)., 2006)
   
二维次级构造褶皱SCOP公司(Casbon和Saqi,2005年)和CATH(里夫斯., 2006)
   
三维原子坐标偏微分方程(伯曼., 2000)和MODBASE(Pieper公司., 2006)
 结合位点绑定MOAD(., 2005)和sc-PDB(凯伦伯格., 2006)
缩写:MOAD,所有数据库之母;UniProt,通用蛋白质资源。

靶点也可以根据其药理学特征(对一组配体的结合亲和力)进行分类,这意味着根据它们识别的配体的性质(保利尼., 2006). 当然,基于序列和配体的分类之间有相当大的重叠,因为配体通常与蛋白质世界的一个子集相结合。然而,在预测/修改药物药理特征的药物设计中,蛋白质亚家族之间的关系特别有趣。

靶-配体空间

通过浏览存储亲和力或结构信息的完整矩阵,可以在蛋白质-配体空间中直接导航。实验评估x个上的化合物目标(例如,在体外结合亲和力测定)导致基质xy公司数字(例如IC50值),可用于通过多元线性回归预测新化合物对现有目标的亲和力(考瓦尔., 1995),测量结构-两个目标之间的活动关系距离(维也纳., 2004)并预测全球药理概况(克雷杰萨., 2003). 这种方法的一个明显优点是它依赖于真正的绑定亲和力值,并且实验得出的描述符通常会优于计算出的描述符。一个明显的缺点是需要大量的数据来获得真实的信息,例如在学术环境中,类似的方法是不现实的。因此,可以用对接或3-D QSAR方法得出的预测亲和力来代替实验(Matter和Schwab,1999年;福西., 2006),尽管在一个微小的蛋白质空间中外推将受到限制。由于结合自由能极难预测,用分子相互作用描述符取代亲和力是可能的。特别感兴趣的是结构相互作用指纹(IFP)(辛格., 2006)它将蛋白质-配体复合体的原子坐标转换为一个比特串,以结合位点的每个残基为特征,即由共结晶或对接配体形成的分子相互作用类型(例如氢键、芳香相互作用、疏水接触)。比较n个配体和单个蛋白质或一个配体和n个-然后,通过计算1-D IFP之间的距离,对配体进行相关蛋白质的计算(图3).

保存图片、插图等的外部文件。对象名称为0707307f3.jpg

()派生和(b条)通过分子相互作用指纹图比较蛋白质-配体复合物。”为了便于比较,0'和'1'数字被彩色编码的方块取代(蓝色,疏水相互作用;绿色,芳香相互作用;红色,氢键)。

基于配体的化学基因组方法

注释配体库

基于配体的化学基因组方法的基本范式是,与现有生物标记配体具有足够相似性的分子具有更大的共享相同生物特征的概率(图4). 因此,用生物信息(目标、,在体外关联数据和ADMET属性)。近年来,主要是小型生物技术公司通过对文献和专利数据的详尽调查,做出了巨大努力来汇编此类数据(表3). 由于化学基因组方法通常侧重于靶家族,因此这些档案大多与最重要的药物靶家族(GPCR、激酶、核激素受体(NHR)、蛋白酶和磷酸二酯酶)有关。

保存图片、插图等的外部文件。对象名称为0707307f4.jpg

结构-活动关系同源流程图。

表3

生物注释化合物库

数据库描述网站
AurSCOPE公司目标家族知识数据库,包含16万个GPCR配体和77 000个激酶抑制剂的药理学和药物动力学数据http://www.aureus-pharama.com
生物指纹生物概况(在体外2400种小分子药物和类药物化合物网址:http://www.cerep.fr/
化学银行441高通量筛选和小分子微阵列分析中50000种化合物的储存和相关生物特性http://chembank.broad.harvard.edu/
化学生物基靶向中心配体数据库(GPCR、激酶、PDE)http://www.jubilantbiosys.com/
激酶知识库激酶结构&活性和化学合成数据http://www.eidogen-sertanty.com/
MDL药物数据报告132000种生物相关化合物和定义明确的衍生物http://www.mdli.com网站/
MedChem数据库650000种化合物,具有生物和药理信息网址:http://www.gvkbio.com
斯特莱特高度管理的目标复合SAR关系http://www.inpharmatica.co.uk/
袋熊154236个条目,超过307 700个生物活性,涉及1320个独特靶点http://sunsetmolecular.com/

诺华公司的科学家提供了一个很好的例子(舒芬豪尔., 2003)世卫组织通过合并来自不同化学和生物数据库的字段,将化学空间与目标空间联系起来,以提供统一和可搜索的化学基因组数据库。一方面,从MDL药物数据报告中收集了超过110 000种药物配体(表3). 另一方面,对靶点的注释是基于酶和受体的现有分类。将MDDR的“活性键”与目标分类方案联系起来,可以注释53000个化合物,总计799个不同的活性键和相关目标。由于目标序列可与配体相连,因此基于序列的配体相似性搜索是可行的。特定GPCR的注释参考配体被用作恢复新受体配体或接近参考GPCR的受体配体的起点。有趣的是,虚拟筛选方法的效率取决于参考和查询目标之间的系统发育距离。生物注释复合库的另一个直接应用是目标定向组合库的设计(萨夫丘克., 2004)专注于一系列靶点偏好的化学类型。

天然产物还涵盖了一个非常有趣的具有生物相关性的化学空间,因为这些化合物通常通过高度特异的机制与特定的靶点结合,因此受到进化压力。由具有生物注释的天然产物跨越的化学空间最近被描述为一个结构层次的支架树(科赫., 2005),可以通过浏览来设计面向自然生产的化学库。

生物注释化合物库是纠正表型的潜在新生物机制的直接来源。. (2003)设计了一个包含2036个生物活性化合物的文库,涵盖169种不同的生化机制,该文库结构多样,能够在细胞活性和增殖测试中提供85个hits。在85次点击中,有27次被新的生化机制激活。

特权结构

“特权结构”一词是由埃文斯. (1988),他注意到1,4-苯二氮卓支架对各种靶点的混杂性(图5). 特权结构被定义为“对目标空间特定区域(例如GPCR)表现出强烈偏好并适合定向目标复合库设计的子结构/脚手架”(Klabonde和Hessler,2002年). 事实上,最近对类药物配体进行的一项更深入的分析表明,特权只出现在支架的某种程度的化学功能化上(施努尔., 2006). 例如,联苯亚结构不是一种特权结构,而是一种简单的蛋白质结合基序,因为它存在于广泛的蛋白质配体中,对特定的靶家族没有特别的偏好。然而,将联苯基序延伸到2-四唑联苯显著增强了GPCR后一种亚结构的特异性(施努尔., 2006). 值得注意的是,许多亚结构显然在不相关的靶家族中有相应的结合位点(例如,GPCR、激酶、离子通道、蛋白酶、核激素受体)。只有少数几个(参见中的示例图6)对于特定的目标家庭来说确实是有选择性的(施努尔., 2006). 这种精细特异性的一个主要原因是,特殊亚结构的特定结合位点在靶亚家族的进化过程中一直保持不变(邦登斯加德., 2004;Surgand公司., 2006). 当实验筛选目标家族的蛋白质时,家族特异性特权结构对于设计目标库和提高命中率至关重要。Amgen介绍了一个设计目标库的好应用程序(., 2004). 在训练机器学习算法来区分真激酶抑制剂和非激酶抑制剂之后,可以选择多种化学类型来设计一个以激酶为靶点的库,在随后的激酶抑制分析中,该库可获得真抑制剂的高度富集。

保存图片、插图等的外部文件。对象名称为0707307f5.jpg

3H-1,4-苯二氮杂卓-2-酮支架(灰色)跨越不同靶点的许可性。1:Ro-5–3335,HIV-1 Tat抑制剂;2:安定,GABA-A受体配体;3:231023:法尼基转移酶抑制剂;4:CI-1044,磷酸二酯酶4抑制剂;5:普拉那肽、胆囊收缩素(CCK)受体拮抗剂;6:BZ-423,F1F0-ATP酶抑制剂,7:171644,催产素受体拮抗剂,8:309060:β-γ分泌酶抑制剂;9:278588:Stat5激动剂;10:276345:千伏通道阻断剂。

保存图片、插图等的外部文件。对象名称为0707307f6.jpg

邻烷氧基靶向的人GPCR-N个-苯哌嗪特权结构(http://bioinfo-pharma.u-strasbg.fr/hGPCRLig/). 值得注意的是,没有其他与类药物化合物共结晶的蛋白质能够识别这种亚结构(http://bioinfo-pharma.u-strasbg.fr/scPDB/).

基于配体生物信息学筛选

通过简单观察物理化学性质(分子量、对数P(P)、极表面积、氢键供体和受体计数)(墨菲,2006). 因此,人们可以很容易地想象,更复杂的描述符可以用于预测任何给定化合物的全局目标轮廓,前提是要预测的目标由现有配体充分描述。基于配体生物信息学文献中开始出现目标捕鱼的方法(案例., 2005;折弯机., 2006;巴瓦尼., 2006;梅斯特雷., 2006;Nettles公司., 2006;尼迪., 2006;斯坦德尔., 2006). 它们都有三个基本成分:(i)一组参考化合物,其中2-D(支架、子结构、指纹)或3-D描述符(药效团)存储在数据库中,(ii)使用QSAR、机器学习(贝叶斯分类、支持向量机)或药效团搜索的筛选程序,以及(iii)使用上述描述符进行筛选收集,以识别可能与参考化合物具有相同靶点或靶点轮廓的新分子(图7).

保存图片、插图等的外部文件。对象名称为0707307f7.jpg

生物信息学目标捕鱼方法。

梅斯特雷. (案例., 2005;梅斯特雷., 2006)注释了一个针对NHR的分子库。通过对2000个配体和25个受体进行分级分类,化学基因组将桥接配体与靶空间联系起来,可以很容易地将选择性支架与混杂支架区分开来。使用基于以原子为中心的特征对分布的香农熵描述符(SHED),可以筛选任何化合物集合,以识别表示SHED到参考NHR配体的距离超过定义阈值的点击,因此可能共享相同的NHR轮廓。

诺华公司成功应用了一种使用贝叶斯统计的机器学习算法(., 2004)根据生物注释袋熊数据库中化合物的扩展连接性指纹预测目标图谱(尼迪., 2006). 对于每个活动类别(目标),训练一个单独的贝叶斯模型来区分已知的活动和已知的非活动。然后通过预测每个测试化合物成为每个目标配体的概率来预测测试集中最可能的目标化合物。平均而言,在使用Wombat化合物进行训练并测试来自另一个数据集(MDDR)的10个不同活动类别的分子时,77%的时间找到了正确的目标(尼迪., 2006). 当考虑所有训练复合物的全局分布,而不是一系列单个概率时,可以观察到预测的显著改进,其中所有目标关联概率都连接到一个“Bayes亲和指纹”中(折弯机., 2006). 其他2-和3-D描述符已针对同一应用进行了评估。对于结构类似于训练集中的受试化合物,二维描述符比纯三维药效学方法更能预测正确的靶点预测。对于单体(化合物与训练集的分子没有很强的相似性),三维描述符更具预测性。

在所有这些方法中,必须首先根据分子目标从训练集中自动分类化合物,而不必检查每个化合物是否真的与目标结合,在哪里(结合位点)以及如何(受体配体的激动剂或拮抗剂)。因此,存在用不正确的数据训练机器学习算法并生成错误规则的风险。为了克服这个缺点,可以采用更精确但速度较慢的三维策略。其中,一种很有前途的方法是从蛋白质-配体复合物中提取三维药效团,该复合物具有实验确定的原子坐标和药理活性(斯坦德尔., 2006). 通过经典药效团搜索,可以浏览目标注释药效团数据库以识别新化合物的目标。该方法的优点在于参考数据集的质量较高,但受药效团生成步骤和蛋白质数据库(PDB)配体之间观察到的化学多样性的限制(凯伦伯格., 2006). 例如,膜受体(例如,GPCR、离子通道)无法通过这种方法进行预测,这些蛋白质家族的晶体学数据非常稀少,尽管可以从理论上推导出基于同源模型的药效团。

基于靶点的化学基因组方法

控制配体对同一家族相关靶点的选择性是早期药物发现阶段的关键信息。因此,人们对比较同一家族中的所有靶点越来越感兴趣,尤其是那些具有足够结构数据(X射线或核磁共振结构)的靶点,以便能够对未知结构的靶点(例如,蛋白激酶)进行全蛋白质比较建模。基于靶点的化学基因组方法可以分为两类,这取决于是否比较了靶点的氨基酸序列或三维结构。

基于序列的比较

基于序列的方法旨在用于任何类型的目标族,前提是可以对所有要比较的目标进行多重对齐。它们通常用于缺乏高分辨率结构数据妨碍目标比较的目标族。GPCR是基于序列的比较的理想框架(克罗斯利,2004;弗里默尔., 2005;克拉托齐威尔., 2005;Surgand公司., 2006),因为它是药物设计的一个非常重要的靶家族,迄今为止只有一个家族成员(牛视紫红质)结晶(帕尔琴斯基., 2000). 在对所有序列进行比对后,可以提取用于绘制大多数非肽类配体结合位点的关键残基,并将其串联成由几个残基组成的未映射序列(图8),稍后可用于根据序列标识导出距离矩阵(Surgand公司., 2006),序列相似性(克拉托齐威尔., 2005)或物理化学性质(弗里默尔., 2005). 最近使用这种策略提出了372个人类GPCR的基于空洞的详尽聚类(Surgand公司., 2006). 有趣的是,它完美地再现了完整的基于序列的树,这表明在比较一个家族中的目标时,只有少数残基是真正重要的。这种简化使得对特征(结合位点区域)的分析变得简单得多,这些特征通过简单地观察残基守恒来负责选择性或许可性配体结合(克罗斯利,2004;Surgand公司., 2006). 基于空洞的树在药物发现中有几个潜在的应用。一个简单的方法是目标跳跃,这意味着通过首先考虑密切相关受体的已知配体来发现特定受体的受体配体。例如,CRTH2受体拮抗剂可以从现有的血管紧张素II 1型受体拮抗剂中鉴定出来(弗里默尔., 2005),因为这两种受体都是在GPCR空洞偏倚树中发现的。此外,通过处理那些负责选择性/杂乱性的残基,有助于针对树的特定区域设计目标库(弗里默尔., 2005;克拉托齐威尔., 2005).

保存图片、插图等的外部文件。对象名称为0707307f8.jpg

以人类腺苷受体为例的靶点序列比较(Surgand公司., 2006). ()关键空腔衬里残留物的选择和(b条)根据残留物守恒进行聚类。

基于结构的比较

只有当目标家族有足够好的结构模板(X射线结构)来提供其他相关目标的同源模型时,才可能进行基于结构的比较。一般来说,只有配体结合位点(., 2005;凯伦伯格., 2006)进行比较,因为这种比较的基本目的是了解已知配体相关靶点的选择性/许可性特征。

第一种可能的策略是比较空腔中计算出的分子相互作用场以进行比较(Naumann and Matter,2002年;霍普., 2006;Pirard and Matter,2006年). 从所有靶的结构排列开始,在围绕配体结合位点的三维网格的每个点滚动几个探针原子(例如sp3碳原子)所产生的相互作用能量被连接成MIF向量,它可以放置在全局矩阵中,其中行描述给定三维网格点处的目标和列交互能量(图9)通过主成分分析矩阵,可以比较MIF并对同源目标进行聚类(Naumann and Matter,2002年;Pirard and Matter,2006年)或通过计算MIF距离,该距离随后在目标树中转换(霍普., 2006). 这种方法的一个明显问题是,这种比较在很大程度上取决于结构排列、网格分辨率和探针原子的选择。此外,它不能应用于不同家庭的目标。然而,它已成功应用于蛋白激酶(Naumann and Matter,2002年;霍普., 2006),丝氨酸蛋白酶(霍普., 2006)、基质金属蛋白酶(Pirard and Matter,2006年)和核激素受体(霍普., 2006)精确定位可解释选择性或混杂配体结合的空腔区域或子口袋,从而指导化合物库的设计朝向理想的选择性模式。

保存图片、插图等的外部文件。对象名称为0707307f9.jpg

基于分子相互作用场(MIF)的目标聚类。

为了避免先前报告的结构对齐偏差,可以直接比较三维原子蛋白质坐标来测量两个目标之间的距离。全局结构对齐方法(辛迪亚洛夫和伯恩,1998年;霍尔姆和帕克,2000年;斯坦德利., 2005)通常通过比较重叠序列片段来计算结构等效的残基数。然而,这种方法对于不连续序列(活性位点)和显示不同折叠的蛋白质并不适用。第二种方法是识别预定义的结构基序或模板(例如,丝氨酸蛋白酶中的Ser–His–Asp催化三联体),并通过匹配模板将查询与参考蛋白对齐(阿提米乌克., 1994;华莱士., 1997). 然而,许多蛋白质(例如激酶、GPCR、离子通道)可能共享独特配体(ATP)的结合位点,而不共享任何结构模板相似性。最新的生成结构比对的方法是通过代表性位置的物理化学性质来描述蛋白质。分子表面可以很容易地离散成化学标记的稀疏点(罗森., 1998)或图形(基诺希塔和中村,2003年)因此,对齐以最大化与任何参考的曲面重叠。已成功浏览蛋白质表面数据库(eF-site),通过检测单核苷酸结合位点来预测假想古菌蛋白(MJ0226)的功能(基诺希塔和中村,2003年). 然而,基于表面的比较相对较慢,因此与蛋白质组范围的比较不兼容。最新和更快的方法(施密特., 2002;Jambon公司., 2003;舒尔曼·佩莱., 2004;权力., 2006;Gold and Jackson,2006年)在过去5年中开发的。它们都有一个共同点,即通过编码同源残基的物理化学性质(氢键能力、芳香性、疏水性、电荷)的伪中心(沿着或靠近每个感兴趣侧链的虚拟原子)来表示感兴趣的活性位点,伪中心通过边连接在一起,从而定义了分子图。对齐是通过检测最大公共子图进行的(团检测)(加德纳., 1997)或几何散列(Nussinov和Wolfson,1991年)从定义的伪中心。因此,对于具有完全不同折叠和催化活性的蛋白质,可以检测到配体结合亚基的局部相似性。预测的类似结合位点甚至可以在全球网络中连接在一起,以更好地将蛋白质定位在目标空间(Zhang和Grigorov,2006年).

远处蛋白质结合位点相似性的一个很好的例子是韦伯. (2004),who基于COX-2和HCA结合口袋的相似性检测了基于芳基磺酰胺的COX-2抑制剂与人碳酸酐酶(HCA)的交叉反应性。这些匹配技术的一个问题是,计算出的相似性分数(通常取决于原子/伪中心/三角形匹配的数量)并不总是容易解释,特别是对于不同维度的活性位点,因为大型活动网站往往比小型网站呈现更多的匹配,即使后者更相似。因此,需要类似于用于比较配体的标准化距离度量。提出了一种有前途的方法Surgand(2006年),who通过无量纲80-三角形球体离散活动场地并投影,来自cβ空穴衬里残留物的原子到球体中心,各种拓扑和物理化学描述符。因此,通过将球体每个三角形之间描述子空间的归一化差值相加,即可简单地计算出两个活动站点之间的距离。该方法能够识别远程绑定站点的相似性(图10)在GPCR(GPR30)和NHR(雌激素受体α)共享4-羟基三苯氧胺作为高亲和力配体(Revankar公司., 2005).

保存图片、插图等的外部文件。对象名称为0707307f10.jpg

从sc-PDB目标库中筛选1060个结合位点的非冗余子集(凯伦伯格., 2006)用于配体结合位点,类似于GPR30用于4-羟基-氨甲氧基芬的配体结合部位。()通过降低与GPR30 4-羟基-三甲氧基苯结合位点的相似性(范围从1到0)对sc-PDB条目进行排序(根据30个残基的共识列表推断,该列表界定了大多数GPCR配体的典型非肽类结合位点,如Surgand公司. (2006).3ert sc-PDB条目(雌激素受体中的4-羟基-三甲氧基苯结合位点α)在1060个被调查的结合位点中排名第二。(b条)预测GPR30(蓝色)与ER的对齐-α4-羟基三苯氧胺(白色球和棒)的结合位点(绿色)。这两个结合位点都有一个可水进入的负电荷残基和一个埋藏的疏水区域(根据SiteAlign程序,相似性指数为0.79(Surgand公司., 2006)).

这种比较的当前速度使得可以定义所有对所有的相似矩阵(施密特., 2002;舒尔曼·佩莱., 2004;Gold and Jackson,2006年),并为各种应用打开了大门:(i)配体结合位点的功能分析和分类,(ii)预测潜在配体,以及(iii)预测靶向特定蛋白质引起的副作用。

比较配体结合位点的另一种方法是评估apo或全蛋白的已知X射线结构的潜在配体结合包膜的相似性(., 2005). 最近提出了人类囊体的初稿,它是一组943种结晶的人类蛋白质的所有可能的配体结合包膜的集合(., 2005)并根据包络相似性进行聚类。有趣的是,基于配体包膜的树仅部分匹配基于靶蛋白氨基酸序列或结合配体相似性的替代树(., 2005).

最近提出的另一种比较同一家族蛋白质的方法是观察包装缺陷(费尔南德斯., 2004)定位于所谓的“脱氢”(主链重原子与未满足的氢键伙伴),这是蛋白质与潜在配体相互作用能力的良好指标,可以从氨基酸序列中预测。32种PDB-报告激酶之间的堆积距离与根据17种抑制剂的实验亲和矩阵估算的这些激酶之间的药理学距离几乎相同(Fernandez和Maddipati,2006年)并有效指导针对包装缺陷的各种酶的选择性抑制剂的结构设计(费尔南德斯,2005).

基于靶配体的化学基因组方法

靶结合位点的化学注释

可以浏览许多带有生物注释的化学库(表3)将化学品与目标空间联系起来,并将基于配体的设计重点放在目标系列上(折弯机., 2006;Nettles公司., 2006;尼迪., 2006). 然而,就结合位点信息缺失而言,比较具有相同靶点但不具有相同结合位点的化合物(例如,正构配体和变构配体)存在潜在风险。因此,根据配体的化学类型严格注释蛋白质序列和/或结合位点非常重要。SMID(小分子相互作用数据库)档案是一个有趣的倡议,通过域特异配体注释蛋白质氨基酸序列(斯奈德., 2006). 共6300个配体,覆盖230个000个实验观察到的结构域/小分子相互作用被存储在关系数据库中,通过使用反向定位特定基本局部对齐搜索(BLAST)程序将其结构域与已知蛋白质结构进行比较,可以浏览该数据库以预测未知三维结构的最可能的蛋白质配体(费尔德曼., 2006). PDB中的配体标记结合位点在几个数据库中进行了注释(凯伦伯格., 2006),但只有两个(BindingMOAD,sc-PDB;表3)从药理学的角度考虑配体,因此对化学基因组方法很感兴趣。此类数据库可用于优先选择配体或分子支架,以设计覆盖明确目标空间的靶向化合物库(图11).

保存图片、插图等的外部文件。对象名称为0707307f11.jpg

查询sc-PDB化学基因组数据库(http://bioinfo-pharma.u-strasbg.fr/scPDB)符合五项规则(利平斯基., 2001)小分子量片段(分子量<300,克隆蛋白<3,氢键供体计数<3,H键受体计数<6)与蛋白激酶共结晶。

二维搜索

要浏览和预测蛋白质-配体复合物,需要从知识数据库中为配体和蛋白质建立简单的描述符(表3)并将它们连接成单个蛋白质-配体描述。编码此信息的最简单方法是从实验性结合亲和矩阵开始(考瓦尔., 1995;克雷杰萨., 2003;维也纳., 2004)并定义适当的QSAR/QSPR模型,以通过一般邻域行为模型预测新化合物对注册目标或完整虚拟轮廓的亲和力(克雷杰萨., 2003). 最近提出了另一种用于脱蛋白GPCR的方法,在这种方法中,如果高亲和力络合物(pK(K)>7) 已在PDSP数据库中报告(http://pdsp.med.unc.edu/). 从5319个非冗余已知复合物中训练机器学习算法,并将其应用于一组911 415个虚拟复合物(NCI数据库中的55个孤儿受体和34 753个类药物化合物),以预测最可能的关联(博克和高格,2005年). 样本外验证(发现混杂配体的受体和单个靶点的配体)与文献数据基本一致,一些预测仍在等待实验验证。

三维搜索

预测配体假定靶点的一种简单方法是将化合物库的每个配体对接到目标库的每个活性位点。该策略已被多个小组验证,并证明能够恢复已知目标的已知配体,预测其离靶点,从而预测一些潜在的副作用(陈和智,2001;保罗., 2004). 到目前为止,文献中描述的利用对接方法的单一成功目标捕获应用程序(穆勒., 2006). 因此,反向对接首先需要一个高质量的绑定位点三维数据集,其自动设置非常困难,其次需要一个准确的评分函数来正确排列目标。一个问题是,基于能量的评分函数在通过降低结合自由能来量化非常异质的蛋白质-配体复合物方面并不擅长(费拉拉., 2004)为了有效地选择目标,需要其他得分方式。最有希望的方法之一是计算蛋白质与其配体之间的IFP。实际上,IFP是简单的位串,将蛋白质-配体相互作用的三维信息转换为简单的一维位向量表示(图3)可以通过使用传统指标(例如,Tanimoto系数、欧几里得距离)快速进行比较。IFP的使用显示出几个有前景的特征:(i)提高对接实验中姿态预测的质量(., 2004;马可和罗格南,2006年); (ii)根据相关抑制剂与靶亚家族相互作用的多样性,对一组相关抑制剂的蛋白-配体相互作用进行聚类(丘瓦基., 2005;马可和罗格南,2006年); (iii)协助基于目标的图书馆设计(., 2006).

然而,与停靠无关的三维方法也可能成为预测蛋白质-配体复合物的一种有趣方法。一个重要的问题是用类似的描述符对蛋白质和配体属性进行编码,这样就可以通过使用第二个描述符作为查询来检索一个伙伴。CoLiBRI(基于受体信息的互补配体)方法提出了一种有前景的解决方案(奥洛夫., 2006)其中,配体和活性中心原子由同一个矢量的分子描述符描述,这些描述符是从孤立原子的形状和电子特性派生出来的。因此,通过将活性位点的模式映射到其互补配体的模式上,可以直接关联活性位点与其配体之间的化学相似性。当应用于800个高分辨率PDB复合物的测试数据集时,互补配体在90%的测试活性位点的大型库中排名前1%。活性位点的准确度显著下降,与测试集中的活性位点差异很大,但仍可用作去除最不可能的配体的预过滤步骤(奥洛夫., 2006).

结束语

随着对药物感兴趣的靶点和配体的高通量数据(结构、结合亲和力和功能效应)变得可用,合理药物发现的化学组学方法在过去几年中呈爆炸式增长。针对配体或靶邻域,提出了许多连接这些数据的方法。清晰的数据组织和存储对于培育此类应用程序是必要的,并且对于最有趣的目标家族(激酶、GPCR和NHR)来说,这些应用程序开始出现。在最近的一个特征中,可以通过使用化学基因组数据预测更早更好地控制配体选择性。这并不意味着将设计出更具选择性的配体,而是简单地说,观察到的化合物选择性特征将与治疗用途兼容。此外,在目标空间定位新的基因组靶点并利用相关的化学信息后,可以更好地解决这些靶点。

缩写

一维一维的
二维二维的
三维三维
ADMET公司吸收、分布、代谢、排泄和毒性
全球采购控制报告G蛋白偶联受体
国家公路局核激素受体
QSPR公司数量结构-属性关系
定量构效关系定量结构-活动关系

笔记

利益冲突

提交人表示没有利益冲突。

工具书类

  • An J,Totrov M,Abagyan R.Pocketome通过配体结合包膜的综合鉴定和分类。分子细胞蛋白质组学。2005;4:752–761.[公共医学][谷歌学者]
  • Artymiuk PJ、Poirrette AR、Grindley HM、Rice DW、Willett P.蛋白质结构中氨基酸侧链三维模式识别的图形理论方法。分子生物学杂志。1994;243:327–344.[公共医学][谷歌学者]
  • Attwood TK、Bradley P、Flower DR、Gaulton A、Maudling N、Mitchell AL等,《打印及其自动补充》,prePRINTS。核酸研究。2003;31:400–402. [PMC免费文章][公共医学][谷歌学者]
  • Bender A,Glen RC。分子相似性:分子信息学中的一项关键技术。有机生物化学。2004;2:3204–3218.[公共医学][谷歌学者]
  • Bender A、Jenkins JL、Glick M、Deng Z、Nettles JH、Davies JW。”贝叶斯亲和指纹提高了虚拟筛选中的检索率,并定义了正交生物活性空间:多目标药物何时是可行的概念。模型化学杂志。2006;46:2445–2456.[公共医学][谷歌学者]
  • Berman HM、Westbrook J、Feng Z、Gilliland G、Bhat TN、Weissig H等。蛋白质数据库。核酸研究。2000;28:235–242. [PMC免费文章][公共医学][谷歌学者]
  • Bhavani S、Nagargadde A、Thawani A、Sridhar V、Chandra N。基于子结构的支持向量机分类器,用于预测不同类别药物的不良反应。化学信息模型杂志。2006;46:2478–2486.[公共医学][谷歌学者]
  • Bock JR,Gough DA。孤儿G蛋白偶联受体配体的虚拟筛选。化学信息模型杂志。2005;45:1402–1414.[公共医学][谷歌学者]
  • Bondensgaard K、Ankersen M、Thogersen H、Hansen BS、Wulff BS、Bywater RP。G蛋白偶联受体对特权结构的识别。医学化学杂志。2004;47:888–899.[公共医学][谷歌学者]
  • Caron PR、Mullican MD、Mashal RD、Wilson KP、Su MS、Murcko MA。药物发现的化学组学方法。当前操作化学生物。2001;5:464–470.[公共医学][谷歌学者]
  • Casbon J,Saqi MA。S4:SCOP超家族的基于结构的序列比对。核酸研究。2005;33:D219–D222。 [PMC免费文章][公共医学][谷歌学者]
  • Cases M、Garcia-Serna R、Hettne K、Weeber M、van der Lei J、Boyer S等。针对核受体家族的注释化合物库的化学和生物特征分析。当前顶级药物化学。2005;5:763–772.[公共医学][谷歌学者]
  • 陈毅中,志总。配体-蛋白质反向对接及其在计算机搜索小分子蛋白质靶点中的潜在应用。蛋白质。2001;43:217–226.[公共医学][谷歌学者]
  • Chuaqi C,Deng Z,Singh J.蛋白激酶抑制剂复合物的相互作用谱及其在虚拟筛选中的应用。医学化学杂志。2005;48:121–133.[公共医学][谷歌学者]
  • Clark M.基于广义碎片-子结构的属性预测方法。化学信息模型杂志。2005;45:30–38.[公共医学][谷歌学者]
  • Crossley R.针对G蛋白偶联受体的筛选文库设计。当前顶级药物化学。2004;4:581–588.[公共医学][谷歌学者]
  • Deng Z,Chuaqui C,Singh J.结构相互作用指纹(SIFt):一种分析三维蛋白质-配体结合相互作用的新方法。医学化学杂志。2004;47:337–344.[公共医学][谷歌学者]
  • Deng Z,Chuaqui C,Singh J.利用蛋白质-配体相互作用约束进行基于知识的靶向库设计。医学化学杂志。2006;49:490–500.[公共医学][谷歌学者]
  • Evans BE、Rittle KE、Bock MG、DiPardo RM、Freidger RM、Whitter WL等。药物发现方法:开发有效、选择性、口服有效的胆囊收缩素拮抗剂。医学化学杂志。1988;31:2235–2346.[公共医学][谷歌学者]
  • Feldman HJ、Snyder KA、Ticoll A、Pintile G、Hogue CW。来自蛋白质数据库的完整小分子数据集。FEBS信函。2006;580:1649–1653.[公共医学][谷歌学者]
  • Fernandez A.在药物设计中作为选择性过滤器的不完整蛋白质包装。结构。2005;13:1829–1836. [PMC免费文章][公共医学][谷歌学者]
  • Fernandez A,Maddipati S.药物靶向激酶交叉反应的先验推断。医学化学杂志。2006;49:3092–3100.[公共医学][谷歌学者]
  • Fernandez A、Rogale K、Scott R、Scheraga HA。通过包裹HIV-1蛋白包装缺陷设计抑制剂。美国国家科学院程序。2004;101:11640–11645. [PMC免费文章][公共医学][谷歌学者]
  • Ferrara P,Gohlke H,Price DJ,Klebe G,Brooks CL.,III评估蛋白质-配体相互作用的评分函数。医学化学杂志。2004;47:3032–3047.[公共医学][谷歌学者]
  • Finn RD、Mistry J、Schuster-Bockler B、Griffiths-Jones S、Hollich V、Lassmann T等。Pfam:家族、网络工具和服务。核酸研究。2006;34:D247–D251。 [PMC免费文章][公共医学][谷歌学者]
  • Frimurer TM、Ulven T、Elling CE、Gerlach LO、Kostenis E、Hogberg T。确定7TM受体之间配体结合关系的物理发生方法。生物有机医药化学快报。2005;15:3707–3712.[公共医学][谷歌学者]
  • Fukunishi Y,Kubota S,Nakamura H。分子相互作用能量的降噪方法:在电子药物筛选和电子靶蛋白筛选中的应用。化学信息模型杂志。2006;46:2071–2084.[公共医学][谷歌学者]
  • Gardiner EJ,Artymiuk PJ,Willett P.Clique-匹配三维分子结构的检测算法。J摩尔图模型。1997;15:245–253.[公共医学][谷歌学者]
  • Gold ND,Jackson RM。用于探索功能关系的蛋白质-配体结合位点的折叠独立结构比较。分子生物学杂志。2006;355:1112–1124.[公共医学][谷歌学者]
  • Holm L,Park J.DaliLite蛋白质结构比较工作台。生物信息学。2000;16:566–567.[公共医学][谷歌学者]
  • Hoppe C,Steinbeck C,Wohlfahrt G.基于网格图知识潜能的配体结合位点的分类和比较。摩尔图模型。2006;24:328–340.[公共医学][谷歌学者]
  • Hu L、Benson ML、Smith RD、Lerner MG、Carlson HA。绑定MOAD(所有数据库之母)蛋白质。2005;60:333–340.[公共医学][谷歌学者]
  • Hulo N、Bairoch A、Bulliard V、Cerutti L、De Castro E、Langendijk-Genevaux PS等。PROSITE数据库。核酸研究。2006;34:D227–D230。 [PMC免费文章][公共医学][谷歌学者]
  • Jambon M,Imberty A,Deleage G,Geourjon C.检测蛋白质结构中常见3D位点的新生物信息学方法。蛋白质。2003;52:137–145.[公共医学][谷歌学者]
  • Kauvar LM、Higgins DL、Villar HO、Sportsman JR、Engqvist-Goldstein A、Bukar R等。通过亲和指纹预测配体与蛋白质的结合。化学生物。1995;2:107–118.[公共医学][谷歌学者]
  • Kellenberger E、Muller P、Schalon C、Bret G、Foata N、Rognan D.sc-PDB:蛋白质数据库中的药物结合位点注释数据库。化学信息模型杂志。2006;46:717–727.[公共医学][谷歌学者]
  • Kinoshita K,Nakamura H.使用分子表面数据库eF-site通过相似性搜索识别蛋白质生化功能。蛋白质科学。2003;12:1589–1595. [PMC免费文章][公共医学][谷歌学者]
  • Klabunde T,Hessler G.靶向G蛋白偶联受体的药物设计策略。化学生物化学。2002;:928–944.[公共医学][谷歌学者]
  • Koch MA、Schuffenhauer A、Scheck M、Wetzel S、Casaulta M、Odermatt A等。绘制生物相关化学空间:天然产物的结构分类(SCONP)美国国家科学院程序。2005;102:17272–17277. [PMC免费文章][公共医学][谷歌学者]
  • Kratochwil NA、Malherbe P、Lindemann L、Ebeling M、Hoener MC、Muhlemann A等。G蛋白偶联受体跨膜结合囊分析的自动化系统:排列、基于受体的药效团及其应用。化学信息模型杂志。2005;45:1324–1336.[公共医学][谷歌学者]
  • Krejsa CM、Horvath D、Rogalski SL、Penzotti JE、Mao B、Barbosa F等。预测ADME特性和副作用:生物打印方法。当前药物发现进展。2003;6:470–480.[公共医学][谷歌学者]
  • Lander ES、Linton LM、Birren B、Nusbaum C、Zody MC、Baldwin J等。人类基因组的初始测序和分析。自然。2001;409:860–921.[公共医学][谷歌学者]
  • 加利福尼亚州利宾斯基、伦巴多F、多明尼BW、费尼PJ。在药物发现和开发环境中评估溶解度和渗透性的实验和计算方法。Adv Drug Deliv修订版。2001;46:3–26.[公共医学][谷歌学者]
  • Marcou G,Rognan D.利用分子相互作用指纹优化支架对接。化学信息模型杂志。2006;47:195–207.[公共医学][谷歌学者]
  • Matter H,Schwab W.基质金属蛋白酶抑制剂的亲和力和选择性:从配体和蛋白质的角度进行的化学计量学研究。医学化学杂志。1999;42:4506–4523.[公共医学][谷歌学者]
  • Mestres J、Martin-Couce L、Gregori-Puigjane E、Cases M、Boyer S.Ligand-based approach to生物信息学药理学:核受体分析。化学信息模型杂志。2006;46:2725–2736.[公共医学][谷歌学者]
  • Morphy R.目标家族和功能活性对临床前化合物物理化学性质的影响。医学化学杂志。2006;49:2969–2978.[公共医学][谷歌学者]
  • Muller P、Lena G、Boilard E、Bezzine S、Lambeau G、Guichard G等。生物信息学支架导向库的导向靶向鉴定:1,3,5-三氮杂烷-2,6-二酮作为新型磷脂酶A2抑制剂。医学化学杂志。2006;49:6768–6778.[公共医学][谷歌学者]
  • Naumann T,Matter H。使用配体结合位点的3D分子相互作用场分析对蛋白激酶进行结构分类:靶家族景观。医学化学杂志。2002;45:2366–2378.[公共医学][谷歌学者]
  • Nettles JH、Jenkins JL、Bender A、Davies JW、Glick M.《化学和生物空间桥梁:使用2D和3D分子描述符进行目标捕捞》。医学化学杂志。2006;49:6802–6810.[公共医学][谷歌学者]
  • Nidhi、Glick M、Davies JW、Jenkins JL。利用化学基因组学数据库训练的多类别贝叶斯模型预测化合物的生物靶点。化学信息模型杂志。2006;46:1124–1133.[公共医学][谷歌学者]
  • Nussinov R,Wolfson HJ。利用计算机视觉技术有效检测生物大分子中的三维结构基序。美国国家科学院程序。1991;88:10495–10499. [PMC免费文章][公共医学][谷歌学者]
  • Oloff S,Zhang S,Sukumar N,Breeman C,Tropsha A.配体-受体互补性的化学计量分析:基于受体信息识别互补配体(CoLiBRI)化学信息模型杂志。2006;46:844–851. [PMC免费文章][公共医学][谷歌学者]
  • Palczewski K、Kumasaka T、Hori T、Behnke CA、Motoshima H、Fox BA等。视紫红质的晶体结构:g蛋白偶联受体。科学。2000;289:739–745.[公共医学][谷歌学者]
  • Paolini GV、Shapland RH、van Hoorn WP、Mason JS、Hopkins AL。药理学空间的全球映射。国家生物技术。2006;24:805–815.[公共医学][谷歌学者]
  • Paul N、Kellenberger E、Bret G、Muller P、Rognan D。通过蛋白质数据库的虚拟筛选恢复特定配体的真实靶点。蛋白质。2004;54:671–680.[公共医学][谷歌学者]
  • Pieper U、Eswar N、Davis FP、Braberg H、Madhusudhan MS、Rossi A等。MODBASE:一个注释的比较蛋白质结构模型和相关资源的数据库。核酸研究。2006;34:D291–D295。 [PMC免费文章][公共医学][谷歌学者]
  • Pirard B,Matter H。基质金属蛋白酶靶家族景观:基于蛋白质结合位点分析的配体选择性化学计量学方法。医学化学杂志。2006;49:51–69.[公共医学][谷歌学者]
  • Powers R、Copeland JC、Germer K、Mercier KA、Ramanathan V、Revesz P。蛋白质功能注释和药物设计中蛋白质活性位点结构的比较。蛋白质。2006;65:124–135.[公共医学][谷歌学者]
  • Raymond JW,Blankley CJ,Willett P.使用基于图形和指纹的相似性度量比较化学聚类方法。J摩尔图模型。2003;21:421–433.[公共医学][谷歌学者]
  • Reeves GA、Dallman TJ、Redfern OC、Akpor A、Orengo CA。CATH数据库中域超家族的结构多样性。分子生物学杂志。2006;360:725–741.[公共医学][谷歌学者]
  • Revankar CM、Cimino DF、Sklar LA、Arterburn JB、Prossnitz ER。跨膜细胞内雌激素受体介导快速细胞信号传导。科学。2005;307:1625–1630.[公共医学][谷歌学者]
  • Root DE,Flaherty SP,Kelley BP,Stockwell BR。使用注释化合物库进行生物机制剖析。化学生物。2003;10:881–892.[公共医学][谷歌学者]
  • Rosen M,Lin SL,Wolfson H,Nussinov R.活性位点和功能相似性搜索中的分子形状比较。蛋白质工程。1998;11:263–277.[公共医学][谷歌学者]
  • Russ AP,Lampel S.药物基因组:更新。今日毒品发现。2005;10:1607–1610.[公共医学][谷歌学者]
  • Sadowski J,Kubinyi H.区分药物和非药物的评分方案。医学化学杂志。1998;41:3325–3329.[公共医学][谷歌学者]
  • Savchuk NP,Balakin KV,Tkachenko SE。利用带注释的化学库探索化学基因组知识空间。当前操作化学生物。2004;8:412–417.[公共医学][谷歌学者]
  • Schmitt S,Kuhn D,Klebe G。一种独立于序列和折叠同源性检测蛋白质间相关功能的新方法。分子生物学杂志。2002;323:387–406.[公共医学][谷歌学者]
  • Schnur DM,Hermsmier MA,Tebben AJ。目标家庭私有子结构是否真正享有特权。医学化学杂志。2006;49:2000–2009.[公共医学][谷歌学者]
  • Schuffenhauer A、Floersheim P、Acklin P、Jacoby E.反映目标蛋白相似性的配体相似性度量。化学信息与计算科学杂志。2003;43:391–405.[公共医学][谷歌学者]
  • Sheridan RP,Kearsley SK。为什么我们需要这么多化学相似性搜索方法。今日毒品发现。2002;7:903–911.[公共医学][谷歌学者]
  • Shindyalov IN,Bourne PE。通过最优路径的增量组合延伸(CE)进行蛋白质结构比对。蛋白质工程。1998;11:739–747.[公共医学][谷歌学者]
  • Shulman Peleg A、Nussinov R、Wolfson HJ。蛋白质结构中功能位点的识别。分子生物学杂志。2004;339:607–633. [PMC免费文章][公共医学][谷歌学者]
  • Singh J,Deng Z,Narale G,Chuaqi C.结构相互作用指纹:一种组织、挖掘、分析和设计蛋白质小分子复合物的新方法。化学生物药物设计。2006;67:5–12.[公共医学][谷歌学者]
  • Snyder KA、Feldman HJ、Dumoniter M、Salama JJ、Hogue CW。基于结构域的小分子结合位点注释。BMC生物信息学。2006;7:152. [PMC免费文章][公共医学][谷歌学者]
  • Standley DM,Toh H,Nakamura H.GASH:一种改进算法,用于最大化两个蛋白质结构之间的等效残基数。BMC生物信息学。2005;6:221. [PMC免费文章][公共医学][谷歌学者]
  • Steindl TM、Schuster D、Laggner C、Langer T。平行筛选:药效团建模和虚拟筛选的新概念。化学信息模型杂志。2006;46:2146–2157.[公共医学][谷歌学者]
  • Surgand JS公司。新世纪生物信息技术的发展为接受者提供了新的保障。路易斯·巴斯德大学-斯特拉斯堡I:法国;2006[谷歌学者]
  • Surgand JS、Rodrigo J、Kellenberger E、Rognan D。人类G蛋白偶联受体跨膜结合腔的化学基因组分析。蛋白质。2006;62:509–538.[公共医学][谷歌学者]
  • Venter JC、Adams MD、Myers EW、Li PW、Mural RJ、Sutton GG等。人类基因组序列。科学。2001;291:1304–1351.[公共医学][谷歌学者]
  • Vieth M、Higgs RE、Robertson DH、Shapiro M、Gragg EA、Hemmere H.激酶抑制剂和靶点的结构生物学和化学基因组学。Biochim生物物理学报。2004;1697:243–257.[公共医学][谷歌学者]
  • Votano JR、Parham M、Hall LH、Kier LB、Hall LM。基于大数据集,使用拓扑结构表示的几个QSPR模型预测水溶性。化学生物多样性。2004;1:1829–1841.[公共医学][谷歌学者]
  • Wallace AC、Borkakoti N、Thornton JM.TESS:一种几何散列算法,用于导出用于搜索结构数据库的三维坐标模板。应用于酶活性部位。蛋白质科学。1997;6:2308–2323. [PMC免费文章][公共医学][谷歌学者]
  • Wang J,Krudy G,Xie XQ,Wu C,Holland G。生物利用度、蛋白质结合和尿排泄的遗传算法优化QSPR模型。化学信息模型杂志。2006;46:2674–2683.[公共医学][谷歌学者]
  • Weber A、Casini A、Heine A、Kuhn D、Supuran CT、Scozzafava A等。COX-2选择性塞来昔布对碳酸酐酶的意外纳米抑制:由于相关结合位点识别,出现了新的药理机遇。医学化学杂志。2004;47:550–557.[公共医学][谷歌学者]
  • Weininger D.史密斯1。介绍和编码规则。化学与计算科学杂志。1988;28:31–36. [谷歌学者]
  • Willett P.使用2D指纹进行基于相似性的虚拟筛选。今日毒品发现。2006;11:1046–1053.[公共医学][谷歌学者]
  • Wu CH、Apweiler R、Bairoch A、Natale DA、Barker WC、Boeckmann B等。通用蛋白质资源(UniProt):蛋白质信息的扩展领域。核酸研究。2006;34:D187–D191。 [PMC免费文章][公共医学][谷歌学者]
  • Xia X,Maliski EG,Gallant P,Rogers D.使用贝叶斯模型对激酶抑制剂进行分类。医学化学杂志。2004;47:4463–4470.[公共医学][谷歌学者]
  • Zhang Z,Grigorov MG.蛋白质结合位点的相似网络。蛋白质。2006;62:470–478.[公共医学][谷歌学者]

文章来自英国药理学杂志由以下人员提供英国药理学学会