搜索示例

这个高级搜索查询生成器提供了一个强大的搜索界面,可以使用多种搜索条件构建复杂的科学查询,这些条件组合了不同的属性、输入、运算符和分组。下面提供了几个示例查询。

全文和属性搜索

您可以使用“全文”选项在“高级搜索”菜单上的所有可用属性中搜索单词或短语。“全文”搜索允许您快速查找与特定主题相关的结果,而不管上下文如何。然而,您的搜索越一般,返回的结果就越多,结果与搜索条件的相关性也就越松散。请注意,“高级搜索”属性包括来自mmCIF文件的术语以及来自第三方生物资源的集成数据。

这个搜索示例查询在任何属性中具有“荧光素酶”术语的结构,并将PubMed摘要从搜索中排除,以避免不需要的匹配。

如果可能,最好显式指定特定的搜索属性,而不是使用“全文”搜索。使用以下示例查看如何使用“属性搜索”选项执行特定搜索。

大分子

PDB结构中的聚合物可以是蛋白质、DNA、RNA和DNA/RNA杂交体。聚合物实例(又称链)是不同大分子的单独拷贝。一个结构可能包含相同大分子的多个副本。

高分子成分搜索

  • 这个搜索示例查询长度在350-400个残基之间的单个蛋白质链(没有其他)的结构;
  • 这个搜索示例查询包含RNA聚合物的结构,而不管该结构可能包含或不包含哪些其他聚合物类型。

高分子类型搜索

  • 这个搜索示例查询所有膜蛋白PDB中的结构(由资源PDBTM、MemProtMD、OPM或mpstruc注释)。

改良残留物搜索

改性残基是非标准聚合物成分(即蛋白质序列中的非标准氨基酸或核酸序列中的不标准核苷酸)。

这个例子展示了如何找到具有修饰残基的结构。

嵌合大分子实体搜索

PDB中的聚合序列有时是通过融合来自不同生物体的序列片段来设计的。这些被称为嵌合实体。此搜索将找到任何包含嵌合实体的PDB条目。

序列相似性和对齐

这个序列相似性搜索可用于从PDB档案中查找类似的蛋白质和核酸序列。使用序列相似性搜索时,选择聚合物实体来自结果显示为菜单,在搜索结果页面中包含成对序列对齐及其统计信息的图形显示。

E-Value和Sequence Identity Cutoff(%)过滤器有助于删除无关或远距离相关的序列。默认情况下,搜索允许匹配最宽范围的序列。例如,默认的E-Value=1表示结果可能只是偶然包含分数相似的序列。默认的Identity Cutoff(%)=0表示结果可能包含序列相似度较低的序列。

这个搜索查询发现与贝克酵母中的“N-乙酰转移酶MPR1”蛋白类似的序列。结果包括与查询序列相关但序列同源性较差的“Gcn5-related N-acetyltransferase”蛋白。

请参阅蛋白质序列比对视图第页获取序列对齐显示的完整文档。

序列主题搜索

这个序列主题搜索搜索与序列基序匹配的蛋白质和核酸序列。序列基序可以是精确的序列,也可以是由正则表达式语法表示的序列模式。

  • 序列基序搜索允许搜索任意短的序列片段,例如:
    NPPTP核电站
  • motif搜索通过在可变剩余位置放置一个“X”来支持通配符查询。使用结果序列-X-P-P-X-P(其中X是可变残基,P是脯氨酸)查询SH3域可以表示为:
    XPPXP程序
  • 可变残数的范围由{n}表示法指定,其中n是可变残数数。查询残基W和G之间有七个变量和二十个变量残基(表示为.在正则表达式中)在G和L之间使用以下符号:
    西。{7} G.公司。{20} L(左)
  • 变量范围用{n,m}表示,其中n是最小的重复次数,m是最大的重复次数。例如,在DNA结合域中结合锌的锌指基序可以表示为:
    C。{2,4}C。{12} H。{3,5}高
  • “^”运算符搜索蛋白质序列开头的序列模体。以下两个查询查找带有N末端组氨酸标记的序列:
    ^HHHH小时^高{6}
  • 方括号指定特定位置的替代残留物。结合ATP或GTP的Walker(P环)基序可以表达为:
    [AG]。。。。GK[ST]公司
    A或G后面是4个可变残数,然后是G和K,最后是S或T。

使用序列主题搜索时,选择聚合物实体来自结果显示为菜单中包含在匹配序列中找到基序的序列位置。

结构主题搜索

这个搜索示例查询AlphaFold中包含丝氨酸蛋白酶催化三联体基序的CSM(如PDB条目1a0j所示)。
下面列出了运行此查询的步骤:

  • 首先转到PDB条目1a0j的结构摘要页.
  • 打开1D-3D视图通过单击此页上图像下方的可用链接,可获得此结构。
  • 根据所提供的注释,在按住shift按钮的同时,在1D(序列)部分中查找并单击活性位点残留物。这应允许同时选择所有3个活性位点残留物,这些残留物应在3D面板中突出显示。
  • 单击Toggle(切换)菜单中的Toggle Expanded Viewport(切换扩展视口)按钮(位于3D画布的右侧)以访问所有Mol*功能。
  • 单击控制面板(页面右侧)中结构图案搜索下的提交搜索选项。
  • 该搜索将在所有实验结构和CSM上运行。通过选择左侧优化菜单中CSM源数据库下的AlphaFold,优化返回的搜索结果。

程序集

生物组装是大分子在结构中的排列,被认为是具有生物意义的分子组装。

组件组成

以下是查询具有不同组成特征的生物集合的搜索示例:

  • 这个搜索示例查询生物组装中聚合物的总数,无论是包含多个相同的分子还是不同的分子。
  • 这个搜索示例查询长度在350-400个残基之间的单个蛋白质链(没有其他蛋白质链)的生物组装。
  • 这个搜索示例查询包含24条完全相同的链的生物组件。例如,铁蛋白的生物组装1新由单个聚合物链的24个副本组成。
  • 这个搜索示例使用基于化学计量的搜索(A2B2C2)和基于结构的搜索Fab轻链(例如,使用PDB结构)查询与二聚抗原结合的免疫球蛋白Fab片段1bj1,链条A)。
  • 这个搜索示例查询PDB中包含至少一种重水(或DOD)的组件。

配体

配体是与较大生物分子形成复合物的化学物质。

游离配体与聚合物配体

大多数配体被认为是与大分子非共价相互作用的“独立配体”。配体可以与大分子或其他异源基团共价连接的频率较低。

用三磷酸腺苷寻找结构(列车自动防护系统)其中:

结构配体配合物

这个搜索示例查询与任何类型的配体复合体。

您还可以缩小搜索范围,只包括具有特定功能的复合体。例如:

  • 这个搜索示例质疑用X射线衍射实验技术解决的蛋白质-甘氨酸络合物;
  • 这个搜索示例查询来自金黄色葡萄球菌(菌株N315)的蛋白质与配体的复合物。
  • 这个搜索示例用以下实验细节从结构中查询DNA-配体络合物:
    • 实验方法:X射线衍射
    • 优化X射线分辨率:0-2
    • 精炼R因子(R功):0-0.2
    • 精炼R系数(无R):0-0.214
    • 有实验数据:有

权益配股(LOI)

结构可能包括注释为“感兴趣的配体”的小分子,这意味着小分子是作者研究的主题。

这个搜索示例查询包含“感兴趣的配体”的结构。

绑定相关性

您可以使用来自绑定数据库PDB绑定-CN资源。

结合亲和力测量属于以下类型之一:

  • IC50:降低酶活性50%的配体浓度;
  • 半数有效浓度:产生半最大响应的化合物浓度;
  • Kd(千克):离解常数;
  • 灵魂:关联常数;
  • :酶抑制常数;
  • ΔG:结合吉布斯自由能(对于缔合反应);
  • ΔH:与化学反应相关的焓变化;
  • -TΔS:与化学反应有关的熵的变化。

浓度常数(IC50,EC50)和结合常数(Ki,Kd)如所示纳米; 热力学参数(ΔG、ΔH、-TΔS)如所示千焦/摩尔; 关联结合常数(Ka)如所示M(M)-1.

例如,这个搜索返回EC50=2 nM的结构-甘氨酸复合物,例如来自3GWS系统3,5,3’三碘代噻吩的EC50为2 nM(T3航站楼).

化学成分

化学成分包括PDB档案中发现的所有残基(存在于蛋白质或核酸序列中)、小分子(配体)以及肽类抗生素和抑制剂分子。

  • 这个搜索示例使用化学成分词典。示例:
    • 列车自动防护系统-三磷酸腺苷
    • -血红素基团
    • MSE公司-当硒代蛋氨酸不是蛋白质聚合物的一部分时
    • ZN公司-锌离子
    • F类-对于氟离子
  • 这个搜索示例使用分子名称查询包含特定分子(例如生物素)的结构。

药物搜索

DrugBank提供了关于小分子药物化学属性的各种信息,用于搜索PDB档案。这些包括药物目标名称、品牌名称、分类分组(是否批准、试验、撤回等),或是否在市场上销售(在美国、欧洲和加拿大)。这些化学属性(特征)可用于查询档案以查找特定药物分子。

同义词和化学标识符

通过使用化学成分部分下的同义词字段,可以按DrugBank注释的药物名称进行搜索。

这个搜索示例查询包含药物阿昔洛韦(或阿昔洛病毒)的结构,该结构映射到化学成分空调2.

通过将“返回类型”更改为“分子定义”,您可以找到与查询匹配的小分子药物。所以这个搜索在化学成分词典中找到药物“阿昔洛韦”。

批准和市场可用性

小分子药物可以根据其在以下市场中的可用性进行搜索:美国、欧盟、加拿大。美国所有新药在上市前都应证明其预期用途安全有效,并且需要获得FDA批准。

使用这个搜索查找PDB档案中所有在历史上任何时候批准在美国市场使用的小分子药物。

这个搜索示例仅包括当前市场上的药物,-可以通过将药物营销结束字段留空来完成。

要查找所有或特定药物分子与生物大分子结合的结构,请根据需要设置查询,并将“返回类型”更改为“结构:
这个例子查询绑定了FDA批准药物的所有结构。

此搜索示例查询PDB中与特定小分子药物Gleevec或STI结合的所有结构。

撤回

在批准临床应用后,一些药物可能会因有害的副作用而被撤回。例如,止痛药万络,也称为罗非昔布(RCX公司在里面PDB入口5公里)因发现心脏病发作和中风的几率增加而被召回。

这个搜索示例帮助找到所有撤回的药物

结合查询和DrugBank信息

您可以使用“结构属性”部分,将搜索FDA批准的药物与其他与特定大分子结构相关的注释结合起来。

例如,使用这个搜索查找标注为利益配体(意向书)。请注意,将返回类型设置为Structure并不能保证批准的药物和LOI是相同的成分。

出版物

搜索没有关联发布的PDB结构。
这个搜索示例对PDB中主要出版期刊列为“待出版”的结构的查询。

计算结构模型(CSM)

截至2022年8月,AlphaFold2(Jumper等人,2021)和RoseTTAFold(Baek等人,2022)预测的CSM可从RCSB.org获取,用于查询、可视化和分析。

没有可用的实验结构:

要搜索具有CSM但没有相应实验结构的小鼠蛋白质.
按以下方式处理问题以查看示例:
1.搜索所有鼠标序列
2.按UniProt ID分组
3.按组大小排序结果(从最小值开始)
第一个列出的尺寸为1的组大多只包含没有实验数据的模型。

预测结构置信度

查询人类蛋白质的高质量(pLDDT>90)计算结构模型.



请向报告任何遇到的断开链接info@rcsb.org
上次更新时间:2024年7月17日