FB2024_02型 , 2024年4月23日发布
FB2024_02型 , 2024年4月23日发布
查询生成器

查询生成器


QueryBuilder帮助

查询生成器(QB)为FlyBase中的信息提供一站式购物。

  • 使用QB,您可以在FlyBase的任何报告中搜索任何字段(在QuerySegment中),以及然后将得到的hit-list与其他领域的搜索相结合,允许组合搜索(使用布尔运算符)。

  • 简单和复杂的查询可以通过几个步骤来构建。

  • QB允许用户与QuickSearch相比,执行更复杂的搜索或FlyBase上的其他搜索工具,充分利用数据存储在FlyBase中。

  • 一个有用的功能QB的特点是FlyBase标识符或有效符号的列表可以是从外部文件导入以用作查询段。

  • 一组结果可以通过FlyBase上的其他搜索导出到QB点击列表右上角的“点击列表优化”按钮,以及然后进行修改,通过添加其他查询来优化搜索部分。

有三种选择在QB起始页上:

-选择预先构建的QueryTemplate

-导入以前保存的查询

-生成新查询

隐藏选择预先构建的QueryTemplate

QB起始页上的第一个选项允许用户选择查询从预先构建的查询模板列表中。可用的模板按数据类型/输出进行组织。要查看的列表与给定数据类相关的模板,选择左侧下拉菜单中的兴趣。列表右侧将显示预先构建的查询模板和数据类特定的“关键字”列表将出现在左侧。这个可以通过选择一个或多个关键字。只有包含所选关键字的模板才会保留。返回给定数据的完整模板集类,只需取消选择所选关键字。

当你找到与您感兴趣的查询匹配或类似的模板,单击模板左侧的按钮。这会给你带来使用指定的查询设置并准备好运行。修改参数以完全匹配您自己的查询规范,使用每个段中的绿色“编辑”选项卡查询的。根据需要修改搜索词,单击“完成编辑”,然后选择“运行查询”。

隐藏导入保存的查询

任何QuerySchema(a使用布尔运算符组合的QuerySegments集合)可以是保存以供以后使用“保存查询”选项再次运行在结果页面上。QuerySchema保存为一个小文本文件。

隐藏如何构建新查询

使用查询FlyBaseQB,您必须构建一个或多个段。

要开始构建查询时,单击标题为“查询为空…”的黄色框。。。单击此处以开始建造”。

请注意,构建将受控词汇(CV)层次结构用作数据集与使用其他任何数据集构建数据段略有不同数据类。

构建细分市场使用文本字符串

步骤1:选择数据类从“数据集”菜单中搜索。

有16个选项可用于从中选择。从前13个数据集中选择任何一个都会更改窗口显示,以显示在报告中找到的所有字段数据集。其余三个选项中的第一个选项是查询FlyBase使用我们用来添加结构化的受控词汇表(CV)某些字段的内容。有关使用CV进行以下操作的信息,请参见下文搜索FlyBase。

步骤2:选择字段搜索,或使用“任意字段”搜索完整记录。

第3步:输入文本要搜索的字符串。搜索算法将识别数据字段包含您输入的文本字符串的。你可以选择案例灵敏度(如果需要)。自动完成将列出字段条目与您键入的文本相对应。

步骤4:单击“完成编辑”按钮。

步骤5:(可选):至添加其他段,单击“+”按钮。附加可以使用标准布尔值将线段连接到现有线段操作员。

构建细分市场使用受控词汇术语

第1步:选择“CV层次结构(GO/等)”。

第二步:点击选项更改窗口显示以显示来自FlyBase中使用的各种CV。您可以浏览CV从这些顶级术语,或者您可以在目录中搜索术语使用上面的搜索框匹配您要查找的内容条款。默认情况下,您将从以下位置搜索CV术语您选择的术语的整个子树。如果您希望搜索仅针对您选择的确切简历术语,选择“This CV term(提示:您将检索更多搜索整个子树的结果)

第三步:一旦你选择了您的术语,窗口将返回到QB起始页,现在显示第一个QuerySegment由您选择的CV术语组成。

第4步:单击“完成”按钮。

步骤5:(可选):至添加其他段,单击“+”按钮。附加可以使用标准布尔值将线段连接到现有线段操作员。

准备、检查和运行查询

步骤1:检查布尔值操作符(如果查询包含多个段)。违约为“AND”。更改为“OR”或“BUT NOT”如果需要。

第2步:检查QuerySegments正确。单击可以修改段或通过单击右上角的“X”删除段框的角。

步骤3:选择输出选项。默认设置是显示相关基因与其他数据集的交叉引用,以及搜索D.黑食肉动物仅限数据。如果需要,请进行更改。

步骤4:单击“Run”(运行查询”按钮。

隐藏搜索表达式数据

  • 第1步:
  • 选择“构建新查询”选项。


  • 第2步:
  • 从数据集菜单中选择“表达式模式”数据集。


  • 第三步:
  • 使用Stage、Tissue和亚细胞位置文本字段中的CV术语构建查询。
  • 自动完成功能将帮助您选择有效的CV术语来构建表达式语句。


  •  
  • 提示和小贴士:
    此表单中的输入字段使用了一个复杂的自动完成功能。当您开始键入(甚至只需在其中单击)字段时简历条款将出现。对于您填写的第一个字段,该类别的所有适当CV术语都可用。

    每个填充的搜索字段进一步限制其余字段的自动完成功能。例如,如果您在发育阶段字段中输入了“原肠胚阶段”,身体部位/组织搜索字段的自动完成功能将包括CV术语“parasegment 10”,但将排除CV术语“leg”。同样,如果您在身体部位/组织搜索字段中输入了CV术语“前胸腿”,开发阶段搜索字段的自动完成功能将包括“成年期”,但不包括“胚胎期4”。

    如果只选择自动完成功能建议的术语,表达式语句查询应始终匹配某些结果。

    每个搜索字段下面都有一个限定符字段,您可以在其中输入限定符,例如“早期”表示发育阶段,“顶端”表示亚细胞位置。每个限定符搜索字段都有一个自动完成功能,并且只提供用于策展的限定词在其上方的搜索字段中输入的术语。

    由于这种分层自动完成,可以选择排除其他字段中所有可能性的术语子集。在这种情况下,自动补全将告诉您“没有匹配的变体”。如果为一个或多个术语选择限定符,则尤其如此。如果运行这样的查询,则不会返回任何点击。此外,自动完成不能考虑表达式语句只能存在于,例如,“插入”数据集,当您当前正在搜索“基因”数据集时。在这些情况下,您的搜索将不会返回直接命中,但步骤4中结果上方的“交叉引用”按钮将指示在一个或两个其他数据集中有点击。

    为了避免运行未命中的查询,强烈建议您使用自动完成功能建议的术语。

    使用部分上下文和/或通配符仍将允许自动完成和搜索功能发挥作用,但可能导致过度或不足预测(包括不相关的点击,或排除相关的点击)通过复杂的搜索/检索算法。


  • 第4步:
  • 单击绿色的“完成编辑”按钮。
  • 通过单击绿色的“编辑”按钮,您可以在运行查询之前对其进行编辑,这将带您回到第3步。
    您也可以通过单击黄色加号按钮将新子句添加到搜索中。这里的逻辑类似于用于其他QueryBuilder数据集的逻辑。


  •  
  • 提示和小贴士:
    可以搜索重组结构和转基因插入通过从“基因”更改步骤4中的输出选项“插入”或“重组结构”。


  • 步骤5:
  • 运行查询。(单击绿色的“运行查询”按钮。)


  •  
  • 提示和提示:
    请注意,您可以查看三个数据集中的任何一个的结果(“基因”、“插入”和“重组结构”),即使您已经为输出选项选择了一个数据集。输出上方显示了其他数据集中的交叉引用。单击其中一个链接会将视图切换到所示数据集的结果。
隐藏特征
  • 计算
  • 计算可以合并到包含数字的字段的搜索中。
  • 选项包括大于(>),小于(<),加或减(+/-)和范围(-).
  • 任何值,无值
  • 搜索字段中是否存在信息,而不是搜索特定值。
  • 选项包括IS NULL(为空)不为空(此查询区分大小写)。
  • 逻辑运算符
  • 使用逻辑运算符组合多个查询分支。
  • 选项包括,、和但不是.
  • 短语
  • 多个单词被视为一个短语。
  • 只有按指定顺序包含搜索词的记录才会匹配。
  • 批次查询
  • 上传FlyBase ID列表,搜索所有相关记录。
  • 查询结果也可以使用标准批量下载。
  • 分层简历查询
  • 完全支持GO(开始)解剖/发育术语关系。
  • 搜索标准数据类(例如Genes)中的CV字段时,只会找到包含您指定的单个术语的记录。这个GO/解剖简历数据库将这些CV中的每个术语与层次结构中其下方的所有术语相关联,从而允许单次搜索来查找包含该术语或该术语的任何子项的记录。
  • 字段类型标记
  • 五个字段类型标记有助于组织和识别搜索选项。
    • 个人简历-受控词汇,各记录中的术语一致
    • 标志-标记存在指定类型链接的记录(标记字段的任何搜索都将作为“IS NOT NULL”执行,忽略用户提供的上下文)
    • 地图-遗传、细胞遗传学或基因组图谱数据
    • 符号-符号是唯一或主要的数据类型
    • 文本-数据是自由文本,不同记录的用法可能不一致
  • 字段内容词典
  • 预览字段中的信息,或选择要在搜索中使用的词典条目。
  • 字段字典从所选字段中的数据中列出最多100个最常用的符号、术语、数字或单词。
  • 备选结果
  • 其他FlyBase数据类中的相关记录只需点击绿色按钮.
  • QB为符合搜索条件的记录创建一组交叉引用。运行搜索时,会为所选数据类显示逐项结果列表(例如,基因记录)。结果页面顶部的一系列绿色按钮提供了指向其他数据类(例如Insertions)中相关记录的链接。使用QB,您不需要打开每个报告并单击链接层来查找相关信息。此功能还可用于查找由于不熟悉的命名法(如插入符号)而可能难以直接搜索的信息。只有引用被排除在自动生成替代结果之外(因为此数据集的大小很大)。
  • 链接
  • 点击即可获得其他数据库的相关信息黄色按钮.
  • 如果搜索标识的记录包含指向外部数据库的链接,则可以通过结果页面Linkout部分的黄色按钮或按钮获得这些链接。
隐藏更多信息和示例
  • 星号是野生的。搜索字符串两端或字符串中间嵌入的星号(*)将被解释为“任意字符”。
    • 股票|符号 妈妈*
    • 等位基因|简历:表型类别*母亲*
    • 插入|符号 *ptc公司*
  • 通配符不会自动添加到QB搜索中。如果查询无效,请在一端或两端使用*重试。
  • 搜索标志字段带*或任何字母串。
    • 基因|标记:互动苍蝇 违约
    • 多肽|标志:抗体URL(DSHB杂交瘤: *
  • 不区分大小写搜索是标准的。有两个例外:
    • A类区分大小写符号搜索适用于大多数数据类。
    • 保留的短语IS NULL(为空)不为空区分大小写.
  • 多个单词被视为短语.
    • 基因|文本:其他信息 组织培养细胞
  • 细胞学定位搜索被重定向到GBrowse数据集,该数据集使用细胞学位置的估计序列范围。
  • 联接查询段使用AND或or。
  • 当使用两个或多个查询段时,QB给出优先级到前面的部分。
    • 吊带和翅膀或腿被解释为(吊带和翅膀)或(腿)
  • 计算查询示例:
    • GBrowse数据|外显子的确切数量 > 2   
    • 多肽类|P(P)蛋白质大小(kD:< 50  
    • 注释|映射:序列范围3L:5787637..5819561+/-5000(逗号是可选的)
    • 插入|地图:细胞遗传学位置67B-D型
  • 引用记录集仅在搜索References数据集时创建。
    • 参考文献|作者 胁元(创建引用数据集)
    • 通道|文本:发现者 胁元(不创建引用数据集)
隐藏注释、已知问题和即将出现的功能
  • 要了解有关受控本体数据库的更多信息,请执行以下操作:
  • GO-基因本体:
  • http://www.geneontology.org
  • 要搜索GO术语及其定义,我们建议:
  • http://www.ebi.ac.uk/ego
  • 要了解更多有关解剖和发育术语的信息,请访问Termlink:
  • http://www.flybase.org/cgi-bin/fbcvq.html?启动
  • 生成股票和图像的交叉引用,但来自这些数据类型的交叉引用被阻止。这是因为这些记录可能包括切线相关的对象,例如在多标记映射库中突变的一组基因。
  • 人员数据不包括在QB中。
  • 所有菜单和字典文件都是自动生成的。字典文件在服务器上保留2小时。如果服务器上还没有给定字段的索引字典,那么生成它需要一些时间
  • 如果您在使用QueryBuilder时遇到任何问题,或者希望获得有关查询的帮助,请使用联系FlyBase给我们写信。