UCSC基因分类器用户指南

目录

介绍
入门
了解基因分类器显示
配置基因分类器显示
筛选基因显示
显示序列和基于文本的输出

搜索基因组浏览器帮助页面:

欢迎提出问题和反馈.

介绍

基因起作用并一起进化。要理解一个基因,你通常需要了解一个完整的基因家族。许多这样的家族已经为人所知和所述,例如HOX家族调节肢体和大脑发育的许多方面以及作为中枢的细胞色素P450家族许多药物的新陈代谢。

识别基因已知亲属的一种简单方法是寻找具有名称的基因相似性,因为生物学家倾向于对相似的基因使用相似的名称。然而,只有科学家部分了解基因组中可能三分之一基因的功能;因此,其他将基因分组成家族的技术是必要的。

UCSC基因分类器是探索基因家族和关系的极好资源在基因中。该工具显示所选基因组中与一个基因组相关的基因表另一个。可以探索几个不同的关系:蛋白质水平的同源性,基因的相似性表达谱或基因组接近性。Gene Sorter支持对各种术语进行搜索和短语,包括基因名称、UniProtKB蛋白质名称、GenBank登录或单词或基因描述中的短语。基因家族显示器是高度可配置的,允许用户可以控制列的顺序和数量、行数和显示的基因。这个该工具提供了几种输出格式,包括可以导入的简单制表符分隔格式到电子表格或关系数据库中。

基因分类器的一个重要用途是收集共享相似基因的集合用于统计分析的属性。例如,可能需要检查共享类似表达模式或在具有以下特征的基因中寻找蛋白质序列基序的基因共享类似的GO注释。

基因分类器最强大的功能之一是它的过滤功能。过滤器用户可以根据以下条件快速选择基因组中25000个基因中有趣的子集各种详细而灵活的选择标准。例如,过滤器可用于选择所有在小脑中过度表达的人类基因都具有GO非翻译G蛋白偶联受体活动。

基因分类器由Jim Kent、Fan Hsu、David Haussler和UCSC设计和实现基因组生物信息学小组。这项工作得到了国家人类基因组的资助霍华德·休斯医学研究所。

入门

要开始使用基因分类器,首先必须选择基因组区域和基因类型您希望显示的关系。您可能还想更改一些基因分类器配置设置以根据您的研究需要定制显示。这些配置选项包括中描述的配置基因分类器显示.

启动基因分类器

  1. 打开基因分类器主页.
  2. 通过从中选择适当的选项来指定要查看的基因组和程序集基因组装配下拉菜单。
  3. 搜索用于确定将显示哪些基因的文本框在浏览器中。有效的搜索词(以人类基因组为例)包括:

    • 基因名(HOXA9)
    • UniProtKB蛋白质名称(HXA9)
    • 基因描述中出现的单词或短语(MAP激酶)
    • a GenBank mRNA加入(U14680)
  4. 通过从排序依据下拉菜单。基因将按照与所选基因的接近程度排序,基于以下标准之一:
    • 表达(GNF Atlas1)——基于GNF Atras1数据的基因表达相似性
    • 蛋白质同源性-BLASTP——基于BLASTP E值的蛋白质同源性相似性
    • 蛋白质同源性-Rankprop——基于Rankprot的蛋白质同源性相似性算法
    • 蛋白质同源性-PSI-BLAST——基于PSI-BLAST的蛋白质同源性相似性E值
    • Pfam相似性——基于共享域数量的相似性
    • 基因距离——染色体与所选基因的绝对距离(左或右)
    • 染色体——按染色体位置排序的列表
    • 名称相似性——与选定基因名称的相似性,基于前几个名称的字符
    • 按字母顺序排列--按基因名称排序的列表
    • GO相似性——与所选基因共享的基因本体(GO)术语数量
  5. 从中选择要显示的项目数显示下拉菜单(默认为50).
  6. 快走!按钮显示搜索结果。

了解基因分类器显示

Gene Sorter的主页面显示了一个包含基因行和相关联的属性。在大多数情况下,当前选择的基因显示在列表顶部,突出显示浅绿色。其余基因根据排序相对于所选基因排序中指定的标准排序依据菜单。例如,在按基因距离排序的表中,这些基因按照与所选基因的染色体接近程度从大到小的顺序排列。

最初的基因排序器显示仅显示可用列的默认子集。这套可以使用基因分类器来扩展、减少和重新排列列配置实用程序。要查看有关显示在列,单击该列的标签。

要在表中选择不同的基因,请单击该基因的名称。基因分类器将移动将基因条目置于列表顶部并高亮显示。其余基因将重新排序相对于新选择。

列说明(按字母顺序列出)

配置基因分类器显示

基因分类器是高度可配置的,允许您微调显示以仅显示你感兴趣的基因和数据列的顺序最适合你的研究需要。大多数配置都是通过配置页面上的设置控制的,可以通过访问这个配置按钮。

更改显示的行数
要增加或减少表中显示的行数,请从显示下拉菜单,然后单击快走!按钮。

更改显示的列数
默认情况下,Gene Sorter只显示基因组可用的表格列的一小部分。您可以在配置页面。

配置表显示了当前选定基因组的所有可用列,如从左到右的显示顺序。要在基因排序器显示中添加或删除列,请单击打开复选框以切换设置(选中表示显示列)。收件人快速更改打开设置所有列,单击全部隐藏全部显示按钮。单击提交按钮显示基因分类器中的更改。

更改列位置
除了添加或删除列之外,还可以将列移动到左侧或就在Gene Sorter表中。配置表中列名的顺序指示基因排序器显示中列的当前相对位置(从左到右)正确的。要将列向左移动一个位置,请单击向上的项目中的箭头职位列。同样,单击向下向右移动列的箭头。完成更改后,单击提交按钮。

更改表达式颜色
默认情况下,基因表达比率使用红/绿颜色方案显示,其中红色表示一个基因表达量越高,绿色对应的表达量越少。色盲用户可能发现将颜色从红色/绿色切换到黄色/蓝色很有帮助。为此,请选择“黄色高/蓝色低”选项表达式比率颜色下拉菜单打开配置页面,然后单击提交按钮。

更改表情颜色的亮度
要增加或减少表达式列中颜色的亮度,请编辑亮度配置表中相应条目的值。值大于小于1.0会增加亮度,而小于1.0会使颜色变暗。单击提交按钮显示新值。

更改表达式列中显示的组织数据类型
默认情况下,表达式列显示一个小的选定区域中基因表达的中位数比率一组组织。使用组织下拉菜单配置组织显示列。“所有副本”选项将显示每个实验的价值每个组织的复制品。“副本中值”选项为每个副本显示一个值代表该组织所有复制品中位数的组织。

在比率和绝对表达式值之间切换
默认情况下,表达式列显示基因的表达与基因整体。要查看绝对表达式值,请选择“绝对”选项来自下拉菜单。

显示拼接变体
默认情况下,Gene Sorter只显示一个剪接变体:产生最大剪接变体的那个蛋白质。要显示所有拼接变体,请单击显示所有拼接变体复选框。注释在大多数情况下,列值(有时还包括名称)在变体。

恢复默认设置
在Gene Sorter会话期间的任何时候,都可以将Gene Sort表恢复为默认值布局,单击违约按钮,然后单击提交.

保存配置以备将来使用
Gene Sorter配置实用程序允许您存储多个配置以供将来使用会议。如果需要不同的布局研究用途。要保存基因分类器布局的当前配置,请单击保存按钮。在顶部的文本框中键入配置的名称页面,然后单击保存.

加载以前保存的配置
保存配置后,可以在以后的会话中将其加载回Gene Sorter。要加载配置,请单击负载按钮。基因分类器将显示保存的配置的名称列表。单击某个名称以将其高亮显示,然后点击负载根据保存的设置重新配置基因分类器。

查看保存的配置列表
要显示已保存的配置列表,请单击保存按钮上的配置页面。如果您有任何保存的配置,Gene Sorter将显示一个现有设置显示配置名称的列表。要永久删除从列表中选择配置,单击名称以高亮显示,然后单击删除现有安装程序按钮。

筛选基因显示

Gene Sorter的基因过滤功能提供了一种多功能的方式来微调显示只展示你感兴趣的基因。过滤器应用于单个基因字段,并且可以组合以增加搜索的特异性。要访问“筛选器”页面,请单击滤波器按钮。

在过滤器设置过程中的任何时候,您都可以单击列表名称按钮上的筛选页面可查看当前筛选设置为时将返回的基因列表应用于基因组。您可能会发现此列表有助于微调过滤器。

基于匹配的一个或多个术语进行筛选
基于名称、ID或其他单词的过滤器将显示限制为仅显示与其中一个匹配的基因或多个输入到搜索文本框。可以筛选的值示例这个基础包括基因名称、RefSeq登录号、基因描述、编码SNP和GO条款。

此搜索支持“*”和“?”上的通配符匹配。多个术语必须是由空格或制表符分隔。例如,基因名称字段上的搜索条件“HOXA9 FOX*”返回名为HOXA9的基因以及名称以字母“FOX”开头的任何基因。什么时候?搜索包含多个单词(GO术语、编码SNP、,Pfam域和基因描述),多单词元素必须用单引号括起来。对于例如,对描述短语“叉头盒蛋白”的搜索应输入为“叉头盒蛋白”。使用“any”和“all”选项来确定搜索是否应返回与任何词(“any”)匹配的任何基因,或只返回那些匹配所有术语的基因(“all”)。

为了便于在多个术语上进行搜索,Gene Sorter提供了粘贴或上传选项搜索词列表。要粘贴术语列表,请单击筛选器的粘贴列表按钮,然后在文本框中粘贴或键入术语。术语必须用空格、制表符或在单独的行中输入,不能包含通配符。完成列表后,单击“提交”按钮返回主过滤器页面。文件上传实用程序-通过上传列表按钮-具有类似的功能。

基于数值范围的过滤
通过指定数值范围,可以过滤几个基因字段一定会摔倒。这类字段的示例包括表达比率、Blastp数据和基因组位置。要使用此类型的筛选器,请输入限定范围的最小值和最大值你感兴趣的。在某些情况下,有效值的范围会显示在过滤器中框。

基因组位置过滤器需要染色体的名称(格式为chrN公司)英寸除了染色体的起始和终止位置。要列出染色体上的所有基因,请仅输入染色体名称。

表达式过滤器包括“any”和“all”选项,以确定如果任何组织表达值满足最小值和最大值,搜索应返回一个基因条件(“任何”)或仅当所有组织表达值满足搜索条件时(“全部”)。

保存过滤器设置
Gene Sorter提供了一种保存过滤器设置以供将来会话使用的机制。收件人保留当前筛选器配置,单击保存筛选器按钮。键入筛选器的名称,然后单击保存保存过滤器并返回过滤器第页。

加载保存的筛选器
保存过滤器配置后,您可以在以后的会话中通过将其重新加载来检索它进入你的基因分类器。要加载保存的过滤器设置,请单击加载筛选器按钮打开过滤器页面。单击要加载的筛选器的名称,然后单击负载按钮。单击提交按钮将过滤器设置应用于基因分拣机。

查看保存的过滤器列表
要显示已保存的过滤器设置列表,请单击保存按钮上的过滤器页面。如果您有任何保存的过滤器,Gene Sorter将显示一个现有设置显示筛选器名称的列表。要从列表中永久删除筛选器,请单击要删除的名称高亮显示它,然后单击删除现有设置按钮。

显示序列和基于文本的输出

基因分类器对数据的图形表示有助于直观观察关系以及显示的基因之间的模式。然而,将数据转换为基于文本的格式,可以轻松保存到文件或加载到其他程序、数据库或用于进一步分析的电子表格。基因分类器提供了一种保存电流的机制显示在以制表符分隔的文本文件中,或显示当前显示。

创建基于文本的输出
要将当前Gene Sorter表输出为文本,请单击页面顶部的文本按钮。这个Gene Sorter将在单独的以tab分隔的行上显示每行表数据。

查看基础序列
要显示当前基因排序表下的蛋白质、mRNA或基因组序列,请单击页面顶部的序列按钮。在“获取序列”页面上,选择所需序列配置设置,然后单击获取序列按钮。基因分类器将为表中显示的每个基因显示基于文本的FASTA格式记录列表。这个FASTA记录可能会被剪切并粘贴到Blat中以供进一步研究。