通用汽车公司 帮助和文档

帮助

目录

GeneMANIA搜索提示

  • 如果大多数输入基因在功能上相关,GeneMANIA的工作效果最好。否则,将导致网络断开,网络权重将不是最优的。它们由哪个功能关联并不重要,只要该功能以某种方式被GeneMANIA系统中的某些功能关联网络捕获。
  • 如果查询列表包含6个或更多基因,GeneMANIA将计算基因列表特定的权重。如果查询列表中的基因少于6个,GeneMANIA将基于GO注释模式进行基因功能预测。
  • GeneMANIA的输入基因列表超过50个,速度较慢;如果你有这么大的基因列表,我们建议使用不超过100个基因的基因列表。GenMANIA公司Cytoscape应用程序能够处理更大的基因列表。
  • 可以在高级选项中配置合成基因的数量、合成属性的数量和权重方法。通过单击搜索栏中的省略号(“…”)访问高级选项。

GenMANIA网络类别

GeneMANIA搜索许多大型、公开可用的生物数据集,以找到相关基因。这些包括蛋白质、蛋白质-DNA和遗传相互作用、途径、反应、基因和蛋白质表达数据、蛋白质域和表型筛选图谱。定期更新数据。

网络名称描述数据源,或者是从与数据源相关的PubMed条目生成的(第一作者-最后一作者年),或者只是数据源的名称(BioGRID,PathwayCommons-(原始数据源),Pfam)

  • 共同表达:基因表达数据。在基因表达研究中,如果两个基因的表达水平在不同条件下相似,那么这两个基因是相连的。这些数据大多来自基因表达总览(GEO);我们只收集与出版物相关的数据。
  • 物理交互:蛋白质相互作用数据。如果在蛋白质相互作用研究中发现两种基因产物相互作用,则它们是相互关联的。这些数据是从蛋白质相互作用数据库中发现的主要研究中收集的,包括BioGRID和PathwayCommons。
  • 遗传相互作用:遗传相互作用数据。如果发现扰动一个基因的效应被扰动到第二个基因而改变,那么两个基因在功能上是相关的。这些数据是从初步研究和BioGRID收集的。
  • 共享蛋白质域:蛋白质域数据。如果两个基因产物具有相同的蛋白质结构域,它们就会相互关联。这些数据是从域数据库收集的,如InterPro、SMART和Pfam。
  • 协同校准:在同一组织中表达的基因,或在同一位置发现的蛋白质。如果两个基因都在同一组织中表达,或者如果它们的基因产物都在相同的细胞位置被识别,那么这两个基因是相连的。
  • 通路:路径数据。如果两个基因产物在一条通路中参与相同的反应,则它们是相互关联的。这些数据通过PathwayCommons从各种源数据库收集,如Reactome和BioCyc。
  • 预测:预测基因之间的功能关系,通常是蛋白质相互作用。预测数据的一个主要来源是通过体形学绘制另一种生物体的已知功能关系。例如,如果已知两种蛋白质的直向同源物在另一种生物体中相互作用,则预测它们会相互作用。在这些情况下,网络名称描述了实验测量的交互作用的原始数据源,以及映射交互作用的生物。例如,根据人类网络预测的老鼠网络:Barrios-Rodiles-Wrana-2005-Human2Mouse。此外,我们还包括来自其他组的预测功能关联,这些组结合了给定生物体的多个数据源,例如,整个酵母网预测网络:Lee-Marcotte-2007酵母网;用于生成酵母网的遗传相互作用数据:Lee-Marcotte-2007遗传相互作用。在这些情况下,网络名称表示详细描述预测网络的原始出版物,并且(在某些情况下)列出了用于生成整个预测网络的单个网络(例如上面的后一个示例)。一些预测网络包括来自其他生物的数据。在这些情况下,网络名称中提到了原始有机体,例如,用于生成WormNet:Lee-Marcotte-2008 protein interactions yeast2worm的酵母蛋白质相互作用数据。
  • 其他:不符合上述任何类别的网络。示例包括来自Ensembl的表型相关性、来自OMIM的疾病信息和化学基因组数据。
  • 已上传:您已上传的网络。

上传您自己的网络

您可以将网络上传到GeneMANIA,并在GeneMANIA了解的所有公共可用网络的上下文中对其进行分析。会话结束后或24小时内,您的网络将从GeneMANIA服务器上删除。请参阅我们的隐私政策了解更多信息。

上传网络按钮可以在高级选项面板中找到。您的网络必须针对GeneMANIA支持的有机体之一,使用制表符分隔的文本,并采用以下格式GeneID评分。分数会因网络类型而异,但通常是一个从零(无交互)到1(强交互)的数字。对于存在或不存在交互的交互网络或路径,所有链接的得分为1。对于基因表达网络,分数可以是基因对的皮尔逊相关系数,代表了几个实验中的表达水平相似性。

对于共表达网络,分数可以是两个基因表达谱之间的皮尔逊相关系数。请注意,网络是标准化的,以减少高度连接节点的影响,因此一旦上传,分数可能会略有变化。

选择适当的网络权重选项

GeneMANIA可以使用几种不同的方法对网络进行加权,将所有网络组合在一起,形成搜索结果的最终复合网络。默认设置通常是适当的,但您可以在高级选项面板中选择权重方法。

查询相关权重

  • 自动选择的权重方法(默认):网络权重是根据输入基因列表的大小选择的。如果输入基因列表中的基因少于5个,默认的网络加权方法是“基于基因-生物学(GO)的加权,基于生物过程”。这种加权方法假设输入基因列表与生物过程相关(由GO定义)。如果您的输入基因列表有5个或更多的基因,GeneMANIA会使用“基于查询基因分配”策略,基于权重分配,以最大化所有输入基因之间的连接。
  • 基于查询基因分配:权重是使用线性回归自动选择的,以使列表中的基因尽可能多地相互作用,并尽可能少地与列表中未列出的基因相互作用。如果输入的基因列表包含5个以上的基因,则这是默认方法。

基于基因本体(GO)的权重

这些加权方法基于GO术语,这些术语具有3到300个相关基因。只使用了最可靠的注释(即,删除了所有带有IEA证据代码的注释,因为这些注释不太可靠)。每个GO分支有一种加权方法。

  • 基于生物过程:假设输入基因列表通过GO生物过程相关。如果输入基因列表中包含的基因少于5个,则这是默认方法。
  • 基于分子功能:假设输入基因列表通过GO分子功能关联。
  • 基于蜂窝组件:假设输入基因列表通过GO细胞成分相关。

同等权重

  • 网络平等:所有网络都被分配了相同的权重。如果你想看到连接你输入基因的所有网络,这是很有用的。
  • 按数据类型等于:所有网络类别都被分配了相等的权重,权重也均匀分布在每个类别内的网络之间。

网络数据源

每个网络数据源表示为一个加权交互网络,其中每对基因被分配一个关联权重,该权重为零表示没有交互作用,或为正值,反映交互作用的强度或它们交互作用的观察结果的可靠性。例如,基因表达数据集中一对基因的关联是皮尔逊相关在实验中,它们在多种条件下的表达水平系数。共同表达的基因越多,它们之间的关联权重就越高,范围可达1.0,这意味着表达完全相关。

直接互动用于二进制信息可用的网络(如蛋白质相互作用)。当两种蛋白质相互作用时,它们的网络链接的权重为1。

共享的邻居用于将一个基因的图谱与第二个基因的图谱进行比较并计算Pearson相关系数的网络(如蛋白质结构域数据)。

GeneMANIA数据库由来自各种来源的基因组学和蛋白质组学数据组成,包括来自基因和蛋白质表达谱分析研究以及初级和精心策划的分子相互作用网络和途径的数据。GeneMANIA依赖于以下数据源:

GeneMANIA系统中当前网络的完整列表可在GeneMANIA查询界面的高级选项(单击搜索栏中的省略号“…”)。

功能富集分析

GeneMANIA结果页面的功能选项卡显示Gene Ontology(GO)术语,这些术语在GeneMANIA显示的网络中的基因中进行了丰富。

我们只考虑GO术语中的注释(直接或向上传播),在感兴趣的有机体中有10到300个非“IEA”和非“RCA”注释。报告了FDR校正的超几何检测的GO类别和Q值,以及显示网络中注释基因数量与基因组中注释基因数的覆盖率。我们使用Benjamini-Hochberg程序估计Q值。类别显示的Q值截止值为0.1

我们使用查询列表中的所有基因或GeneMANIA发现的具有至少一个GO注释的相关基因作为前景集,并使用网络数据库中具有GO注释和至少一个相互作用的所有基因作为背景集来测试富集。

由于功能富集是在显示的网络上计算的,因此在GeneMANIA高级选项面板中为相关基因数量选择的值将影响结果。尝试使用此参数的其他值可能会有所帮助,尤其是当功能类别集为空或默认值较小时。如果您只想测试查询列表的丰富性,请选择“0”作为返回基因的数量。

计算机要求

Web浏览器:GeneMANIA支持最新版本的Chrome、Firefox、Safari和Edge。为了更快、更顺畅地使用GeneMANIA,我们建议您使用符合标准的浏览器,例如Firefox浏览器.

Internet连接:快速互联网连接,如DSL、电缆或T1。

计算机:一台具有至少1GHz CPU、1GB RAM和现代视频卡的现代计算机。

链接到GeneMANIA

链接URL最简单的形式是http://genemania.org/link?o=<tid>&g=<基因>,或者也可以

http://genemania.org/search/<有机体>/<基因>,其中:

  • <有机体>:生物体名称或通用名称(例如人类同卵类)没有标点符号(例如面包_酵母不是面包酵母)
  • <第三天>:NCBI生物分类id(拟南芥=3702,秀丽梭菌=6239,黑腹滨鹬=7227,智人=9606,小家鼠=10090,酿酒酵母=4932)
  • <基因>:由管道分隔的一个或多个基因符号(“ )–n.b.管道必须以URL编码为“%7C”(例如,“pcna%7Crad51”表示“pcna” rad51英寸)

最简单形式的示例:

  • 一个基因:http://genemania.org/link?o=3702&g=rad50
  • 多基因:http://genemania.org/link?o=3702&g=PHYB%7CELF3%7CCOP1%7CSPA1%7CFUS9

可选参数:

GeneMANIA链接支持一些可选参数(请参阅有关各种权重方法含义的GeneMANIA帮助部分):

  • :网络合并法;必须是以下之一:
    • 自动关联:基于查询基因分配
    • 自动的:自动选择的加权方法
    • 英国石油公司:基于生物过程
    • 中频:基于分子功能
    • 复写的副本:基于蜂窝组件
    • 平均的:按数据类型相等
    • 平均类别:网络平等
  • 第页:GeneMANIA生成的结果数;必须是介于1..100之间的数字。

如果未提供可选参数,则GeneMANIA采用默认值:m=自动; r=10.

使用可选参数的示例:

以下查询使用6个基因作为输入运行拟南芥的GeneMANIA算法,即“平均”方法,并返回50多个基因:

http://genemania.org/link?o=3702&g=DET1%7CHY5%7CCIP1%7CCIP8%7CPHYA%7CHFR1&m=average&r=50

以下查询使用“基于分子过程”的方法运行拟南芥CIP1基因的GeneMANIA算法,并返回101个基因:

http://genemania.org/link?o=3702&g=CIP1&m=bp&r=100

无效查询:

  • http://genemania.org/link?o=3702:必须至少指定一个基因
  • http://genemania.org/link?o=1000:分类id无效
  • http://genemania.org/link?o=3702&g=PHYA&m=super_smart&R=50:无效方法
  • http://genemania.org/link?o=3702[g=det1&r=1000:结果必须小于100

链接愉快!