跳到主要内容
  • 方法
  • 出版:

MAPPFinder:使用基因本体和GenMAPP从微阵列数据创建全局基因表达谱

摘要

MAPPFinder是一个工具,它通过将基因本体(GO)项目的注释与自由软件包GenMAPP集成,在生物学的所有领域创建全球基因表达谱http://www.GenMAPP.org(英文)。结果显示在一个可搜索的浏览器中,允许用户快速识别GO术语和基因表达变化过多的数字。点击GO术语会生成GenMAPP图形文件,可以在其中探索基因关系、添加注释,并可以自由交换文件。

背景

DNA微阵列实验同时测量了数千个基因的表达水平,产生了大量的数据。对这些数据的分析对生物学家提出了巨大的挑战,需要新的工具来帮助从这些实验中获得生物学见解。虽然数据是针对单个基因生成的,但在逐个基因的基础上检查数据集是很耗时的,并且很难在整个数据集上执行。加快数据分析速度的一种方法是从更高级别的组织中获取数据。这可以使用数据驱动的方法来实现,例如层次聚类和自组织映射[1,2],其识别具有相似表达模式的基因组。一种补充方法是在已知生物过程或途径的水平上查看数据。识别那些显示出大量基因表达变化的生物相关基因组,将对特定数据集中发生的生物学进行信息描述,从而产生新的假设,并确定需要更详细调查的特定生物学领域。

GenMAPP(Gene MicroArray Pathway Profiler)是一种有助于识别重要生物过程的工具[]是一个程序,用于查看和分析微阵列路径剖面(MAPP)上的微阵列数据,该微阵列路径轮廓表示生物路径或任何其他基因功能分组。当MAPP链接到基因表达数据集时,GenMAPP会根据用户提供的标准自动动态地对MAPP上的基因进行颜色编码。GenMAPP是基于路径的基因表达数据分析的有用起点,但在使用该工具识别所有生物学中相关的基因表达变化之前,需要满足几个关键要求。在实践层面上,需要自动化基于路径的微阵列数据分析,以便探索所有可能的路径。识别单个通路中的相关基因表达变化通常很有趣,但有必要知道在特定通路上看到的基因表达变化是该通路独有的还是发生在许多其他通路中。对自动化同样重要的是扩展以数字表示的路径信息。GenMAPP目前有50多个描述各种生物途径和基因家族的MAPP文件,但这仍然只是所有已知生物学的一小部分[]. 其他几个途径项目,如KEGG[4]、经济周期/元周期[5],路径处理器(使用KEGG)[6]和ViMAc[7]可与微阵列数据分析集成,但这些程序侧重于明确定义的代谢途径,如GenMAPP,将从更广泛的途径信息基础中受益。

为了解决这个问题,我们使用了基因本体(GO)联盟提供的信息[8]. GO联盟正在创建一个定义的词汇表,描述所有基因的生物过程、细胞成分和分子功能。GO以分层方式构建,GO术语之间存在父子关系。公共基因数据库的馆长正在将基因分配给GO术语,以便为单个基因提供注释和生物背景。除了提供基因注释外,GO还提供了一种结构,用于将基因组织成生物相关组。这些分组可以作为确定微阵列实验中显示相关基因表达变化的生物学领域的基础。虽然GO已被手动和一些软件包用于注释微阵列数据[9,10,11],还没有自动化的方法将其用于基于路径的分析。

我们开发了一个名为MAPPFinder的工具,它将基因表达式数据动态链接到GO层次结构。对于11239个([12]; 截至2002年5月6日])GO生物过程、细胞成分和分子功能术语,MAPPFinder计算符合用户定义标准的被测基因的百分比。这是针对每个特定GO节点进行的,并针对父GO项及其所有子项中符合标准的基因的累积总数,给出了与特定GO项相关的基因数量的完整图片。使用此百分比和z(z)score(参见材料和方法),用户可以根据基因表达变化的相对数量对GO术语进行排名。因此,MAPPFinder在生物过程、细胞成分和分子功能的水平上生成基因表达谱,快速确定需要进一步研究的生物学领域(图1).

图1
图1

MAPPFinder的工作原理。微阵列数据作为GenMAPP基因表达数据集导入MAPPFinder。MAPPFinder使用关系数据库和GO中的基因关联文件,将数据集中的数千个基因分配给数千个GO术语。MAPPFinder使用用户定义的显著基因表达变化标准,计算符合标准的基因百分比以及每个GO项的统计分数。使用MAPPFinder生成的排名列表和GO浏览器,用户可以快速识别出具有高水平基因表达变化的有趣GO术语。这些GO术语中涉及的特定基因可以使用GenMAPP在自动生成的MAPP上进行检测。

MAPPFinder和GenMAPP都可以在免费充值[13].

结果和讨论

为了证明MAPPFinder的实用性,我们使用该程序分析了公开可用的小鼠微阵列数据集,即FVB心脏发育、成熟和衰老基准集[14]. 该数据集测量了12.5天胚胎和成年小鼠心脏中的基因表达水平。我们利用12.5天的胚胎时间点来确定那些显示胚胎心脏和成年心脏之间差异表达基因的生物过程。我们使用两个标准对此数据集进行了MAPPFinder分析,要么是增加(倍数变化>1.2第页<0.05)或减少(倍数变化<-1.2和第页<0.05)。我们之所以选择这个数据集进行演示,是因为与成年小鼠心脏组织相比,在12.5天胚胎中观察到的基因表达存在大量差异。

MAPPFinder将本实验中测量的9946个探针组与11239个GO项联系起来[12]并计算符合标准和a的基因百分比z(z)每个GO学期的得分。1对数据集和GO之间的联系以及MAPPFinder进行的计算进行了总体总结。在FVB基准数据集中测量的9946个探针组中,近一半与GO项有关,约占与GO项相关的小鼠基因的70%[15]并涵盖了目前已知的小鼠生物学的大部分内容。随着小鼠基因组数据库(MGD)添加更多GO术语和基因关联,微阵列数据集中与GO术语相关的基因比例将增加[16].

表1 MAPPFinder计算中使用的基因数量

MAPPFinder将微阵列数据集中的基因分配给GO结构后,它计算每个GO项的百分比和z(z)符合用户标准的基因得分(参见材料和方法)。这两个值可用于识别具有过度(或不足)表示的基因表达变化数量的GO术语。MAPPFinder结果以两种形式显示。第一个是GO浏览器,它以图形方式显示GO层次结构中的MAPPFinder结果(图2a个,3a年). 第二个是一个文本文件,列出了所有度量的GO术语,按z(z)分数。给出了符合标准的基因数量、实验中测量的基因数量以及MGD分配给每个GO项的基因数量,以及各自的百分比和z(z)分数,在文本文件和GO浏览器中(图2亿). 2显示了带有z(z)在胚胎12.5天的时间点,显著增加和减少的标准的得分大于2。改变基因少于5个或超过100个的GO术语被从列表中删除,因为这些术语对于我们的数据分析来说要么太具体,要么太笼统。该过滤器确定了显著增加标准的前108个(8.0%)GO项和显著减少标准的前63个(4.8%)GO-项。通过升高或降低z(z)得分截止,或包括基因数量较多或较少的术语。然后,手动修剪过滤后的列表中的相关GO项,以删除GO层次结构中任何过度表示的分支(有关完整结果,请参阅其他数据文件)。当父项和子项都出现在列表中时,如果父项的出现完全是由于符合子项标准的基因所致,则会删除父项。清单上的其余术语仍然有很大程度的相关性,但为了完整起见,保留在这里。

图2
图2

MAPPFinder浏览器。(a)GO层次结构的分支源于生物过程术语“RNA加工”。这些术语用MAPPFinder结果着色,表示与成年小鼠相比,12.5天胚胎中的基因显著增加。0-5%基因改变的术语为黑色,5-15%为紫色,15-25%为深蓝色,25-35%为浅蓝色,35-45%为绿色,45-55%为橙色,大于55%为红色。术语RNA处理以黄色突出显示,表明它符合搜索或筛选要求。(b)MAPPFinder结果。RNA处理这一术语以标记的各种MAPPFinder结果显示。计算了符合标准的基因百分比和本实验测量的GO中的基因百分比。将单独计算此节点的结果,并将其与所有子节点(即嵌套结果)结合计算。这个z(z)分数表示符合标准的基因数量是否高于或低于预期。正值表示基因的改变比预期的要多;负分数意味着改变的基因比预期少,接近0的分数表示改变的数量接近GO项的预期值。

图3
图3

将MAPPFinder链接到GenMAPP。(a)MAPPFinder浏览器显示了12.5天胚胎增加的GO过程术语“糖酵解”结果。GO术语的颜色编码与图中相同2.(b)在MAPPFinder浏览器中单击GO术语糖酵解生成相应的GenMAPP MAPP文件。此MAPP文件包含与此术语及其所有子项相关的基因列表。(c)使用GenMAPP中的工具重新排列GO列表中的基因,以描述代谢中间产物和细胞隔室的糖酵解途径。(b)和(c)基因的颜色编码如下:红色,折叠变化>1.2和第页12.5天胚胎小鼠与成年小鼠之间的差异<0.05。蓝色,折叠变化<-1.2和第页< 0.05. 灰色,不符合上述标准。白色,阵列上未找到基因。

表2与成年小鼠相比,12.5天胚胎中基因的MAPPFinder结果显著增加和显著减少

MAPPFinder的结果展示了与成年小鼠相比,12.5天胚胎中生物过程、细胞成分和分子功能增加和减少的总体情况(表2). MAPPFinder使用显著增加基因表达变化的标准,初步确定了与细胞分裂和生长有关的GO术语。值得注意的GO术语包括“有丝分裂细胞周期”过程(70个基因中的62.9%,z(z)得分为8.1),“mRNA剪接”(21个基因中的90.5%,z(z)得分为7.5分)和“蛋白质生物合成”(104个基因中的50%,z(z)6.8分)。排名靠前的组成部分和功能术语反映了相同的生物过程。例如,组成术语“剪接体”表明,20个基因中有17个(85%,z(z)得分6.7)上调。这些过程的上调与心肌细胞在胚胎发育过程中保持有丝分裂活性这一事实相一致[17]. MAPPFinder结果表明,除了参与细胞分裂和生长的过程外,“跨膜受体蛋白丝氨酸/苏氨酸激酶信号通路”和“诱导凋亡”的过程也被上调,与细胞分裂和细胞生长有关z(z)得分约为2分。术语“跨膜受体蛋白丝氨酸/苏氨酸激酶信号通路”的出现是由于参与转化生长因子-β(TGFβ)受体信号传导的基因上调,TGFβ被认为调节心脏发育过程中形态发生所需的凋亡诱导[18,19].

与成年心脏相比,参与能量代谢的基因在12.5天胚胎心脏中表现出最高水平的下调。特别是,过程术语“脂肪酸代谢”(30个基因中的63.3%,z(z)得分为5.9)和“碳水化合物代谢的主要途径”(39个基因中的51.3%,z(z)得分4.8),是术语“糖酵解”和“三羧酸循环”的父代,表明与成年小鼠相比,胚胎中的整体代谢基因下调。此外,组成术语“线粒体”显示187个基因中有88个(47.1%,z(z)分数9.1)被下调。脂肪酸代谢相关基因的下调与研究一致,研究表明发育中的心脏不同于成人心脏,它的能量不来自脂肪酸[20].

总的来说,MAPPFinder的结果提供了一个关于12.5天胚胎心脏与成人心脏相比上调和下调过程的全局视角。结果证实了预期:与成人心脏相比,胚胎心脏的细胞分裂和生长增加,能量代谢降低。此外,MAPPFinder提供的全球基因表达谱允许将观察到的细胞分裂、生长和能量代谢的基因表达变化置于其他调控和发育过程的背景下,如TGFβ信号和凋亡。

MAPPFinder浏览器

将MAPPFinder结果作为排名列表进行查看可以提供丰富的信息,但它并没有充分利用GO是按层次结构排列的这一事实。MAPPFinder还显示了GO层次结构上下文中的结果(图2a个,3a年)显示了整个层次结构,颜色编码的基因改变的百分比。用户可以遍历层次结构,扩展显示基因表达变化的树的分支,从广义术语转移到更具体的类别。通常,术语的排名列表会显示许多相互关联的术语,有必要查看层次结构中的结果,以确定它们之间的关系。例如,术语“RNA代谢”、“RNA处理”、“mRNA处理”和“mRNA剪接”在表中显示为上调2然而,树视图(图2a个)清楚地表明,mRNA剪接是RNA剪接和mRNA加工的子术语,而这又是RNA代谢的子术语。同样,术语“碳水化合物代谢的主要途径”、“分解代谢的碳水化合物代谢”和“糖酵解”也在表中显示为下调2MAPPFinder浏览器(图3a年)表明“糖酵解”通过这些术语之间的层级关系与“碳水化合物代谢的主要途径”有关。

MAPPFinder浏览器还提供三种搜索和导航功能。首先,用户可以通过关键字或确切的GO术语名称进行搜索。其次,用户可以通过基因标识符进行搜索,以找到与该基因相关的GO项。例如,使用其SWISS-PROT标识符MYH6_MOUSE或其MGD标识符MGI:97255搜索α-肌球蛋白重链基因,可以找到GO过程术语“横纹肌收缩”、“细胞骨架组织和生物发生”、“蛋白质修饰”和“肌肉发育”。第三,用户可以自动展开GO树,以显示基因数量最少或基因百分比最小的所有节点,满足标准或最小z(z)分数。符合过滤器的术语以黄色突出显示,以清楚地指示搜索结果。

一旦用MAPPFinder识别出感兴趣的GO术语,用户就会想确切地知道哪些基因与这些术语相关,以及哪些基因正被差异表达。这可以使用GenMAPP完成。在MAPPFinder浏览器中选择GO术语会自动构建一个包含与该GO术语及其所有子项关联的基因的MAPP,并在GenMAPP中打开该MAPP。3亿显示了通过在MAPPFinder浏览器中选择GO术语“糖酵解”生成的MAPP。MAPP上的基因采用与计算MAPPFinder结果相同的标准进行颜色编码,在12.5天胚胎时间点显著增加和减少。点击MAPP上的基因会打开一个“主页”,其中包含注释、基因表达数据以及指向公共数据库中该基因页面的超链接。通过集成GenMAPP和MAPPFinder,可以从所有生物过程、成分和功能的全球基因表达谱无缝过渡到对所涉及的特定基因的基因表达水平的详细描述。例如,对糖酵解MAPP的进一步检查表明,与成人心脏相比,12.5天胚胎中己糖激酶I上调,亚型II和IV下调。这与己糖激酶I是胚胎心脏的主要亚型一致[21].

将MAPPFinder扩展到GO以外

GO是分析生物途径背景下微阵列数据的良好起点,但这绝不是对相关基因进行分组的唯一方法。与其将每个GO过程表示为MAPP上的字母表,不如将这些基因之间的关系表示为一个完整描述的路径。作为这一方向的起点,GenMAPP.org[13]已经创建了50多个MAPP,描述了代谢途径、信号途径和基因家族。MAPPFinder可以将任何MAPP文件合并到其分析中,以增加GO层次结构。对于FVB基准开发数据集,我们在54个鼠标MAPP的存档上运行了MAPPFinder,可从[13](有关完整结果,请参阅其他数据文件)。12.5天胚胎时间点的这些结果与GO结果一致,表明参与代谢途径“三羧酸循环”的基因的表达(测量的12个基因中83.3%,z(z)得分为5.91)和“脂肪酸降解”(测量的13个基因中的69.2%,z(z)得分4.82)显著降低。此外,显著增加的标准确定了编码核糖体蛋白的基因(45个基因中的71.1%,z(z)得分6.75)和参与细胞周期的基因(15个基因中的53.3%,z(z)得分2.4)。

GenMAPP提供的MAPP档案并不全面。这个档案的增长依赖于整个生物界的援助。我们希望,随着MAPPFinder用户看到将GO生物过程视为完整描述的路径的附加效用,他们将使用GenMAPP将基因列表组织成更具描述性的生物路径。3立方厘米给出了一个示例,说明如何使用GenMAPP中的工具重新排列GO术语“糖酵解”的基因,以描述显示酶级联、代谢中间产物和细胞隔室方向的完整路径。GenMAPP.org目前正在接受新MAPP文件的提交。社区贡献的MAPP将包含在可下载的MAPP档案中。

MAPPFinder是对当前分析工具的必要补充

通过从更高级别或组织访问大型数据集,MAPPFinder有助于简化数据分析,并缩短对微阵列数据进行生物学理解所需的时间。MAPPFinder通过使用GO提供的大量注释,极大地扩展了当前基于路径的工具。这一广泛的分析将有助于确定尚未涉及特定实验条件的生物过程,并开始在以前认为不相关的生物过程之间建立联系。

MAPPFinder可用于酵母、小鼠和人类数据。我们计划将该计划扩展到GO中的许多其他物种,更新将在[13].

材料和方法

基因表达数据

公开可用的小鼠微阵列数据集,即心脏发育、成熟和衰老的FVB基准集,是从基因组应用的心脏基因组计划获得的[14]. 这些数据使用雄性和雌性FVB/N小鼠比较发育过程中不同时间点的健康小鼠心脏。具体来说,该数据集检查了12.5天胚胎、1天新生小鼠、1周小鼠、4周小鼠和5个月和1岁成年小鼠的心脏组织。我们的分析集中于12.5天胚胎时间点和对照成年小鼠。每个时间点使用三个Affymetrix U74A版本1阵列。在胚胎发育期,每个阵列共有三个心脏,因为它们体积较小。为了提高我们分析中的统计能力,将5月龄和1年龄小鼠合并为一组正常成年小鼠。使用Affymetrix MAS 5.0软件获得信号强度值。将小于20的信号值提高到20,并取对数基数2。与联合对照组的平均值相比,根据每个时间点的平均值确定对数倍。通过排列计算值测试。使用R统计编程语言的multest包进行统计分析[22]. 将这些数据导入GenMAPP,并将生成的GenMAPP表达式数据集文件(.gex)导出到MAPPFinder。

MAPPFinder需要一个用户定义的标准来实现有意义的基因表达变化。在这种情况下,我们将折叠变化与统计滤波器相结合,以确定显著性。我们使用大于1.2的折叠变化第页值小于0.05,定义基因表达显著增加,并且倍变小于-1.2第页-值小于0.05,定义基因表达显著降低。为了确定每个GO项中基因表达变化的总数,一个大于1.2或小于1.2的折叠变化的附加标准和一个第页使用小于0.05的值(未显示数据)。

值得注意的是,虽然我们使用了Affymetrix GeneChips产生的基因表达数据,但来自其他微阵列平台和其他技术的数据,如SAGE(基因表达的序列分析),也可以同样容易地使用。

将表达数据链接到基因本体

MAPPFinder使用GO提供的三个本体文件(Process、Component和Function)构建GO层次结构的本地副本[12]. GO的有向无环图(DAG)结构[23]允许节点是多个父节点的子节点。这使得MAPPFinder结果的导航、可视化和计算比GO存储在经典树结构中更加困难。为了简化实现MAPPFinder算法所需的编程,将DAG结构转换为经典树。对于包含多个父节点的DAG的每个节点,使用本地标识符将多个副本插入GO的树表示中,以处理重复的GO项。此树结构维护GO DAG结构中实施的“真实路径”规则。MAPPFinder在内部处理此转换,对于用户来说,MAPPFinderbrowser中看到的GO层次结构将与其他GO浏览器中看到的相同。

GO项和表达式数据集中的基因之间的链接是通过基因关联文件建立的[15]. 这些协会来自欧洲生物信息学研究所[24]对于人类基因,小鼠基因组数据库(MGD)[16]小鼠基因,以及酵母菌属基因组数据库(SGD)[25]用于酵母基因。目前,输入数据中的基因必须使用GenBank、SWISS-PROT或SGD标识符进行识别。

MAPPFinder使用关系数据库将表达式数据集链接到基因关联文件。MAPPFinder数据库将基因表达数据与每个物种的适当基因识别系统相关联(图1). 对于人类数据,基因关联文件使用SWISS-PROT标识符,需要一个SWISS-PROT-to-GenBank关系表将使用GenBank登录号的数据集链接到GO注释。对于酵母数据,基因关联文件使用SGD标识符。对于使用SWISS-PROT标识符的表达式数据集,还包括一个SWISS-PROT-to-SGD关系表。对于鼠标数据,GO基因关联文件使用MGD标识符,需要GenBank-to-MGD关系表和SWISS-PROT-to-MGD关系表。MAPPFinder利用了MGD也与UniGene相关的事实,允许不在MGD GenBank关系表中的额外EST用作基因标识符。通过这个中间步骤,可以将更多的GenBank标识符链接到GO注释。目前,SWISS-PROT和UniGene之间没有直接关系,因此没有对人类数据使用类似的中间步骤。

计算MAPPFinder结果

MAPPFinder计算每个GO术语中符合用户定义标准的基因百分比,此测量称为“变化百分比”。MAPPFinder还计算了实验中测量到的与GO项相关的基因百分比,该测量称为“存在百分比”。计算存在百分比对于确定GO项在数据集中的表示程度是必要的。

GO基因关联文件[17]有潜在的问题,因为他们独立对待每个GO术语,消除了隐含的亲子关系。因此,单独查看GO术语通常没有什么信息,因为与任何一个术语相关的基因数量小于该过程、成分或功能所涉及的实际基因数量。为了解决这个问题,我们计算了一个父术语的嵌套百分比,该父术语在层次结构中的所有子项都位于它下面。通过将子项与其父项相结合,结果包含了与层次结构的整个分支相关的基因,从而更准确地表示了参与该过程、组件或功能的基因数量。随着GO的更具体分支被检查,两个方程的分母将变小,用户可以找到他们想要的特异性水平。这种方法带来的一个复杂问题是,在某些情况下,一个基因与父项和子项或多个子项都相关。当计算子树的百分比时,我们确保每个基因只计算一次,这样具有多个注释的基因就不会权重更大。

计算MAPPFinder结果时出现的另一个复杂问题是阵列上同一基因的多个探针的问题。在这种情况下,特征或重复基因聚集到一个独特的基因。如果数组中该基因的任何实例符合用户定义的标准,则该基因符合用户定义标准。独特基因的数量也用于计算z(z)得分,意味着统计数据仅基于数据集中每个基因的一次出现。

还提供了每个MAPP和GO项中相对基因表达活性的统计评级。这是一个标准化的差异分数(z(z)得分)使用超几何分布下符合GO项标准的基因数量的期望值和标准偏差。这个z(z)该分数有助于根据基因表达变化的相对量对GO术语进行排名。积极的z(z)分数表明GO术语中符合标准的基因数量比偶然预期的要多。否定z(z)分数表明符合标准的GO术语的基因比偶然预期的要少。A类z(z)分数接近零表示符合标准的基因数量接近预期数量。极端阳性的分数表明GO术语具有最大的信心,即该组基因表达变化之间的相关性不是偶然发生的。数值没有分配给GO术语或MAP,因为尽管这样的标准化差异分数可能接近正常值z(z)单个MAPP的得分、GO术语之间缺乏独立性以及它们之间发生的多次测试肯定会使正常第页这样的值z(z)得分不可靠。因此,第页未将值分配给GO术语和MAPP。

这个z(z)分数的计算方法是,从观察到的基因数中减去符合标准的GO项(或MAPP)中的预期基因数,再除以观察到基因数的标准偏差。使用的方程式为

哪里N个是测量的基因总数,R(右)是符合标准的基因总数,n个是该特定MAPP中的基因总数,以及第页是符合此特定MAPP标准的基因数。

因此,如果两个GO术语包含相同数量的基因,则符合标准的基因数量越多的术语得分越高。除以标准差可以调整GO项的大小,将大量符合标准的基因排在GO项(或MAPP)的前面,而GO项与MAPP的基因变化百分比相同,但总基因较少。

MAPPFinder结果在GO浏览器中生成,用于在GO层次结构的上下文中进行分析,并作为制表符分隔的文本文件,可用于电子表格程序中的数据排序和过滤。

其他数据文件

以下附加数据文件可用:

FVBN开发数据的形式为GenMAPP表达式数据集文件(.gex)。它包含微阵列数据集和用于定义增加和减少基因表达变化的标准。它可以在GenMAPP中打开进行编辑,是与MAPPFinder一起使用的适当数据类型。

FVBN开发数据作为数据库文件由MAPPFinder(.gdb)生成。它包含数据集中的基因和GO层次结构之间的关系。可以在Microsoft Access中打开该文件以进行查看。必须存在此文件,才能从现有MAPPFinder结果生成GenMAPP MAPP。

文件中包含了12.5天胚胎与成年小鼠的MAPPFinder结果:12.5天胚胎-显著增加-基因本体结果,12.5天胚胎-显著增加-局部结果,12.5天胚胎-显著减少-基因本体结果,12.5天胚胎-显著减少-局部结果,12.5天胚胎-所有变化-基因本体结果,12.5天胚胎-所有变化-局部结果。这些文本文件包含两个条件以及GO层次结构和GenMAPP.org MAPP的MAPPFinder结果。这些文件可以加载到MAPPFinder中,以便在MAPPFinder-GO浏览器中查看。这些文件以制表符分隔,也可以在Microsoft Excel中作为表格查看。“All Changes”文件包含寻找增加或减少基因表达变化的标准的结果。A类zip文件包含所有可选数据文件。

工具书类

  1. Eisen MB、Spellman PT、Brown PO、Botstein D:全基因组表达模式的聚类分析和显示。美国国家科学院院刊,1998年,95:14863-14868。10.1073/pnas.95.25.14863。

    第条 中国科学院 谷歌学者 

  2. Tamayo P、Slonim D、Mesirov J、Zhu Q、Dmitrovsky E、Lander ES、Golub TR:用自组织图解释基因表达:方法和在血样分化中的应用。美国国家科学院院刊,1999年,96:2907-2912。10.1073/pnas.96.6.2907。

    第条 中国科学院 谷歌学者 

  3. Dahlquist KD,Salomonis N,Vranizan K,Lawlor SC,Conklin BR:GenMAPP,一种用于查看和分析生物途径微阵列数据的新工具。自然遗传学。2002, 31: 19-20. 10.1038/ng0502-19。

    第条 中国科学院 谷歌学者 

  4. Nakao M、Bono H、Kawashima S、Kamiya T、Sato K、Goto S、Kanehisa M:KEGG中的基因表达分析和通路重建。基因组通知Ser WorkShop基因组通知。1999, 10: 94-103.

    中国科学院 谷歌学者 

  5. Karp PD、Riley M、Paley SM、Pellegrini-Toole A:MetaCyc数据库。《核酸研究》,2002年,30:59-61。10.1093/nar/30.1.59。

    第条 中国科学院 谷歌学者 

  6. Grosu P、Townsend J、Hartl D、Cavalieri D:通路处理器:将全基因组表达结果整合到代谢网络中的工具。《基因组研究》,2002年,12:1121-126。10.1101克/克226602。

    第条 中国科学院 谷歌学者 

  7. Luyf A、de Gast J、van Kampen A:在全基因组范围内可视化代谢活动。生物信息学。2002, 18: 813-818. 10.1093/bioinformatics/18.6.813。

    第条 中国科学院 谷歌学者 

  8. Ashburner M、Ball CA、Blake JA、Botstein D、Butler H、Cherry JM、Davis AP、Dolinski K、Dwight SS、Eppig JT等:基因本体:生物学统一的工具。自然遗传学。2000, 25: 25-29. 10.1038/75556.

    第条 中国科学院 谷歌学者 

  9. Pletcher SD、MacDonald SJ、Marguerie R、Certa U、Stearns SC、Goldstein DB、Partridge L:衰老和热量限制的全基因组转录谱黑腹果蝇当前生物。2002, 12: 712-723. 10.1016/S0960-9822(02)00808-4。

    第条 中国科学院 谷歌学者 

  10. Silcon Genetics产品:Gene Spring[http://www.silicongenetics.com/cgi/SiG.cgi/Products/GeneSpring/index.smf]

  11. Affymetrix-NetAffx分析中心。[http://www.affmetrix.com/analysis/index.affx]

  12. 基因本体项目本体文件。[ftp://ftp.geneontology.org/go/ontology/]

  13. GenMAPP公司。[http://www.GenMAPP.org(英文)]

  14. 心脏基因组学:心脏发育、成熟和衰老的FVB基准数据集。[http://www.cardiogenomics.org:1550/groups/proj1/pages/fvb_home.html]

  15. 基因本体论项目基因关联文件。[ftp://ftp.geneontology.org/go/gene-associations公司]

  16. Blake JA、Richardson JE、Bult CJ、Kadin JA、Eppig JT、小鼠基因组数据库组:小鼠基因组数据库(MGD):实验室小鼠的模型生物数据库。《核酸研究》,2002年,30:113-115。10.1093/nar/30.1.113。

    第条 中国科学院 谷歌学者 

  17. 朱华:心肌细胞发育和形态发生。在《心肌》中。编辑:Langer GA.1997,加利福尼亚州圣地亚哥:学术出版社,33-80。

    第章 谷歌学者 

  18. Poelmann R、Molin D、Wisse L、Gittenberger-de Groot A:心脏发育中的细胞凋亡。《细胞组织研究》2000,301:43-52。2007年10月10日/004410000227。

    第条 中国科学院 谷歌学者 

  19. Kubalak S,Hutson D,Scott K,Shannon R:转化生长因子β2升高可促进细胞凋亡,并有助于视网膜X受体α基因敲除胚胎的异常流出道和主动脉囊发育。发展。2002, 129: 733-746.

    中国科学院 谷歌学者 

  20. Lopaschuk G,Collins-Nakai R,Itoi T:心脏能量底物使用的发育变化。《心血管研究》1992,26:1172-1180。

    第条 中国科学院 谷歌学者 

  21. Fritz H,Smoak I,分支S:器官发生早期和晚期胚胎小鼠心脏中己糖激酶I的表达和活性。组织化学细胞生物学。1999, 112: 359-365. 2007年10月17日/004180050417。

    第条 中国科学院 谷歌学者 

  22. 在复制cDNA微阵列实验中鉴定差异表达基因的统计方法。[http://www.stat.berkeley.edu/users/terry/zarray/TechReport/578.pdf]

  23. 基因本体联盟:创建基因本体资源:设计和实现。《基因组研究》2001,11:1425-1433。10.1101/gr.180801。

    第条 谷歌学者 

  24. EMBL-EBI:GOA项目在线。[http://www.ebi.ac.uk/GOA/project.html]

  25. Dwight SS、Harris MA、Dolinski K、Ball CA、Binkley G、Christie KR、Fisk DG、Issel-Tarver L、Schroeder M、Sherlock G等:酵母菌属基因组数据库(SGD)使用基因本体(GO)提供二级基因注释。《核酸研究》,2002年,30:69-72。10.1093/nar/30.1.69。

    第条 中国科学院 谷歌学者 

下载参考资料

致谢

我们感谢A.Zambon、W.Tingley、T.Speed、P.Bacchetti和J.Myers就MAPPFinder的设计和实现所进行的有益对话,感谢B.Taylor对本手稿编写的帮助,感谢S.Izumo和CardioGenomics公开微阵列数据集。这项工作得到了J.David Gladstone Institutes、旧金山总医院综合临床研究中心、国家心脏、肺和血液研究所、旧金山综合医院综合临床研发中心MO1RR00083(B.R.C.)和NHLBI基因组应用计划(BayGenomics)的支持。

作者信息

作者和附属机构

作者

通讯作者

与的通信布鲁斯·R·康克林.

电子辅助材料

13059_2002_517_MOESM1_ESM.gex公司

附加数据文件1:GenMAPP表达式数据集文件(.gex)形式的FVBN开发数据。它包含微阵列数据集和用于定义增加和减少基因表达变化的标准。它可以在GenMAPP中打开进行编辑,是与MAPPFinder一起使用的适当数据类型。(GEX 3 MB)

13059_2002_517_MOESM2_ESM.gdb

附加数据文件2:FVBN开发数据作为MAPPFinder(.gdb)生成的数据库文件。它包含数据集中的基因和GO层次结构之间的关系。可以在Microsoft Access中打开该文件以进行查看。必须存在此文件才能从现有的MAPPFinder结果构建GenMAPP MAP。(GDB 4 MB)

附加数据文件3:12.5天胚胎-显著增加-基因本体结果(TXT 96 KB)

附加数据文件4:12.5天胚胎-显著增加-局部结果(TXT 2 KB)

附加数据文件5:12.5天胚胎-显著减少-基因本体结果(TXT 93 KB)

附加数据文件6:12.5天胚胎-显著减少-局部结果(TXT 3 KB)

附加数据文件7:12.5天胚胎-所有变化-基因本体结果(TXT 128 KB)

附加数据文件8:12.5天胚胎-所有变化-局部结果(TXT 3 KB)

附加数据文件9:包含所有附加数据文件的zip文件。(邮政编码:3 MB)

权利和权限

转载和许可

关于本文

引用这篇文章

Doniger,S.W.,Salomonis,N.,Dahlquist,K.D。等。MAPPFinder:使用基因本体和GenMAPP从微阵列数据创建全局基因表达谱。基因组生物学 4,R7(2003)。https://doi.org/10.1186/gb-2003-4-1-r7

下载引文

  • 收到:

  • 修订过的:

  • 认可的:

  • 已发布:

  • 内政部:https://doi.org/10.1186/gb-2003-4-1-r7

关键词