跳到主要内容

分子系统生物学的注释、映射、表达和网络(AMEN)工具套件

摘要

背景

高通量基因组生物学实验产生了大量多层面的数据集,需要灵活且用户友好的分析工具,以便于生命科学家对其进行解释。目前存在许多解决方案,但它们通常仅限于复杂数据管理和分析过程中的特定步骤,有些解决方案需要广泛的信息学技能才能有效安装和运行。

结果

我们开发了注释、映射、表达和网络(AMEN)软件,作为一套独立、统一的工具,使经过基本生物信息学培训的生物和医学研究人员能够管理和探索基因组注释、染色体映射、蛋白质相互作用、表达谱分析和蛋白质组学数据。当前版本提供了以下模块:(i)上传和预处理来自微阵列表达谱实验的数据,(ii)检测显著共表达基因组,以及(iii)搜索这些组中功能注释的丰富性。此外,用户界面设计为同时可视化几种类型的数据,例如蛋白质相互作用网络,以及表达谱和细胞共同定位模式。我们已经成功地应用该程序来解释来自芽殖酵母、啮齿动物和人类的表达谱数据。

结论

AMEN是在GNU许可下免费提供的分子系统生物数据分析的创新解决方案。该程序可通过Sourceforge门户网站获得,其中包括一份用户指南,其中包含具体示例、外部数据库链接和有用的评论,以实现其他功能。我们强调,AMEN将继续由我们的实验室开发和维护,因为它已被证明对我们的基因组生物学研究计划极为有用。

背景

高通量DNA测序、基于微阵列的mRNA表达谱分析、蛋白质组学实验和蛋白质相互作用分析已经产生了大量复杂的数据集,需要在基因或基因组水平上与功能信息集成。使用微阵列进行大规模表达谱分析是基因组生物学中最流行的实验方法之一,因此优化方法可用于所有关键分析步骤。它们包括原始数据预处理、质量控制和标准化[1,2],在静态或时程条件下识别差异表达基因[5],基因聚类[68]并在表达簇中搜索功能注释的显著过度或不足表达[911]. 这个生物导体项目提供了许多在中开发的软件包R(右)用于高吞吐量分析任务的[1214]. 然而,安装和运行它们需要广泛的编程技能,而这些技能在生命科学家中还不常见。为了缓解这个问题,已经开发出了具有方便的图形用户界面(GUI)的程序,在大多数情况下,这些程序仅限于由基因本体(GO)联盟进行注释,以便于进行功能分析[10]或仅限于一组基因组[15,16]. 其他工具将表达与染色体定位相关[1721],蛋白质相互作用[22]或路径数据[23].

为了结合分析步骤,开发了许多基于web的应用程序[2430]. 它们是免费的,不需要维护工作。但是,它们的可访问性和速度取决于网络流量、服务器可用性和分析程序的规范。此外,基于web的系统通常提供预先配置且不灵活的数据分析方法,并且通常不包括组合不同类型的高吞吐量数据的高级选项。为了解决这些问题,并允许集成探索不同类型的数据,我们开发了注释、映射、表达式和网络(AMEN)程序,使用户能够探索和分析多方面的高通量生物数据。它包括一套工具和算法,可以根据需要对参数进行微调,并对分析步骤进行排序。AMEN以类似于EXPANDER 2.0的方式涵盖阵列数据管理、分析和解释[29]. 然而,我们的软件提供了更多选项来组合不同类型的数据,使用户不仅可以导入基因组注释和转录组,还可以导入蛋白质组和相互作用组数据,而不受物种限制。

实施

AMEN软件体系结构由在Tcl/Tk中实现的四层组成(图1) [31]. 第一层提供用于上传、格式化和预处理表达、注释、染色体映射和蛋白质相互作用数据的模块。第二层是主应用程序窗口的用户友好GUI,它使用弹出菜单项目,上传数据,工具,意见选项功能(图2). 六个面板提供了对项目列表的访问,例如探针ID、基因、蛋白质(组)、RNA/蛋白质分析实验数据(表达式)、基因组注释(注释)、蛋白质-蛋白质和蛋白质-DNA相互作用(相互作用)、染色体定位(映射)以及统计模块的输出(统计)。每个面板下方的功能按钮允许用户滚动项目列表(向上/向下)、标记项目(全选/取消选择)、更改面板内容(添加/删除)、更改项目名称(修改)或更改文件内容(编辑)。用户将每个面板中以黄色高亮显示的选定项目组合到不同的工作流中。例如,选择与有丝分裂(MI)、减数分裂(ME)和减数分裂后(PM)生殖细胞相比,在睾丸(DET)和体细胞支持细胞(SO)中显示差异表达和峰值信号的小鼠基因(注释面板)和精子发生数据(表达面板)(见图2)生成由模块生成的RNA分析信号的图形显示,该模块通过视图>表达式数据>配置文件菜单(图). 选择蛋白质网络数据(交互面板)使用户能够显示交互模式(参见参考中的图4[32]). 选择染色体定位(映射面板)和统计项使用户能够关联表达和映射信息,或者揭示转录模式和生物过程中角色之间的联系(参见参考文献[33]更多详细信息)。在后台,第三层自动创建并运行统计计算环境R的脚本,该环境执行Bioconductor包中实现的统计计算和聚类方法。第四层显示基于Tk脚本和图形渲染软件GraphViz的输出。

图1
图1

AMEN体系结构.显示了软件和工作流的流程图。

图2
图2

主应用程序窗口给出了主应用程序窗口的屏幕截图。如图所示,六个数据类型面板显示了哺乳动物睾丸表达数据的可能分析策略。四组(簇)基因定义为d日不同地e(电子)以表示t吨estis和所以matic(DET-SO),惯性矩总量(DET-MI),生物(DET-MI)和第页成本-eiotic(DET-PM)分别取决于支持细胞、精原细胞、精母细胞和精子细胞中的峰值表达。表达数据集(精子发生)是通过包含大约25000个蛋白编码小鼠基因的基因芯片获得的,并为其选择了适当的注释文件(Mouse430_2.na22)。为了可视化分为两个选定簇(DET-MI和ME)的蛋白质的相互作用网络,结合了三个来源的信息(IntAct_MINT_BioGRID)。为了显示属于给定表达簇的选定基因的染色体定位,可以使用带有和不带细胞学带的基因坐标文件(affyMOE430,affyMOE430_WithCyto)。用户可以选择对GO术语在簇中的富集进行统计分析(AnnotationEnrich),也可以选择对染色体进行基因富集(MappingEnich)。

图3
图3

表达式分析数据的图形显示对数转换的表达信号强度分别与Y轴和X轴上的样本名称绘制。每个样本的信号分布和中位数通过方框图显示。显示了分类为睾丸差异表达(DET)和有丝分裂(MI)或减数分裂(ME)生殖细胞转录峰值的基因的数据(见[33])。样本名称一式两份,包括支持细胞(SE)、精原细胞(SG)、精母细胞(SC)、精子细胞(ST)、生精小管(TU)和总睾丸(TT)。行和列对应于探测集ID和样本。表达信号以红色(高)或蓝色(低)显示,如比例尺所示。绿线表示用户选择的表达式配置文件。

我们的程序需要预先安装适用于所有常用操作系统(如MS Windows、UNIX、Linux和Mac OS X)的Tcl/Tk、R和GraphViz程序。可以通过Sourceforge网站访问详细的下载和安装说明。我们还提供了一个Windows版本的软件,可以预先安装嵌入其中的Tcl/Tk、R和GraphViz[34]. 我们决定停止使用goCluster,因为它缺少关键的分析功能,并且进一步开发和维护的成本超过了我们实验室和社区的利益。我们强调,AMEN经常更新,因为该软件是我们正在进行的生物医学研究的关键工具。它的结构极大地促进了新模块的实现。实际上,一行Tcl代码就足以在主GUI中包含其他功能。

结果和讨论

数据上传

典型的工作流包括当前版本中可用的五种类型的模块:数据上传和预处理、统计过滤、集群、功能挖掘和可视化。使用主应用程序窗口(图2). 它包括与不同输入数据相对应的六个面板:项目(如基因、转录物、蛋白质或探针标识符)、表达信号、功能注释、(蛋白质-蛋白质)相互作用、染色体位置和统计数据。在此过程中,项目(如探针集ID)自动与其他数据类型(包括基因符号、染色体位置和GO术语)关联。该界面便于访问数据和设计优化分析程序。数据以制表符分隔的兼容格式作为文本文件输入,以确保与所有操作系统兼容。

组数据

用户可以上传预先选择的项目列表(称为“主要条目”,例如探针、转录本、基因或蛋白质标识符),也可以通过统计过滤、聚类和/或可视化模块获得此类列表(参见图4).

图4
图4

GO项分析的图形输出显示了与来自DET-MI和-ME表达簇的基因相关的生物过程类别中过度代表的GO术语的示例。表达簇的名称和基因数显示在每列顶部。与给定GO项相关的基因座数量显示在列的左侧。根据GO项顶部的比例尺,观察到的和预期的基因座数量在彩色编码矩形中给出,红色和蓝色分别表示高分辨率和低分辨率。粗体或绿色的数字表示用户选择的术语或基因明显过多。为了获得所示的输出,我们使用了一个经过FDR调整的第页-值<0.001,OSIR>0.1,与一个术语相关的最小基因数设置为>10。

表达式数据

目前,已为商业Affymetrix高密度寡核苷酸微阵列(GeneChips)和Illumina基因表达串珠阵列实施表达数据质量控制和规范化模块。背景校正、方差稳定和归一化方法为MAS5.0、RMA、GCRMA和RSN[35]. 也可以上传预先规范化的表达式数据集,只要它们被表示为以制表符分隔的矩阵,其行和列分别包含主项(通常是探测标识符)和实验条件名称。

注释、交互和映射数据

转录组(Affymetrix和Illumina CSV注释文件)、蛋白质组(国际蛋白质索引、EBI和NCBI全蛋白数据文件)、相互作用组(IntAct、MINT和BioGRID使用的蛋白质组学标准初始分子相互作用2.5文件)的功能信息染色体定位分析(来自UCSC网站的PSL染色体定位文件)通过简单的程序导入并转换为适当的文件格式[3643].

统计过滤

这些模块输出在给定样本集中确定的显著差异表达项目列表(表示为转录本或探针标识符)。用户可以通过阈值参数(包括表达水平截止值、标准偏差或折叠变化)选择在不同实验条件下表现出强烈变化的转录本。此外,相似性搜索模块有助于使用特定的用户定义模式检索共同表达的成绩单组。一旦确定了一组目标转录物,就可以使用置换(随机化)、调节t检验(经验贝叶斯方法)和基于非参数等级的统计方法来确定信号强度的变化是否可再现且显著。这些方法在中实现multtest公司,萨姆、利玛排名产品R包,分别[4446]. 根据Hommel(家族错误率控制)或Benjamini/HochBerg[错误发现率(FDR)的确定]多重测试校正方法,通过调整p值来考虑假阳性[47,48].

群集

聚类方法用于根据实验条件下项目的总体相似程度对项目进行分类。这些算法对于识别共同表达(显示类似转录模式)、共同调控(共享共同启动子元件)或在特定生物过程中发挥作用的基因尤其重要。用户可以在三个层次聚类模块之间进行选择:HCLUST(层次)、AGNES(AGglomerative NESting)和DIANA(DIvisive ANAnalysis)[8,49]. 四种监督分区方法包括k-means[50]、PAM(围绕Medoids进行分区)、FANNY(模糊分析聚类)和CLARA(聚类LARge应用程序)[49]. 我们还包括了两个无监督聚类模块,称为MCLUST(基于模型的clustering)和HOPACH(分层有序分区和折叠混合),它们可以自动确定给定数据集中的聚类数量[51,52]. 最后,为了估计分类的质量或帮助确定最佳簇数,从而实现不同表达模式的最佳分离,可以使用轮廓图方法[53].

功能性采矿

通过使用超几何或二项式统计测试搜索与这些聚类中的项目(基因)相关的功能注释术语,验证并进一步分析表达聚类。第页-如上文所述,使用多种测试校正方法调整值。功能信息通常由GO财团提供[9]但是,原则上,AMEN可以处理来自上传注释文件中的任何信息源的数据,例如InterPro蛋白域、生化途径、染色体定位数据或用户提供的其他信息。

请注意,本体词汇表具有层次结构,因此一个条目(例如基因)与多个冗余术语相关联。为了减少注释项输出,我们使用本体特定信息速率(OSIR):现场视察报告= (n个-)/n个,其中n个是与给定的过度表示项(父节点)关联的项目数,以及分别与其下级过度表示项相关的项目数(子节点)。最小值现场视察报告阈值通常设置在0.05和0.20之间,这意味着如果与给定父节点相关的基因中少于5%或20%与其子节点无关,则父节点被删除。

数据可视化

目前实现了四种类型的可视化模块。首先,用户可以将表达式数据显示为假彩色编码的热图或图形(图). 其次,一个彩色编码的图形模块,用于显示集群中明显过度或不足的功能注释术语(图4). 此输出可能包含来自多个实验的数据,并同时显示为不同的列。或者,也可以显示过度代表GO(开始)项及其相关父节点作为有向无环图。第三,根据国际细胞遗传学命名标准(ISCN),包含一个模块来创建染色体表意图(图5). 该功能有助于揭示表达模式和选定目标项目的染色体映射之间的相关性。它包括ISCN表意图以及表达数据的热图和直方图,显示给定区域中观察到的和预期的基因数量。最后,完整的图形Viz可以使用工具绘制蛋白质或其他类型相互作用的网络图(图6). 代表生物项目(蛋白质、基因)的节点是彩色编码的,以便于解释表达簇、亚细胞位置和相互作用数据之间的关系。

图5
图5

染色体表意符号表示显示了小鼠X染色体的ISCN象形图(第1列)。DET-MI表达簇中基因的染色体定位用红色(正链或顶链)和蓝色(负链或底链)线标记(第2列)。彩色编码的热图(见图3中的比例尺)显示了每个样本的表达信号(第3列)。10 Mbp连续区域内的映射基因数量分别绘制在X轴和Y轴上(第4列)。彩色编码条显示观察到的位点的数量,红色和蓝色表示重复表达过度或不足。灰色条表示偶然落入给定区域的位点数量。红色箭头表示基因座丰富的区域(FDR-调整第页-值<0.001)。其余的第5-7列显示,X染色体上没有属于DET-ME簇的减数分裂基因。

图6
图6

蛋白质相互作用网络的显示显示了基于从IntAct、MINT和BioGRID数据库检索的小鼠、大鼠和人类组合数据的蛋白质相互作用的全局视图。连接节点(蛋白质)的蓝线代表直接的物理相互作用。线厚度随着支持预测相互作用的已发布观测值的数量而增加。节点用颜色编码,以指示该蛋白质所属的表达簇(上半部分)和其定位的亚细胞成分(下半部分),如图所示。

可视化模块输出交互式和可点击的图像,提供每个簇和基因的详细信息,可以手动选择这些信息进行进一步分析。它们还提供手动缩放(在X、Y或两个方向)和平移功能,使用户能够专注于感兴趣的特定结果。最后,用户可以使用可缩放矢量图形格式(SVG)在所有web浏览器上进行查看,并使用SVG编辑器(如Inkscape或Adobe Illustrator)进行进一步处理[54,55].

数据导出

AMEN提供了一个模块,用于将选定的项目列表导出为HTML表格文件,该文件可以在电子表格应用程序(如MS Excel)中打开并进一步处理。用户可以选择不同类型的注释、映射和表达式数据,并确定它们在要导出的文件中的顺序。

AMEN的应用

该项目对于我们研究人类和啮齿类动物睾丸表达项目至关重要,在该项目中,生殖系表达与生殖功能之间建立了明确的相关性[33]. 注意,这项研究包括减数分裂基因表达和X染色体定位之间负相关的研究(参见附加文件1). 此外,我们使用AMEN比较了睾丸转录组和蛋白质组数据,并探索了睾丸体细胞和生殖细胞之间差异表达的基因产物的蛋白质相互作用网络[32].

正在进行的工作包括与隐睾相关的高不孕风险的表达特征(Hadziselimovic等人,修订版),残留体中mRNA和蛋白质的高通量分析(Rolland等人和Brun等人,未发表),以及Abf1靶基因中功能注释的丰富,一种重要的芽殖酵母DNA结合转录因子(U.Schlecht和M.Primig,出版)和Ume6,一种参与减数分裂基因有丝分裂抑制的调节器酿酒酵母(T.Walther和M.Primig正在准备中)。因此,我们的软件适用于结合不同物种的DNA、mRNA和蛋白质数据的分子系统生物数据分析。

与其他解决方案的比较

由于AMEN是一个免费提供的独立分子系统生物学分析工具,我们将其与此类软件的典型示例进行了比较,而不是与基于web服务器的应用程序进行比较,在我们看来,这些应用程序通常不如本地安装的程序灵活和完整。大多数可用的本地解决方案是R包,如affylmGUI和illuminaGUI,它们分别提供适用于Affymetrix GeneChip和Illumina BeadArray数据的质量控制(QC)、预处理、统计测试和聚类[56,57]. BRB-ArrayTools是一个MS Excel插件,提供高级统计测试,用于识别差异表达基因、GO术语富集和使用外部R脚本扩展功能的选项[58]. AMDA提供各种质量控制、规范化、统计和聚类功能,还包括GUI,以及GO术语和KEGG丰富[59]. 与这些解决方案相比,我们的软件还具有一些有用的附加功能,例如一个精细的主应用程序窗口,便于工作流管理,复杂的GO术语丰富图形输出,跨微阵列平台兼容性,蛋白质组学数据导入功能,蛋白质-蛋白质和蛋白质-DNA网络数据处理以及染色体定位和富集(附加文件1). 最后,AMEN的图形输出是交互式的,使用户能够子选择和保存项目列表。

未来发展

AMEN定期更新新功能和模块。我们打算在不久的将来纳入分子途径数据库的数据管理,如《京都基因和基因组百科全书》(KEGG),以显示结合蛋白质相互作用和表达数据的代谢途径[60]. 我们还计划为最近几代全外显子实施额外的数据预处理和归一化算法[61]和平铺微阵列[62,63]以及一个新的主成分分析(PCA)统计模块。最后,我们将AMEN与MIMAS集成[64],我们自己的阵列数据管理和注释解决方案,为我们的实验室和社区提供了一个完整的包,用于存储、描述、分析和解释高通量数据。

结论

AMEN促进了多方面高通量数据处理、分析和解释的优化程序的设计和执行。主要优点包括:直观的GUI、转录组和蛋白质组分析策略的灵活设计;以及表达信号、染色体定位、功能注释和网络交互结果的便捷交互式图形输出。模块化结构便于扩展和定制。我们将继续开发和支持AMEN,作为我们长期生物医学研究项目的一个组成部分。源代码可供希望添加自己功能的生物信息学社区成员免费使用。

可用性和要求

  • 项目名称:阿曼

  • 项目主页: http://sourceforge.net/projects/amen

  • 操作系统:独立于平台

  • 编程语言:Tcl/Tk、R、GraphViz

  • 其他要求:ActiveTcl版本8.4.16.0、R版本2.6.0、GraphViz版本2.14.1或更高版本

  • 许可证:GNU通用公共许可证

工具书类

  1. Bolstad BM、Irizarry RA、Astrand M、Speed TP:基于方差和偏差的高密度寡核苷酸阵列数据归一化方法的比较。生物信息学2003, 19(2):185–193. 10.1093/生物信息学/19.2.185

    第条 中国科学院 公共医学 谷歌学者 

  2. Carvalho B、Bengtsson H、Speed TP、Irizarry RA:高密度寡核苷酸SNP阵列数据的探索、标准化和基因型调用。生物统计学2006

    谷歌学者 

  3. Park T、Yi SG、Lee S、Lee SY、Yoo DH、Ahn JI和Lee YS:在时间进程微阵列实验中识别差异表达基因的统计测试。生物信息学2003年,19(6):694–703。10.1093/生物信息学/btg068

    第条 中国科学院 公共医学 谷歌学者 

  4. Pan W:在重复微阵列实验中发现差异表达基因的统计方法的比较综述。生物信息学2002, 18(4):546–554. 10.1093/生物信息学/18.4.546

    第条 中国科学院 公共医学 谷歌学者 

  5. Bar-Joseph Z:分析时间序列基因表达数据。生物信息学2004, 20(16):2493–2503. 10.1093/生物信息学/bth283

    第条 中国科学院 公共医学 谷歌学者 

  6. Wicker N,Dembele D,Raffelsberger W,Poch O:点聚类密度,转录组数据分析应用。核酸研究2002, 30(18):3992–4000. 10.1093/nar/gkf511

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  7. Tamayo P、Slonim D、Mesirov J、Zhu Q、Kitareewan S、Dmitrovsky E、Lander ES、Golub TR:用自组织图解释基因表达模式:造血分化的方法和应用。美国国家科学院程序1999, 96(6):2907–2912. 10.1073/pnas.96.6.2907

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  8. Eisen MB、Spellman PT、Brown PO、Botstein D:全基因组表达模式的聚类分析和显示。美国国家科学院程序1998, 95(25):14863–14868. 10.1073/pnas.95.25.14863

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  9. Ashburner M、Ball CA、Blake JA、Botstein D、Butler H、Cherry JM、Davis AP、Dolinski K、Dwight SS、Eppig JT、Harris MA、Hill DP、Issel-Tarver L、Kasarskis A、Lewis S、Matese JC、Richardson JE、Ringwald M、Rubin GM、Sherlock G:基因本体论:生物学统一的工具。基因本体联盟。自然基因2000, 25(1):25–29. 10.1038/75556年10月10日

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  10. Khatri P,Draghici S:基因表达数据的本体论分析:当前的工具、局限性和悬而未决的问题。生物信息学2005, 21(18):3587–3595. 10.1093/生物信息学/bti565

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  11. 竞争对手I、Personnaz L、Taing L、Potier MC:一类基因中GO类别的富集或缺失:哪种测试?生物信息学2007, 23(4):401–407. 10.1093/生物信息学/btl633

    第条 中国科学院 公共医学 谷歌学者 

  12. 统计计算R项目[http://www.r-project.org]

  13. 生物导体项目[http://www.bioconductor.org]

  14. Reimers M,Carey VJ:生物导体:生物信息学和计算生物学的开源框架。酶学方法2006, 411: 119–134. 10.1016/S0076-6879(06)11008-3

    第条 中国科学院 公共医学 谷歌学者 

  15. Blom EJ、Bosman DW、van Hijum SA、Breitling R、Tijsma L、Silvis R、Roerdink JB、Kuipers OP:FIVA:从原核生物转录组数据中提取生物学知识的功能信息查看器和分析器。生物信息学2007, 23(9):1161–1163. 10.1093/生物信息学/btl658

    第条 中国科学院 公共医学 谷歌学者 

  16. Scheer M、Klawonn F、Munch R、Grote A、Hiller K、Choi C、Koch I、Schobert M、Hartig E、Klages U、Jahn D:JProGO:利用基因本体信息对原核微阵列数据进行功能解释的新工具。核酸研究2006年,34(Web服务器问题):W510–5。10.1093/nar/gkl329

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  17. Awad IA、Rees CA、Hernandez-Boussard T、Ball CA、Sherlock G:Caryoscope:一个开放源码Java应用程序,用于查看基因组背景下的微阵列数据。BMC生物信息学2004, 5: 151. 10.1186/1471-2105-5-151

    第条 公共医学中心 公共医学 谷歌学者 

  18. Menten B、Pattyn F、De Preter K、Robbrecht P、Michels E、Buysse K、Mortier G、De Paepe A、van Vooren S、Vermeesch J、Moreau Y、De Moor B、Vermeulen S、Speleman F、Vandesompele J:arrayCGHbase:比较基因组杂交微阵列的分析平台。BMC生物信息学2005, 6: 124. 10.1186/1471-2105-6-124

    第条 公共医学中心 公共医学 谷歌学者 

  19. Stanley SM、Bailey TL、Mattick JS:GONOME:测量GO术语和基因组位置之间的相关性。BMC生物信息学2006, 7: 94. 10.1186/1471-2105-7-94

    第条 公共医学中心 公共医学 谷歌学者 

  20. Toedling J、Schmeier S、Heinig M、Georgi B、Roepcke S:MACAT——微阵列染色体分析工具。生物信息学2005, 21(9):2112–2113. 10.1093/生物信息学/bti183

    第条 中国科学院 公共医学 谷歌学者 

  21. Turkheimer FE、Roncaroli F、Hennuy B、Herens C、Nguyen M、Martin D、Evrard A、Bours V、Boniver J、Deprez M:来自微阵列数据的基因表达染色体模式:胶质瘤的方法学、验证和临床相关性。BMC生物信息学2006, 7: 526. 10.1186/1471-2105-7-526

    第条 公共医学中心 公共医学 谷歌学者 

  22. Vlasblom J、Wu S、Pu S、Superina M、Liu G、Orsi C、Wodak SJ:GenePro:用于交互网络高级可视化和分析的Cytoscape插件。生物信息学2006, 22(17):2178–2179. 10.1093/生物信息学/btl356

    第条 中国科学院 公共医学 谷歌学者 

  23. Cerami EG、Bader GD、Gross BE、Sander C:cPath:用于收集、存储和查询生物路径的开源软件。BMC生物信息学2006年,7:497。10.1186/1471-2105-7-497年

    第条 公共医学中心 公共医学 谷歌学者 

  24. Hokamp K、Roche FM、Acab M、Rousseau ME、Kuo B、Goode D、Aeschliman D、Bryan J、Babiuk LA、Hancock RE、Brinkman FS:ArrayPipe:微阵列数据的灵活处理管道。核酸研究2004,32(Web服务器问题):W457–9。10.1093/nar/gkh446

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  25. Kapushesky M、Kemmeren P、Culhane AC、Durinck S、Ihmels J、Korner C、Kull M、Torrente A、Sarkans U、Vilo J、Brazma A:Expression Profiler:下一代——微阵列数据分析的在线平台。核酸研究2004,32(Web服务器问题):W465–70。10.1093/nar/gkh470

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  26. Psarros M、Heber S、Sick M、Thoppae G、Harshman K、Sick B:RACE:基因表达数据的远程分析计算。核酸研究2005年,33(Web服务器问题):W638–43。10.1093/nar/gki490

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  27. Rainer J、Sanchez-Cabo F、Stocker G、Sturn A、Trajanoski Z:CARMAweb:基于R和生物导体的微阵列数据分析综合网络服务。核酸研究2006年,34(Web服务器问题):W498–503。10.1093/nar/gkl038

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  28. Romualdi C、Vitulo N、Del Favero M、Lanfranchi G:MIDAW:微阵列数据统计分析的网络工具。核酸研究2005年,33(Web服务器问题):W644–9。10.1093/nar/gki497号

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  29. Shamir R、Maron Katz A、Tanay A、Linhart C、Steinfeld I、Sharan R、Shiloh Y、Elkon R:EXPANDER——一个用于微阵列数据分析的综合程序套件。BMC生物信息学2005年,6:232。10.1186/1471-2105-6-232

    第条 公共医学中心 公共医学 谷歌学者 

  30. Vaquerizas JM、Conde L、Yankilevich P、Cabezon A、Minguez P、Diaz-Uriarte R、Al-Shahrour F、Herrero J、Dopazo J:GEPAS,微阵列基因表达数据分析的实验导向管道。核酸研究2005年,33(Web服务器问题):W616–20。10.1093/nar/gki500

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  31. Tcl开发人员站点[网址:http://www.tcl.tk/]

  32. Chalmel F,Lardenoil A,Primig M:理解哺乳动物减数分裂核心转录组及其对体细胞癌的影响。Ann N Y科学院2007, 1120: 1–15. 10.1196/年鉴1411.010

    第条 中国科学院 公共医学 谷歌学者 

  33. Chalmel F、Rolland AD、Niederhauser-Wiederkehr C、Chung SS、Demougin P、Gattiker A、Moore J、Patard JJ、Wolgemuth DJ、Jegou B、Primig M:人类和啮齿动物雄性配子发生中的保守转录组。美国国家科学院程序2007, 104(20):8346–8351. 10.1073/pnas.0701883104

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  34. Wrobel G,Chalmel F,Primig M:goCluster整合了微阵列表达数据的统计分析和功能解释。生物信息学2005, 21(17):3575–3577. 10.1093/生物信息学/bti574

    第条 中国科学院 公共医学 谷歌学者 

  35. Zakharkin SO、Kim K、Mehta T、Chen L、Barnes S、Scheirer KE、Parrish RS、Allison DB、Page GP:Affymetrix微阵列实验中的变异来源。BMC生物信息学2005, 6: 214. 10.1186/1471-2105-6-214

    第条 公共医学中心 公共医学 谷歌学者 

  36. Chatr-aryamontri A、Ceol A、Palazzi LM、Nardelli G、Schneider MV、Castagnoli L、Cesareni G:MINT:分子内切酶数据库。核酸研究2007,35(数据库问题):D572–4。10.1093/nar/gkl950

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  37. Kerrien S、Alam-Faruque Y、Aranda B、Bancarz I、Bridge A、Derow C、Dimmer E、Feuermann M、Friedrichsen A、Huntley R、Kohler C、Khadake J、Leroy C、Liban A、Lieftink C、Montecchi-Palazzi L、Orchard S、Risse J、Robbe K、Roechart B、Thorneycroft D、Zhang Y、Apweiler R、Hermjakob H:IntAct——分子相互作用数据的开源资源。核酸研究2007年,35(数据库问题):D561-5。10.1093/nar/gkl958

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  38. Kersey PJ、Duarte J、Williams A、Karavidopoulou Y、Birney E、Apweiler R:国际蛋白质指数:蛋白质组学实验的综合数据库。蛋白质组学2004, 4(7):1985–1988. 10.1002/pmic.200300721

    第条 中国科学院 公共医学 谷歌学者 

  39. Kuhn RM、Karolchik D、Zweig AS、Trumbower H、Thomas DJ、Thakkapallayil A、Sugnet CW、Stanke M、Smith KE、Siepel A、Rosenbloom KR、Rhead B、Raney BJ、Pohl A、Pedersen JS、Hsu F、Hinrichs AS、Harte RA、Diekhans M、Clawson H、Bejerano G、Barber GP、Baertsch R、Hausler D、Kent WJ:UCSC基因组浏览器数据库:2007年更新。核酸研究2007年,35(数据库问题):D668–73。10.1093/nar/gkl928

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  40. Labarga A、Valentin F、Anderson M、Lopez R:欧洲生物信息学研究所的Web服务。核酸研究2007年,35(Web服务器问题):第6周至第11周。10.1093/nar/gkm291

    第条 公共医学中心 公共医学 谷歌学者 

  41. UCSC基因组浏览器网站[http://genome.ucsc.edu]

  42. Stark C、Breitkreutz BJ、Reguly T、Boucher L、Breitcreutz A、Tyers M:BioGRID:交互数据集的通用存储库。核酸研究2006年,34(数据库问题):D535–9。10.1093/nar/gkj109

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  43. Wheeler DL、Barrett T、Benson DA、Bryant SH、Canese K、Chetvernin V、Church DM、DiCuccio M、Edgar R、Federhen S、Geer LY、Kapustin Y、Khovayko O、Landsman D、Lipman DJ、Madden TL、Maglott DR、Ostell J、Miller V、Pruitt KD、Schuler GD、Sequeira E、Sherry ST、Sirotkin K、Souvorov A、Starchenko G、Tatusov RL、Tatuscova TA、Wagner L、,Yaschenko E:国家生物技术信息中心的数据库资源。核酸研究2007年,35(数据库问题):D5–12。10.1093/nar/gkl1031

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  44. Breitling R,Herzyk P:基于秩的方法作为生物微阵列数据分析的T统计量的非参数替代方法。生物信息计算机生物学杂志2005, 3(5):1171–1189. 10.1142/S0219720005001442

    第条 中国科学院 公共医学 谷歌学者 

  45. Tusher VG,Tibshirani R,Chu G:应用于电离辐射反应的微阵列显著性分析。美国国家科学院程序2001, 98(9):5116–5121. 10.1073/pnas.091062498

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  46. Wettenhall JM,Smyth GK:limmaGUI:微阵列数据线性建模的图形用户界面。生物信息学2004, 20(18):3705–3706. 10.1093/生物信息学/bth449

    第条 中国科学院 公共医学 谷歌学者 

  47. Hommel G:基于改进的Bonferroni试验的分阶段拒绝多重试验程序。生物特征1988, 75(1):383–386. 10.1093/生物组/75.2.383

    第条 谷歌学者 

  48. Benjamini Y,Hochberg Y:控制错误发现率:一种实用且强大的多重测试方法。JR统计Soc序列1995年,57(1):289–300。

    谷歌学者 

  49. 考夫曼L,卢梭PJ:在数据中寻找群体:聚类分析导论。纽约:Wiley;1990

    第章 谷歌学者 

  50. Tavazoie S、Hughes JD、Campbell MJ、Church RJ和Church GM:基因网络结构的系统测定。自然基因1999, 22(3):281–285. 10.1038/10343

    第条 中国科学院 公共医学 谷歌学者 

  51. van der Laan MJ,Pollard KS:一种新的可视化和引导混合层次聚类算法。统计规划与推断杂志2003, 117: 275–303. 10.1016/S0378-3758(02)00388-9

    第条 谷歌学者 

  52. Yeung KY、Fraley C、Murua A、Raftery AE、Ruzzo WL:基因表达数据的基于模型的聚类和数据转换。生物信息学2001, 17(10):977–987. 10.1093/生物信息学/17.10.977

    第条 中国科学院 公共医学 谷歌学者 

  53. Schlecht U、Demougin P、Koch R、Hermida L、Wiederkehr C、Descombes P、Pineau C、Jegou B、Primig M:哺乳动物雄性减数分裂和配子发生的表达谱确定了新的候选基因,用于调节生育能力。分子生物学细胞2004, 15(3):1031–1043. 10.1091/桶。E03-10-0762号

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  54. Inkscape:开源可缩放矢量图形编辑器[http://www.inkscape.org]

  55. SVG.org公司[网址:http://www.svg.org]

  56. Schultze JL,Eggle D:IlluminaGUI:用于分析Illumia平台上生成的基因表达数据的图形用户界面。生物信息学2007, 23(11):1431–1433. 10.1093/生物信息学/btm101

    第条 中国科学院 公共医学 谷歌学者 

  57. Wettenhall JM、Simpson KM、Satterley K、Smyth GK:affylmGUI:单通道微阵列数据线性建模的图形用户界面。生物信息学2006, 22(7):897–899. 10.1093/生物信息学/btl025

    第条 中国科学院 公共医学 谷歌学者 

  58. Xu X,Zhao Y,Simon R:BRB-ArrayTools的基因集表达比较工具。生物信息学2007, 24(1):137–139. 10.1093/生物信息学/btm541

    第条 公共医学 谷歌学者 

  59. Pelizzola M、Pavelka N、Foti M、Ricciardi-Castagnoli P:AMDA:自动化微阵列数据分析的R包。BMC生物信息学2006, 7: 335. 10.1186/1471-2105-7-335

    第条 公共医学中心 公共医学 谷歌学者 

  60. Kanehisa M、Goto S、Hattori M、Aoki-Kinoshita KF、Itoh M、Kawashima S、Katayama T、Araki M、Hirakawa M:从基因组学到化学基因组学:KEGG的新发展。核酸研究2006年,34(数据库问题):D354-7。10.1093/nar/gkj102

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  61. Elvidge G:微阵列表达技术:从头到尾。药物基因组学2006, 7(1):123–134. 10.2217/14622416.7.1.123

    第条 中国科学院 公共医学 谷歌学者 

  62. Bertone P,Gerstein M,Snyder M:DNA平铺阵列在实验基因组注释和调控途径发现中的应用。染色体研究2005年,13(3):259–274。2007年10月10日/10577-005-2165-0

    第条 中国科学院 公共医学 谷歌学者 

  63. Mockler TC,Chan S,Sundaresan A,Chen H,Jacobsen SE,Ecker JR:DNA拼接阵列在全基因组分析中的应用。基因组学2005, 85(1):1–15. 2016年10月10日/j.ygeno.2004.10.005

    第条 中国科学院 公共医学 谷歌学者 

  64. Hermida L,Schaad O,Demougin P,Descombes P,Primig M:MIMAS:基于网络的高密度寡核苷酸微阵列数据管理和注释的创新工具。BMC生物信息学2006, 7: 190. 10.1186/1471-2105-7-190

    第条 公共医学中心 公共医学 谷歌学者 

下载参考资料

致谢

我们感谢A.Lardenoil、J.Moore和A.Gattiker激发的讨论,感谢O.Collin在Mac OS X上进行的测试,感谢R.Houlgatte批判性阅读手稿。这项工作得到了国家圣母医学研究所(Inserm)、瑞士生物信息学研究所(SIB)和Région Bretagne第R07077NN号拨款的支持。本文的开放存取出版费用由Inserm提供。

作者信息

作者和附属机构

作者

通讯作者

与的通信迈克尔·普里米格.

其他信息

作者的贡献

FC发起、开发了软件并起草了手稿。议员对这一概念作出了贡献,并撰写了手稿。所有作者阅读并批准了最终手稿。

电子辅助材料

12859_2007_2071_MOESM1_ESM.doc

附加文件1:AMEN和其他解决方案的比较。AMEN和其他独立解决方案中实现的高通量数据分析和解释功能的比较。正文中给出了相应的参考文献。星号表示程序包含一个给定的功能,而当缺少功能时,会加一个减号。(文档40 KB)

作者提交的原始图像文件

权利和权限

本文由BioMed Central Ltd.授权发布。这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/2.0)它允许在任何介质中不受限制地使用、分发和复制原始作品,前提是正确引用了原始作品。

转载和许可

关于本文

引用本文

Chalmel,F.,Primig,M.分子系统生物学的注释、映射、表达和网络(AMEN)工具套件。BMC生物信息学 9, 86 (2008). https://doi.org/10.1186/1471-2105-9-86

下载引文

  • 收到以下为:

  • 认可的以下为:

  • 已发布以下为:

  • DOI程序以下为:https://doi.org/10.1186/1471-2105-9-86

关键词