×

格格(Gaggle)

swMATH ID: 20341
软件作者: P.T.Shannon、D.J.Reiss、R.Bonneau、N.S.Baliga
描述: Gaggle:一个集成生物信息学软件和数据源的开源软件系统。背景:系统生物学家使用各种软件工具处理来自不同来源的多种数据。这些工具中的每一种都擅长于一种类型的分析,例如微阵列、代谢网络和预测蛋白质结构的分析。一个关键的挑战是将这些(和其他即将出现的)数据资源和工具的能力结合起来,创建一个能够公平对待系统生物学数据集的多样性和复杂性的数据探索和分析环境。解决这个问题的方法应该认识到,在这个生物高通量时代,数据类型、格式和软件都在不断变化。结果:在本文中,我们描述了Gaggle——一个简单、开源的Java软件环境,它有助于解决软件和数据库集成的问题。在关注点分离的经典软件工程策略和语义灵活性策略的指导下,它将现有流行程序和web资源集成到一个用户友好、易于扩展的环境中。我们证明了四种简单的数据类型(名称、矩阵、网络和关联数组)足以将不同的数据库和软件组合在一起。通过探索幽门螺杆菌致病基因,我们强调了Gaggle的一些功能,其中我们识别了一种推测的蓖麻毒素样蛋白,这一发现是通过使用广泛的公开可用数据和各种流行的生物信息学软件工具同时进行数据探索实现的。结论:我们集成了各种数据库(例如KEGG、BioCyc、String)和软件(Cytoscape、DataMatrixViewer、R统计环境和TIGR微阵列表达查看器)。通过这种不同软件和数据库的松散耦合,Gaggle可以同时探索实验数据(mRNA和蛋白质丰度、蛋白质-蛋白质和蛋白质-DNA相互作用)、功能关联(操纵子、染色体邻近性、系统发育模式)、代谢途径(KEGG)和Pubmed摘要(STRING网络资源)创建了一个对“网络浏览器和电子表格生物学家”、精通统计的计算生物学家以及介于两者之间的人有用的探索环境。Gaggle使用Java RMI和Java Web Start技术,可以在http://gaggle.systemsbiology.net。
主页: http://gaggle.systemsbiology.net/docs/
相关软件: 地鼠;BayGO公司;GOLEM公司;戈查;答对 了;ProbCD(问题CD);R(右);线索GO;ArrayExpress公司;完整的;生物网格;基因模式;反应途径
引用于: 0个文档