摘要

总结

BioPAXViz是一个Cytoscape(版本3)应用程序,为代谢途径可视化提供了一个全面的框架。除了基本的解析、查看和浏览功能外,BioPAXViz提供的主要新功能是在给定物种系统发育的情况下,通过预先计算的路径系统发育图对代谢路径拓扑进行可视化比较分析。此外,BioPAXViz支持显示层次树,允许通过单个参考路径的变体集进行有效导航。因此,BioPAXViz可以显著促进代谢途径进化和工程的研究,并为其做出贡献。

可用性和实施

BioPAXViz已开发为Cytoscape应用程序,可在以下网址获得:https://github.com/CGU-CERTH/BioPAX.Viz该软件根据麻省理工学院许可证分发,并附带示例文件和数据。上述GitHub存储库中提供了其他文档。

1.简介

代谢途径的出现及其不同的进化使生物体既能从环境中获得营养,又能发现新的生物合成能力(Fani和Fondi,2009年). 因此,代谢酶编码基因在基因组中的相应分布可能是零星的,遵循基因组保护的一般模式(库宁等。, 2005). 考虑到水平基因转移等过程的复杂性,跨基因组代谢途径及其变体之间的进化关系研究可以被认为是一个新兴的研究领域,可以帮助我们理解相应基因组序列中编码的代谢能力(班萨尔等。, 2011,2013;岩崎和高木,2009年). 此外,通过其进化背景以及与相似但不同的路径或具有聚合进化记录的不同路径的比较,可以突出显示路径可能运行的背景。

在我们自己的工作中,我们对代谢途径的比较分析和可视化感兴趣(巴布尔等。, 2009)以期与参考物种进行基因组比较。最近报道了基于Bioconductor/R和Pathway Commons的类似应用(卢娜等。, 2016). 还开发了其他具有不同目标的方法,这些方法考虑了路径的系统发育分布,例如CLIME(等。, 2014). 我们开发了BioPAXViz,一种新的细胞景观应用程序(香农等。, 2003),我们在这里介绍并简要记录。

2.输入规范

BioPAXViz期望BioPAX文件作为其输入(杰米尔等。, 2010). 具体来说,它支持模板(非修改)BioPAX文件以及包含特定蛋白质(节点)存在或不存在信息的特定修改版本的BioPAX文件,即酶作为通路成分,或整个通路本身(存储库中提供的示例)。该关键特征允许考虑在参考路径进化过程中推断存在的假设路径;路径数据通常来自BioCyc(卡斯皮等。, 2014). 这些“祖先状态”是根据节俭标准计算的(Kunin和Ouzounis,2003年),自适应阈值(Psomopoulos鱼等。, 2013)以及依赖这些方法的算法(Psomopoulos等人,手稿正在准备中)。

为了获得模板BioPAX文件的自定义修改版本,我们开发了一个Java控制台应用程序,即BioPAXClient,它通过预定义格式的自定义注释,向BioPAX文件的<Pathway>和/或<ProteinReference>元素添加存在或不存在标志。BioPAXClient免费提供:https://github.com/CGU-CERTH/BioPAX.客户端,其中提供了用于使用和利用其功能的其他文档。这些文件主要用作BioPAXViz的输入。

BioPAXViz预计的另一种输入类型是一个文件,该文件描述了待可视化的代谢途径之间进化层次的树状结构(Kunin和Ouzounis,2003年). 该文件必须包含连接树节点的所有边,并确定哪些节点是树的叶子(这些节点必须与名为<undef>的节点连接)。我们为树维护了相同的输入格式,以确保相同的外观:这些树定义了正在考虑的物种组的分类结构。

GitHub上的BioPAXViz存储库中提供了演示所有上述输入类型所需格式的示例文件,包括存在/不存在标志。

3.使用说明

BioPAXViz支持两种功能模式:

  • 单一代谢途径的可视化(图1a),其中必须提供单个BioPAX文件(修改或引用)作为插件的输入。

  • 跨多个基因组参考通路的多个变体的可视化(图1b). 在这种模式下,必须提供一份描述参考物种进化关系树的文件,以及正在调查的每个变体的(修改的)BioPAX文件。

BioPAXViz功能,代表两种使用模式:(顶部)单视图,对应于具有12种处于参考状态的酶的单一途径的表示,其中10种酶出现在本例中(橙色),2种酶不存在(紫色);(底部)多视图,对应于跨越多个物种的路径实例列表。连接参考物种的树沿着列表显示在左上角面板上,对单个酶使用相同的约定:即考虑中的路径存在于大多数(橙色)但两个(紫色)物种中-所选物种的单个路径实例(黄色)显示在主窗口上
图1

BioPAXViz功能,代表两种使用模式:(顶部)单视图,对应于具有12种处于参考状态的酶的单一途径的表示,其中10种酶出现在本例中(橙色),2种酶不存在(紫色);(底部)多视图,对应于跨越多个物种的路径实例列表。连接参考物种的树沿着列表显示在左上角的面板上,对单个酶使用相同的约定:即所考虑的途径存在于大多数(橙色)但两个(紫色)物种中-所选物种的单个途径实例(黄色)显示在主窗口上

在这两种模式中,本例中选择了用于显示所有代谢途径的“强制定向布局”选项(图1). 但是,用户可以交互修改显示的每个路径视图的布局。

关于颜色约定,节点在黄色的当用户选择它时。此外,“presence”属性由橙色颜色,而“缺少”属性表示为紫色选择这种配色方案是为了兼顾可达性(中性色盲)和美学(对比度更好,明暗对比)。

BioPAXViz是一个与Cytoscape 3.x版兼容的Cytospace应用程序。它使用OSGI开发模型在Java中实现。为了使用BioPAXViz,需要使用Cytoscape 3中的应用程序管理器将其jar发行版安装为新应用程序。

4.通道视图

BioPAXViz的主要目的是促进跨多个基因组参考代谢途径的进化多样性研究。为此倍数需要使用BioPAX文件查看模式,用户需要提供一组修改后的BioPAX文件以及包含参考物种进化关系树的文件。换言之,用户第一次可以可视化BioPAX通路数据的集合,这些数据与物种系统发育明确相关。

一旦加载并解析了所需的输入文件以实现语法完整性,用户就可以从树中选择任何基因组节点(Cytoscape语言中的-network),并在主窗口中观察所选节点(基因组)的参考路径的变体。树中每个节点对应的有机体由该节点的标签表示。默认情况下,树显示在Cytoscape主窗口的左上角(图1b). 可以根据用户的偏好移动或调整大小,并在用鼠标选择具有当前路径视图的主窗口时发送到后台,以优化导航。在这种情况下,可以使用<space>键将树带回前台。此外,可以通过Cytoscape对树视图和单个路径视图进行放大和缩小。

用户可以单独显示作为每个会话的输入给出的所有路径视图,并直观地检查与参考路径相比,哪些节点(对应于酶,并基于输入数据预测)缺失或已添加到每个路径实例。每个节点都标记在蛋白质/酶之后,该蛋白质/酶在该节点所在路径的特定点催化反应;现存节点和祖先节点的权重相等,并且以相同的方式显示。BioPAX文件附带的树为在进化相关路径变体之间导航提供了一种简单的方法,从而识别了参考物种集合中路径内容的变化。通过选择树的节点,相应的物种路径模式将自动显示。此外,通过检测树上较远物种的路径变体,发现水平基因转移也是可行的。

5.结论

BioPAXViz是一个作为Cytoscape应用程序实现的轻量级路径可视化程序。它为在比较基因组学背景下对多条路径进行可视化分析提供了一个健壮且用户友好的界面。这一可视化方法解决了存在/缺失模式(酶系统发育图)、主题变异(途径变异)和复杂历史(物种系统发育)的微妙混合可以加快路径进化模式的直观发现,并激发出在未来工作中大规模自动检测这些模式的严格方法。

基金

这项工作得到了FP7合作项目Microme的支持(拨款协议#222886-2),由欧盟委员会资助,并由欧洲生物信息学研究所协调。我们感谢Microme项目合作伙伴的反馈,感谢Peter D.Karp(SRI International)的评论,感谢Laura Dadurian(CERTH)的帮助。

利益冲突:未声明。

工具书类

巴布尔
 
O。
等(
2009
)
ChiBE:BioPAX通路模型的交互式可视化和操作
.
生物信息学
,
26
,
429
431
.

班萨尔
 
医学硕士。
等(
2011
)
检测水平基因转移的公路
.
J.计算。生物
.,
18
,
1087
1114
.

班萨尔
 
医学硕士。
等(
2013
)
原核生物水平基因转移公路的系统推断
.
生物信息学
,
29
,
571
579
.

卡斯皮
 
R。
等(
2014
)
代谢途径和酶的MetaCyc数据库以及路径/基因组数据库的BioCyc集合
.
无。酸类研究
.,
42
,
D459号
D471号
.

杰米尔
 
E.公司。
等(
2010
)
路径数据共享的BioPAX社区标准
.
自然生物技术
.,
28
,
935
942
.

法尼
 
R。
,
丰迪
M。
(
2009
)
代谢途径的起源和进化
.
物理学。寿命Rev
.,
6
,
23
52
.

岩崎
 
西。
,
高木(Takagi)
T。
(
2009
)
跨原核谱系水平基因转移促进快速路径进化
.
公共科学图书馆-基因
.,
5
,
e1000402。

库宁
 
五、。
,
Ouzounis公司
首席执行官。
(
2003
)
GeneTRACE–重建祖先物种的基因含量
.
生物信息学
,
19
,
1412
1416
.

库宁
 
五、。
等(
2005
)
跨分类群测量基因组保守性:分离株和英国
.
无。酸类研究
.,
33
,
616
621
.

 
Y。
等(
2014
)
基于进化推理的生物途径扩展
.
单元格
,
158
,
213
225
.

卢娜
 
答:。
等(
2016
)
PaxtoolsR:使用pathway Commons在R中进行路径分析
.
生物信息学
,
32
,
1262
1264
.

Psomopoulos鱼
 
F.E.公司。
等(
2013
)
利用模糊系统发育谱检测基因组特异性
.
公共科学图书馆
,
8
,
e52854。

香农
 
第页。
等(
2003
)
Cytoscape:生物分子相互作用网络集成模型的软件环境
.
基因组研究
.,
13
,
2498
2504
.

作者注释

作者希望大家知道,在他们看来,前两位作者应被视为联合第一作者。

现住址:希腊塞萨洛尼卡亚里士多德大学电气与计算机工程系信息处理实验室

现住址:希腊塞萨洛尼卡希腊希拉斯研究与技术中心化学过程与能源研究所(CPERI)生物计算与过程实验室(BCPL)

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academy.oup.com/journals/pages/about_us/legal/notices)
副编辑: 约翰·汉考克
约翰·汉考克
助理编辑
搜索此作者的其他作品: