跳到主要内容

KUPNetViz:肾脏疾病多组学数据集的生物网络查看器

摘要

背景

不断的技术进步使得生物学科学家从传统的单组学转向了多组学实验方法,挑战了生物信息学在这一多层信息之间架起桥梁。正在进行的肾脏生物学研究也不例外。大规模和/或高通量实验的结果显示了肾脏疾病的丰富信息,这些结果分散在网络上。为了解决这个问题,我们最近推出了KUPKB,这是一个肾脏疾病的多组学数据库。

结果

在本文中,我们描述了KUPNetViz,这是一种生物图形探索工具,可以通过可视化生物分子相互作用来探索KUPKB数据。KUPNetViz能够将不同物种、肾脏位置和肾脏疾病的多层实验数据集成到蛋白质相互作用网络中,并允许与生物功能、生化途径和其他功能元件(如miRNAs)相关联。KUPNetViz通过减少和/或自动化其他生物网络可视化软件包中的高级功能,专注于其使用的简单性和生成网络的清晰性。此外,它允许推断不同物种之间的生物分子相互作用,从而形成新的似是而非的假设、充分的实验设计和新的生物机制的建议。我们通过两个使用示例证明了KUPNetViz的价值:钙网蛋白的整合是肾移植排斥反应中更大相互作用网络中的关键角色,以及新观察到白细胞介素-6与多囊肾病的强相关性。

结论

KUPNetViz是一种交互式、灵活的生物网络可视化和探索工具。它为肾脏生物学家提供了KUPKB复杂综合数据的生物网络快照,允许以用户友好的方式制定新假设。

背景

在过去十年中,生物研究的主要进展,主要是高通量分析领域(如组学),导致了可用实验数据的指数增长,这些数据是通过各种技术产生的,包括DNA、miRNA[1]和抗体阵列[2]、下一代测序技术[]和质谱[4]. 生命科学向多组学方法的转变在提供能够组合这些数据的生物信息学工具方面造成了一个缺口。更重要的是,似乎缺乏有效的工具来帮助实验生物学家i)简化和分类多组学方法的结果,这种方法通常以长列表的形式出现ii)可视化不同的信息层,这些信息层可以从多组学的方法中挖掘出来,并将有用的片段聚合成生化路径和/或生物功能组iii)以可重复和可重复使用的方式组合步骤(i)和(ii),以提取有关所研究生物系统的有意义结果,iv)组合所有上述步骤以制定合理的假设,可能应用于类似系统(例如,在相同组织/器官/类似疾病情况下工作的系统),并最终设计新的实验来验证假设。

肾脏生物学领域也面临着类似的问题。尽管肾脏疾病在不同物种(即人类、小鼠、大鼠)中进行了广泛研究,但这些丰富的信息仍然隐藏在公共数据和/或文献库的多个层次中。虽然已经投入了大量的精力来聚合来自多个资源的数据[5-7]生成的数据库无法满足multi-omics属性,并且仍然分散在web上。为了解决这个问题,我们开发了肾脏和尿路知识库(KUPKB)[8]是一个公开的知识库,它使用语义Web技术组织了大量关于肾组织、细胞和疾病分类的现有知识[9]. 可以通过用户友好的iKUP浏览器查询KUPKB[8],可在访问http://www.kupkb.org网站.

iKUP在速度、选择性和描述能力方面是一个强大的工具。然而,它的性质限制了用户以表格格式查看查询结果,只浏览了KUPKB中其他可用的丰富互连数据的表面。此外,尽管它成功地显示了隐藏在分散存储库中的发现,例如一组基因在肾组织、细胞类型和疾病的特定组合下的表达,但它仍然无法将这些信息映射到作为背景信息和多物种方式可用的交互网络。

生物网络表征的价值在生物信息学和系统生物学文献中得到了广泛的分析[10,11]. 一些重要方面包括捕获蜂窝状态的固定快照的能力[12]否则隐藏在表中,以推断函数关联[13],通过在单个图像中结合蛋白质相互作用、基因表达和代谢特征来降低复杂性[14],并在网络快照中执行模式识别[15].

在本文中,我们描述了KUPNetViz,一个交互式生物网络查询和可视化应用程序。其主要目的是通过提供一个替代的KUPKB数据图像来帮助肾脏科学家扩展他们的研究,该图像描述了被查询分子及其邻居之间的相互作用,并以物种依赖和独立的方式进行功能和生物化学途径注释。KUPNetViz支持和推动的主要任务是:i)显示、探索和操纵一些广泛研究的哺乳动物物种的一般蛋白质相互作用以及功能和生化途径关联网络,ii)通过与相关基因/蛋白质/miRNA表达数据集的关联,将这些一般网络转化为肾脏特异性网络,iii)挖掘共同调节和/或直接相互作用(“相邻”)之间可能隐藏的关系肾脏解剖和/或疾病模型的多种组合下的实体,以及iv)不同疾病、解剖以及不同物种之间的表达数据和网络交互的外推,有助于快速制定和筛选生物学假设以及设计新实验。

KUPNetViz中的分子和交互视觉表现受到了该领域先前工作的启发[16]经过多次添加和重大修改以适合使用。为了证明其在肾脏研究中的价值和必要性以及完成上述任务的能力,我们提供了两个使用示例,以证明KUPNetViz明确扩展了iKUP的功能。特别是,我们发现了大量额外的证据证明钙网蛋白在人类肾脏疾病中的作用[8]表明钙网蛋白参与肾移植排斥反应中更大的相互作用网络。此外,我们提出炎症轴白细胞介素-6(IL6)/IL6受体与多囊肾病进展的新关联。

实施和功能

通用体系结构

KUPNetViz是一个使用PHP开发的web应用程序,用于服务器端编程和jQuery(http://www.jquery.org)与客户端的静态HTML相结合。应用程序的后端是一个MySQL数据库,其中包含用于构建实体之间映射的背景知识、网络交互、注释数据和正确解析的实验数据,这些数据是KUPKB最重要的部分。后端数据库可以很容易地更新和维护,因为它可以通过一系列Perl脚本自动重建,这些脚本使用包装器脚本和简单的YAML将KUPKB数据和后台知识资源下载、解析和导入到模式中(http://www.yaml.org网站)配置文件。使用Cytoscape Web图形可视化库呈现、可视化和控制用户查询产生的交互网络以及实验数据映射(基因、蛋白质、miRNA表达和统计意义)[17].

背景知识

KUPKB在KUPNetViz中集成的背景知识已在其他地方进行了广泛描述[8,18]. 简言之,基因、蛋白质和miRNA注释来自NCBI基因UniProt[19]和合奏[20]和微观世界[21]分别是。对于各种生物实体和登录号之间的映射,我们使用了NCBI提供的映射文件(ftp.NCBI.nlm.nih.gov)以及Biomart web服务[22]. NCBI提供的文件也用于将基因映射到各自的GO术语。分子相互作用从STRING蛋白质-蛋白质相互作用数据库中提取[23]通过解析公开的平面文件,从Microosm miRNA目标文件中提取miRNA与基因的相互作用(http://www.ebi.ac.uk/enright-srv/microcosm/htdocs/targets/v5/). 生物化学途径信息来自KEGG[24]使用其免费提供的web服务API下载并构建基因及其各自路径之间的映射。

实验数据

在KUPNetViz中集成并用于将基因/蛋白质/miRNA丰度映射到通过查询应用程序构建的生化网络的实验数据已在其他地方进行了广泛描述[8]. 简言之,知识库目前包含220多个实验,跨越多个生物层(基因、蛋白质、miRNA和代谢物丰度),这些实验来源于已发表的文章和公共知识库(例如GEO)。在某些情况下,数据是从各自的出版物中提取出来的(如果有统计意义的话),而在其他情况下,在整合之前,数据必须重新分析(主要是微阵列数据)。所有实验数据均来自与几种肾脏疾病和解剖相关的研究,并由人工整理。

使用和导航

KUPNetViz应用程序由一个单独的网页组成,该网页分为三个主要部分:i)交互网络画布,ii)带有网络组件图例的注释部分,以及显示所选网络元素的信息和外部链接的动态分段,和iii)应用程序控件,这些控件组织在四个选项卡中,其中包含数据搜索和映射选项以及更高级的应用程序控件。此配置允许用户轻松浏览应用程序,浏览和映射KUPKB数据,而无需离开主网络视图。应用程序的快照如图所示1应用程序的使用是自我指导的,可以概括为三个基本步骤:i)使用感兴趣的分子列表进行搜索,查询一个或多个支持的物种,ii)将实验数据映射到网络,通过导航和选择与查询分子相关的多个肾脏位置和疾病,以及iii)与生物功能、过程和细胞成分、生物化学途径以及针对感兴趣实体的miRNAs相关。

图1
图1

一小群KUPNetViz正在行动。在网络视图下,显示KUPKB数据映射选项卡,研究人员可以将多个基因/蛋白质/miRNA表达数据集映射到网络上,并应用不同的标准和肾脏位置、疾病和已发表研究数据的组合。这张快照聚焦于两种肾脏疾病状态下肾脏中TGFβ1的下调,即急性肾移植排斥反应、间质纤维化和肾小管萎缩,以及间质纤维化和肾小管萎缩中靶向TGFβ1的miRNA的上调,这来源于两项已发表的研究。

数据输入

用户可以使用多种分子识别类型查询KUPNetViz,包括HUGO基因符号(例如“CALR”,但搜索是区分大小写的)、Entrez登录号(例如811)、UniProt接入(例如P27797)、集合基因和蛋白质ID(例如ENSG00000179218或ENSP00000320866)、miRBase接入(例如hsa-miR-362-3p)或通过简单的自由文本(例如“calreticulin”)。上述所有加入项和搜索项都等效于钙网蛋白可用于混合标识类型。目前支持四种不同的哺乳动物,即人类、老鼠、老鼠和狗。KUPNetViz的一个强大功能是能够同时查询多个物种以进行蛋白质网络重建,这在同类应用中是罕见的。

物种间蛋白质相互作用的外推

KUPNetViz所遵循的外推程序非常简单,通过假设实验记录或预测的蛋白质-蛋白质相互作用(例如在人类中但在小鼠中未记录)也可能存在于小鼠(或应用哺乳动物物种支持的任何其他物种)中来执行。因此,该工具没有将来自不同生物体的网络(在类似分类法中)对齐,而是创建了一个具有“超节点”和“超边缘”的元网络,其中蛋白质相互作用在物种之间共享。尽管这一假设涉及到其生物有效性的某些风险,但它允许快速创建关于这些蛋白质相互作用的假设,并从实验者那里快速筛选。对超级节点和超级边缘的外推假设也是基于对每个生物体的生物学研究数量的一定“偏差”,因为与其他生物体相比,人类生物材料(细胞系、健康或患病组织)的研究有一个正常且可理解的趋势。例如,在Pubmed中对“智人”一词进行简单搜索,得出的研究数量(12547599)比搜索时对“肌肉”的研究数量(1159658)多一个数量级。这也反映在蛋白质相互作用的数量上:对于人类,使用以钙网蛋白为中心的一级网络(钙网蛋白的第一个邻居),发现365个蛋白质相互作用(相互作用得分阈值:0.2),而对于小鼠,相同的数据为8(相同的阈值)。

运行时间

KUPNetViz的运行时间取决于两个因素:i)网络布局算法的性能和可视化本身(例如支持的网络大小),这取决于Cytoscape Web库;ii)应用程序关于肾组学数据集映射到网络的查询性能。后者取决于被查询分子的数量。具有几个分子名称的典型查询在几秒钟内完成。在查询和可视化时间方面,唯一耗时的操作是搜索选定节点的二级邻居,以及在多物种模式下工作时搜索许多被查询分子的情况。最后,当网络渲染在用户浏览器中进行时,网络布局的速度取决于用户的机器。

数据导出

可以通过Cytoscape Web库的相应功能进行网络导出。用户能够在查询和处理后以各种文本格式(SIF、GraphML、XGMML和Arena3D格式)导出结果网络[25])以及高质量图像格式(PDF、PNG和SVG)。文本格式允许将生成的网络导入其他图形分析应用程序(如Cytoscape),以便进行进一步的探索和网络属性分析。支持的文本格式足以与大多数当前的生物网络可视化工具兼容。

结果

为了证明KUPNetViz的附加价值,我们提供了两个案例研究,揭示了仅使用iKUP进行挖掘需要付出巨大努力的见解。具体而言,我们探讨了钙网蛋白(动物肾脏疾病相关蛋白)在肾移植排斥反应(间质纤维化和肾小管萎缩)中更大的相互作用网络中的作用,及其与其他功能和通路元件的关联,以及炎症轴白细胞介素-6(IL6)的关联/IL6受体与多囊肾病进展。

案例研究1:钙网蛋白在肾移植排斥反应中的作用

钙网蛋白是一种与动物肾脏疾病有关的蛋白质[26]. 使用iKUP浏览器探索KUPKB中的钙网蛋白条目,我们首次证明了钙网蛋白在人类肾移植排斥反应中被诱导表达,这是一个新的研究领域生物信息学随后通过实验证实的假设[8]. 为了更好地了解钙网蛋白在肾移植排斥反应中的作用,我们试图研究以下问题:1)钙网蛋白是作为一个独立的参与者还是作为一个更大的蛋白质网络的一部分发挥作用,2)与钙网蛋白失调相关的过程是什么。这些问题无法单独使用iKUP浏览器来回答,因为它们需要有关蛋白质相互作用和蛋白质注释与生物过程的知识。

我们使用KUPNetViz搜索人类中的“钙网蛋白”,并可视化相邻基因/蛋白质(一级邻居,相互作用阈值:0.2)。接下来,我们用KUPKB、GO过程和KEGG通道中包含的肾移植排斥反应数据注释了该网络。为了进行这项手术,我们从肾脏疾病小组中选择了“间质纤维化和肾小管萎缩”。该疾病模型与“Nakorchevsky,J Am Soc Nephrol,2010”、“Rodder,Am J Transportation,2009”和“Scherer,Nephrol-Dial Transportion,2009”相关。除了这些数据集,我们还分别从GO和KEGG面板中选择了“ECM-受体相互作用”途径和“基底膜”细胞成分。结果网络如图所示2.

图2
图2

钙网蛋白网络。对钙网织蛋白网络的分析表明,不仅在肾移植物排斥反应中钙网织蛋白的表达被改变,而且许多已知与钙网织蛋白相互作用的基因/蛋白质(34%)也被改变。此外,特定过程/途径也得到了丰富,包括细胞外基质相互作用和基底膜蛋白。这些是已知的参与肾移植排斥反应的过程和途径。KUPKB数据在钙网蛋白相互作用网络上的整体投影清楚地证明了钙网蛋白在肾移植排斥反应中的作用。

总的来说,我们观察到钙网蛋白是一个网络的中心,在该病理学中许多基因和蛋白质也被修饰,这些生物分子大多是基底膜的一部分,与细胞与细胞外基质相互作用(ECM)有关。具体而言,ECM受体相互作用途径大多上调,如连接钙网蛋白的节点从橙色到红色的色阶所观察到的(图2).

已知ECM和基底膜在肾移植排斥反应中发生显著改变[27]使用我们的工具进行的分析将钙网蛋白与这些病理过程联系起来。此外,经鉴定与钙网蛋白(如层粘连蛋白和纤维连接蛋白)相互作用的基底膜蛋白(图中的LAMA2、LAMA4、LAMA5、LAMB1、LAMB2、LAMC1和FN12)已确定在肾移植排斥反应中上调[28,29]. 总之,KUPNetViz的使用为钙网蛋白作为肾移植排斥反应的有价值靶点提供了额外的、基于路径的证据。尽管在其他情况下不可能找到这些链接,但本文中提供的工具的使用大大加速了这一发现。例如,使用Pubmed进行的搜索在查询“层粘连蛋白-纤维连接蛋白-钙网蛋白”时没有返回任何结果。此外,查询经典的网络可视化工具,例如STRING数据库中提供的工具[23]该网站缺乏肾脏疾病的背景知识。

案例研究2:IL6和IL6受体在多囊肾病进展中的潜在参与

IL6是一种促炎症细胞因子,以前曾被描述为肝脏中的促炎症介质[30]在肺部和皮肤中[31]纤维化模型。然而,目前关于IL6在肾纤维化发展中可能起作用的证据有限。最近发表的一项研究表明,IL6基因阻断的小鼠可以防止肾纤维化的发展,这是肾脏中这种联系的唯一可用证据[32]. 此外,作者还观察到,与年龄匹配的对照肾活检相比,慢性肾脏病患者肾活检中IL6的表达水平增加。IL6是一种特殊的细胞因子,尽管它由多种细胞表达,但由于其受体(IL6R)的表达非常有限,它只能针对少数细胞[33].

为了进一步研究IL6和IL6R的可能作用,我们对iKUP中的这些分子进行了搜索,结果表明它们在正常情况下的肾脏表达似乎仅限于集合管,集合管是肾脏的一种管状结构[34]. 结果还表明,IL6和IL6R在人类多囊肾病(PKD)和大鼠PKD模型中均上调[35,36]. 据我们所知,很少有数据将IL6与PKD联系起来,但最近的一项研究[37]表明PKD患者的血清IL6水平高于对照组。为了获得对此链接的进一步支持,我们接下来在KUPNetViz中搜索IL6和IL6R。在人类中,通过查询和显示第一级交互邻居获得的与这两个实体相关的网络在PKD患者中大多上调(图A) ●●●●。该结果是在绘制三个与PKD相关的KUPKB数据集后得出的,即“Lai,蛋白质组学临床应用,2008年”、“Mason,蛋白质组化学临床应用,2009年”和“Song,Hum Mol Genet,2009年)[35,38,39](疾病过滤器:“常染色体显性多囊肾病”和“PKD1常染色体显性肾病”)。更重要的是,在PKD小鼠和大鼠模型中,随着上调水平的增加(即橙色到红色),网络上调随着疾病的严重程度而增加,而p值随着疾病的进展而降低(节点边界增厚)。该结果是在映射小鼠的数据集“Chen,BMC Res Notes,2008”后得出的[40],以及大鼠数据集“Koupedidou,BMC Nephrol,2010”[36]. 后者如图所示B-D.总之,通过使用KUPNetViz,我们能够产生一个新的假设,首次表明IL6/IL6R轴可能是PKD的重要参与者和该疾病的有价值靶点。未来,需要进行实验来证实或驳斥这一假设,但这可能是在理解和处理这一常见且威胁生命的遗传病方面迈出的重要一步。

图3
图3

人和大鼠的IL6/IL6R轴网络。通过查询KUPNetViz中的IL6和IL6R并使用IL6的一级交互邻居创建IL6/IL6R轴表达网络。(A)绘制人类三项相关研究(即“Lai,蛋白质组学临床应用,2008”,“Mason,蛋白质组化学临床应用,2009”和“Song,Hum Mol Genet,2009”)的结果后,观察到PKD患者中与IL6/IL6R相关的网络大多上调,(B)-D)Koupepidou研究衍生的PKD大鼠模型IL6/IL6R网络的渐进性上调等。[36]. 这三幅图描绘了疾病的三个不同阶段,特别是(A)第0天,(B)第6天和(D)第24天,在数据集“Koupepidou,BMC Nephrol,2010”中绘制三个实验条件后。

讨论

从当前版本的KUPKB中提取的有关肾脏疾病的丰富生物信息目前以表格形式呈现。考虑到可能返回很长时间的分子列表、知识库的性质以及它包含层次结构和蛋白质相互作用数据的事实,我们试图通过基因网络可视化模块可视化这些相互作用。在开发之前,我们尝试将实验数据映射到一些现有的软件包中,这些软件包是为生物网络可视化和探索而开发的,同时至少部分符合我们的需求(映射可能的多组分数据、集成的背景数据库、可定制的数据源)。这些工具包括EGAN、[16]和生物网络[41]. 在EGAN的情况下,反馈包括显示的信息量过大、来自多个数据源的视图复杂性、无法同时显示来自多个实验的表达式数据以及应用程序在大型网络上的性能中等。EGAN的另一个主要问题是基因到基因边缘缺乏方向性。另一方面,在生物网络的案例中,用户大多被大量的功能、复杂的界面和多种背景知识数据源所淹没,这些特征可能会让生物信息学家着迷,但往往会让台式生物学家感到沮丧,因为他们寻求的是明确具体的答案,而不是繁重复杂的多功能性。此外,生物网络需要本地安装,这通常是一个缺点,主要是在维护方面。

上述工具只是当今大量工具中的一个小例子,这些工具允许结合查看蛋白质相互作用网络和丰富数据[14]. 撇开KUPNetViz特定于域的特性不谈[14]满足相互作用和丰度数据的组合视图的标准(例如VANTED[42]、GENeVis、[43])并配备高级功能(例如网络群集算法、[44]降维方法[45]超大网络的可视化[46]和网络模块检测[47]). 然而,尽管上述工具在网络相关功能和可视化质量方面表现出色,但它们都没有在一个地方提供一套完整而简单的捆绑背景数据库(蛋白质相互作用、元素注释、功能和通路关联),这一事实对研究者来说至关重要。其他解决方案包括Pajek、[48]和yEd(http://www.yworks.com/en/products_yed_about.html网站)也包括优秀的网络分析工具,但非常通用,不专注于可能会混淆生物学家的生物问题。

许多当前应用程序的另一个缺点是,它们是基于桌面的,而软件开发的当前趋势是出于各种原因从桌面应用程序切换到基于web的应用程序,包括灵活性、维护和平台独立性。因此,尽管有一些基于Java的基于web的工具TM(TM)webstart技术(VANTED[42])或相关技术(VisANT[13]),它们仍有类似于某些桌面应用程序所描述的限制,主要是缺少一组小但足够的捆绑式后台数据库和相对简单的界面,不需要事先培训。尽管KUPNetViz应用程序的基本概念过于简单,但它希望启动一组特定于域的集成可视化工具,重点放在综合界面上。这些界面可以用于回答第一次使用时的生物学问题,而无需用户通过冗长的手册、耗时的数据库和文献搜索来注释网络中的各种实体并理解图论的基本数学概念。

尽管几个生物网络可视化和数据集成包的开发人员已经在结果的简单性和清晰度方面付出了大量努力,其中一些只能由受过训练的生物信息学家充分利用,而另一些则需要事先以研讨会或研讨会的形式进行培训,以便充分发挥其潜力。KUPNetViz应用程序的开发是计算机科学家和肾脏生物学家之间的持续互动,根据应用程序应保持简单易用、不言自明以及应提供简单生物网络快照的论点,添加、删除或重新实现了几个功能。因此,该工具通过隐藏和/或自动化生物图形的几个技术方面和数学属性,使网络显示和功能尽可能简单。同时,它不限制更高级的用户探索结果网络的其他可能数学特性,因为它允许以文本格式导出结果网络,这些文本格式可以导入到许多现有的图形分析包中进行进一步分析。此外,考虑到生物信息学工具发展的最新趋势[49]KUPNetViz专注于以用户为中心的设计方法的应用,考虑到完成案例研究所需的时间以及使用该应用程序的生物学家的反馈,它是此类策略的一个很好的例子。

据我们所知,KUPNetViz的一个新颖之处是能够以多物种的方式可视化基因到基因的关系,同时保持简单的最小化网络显示,这在其他生物网络可视化工具中是罕见的。当前的大多数软件包关注不同物种(例如鱼鹰、[50]或VANLO[51])允许用户可视化但不自动推断可能跨物种应用的可能交互作用,或基于多个可用数据源(例如生物网络[41]). 此外,多网络对齐或手动网络构建通常在应用程序和可视化简单性方面具有一定的成本,经常会让简单或匆忙的用户感到沮丧。

KUPNetViz更进一步,允许将生物分子关系从一个物种外推到另一个物种,同时保持其直观的视觉界面和图形视图(附加文件1). 这为组合不同动物模型和/或人类疾病的组学数据并快速筛选合理假设创造了独特的可能性。由于KUPNetViz支持的生物体在文献中没有得到同样广泛的注释(例如,小鼠的发育功能注释比人类更好[52]),多物种功能允许将基因与基因的关系以及基因/蛋白质表达数据从一个生物体外推到另一个生物体。虽然分子之间的某些关系在物种之间可能有所不同,但大多数关系和生物途径可以被视为进化保守,因此可以很容易地形成外推假设,即生物分子关系和基因/蛋白质在物种间特定病理条件下的表达。然后,研究人员可以判断这些假设的基本有效性,或者通过拒绝一个假设并制定另一个假设,或者通过创建一个似是而非的假设列表,最终在实验室进行验证。

此外,由于整个应用程序可以很容易地在多台机器中构建和部署,因此这种模块化使其很容易适应其他数据源(例如另一个器官)。因此,只要稍作修改,KUPNetViz可能会演变成一个更通用的框架,适用于器官或组织特定的知识库,同时它不像Cytoscape Web本身那样通用,但包含基本的捆绑知识,以作为独立的生物网络可视化应用程序发挥作用。尽管这样的应用程序并不是唯一一种,但与前面提到的两个应用程序相比,它可以将简单性、视觉复杂性和速度保持在可接受的水平([16,41]). KUPNetViz模块化的示意图如图所示4.

图4
图4

KUPNetViz的模块化。对KUPNetViz背后架构的简单描述,它由三个简单层组成,存在于许多类似的应用程序中:i)后台数据库,ii)处理数据库查询和解析的服务器PHP代码层,iii)与用户交互的应用程序客户端。客户端-服务器数据交换使用广泛使用的JavaScript Object Notation(JSON)格式执行。后端数据库层和PHP层中存储的数据中的垂直虚线表示处理背景知识和网络重建的不同模块以及KUPKB数据集及其到网络的映射的区别。这种区别使KUPNetViz演变为更通用的生物网络网络框架,该框架将生物分子相互作用的捆绑背景知识与一个非常简单的界面结合在一起,该界面专为希望获得简单生物状态快照而不想深入了解其他网络属性的实验室研究人员设计。

构建MySQL后端数据库以支持应用程序而不是使用KUPKB语义web存储库背后的理由包括三个主要论点:首先,在开发过程中,我们试图维护软件模块化和可重用性,即使是在当前版本中,可视化应用程序调整为肾脏。因此,我们认为RDB模型(尤其是背景知识部分)可以更容易地调整为其他类似的实验数据源(例如不同的器官)或不同结构的数据源(如不同类型癌症的多组学数据),只需要在用户界面部分进行微小修改。其次,并非KUPNetViz使用的所有背景知识数据源最初都包含在语义网络模型中(例如,蛋白质相互作用或参考路径)。这并不意味着存在KUPKB模型设计问题,而是强调了模型的不同初始目的,即不是网络可视化,而是肾脏解剖和疾病模型的详细知识表示,以及该知识表示模型的实验数据映射和注释。最后,在设计过程中,我们意识到,KUPNetViz提倡的极简方法并不需要存储在语义web存储库中的所有知识(例如,细胞类型和肾组织的高度详细的定位和分层)。因此,我们使用RDB模型来降低查询复杂性和运行速度。除后者外,后台数据库的构建时间,包括后台知识文件的下载和解析以及实验数据的重新传递,所需时间不到三个小时,而语义web存储库的重建需要一天以上(时间是在同一台计算机上测得的)。这样可以更容易地维护KUPNetViz,并可以更频繁地将后端数据库与合并的背景知识源的最新版本同步。

结论和未来工作

KUPNetViz是一个用于肾脏研究的用户友好的生物网络可视化工具。该工具使用从多个资源收集的关于几种肾脏病理状态的数据和有关生物分子相互作用以及功能和生化途径关联的背景知识元素,并创建生物网络快照,以阐明肾脏疾病的机制。它为肾脏生物学家提供了另一种网络数据表示方式,以较小的显示复杂度成本补充了iKUP探索工具的功能。此外,它最重要的特点可能是跨物种的生物分子相互作用外推,这使得研究人员能够以简单的方式快速制定和筛选几个假设。我们在两个案例研究中证明了KUPNetViz的价值,进一步研究了钙网蛋白在肾移植排斥反应中主要上调的基因网络中的关键作用,并新研究了IL6和IL6受体在多囊肾病进展中的潜在参与。

KUPNetViz在肾脏研究中的价值将随着相关公共多组学数据集数量的增加而增加,这些数据集也将在KUPKB中提供。KUPNetViz托管小组在肾脏生物学方面的专业知识保证了其在发布相关数据集时能够持续管理和添加相关数据集。这可能会增加人们对观测网络的信心,因为更多的生物证据最终将从不断增加的数据集中积累起来。数据集的添加简单明了,因为生物学家将数据输入到准备就绪的Excel表中,并通过单个命令行进行合并。我们的目标是每年至少一次将最新的组学数据集纳入KUPKB,KUPNetViz将从中直接受益。未来的扩展包括引入额外的生物分子注释和相互作用资源(KEGG化合物),以及添加一个模块,该模块将使用StRAnGER算法识别高度富集和过度表达的生物功能和生物化学途径[53].

可用性和要求

主页:可通过KUPKB网站和iKUP浏览器(选项卡“KUPKB网络可视化器”)访问http://www.kupkb.org或直接在http://www.kupkb.org/vis/index.php.

操作系统:KUPNetViz是一个基于web的应用程序,因此它是独立于平台的。

要求:KUPNetViz最好在Internet Explorer 8或更高版本、Mozilla Firefox、Google Chrome、Apple Safari和Opera下使用和查看。不建议使用Internet Explorer 7及更低版本。

许可证:KUPNetViz免费用于学术用途,但出于任何商业目的需要作者的许可。该软件无需用户注册即可使用。

更多信息:应用程序主页上提供了分析用户指南和使用示例,并作为在线补充材料(附加文件2).

缩写

KUP公司:

肾和尿路

库普克银行:

肾脏和泌尿系统知识库

KUPNetViz公司:

肾和尿路网络可视化工具

GO(执行):

基因本体论

KEGG公司:

京都基因和基因组百科全书

PKD:

多囊肾病

CKD公司:

慢性肾脏疾病

IL6:

白细胞介素6

IL6R(IL6R):

白细胞介素6受体

关系型数据库:

关系数据库。

工具书类

  1. Yauk CL、Rowan-Carroll A、Stead JD、Williams A:全球microRNA表达技术的跨平台分析。BMC基因组学。2010, 11: 330-10.1186/1471-2164-11-330.

    第条 公共医学中心 公共医学 谷歌学者 

  2. Kingsmore SF:多重蛋白质测量:蛋白质和抗体阵列的技术和应用。Nat Rev药物发现。2006, 5 (4): 310-320. 2006年10月18日。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  3. Metzker ML:测序技术——下一代。Nat Rev基因。2010, 11 (1): 31-46. 10.1038/nrg2266。

    第条 中国科学院 公共医学 谷歌学者 

  4. Dettmer K,Aronov PA,Hammock BD:基于质谱的代谢组学。《质谱学》2007年版,26(1):51-78。10.1002/mas.20108。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  5. Harding SD、Armit C、Armstrong J、Brennan J、Cheng Y、Haggarty B、Houghton D、Lloyd-MacGilp S、Pi X、Roochun Y等:GUDMAP数据库——泌尿生殖研究的在线资源。发展。2011, 138 (13): 2845-2853. 10.1242/dev.063594。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  6. Miyamoto M、Yoshida Y、Taguchi I、Nagasaka Y、Tasaki M、Zhang Y、Xu B、Nameta M、Sezaki H、Cuellar LM等:利用二维蛋白质预分离结合液相色谱-串联质谱对正常人肾小球进行深度蛋白质组学分析。蛋白质组研究杂志,2007,6(9):3680-3690。10.1021/pr070203编号。

    第条 中国科学院 公共医学 谷歌学者 

  7. Pisitkun T、Bieniek J、Tchapyjnikov D、Wang G、Wu WW、Shen RF、Knepper MA:使用LC-MS/MS对IMCD蛋白质进行高通量鉴定。生理基因组学。2006, 25 (2): 263-276. 10.1152/生理遗传学00214.2005。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  8. Klein J、Jupp S、Moulos P、Fernandez M、Buffin Meyer B、Casemayou A、Chaaya R、Charonis A、Bascands JL、Stevens R等人:KUPKB:一种访问肾脏疾病多组学数据的新型网络应用程序。FASEB J.2012,26(5):2145-2153。101096/fj.11-194381。

    第条 中国科学院 公共医学 谷歌学者 

  9. Antezana E、Kuiper M、Mironov V:生物知识管理:语义网络技术的新兴角色。简要生物信息。2009, 10 (4): 392-407. 10.1093/bib/bbp024。

    第条 公共医学 谷歌学者 

  10. Bonneau R:学习生物网络:从模块到动力学。自然化学生物。2008, 4 (11): 658-664. 10.1038/nchembio.122。

    第条 中国科学院 公共医学 谷歌学者 

  11. Zhu X,Gerstein M,Snyder M:连接:生物网络的分析和原理。《基因发展》2007,21(9):1010-1024。10.1101/gad.1528707。

    第条 中国科学院 公共医学 谷歌学者 

  12. Suderman M,Hallett M:可视化探索生物网络的工具。生物信息学。2007, 23 (20): 2651-2659. 10.1093/bioinformatics/btm401。

    第条 中国科学院 公共医学 谷歌学者 

  13. Hu Z,Hung JH,Wang Y,Chang YC,Huang CL,Huyck M,DeLisi C:VisANT 3.5:基于基因本体的多尺度网络可视化、分析和推理。核酸研究,2009,37(Web服务器版):115-121。

    第条 谷歌学者 

  14. Gehlenborg N、O'Donoghue SI、Baliga NS、Goesmann A、Hibbs MA、Kitano H、Kohlbacher O、Neuweger H、Schneider R、Tenenbaum D等:系统生物学的组学数据可视化。自然方法。2010年7月(3增补):S56-S68。

    第条 中国科学院 公共医学 谷歌学者 

  15. Pavlopoulos GA、Wegener AL、Schneider R:生物网络分析可视化工具综述。BioData Min.2008,1:12-10.1186/1756-0381-1-12。

    第条 公共医学中心 公共医学 谷歌学者 

  16. Paquette J,Tokuyasu T:EGAN:探索性基因关联网络。生物信息学。2010, 26 (2): 285-286. 10.1093/bioinformatics/btp656。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  17. Lopes CT、Franz M、Kazi F、Donaldson SL、Morris Q、Bader GD:Cytoscape Web:一种交互式网络浏览器。生物信息学。2010, 26 (18): 2347-2348. 10.1093/bioinformatics/btq430。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  18. Jupp S、Klein J、Schanstra J、Stevens R:开发肾脏和泌尿途径知识库。生物语义学杂志。2011年2月(补充2):S7-10.1186/2041-1480-2-S2-S7。

    第条 公共医学中心 公共医学 谷歌学者 

  19. 联盟TU:重组Universal protein Resource(UniProt)的蛋白质空间。《核酸研究》2012,40(数据库问题):71-75。

    第条 谷歌学者 

  20. Flicek P、Amode MR、Barrell D、Beal K、Brent S、Carvalho-Silva D、Clapham P、Coates G、Fairley S、Fitzgerald S等:合奏2012。《核酸研究》2012,40(数据库问题):84-90。

    第条 谷歌学者 

  21. Kozomara A,Griffiths-Jones S:miRBase:整合microRNA注释和深测序数据。核酸研究2011,39(数据库问题):152-157。

    第条 谷歌学者 

  22. Guberman JM、Ai J、Arnaiz O、Baran J、Blake A、Baldock R、Chelala C、Croft D、Cros A、Cutts RJ等人:BioMart中央门户网站:生物社区的开放数据库网络。数据库(牛津)。2011年:bar041-10.1093/数据库/bar041。

    第条 谷歌学者 

  23. Szklarczyk D、Franceschini A、Kuhn M、Simonovic M、Roth A、Minguez P、Doerks T、Stark M、Muller J、Bork P等:2011年的STRING数据库:全球整合和评分的蛋白质功能相互作用网络。核酸研究2011,39(数据库问题):561-568。

    第条 谷歌学者 

  24. Kanehisa M、Goto S、Sato Y、Furumichi M、Tanabe M:KEGG,用于集成和解释大规模分子数据集。《核酸研究》2012,40(数据库问题):109-114。

    第条 谷歌学者 

  25. Secrier M,Pavlopoulos GA,Aerts J,Schneider R:Arena3D:可视化生物系统中时间驱动的表型差异。BMC生物信息学。2012, 13: 45-10.1186/1471-2105-13-45.

    第条 公共医学中心 公共医学 谷歌学者 

  26. Kypreou KP、Kavvadas P、Karamessinis P、Peroulis M、Alberti A、Sideras P、Psarras S、Capetanaki Y、Politis PK、Charonis AS:纤维化发展过程中钙网蛋白表达的改变。蛋白质组学。2008, 8 (12): 2407-2419. 10.1002/pmic.200700831。

    第条 中国科学院 公共医学 谷歌学者 

  27. Abrass CK、Berfield AK、Stehman-Breen C、Alpers CE、Davis CL:人肾移植活检中间质细胞外基质成分的独特变化与排斥反应和环孢素毒性相关。美国肾脏病杂志。1999, 33 (1): 11-20. 10.1016/S0272-6386(99)70252-0。

    第条 中国科学院 公共医学 谷歌学者 

  28. Mas V、Maluf D、Archer K、Yanek K、Mas L、King A、Gibney E、Massey D、Cotterell A、Fisher R等:建立慢性移植物肾病的分子通路,以测试新的非侵入性诊断标记物。移植。2007, 83 (4): 448-457. 10.1097/01.tp.000251373.17997.9a。

    第条 中国科学院 公共医学 谷歌学者 

  29. Siddiqui I,Khan ZA,Lian D,Jiang J,Zhong R,Garcia B,Chakrabarti S:内皮素介导的癌胎儿纤维连接蛋白在慢性移植物肾病中的表达。移植。2006, 82 (3): 406-414. 10.1097/01.tp.000228905.44649.06。

    第条 中国科学院 公共医学 谷歌学者 

  30. 夏目漱石M、津治H、原田A、秋山M、矢野T、石仓H、中崎I、松岛K、Kaneko S、木开田N:经四氯化碳治疗的IL-6缺乏小鼠肝纤维化减轻,血清白蛋白水平降低。白细胞生物学杂志。1999, 66 (4): 601-608.

    中国科学院 公共医学 谷歌学者 

  31. Yoshizaki A、Yanaba K、Ogawa A、Asano Y、Kadono T、Sato S:DNA拓扑异构酶I和弗氏完全佐剂免疫通过白细胞介素-6信号传导诱导皮肤和肺纤维化及自身免疫。大黄性关节炎。2011, 63 (11): 3575-3585. 10.1002/第30539条。

    第条 中国科学院 公共医学 谷歌学者 

  32. Zhang W,Wang W,Yu H,Zhang Y,Dai Y,Ning C,Tao L,Sun H,Kellems RE,Blackburn MR等:白细胞介素6是血管紧张素II诱导的高血压和慢性肾损伤的基础。高血压。2012, 59 (1): 136-144. 10.1161/高血压AHA.111.73328。

    第条 中国科学院 公共医学 谷歌学者 

  33. O'Reilly S、Ciechmska M、Cant R、Hugle T、van Laar JM:白细胞介素-6在纤维性疾病中的作用。细胞因子生长因子评论2012,23(3):99-107。2016年10月10日/j.cytogfr.2012.04.003。

    第条 公共医学 谷歌学者 

  34. Uawithya P、Pisitkun T、Ruttenberg BE、Knepper MA:大鼠肾脏天然内髓集合管细胞的转录谱。生理基因组学。2008, 32 (2): 229-253.

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  35. Song X,Di Giovanni V,He N,Wang K,Ingram A,Rosenblum ND,Pei Y:常染色体显性多囊肾病(ADPKD)的系统生物学:基因表达途径和综合调控网络的计算识别。人类分子遗传学。2009, 18 (13): 2328-2343. 10.1093/hmg/ddp165。

    第条 中国科学院 公共医学 谷歌学者 

  36. Koupepidou P,Felekkis KN,Kranzlin B,Sticht C,Gretz N,Deltas C:PKD2(1-703)转基因大鼠的囊肿形成先于增殖相关途径的放松。BMC肾病。2010, 11: 23-10.1186/1471-2369-11-23.

    第条 公共医学中心 公共医学 谷歌学者 

  37. Menon V、Rudym D、Chandra P、Miskulin D、Perrone R、Sarnak M:多囊肾病中的炎症、氧化应激和胰岛素抵抗。《美国肾脏病临床杂志》。2011, 6 (1): 7-13. 10.2215/CJN.04140510。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  38. Lai X,Bacallao RL,Blazer-Yost BL,Hong D,Mason SB,Witzmann FA:常染色体显性多囊肾病(ADPKD)患者肾囊肿液蛋白质组的特征。蛋白质组学临床应用。2008, 2 (7-8): 1140-1152.

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  39. Mason SB、Lai X、Bacallao RL、Blazer-Yost BL、Gattone VH、Wang KC、Witzmann FA:常染色体显性多囊肾病囊肿液的生物标记物富集蛋白质组。蛋白质组学临床应用。2009, 3 (10): 1247-1250. 10.1002/prca.200800163。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  40. Chen WC,Tzeng YS,Li H:常染色体显性多囊肾病早期和进展期的基因表达。BMC Res注释。2008, 1: 131-10.1186/1756-0500-1-131.

    第条 公共医学中心 公共医学 谷歌学者 

  41. Kozhenkov S、Dubinina Y、Sedova M、Gupta A、Ponomarenko J、Baitaluk M:生物网络2.0——基因组生物学数据的综合观点。BMC生物信息学。2010, 11: 610-10.1186/1471-2105-11-610.

    第条 公共医学中心 公共医学 谷歌学者 

  42. Junker BH、Klukas C、Schreiber F:VANTED:生物网络背景下的高级数据分析和可视化系统。BMC生物信息学。2006, 7: 109-10.1186/1471-2105-7-109.

    第条 公共医学中心 公共医学 谷歌学者 

  43. Dinkla K,Westenberg MA,van Wijk JJ:压缩邻接矩阵:解开基因调控网络。IEEE转换可视化和计算机图形。2012, 18 (12): 2457-2466.

    第条 中国科学院 谷歌学者 

  44. Freeman TC、Goldovsky L、Brosch M、van Dongen S、Maziere P、Grocock RJ、Freilich S、Thornton J、Enright AJ:微阵列表达数据转录网络的构建、可视化和聚类。公共科学图书馆计算生物学。2007, 3 (10): 2032-2042.

    第条 中国科学院 公共医学 谷歌学者 

  45. Forman JJ、Clemons PA、Schreiber SL、Haggarty SJ:SpectralNET——光谱图分析和可视化的应用。BMC生物信息学。2005, 6: 260-10.1186/1471-2105-6-260.

    第条 公共医学中心 公共医学 谷歌学者 

  46. Auber D:一个巨大的图形可视化框架。图形绘制软件。编辑:Mutzel P,Junger M.2004,德国海德堡:Springer,105-126。

    第章 谷歌学者 

  47. Prinz S、Avila-Campillo I、Aldridge C、Srinivasan A、Dimitrov K、Siegel AF、Galitski T:通过集成分子网络中的模块控制酵母丝状体生长。《基因组研究》2004,14(3):380-390。10.1101克/月2020604。

    第条 公共医学中心 中国科学院 公共医学 谷歌学者 

  48. Batagelj V,Mrvar A:Pajek-大型网络分析程序。连接。1998, 21 (2): 47-57.

    谷歌学者 

  49. de Matos P、Cham JA、Cao H、Alcantara R、Rowland F、Lopez R、Steinbeck C:酶门户:在生物信息学中应用以用户为中心的设计方法的案例研究。BMC生物信息学。2013, 14: 103-10.1186/1471-2105-14-103.

    第条 公共医学中心 公共医学 谷歌学者 

  50. Breitkreutz BJ、Stark C、Tyers M:鱼鹰:网络可视化系统。基因组生物学。2003年,4(3):R22-10.1186/gb-2003-4-3-R22。

    第条 公共医学中心 公共医学 谷歌学者 

  51. Brasch S、Linsen L、Fuelen G:VANLO-对齐生物网络的交互式视觉探索。BMC生物信息学。2009, 10: 327-10.1186/1471-2105-10-327.

    第条 公共医学中心 公共医学 谷歌学者 

  52. da Huang W,Sherman BT,Lempicki RA:生物信息学富集工具:大型基因列表综合功能分析的途径。《核酸研究》2009,37(1):1-13。10.1093/nar/gkn923。

    第条 公共医学 谷歌学者 

  53. Chatziioannou AA,Moulos P:利用统计方法和受控词汇对基因组实验进行优先功能分析:StRAnGER Web应用程序。前神经科学。2011, 5: 8-

    公共医学中心 公共医学 谷歌学者 

下载参考资料

致谢

作者希望向亚里士多德·查齐奥纳努博士致谢,感谢他在应用程序设计的早期阶段提供有用的输入。这项工作由EU/FP7/ICT-2007.4.4 e-LICO项目资助(网址:http://www.e-lico.eu)FP7-IAPP项目“Protoclin”(GA 251368,http://www.protoclin.org).

作者信息

作者和附属机构

作者

通讯作者

与的通信莫洛斯帕纳焦炎Joost P Schanstra先生.

其他信息

竞争性利益

作者没有声明任何利益冲突。

作者的贡献

PM构思、设计和实现了整个软件,测试了软件并起草了手稿。JK和JPS测试了软件,提出了界面修改建议,进行了案例研究,并为起草手稿做出了贡献。SJ和RS为数据库设计和KUPNetViz与iKUP浏览器的集成做出了贡献。JB参与了手稿的起草和数据管理。所有作者都阅读、修改并批准了手稿。

电子辅助材料

12859_2012_5987_MOESM1_ESM.pdf

附加文件1:KUPNetVis多物种视图示例。简单的KUPNetViz网络的三个快照显示了多物种视图,要么使用包含支持物种中的直系同源基因的“超基因”,要么使用塌陷的“超级基因”来简化视图。(PDF 316 KB)

12859_2012_5987_MOESM2_ESM.pdf

附加文件2:KUPNetVis用户指南。一份详尽的用户指南,提供了应用程序的所有功能以及其他示例。(PDF 2 MB)

作者提交的原始图像文件

权利和权限

本文由BioMed Central Ltd.授权发布。这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/2.0)它允许在任何介质中不受限制地使用、分发和复制原始作品,前提是正确引用了原始作品。

转载和许可

关于本文

引用这篇文章

Moulos,P.、Klein,J.、Jupp,S。等。KUPNetViz:肾脏疾病多组学数据集的生物网络查看器。BMC生物信息学 14, 235 (2013). https://doi.org/10.1186/1471-2105-14-235

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/1471-2105-14-235

关键词