跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
数据库(牛津)。2011; 2011年:bar010。
2011年4月8日在线发布。 doi(操作界面):10.1093/数据库/bar010
预防性维修识别码:PMC3072770
PMID:21478484

大鼠基因组数据库通路入口

摘要

相互作用的分子集合统称为通路或网络,代表一个基本的结构单元,是更大、高度集成的生物系统网络的构建块。科学界对了解通路如何工作、相互沟通和协同作用的细节以及一条或多条通路中的改变如何聚合为疾病表型的兴趣,对通路数据和信息提供者提出了更高的要求。为了满足这些需求,大鼠基因组数据库[(RGD)http://rgd.mcw.edu]采用了一种多层次的方法来获取和呈现路径数据。不断添加或扩展资源和工具,以提供更全面的路径数据集以及增强的路径数据操作、探索和可视化功能。在RGD,用户可以轻松识别路径中的基因,查看路径之间的相互关系,并以动态和集成的方式可视化路径。他们可以从几个入口点访问这些组件和其他组件,并轻松地在它们之间导航,还可以下载感兴趣的数据。介绍了RGD的Pathway Portal资源,并讨论了未来的发展方向。

数据库URL: http://rgd.mcw.edu

介绍

大鼠基因组数据库[(RGD)http://rgd.mcw.edu]是实验室大鼠的模型生物数据库,提供了从基因组和遗传到分子和通路,以及表型、疾病和菌株的广泛信息[有关RGD资源的描述,请参阅Dwinell等。(1)]. 数据库中的重要核心对象由大鼠基因、数量性状位点(QTL)和菌株等表示。RGD还提供关于人类和小鼠基因和QTL的信息,以便用户对这三种哺乳动物进行比较。这些对象的信息是基于手动管理或通过使用多个受控词汇表或本体的自动管道获取和存储的。内部开发或外部开发并根据需要进行调整的工具用于存储、访问和挖掘数据以及在数据类型之间导航(2,). 为了提供更好、更全面的数据集成,RGD开发了几个门户,这些门户在数量和内容上都在不断扩展。Pathway Portal项目已经启动,以涵盖多个路径方面,并提供多方面的资源。该门户提供了一系列路径数据和可视化功能,处于几个入口点和其他门户(如疾病门户)的十字路口(1). 以下章节描述了路径门户资源的各个方面,包括路径术语的基因注释、路径本体的开发、交互式路径图的构建以及相关导航功能的提供。

路径数据管理和本体开发

大鼠以及适用的人类和小鼠基因的功能注释是RGD管理工作的一个重要方面,在该过程中使用了几个本体。简要介绍了基因本体(GO),它是最著名和应用最广泛的生物本体之一(4)用于将大鼠基因注释为分子功能、生物过程和细胞成分术语。基于医学主题标题C分支的疾病本体(DO)[(MeSH)http://www.nlm.nih.gov/mesh/]来自国家医学图书馆网址:http://www.nlm.nih.gov/]用于将大鼠、人类和小鼠的基因注释为疾病术语。哺乳动物表型本体(MP),由小鼠基因组信息学(MGI,小鼠基因组数据库)开发-http://www.informatics.jax.org/对于RGD贡献项,用于将大鼠、人类或小鼠基因注释为表型项(如适用)。路径本体(PW)由RGD开发,在下一段中进行了详细描述,用于将大鼠、人类和小鼠基因注释为路径术语。

PW的目标是在层次结构中组织各种类型的生物途径,包括疾病和改变的途径,以及它们之间的关系。本体的五个主要节点是:经典代谢、调节、信号、药物和疾病路径。外部路径数据库和资源,如京都基因和基因组百科全书[(KEGG)http://www.genome.jp/kegg/]、PharmGKB(http://www.pharmgkb.org/index.jsp),反应组(网址:http://www.reactome.org/)以及其他一些对已发表的科学评论文献的广泛研究都被用于填充节点(5–10). 路径交互数据库对新术语的请求和/或对当前术语的更改[(PID)网址:http://pid.nci.nih.gov/]-美国国家癌症研究所(NCI)和自然出版集团(NPG;11)之间的一个合作项目也对本体论的扩展和发展做出了贡献(PID使用PW将人类调控和信号通路映射到PW术语,以允许用户按类别浏览这些通路)。值得注意的是,该节点专门用于疾病路径和为路径的更改版本提供术语。虽然RGD以外的一些途径资源提供了疾病途径,但提供改变的途径是RGD资源的独特特征。改变的途径被视为由于一个或多个基因功能的改变而偏离其正常过程的途径。作为一个推论,疾病途径被视为一个或多个途径中的变化总和,其综合效应导致系统无法适应不利挑战,然后表现为疾病状态。例如,癌症越来越被视为一种途径改变的疾病(12,13).

RGD的路径本体为任何类型的生物路径的基因标准化注释提供了一种方法;它还可以作为连接本体报告、路径图和套件、疾病门户和基因报告页面的工具。根据路径在更广泛的系统生物学或生理网络背景下或与疾病门户相关的疾病背景下发挥的各种作用,选择路径进行注释。例如,胰岛素分泌和胰岛素信号通路是细胞葡萄糖稳态的重要组成部分,两者的损害与2型糖尿病有关。胰岛素信号与其他激素(如瘦素)的作用对能量平衡的正常进行也很重要,能量平衡控制的紊乱与肥胖和相关疾病有关。胰岛素和瘦素都是受体激活配体,依赖于触发下游信号通路来发挥作用。对于任何以注释为目标的路径,都会对综述文献进行广泛研究,以确定路径的组成部分。一旦确定了一组组分基因,大鼠、人和小鼠的基因补体就被注释为通路术语。根据大鼠实验文献,大鼠基因也在功能上注释为适当的GO术语。在疾病和改变路径的情况下,除了常规路径和DO术语外,其突变与与疾病相关的改变路径有关的基因被注释为相应的疾病和改变的路径术语。因此,对已知在改变的途径中功能失调的基因进行疾病途径术语注释。使用DO在逐个基因的基础上进行疾病注释。如果有特定疾病途径的交互式图表,则会提供DO报告页面的链接。该报告列出了以某种方式与该疾病相关的所有基因,并将其注释为相应的疾病术语(参见“交互式路径图和路径套件”部分)。基因报告页面中提供了路径和功能注释的支持参考(请参阅“路径数据输入点和导航功能”部分)。海外建筑运营管理局格式的本体副本和三种物种的注释文件可从RGD ftp网站下载,网址为时间://rgd.mcw.edu/pub/data_release/ftp://rgd.mcw.edu/pub/data_release/nannoted_rgd_objects_by_ontology(生物)/分别为。本体可以在RGD网站上进行探索,网址为http://rgd.mcw.edu/wg/pathway?100网址或使用RGD的本体浏览器(请参阅下面的“路径数据输入点和导航功能”部分),在国家生物医学本体中心(NCBO)的BioPortal,网址为http://bioportal.bioontology.org/ontologies/42912以及欧洲生物信息学研究所(EMBL-EBI)的本体查找服务(OLS)http://www.ebi.ac.uk/ontology-lookup/browse.do?ontName=PW.

交互式路径图和路径套件

路径的图形呈现非常有趣,因为它允许用户立即看到交互伙伴、他们的适配器、效应器和调节器如何塑造分子网络并定义其结果。RGD的交互式路径图页面和最近添加的路径套件是pathway Portal的重要组件。这些图表是使用Ariadne Genomics的Pathway Studio软件包构建的-http://www.ariadnegenomics.com/-图页是在内容管理系统(CMS)中构建的。交互式路径图页面的元素包括路径的描述和图表、实体、关系和形状的图例、缩写和参考列表,以及Ariadne用户的导入选项。描述中提到的蛋白质结构域链接到Pfam数据库中的条目(http://pfam.sanger.ac.uk/); 描述以路径本体报告页面的链接结束,如适用,还包括相关GO术语或DO术语本体报告页面、KEGG地图、PharmGKB报告和/或反应组条目的链接。图表中的每个组件都链接到更多信息的来源:例如,蛋白质或蛋白质相关的图标链接到相应的RGD基因报告页面,或链接到基因的动态列表,图表或列表中的小分子,链接到对应的PubChem(http://www.ncbi.nlm.nih.gov/pccound网站/),生物感兴趣的化学实体(http://www.ebi.ac.uk/chebi/)]或比较毒理学数据库(http://ctd.mdibl.org/)]条目。附带参考链接到PubMed摘要(http://www.ncbi.nlm.nih.gov/pubmed/). 非常重要的是,图中存在的触发或以其他方式连接的路径链接到它们的本体报告页面。每个本体报告都包含GViewer,GViewer是一个显示大鼠染色体全基因组视图的工具,指示注释基因的位置。该报告列出了注释到该术语的所有基因,并显示了本体中路径术语的路径。如果有该路径术语的图表页面,其图标将显示在报告页面的顶部,并链接到交互式图表页面。因此,用户可以从一条路径“行走”到另一条路径,跟随信号的旅程,在连接的网络之间导航,探索他们的个人特征。他们可以比较路径的正常版本和改变版本,并检查改变的路径在疾病发展中可能发挥的作用,以及药物如何试图对抗它。路径术语的独特ID,以及Ariadne和CMS软件和生物信息学方法的特点,使这种路径探索成为可能。例如,可以使用RGD主页的“路径”入口点直接从当前图表列表访问“睾酮生物合成途径”的交互式图表页面(图1A和B);它也可以通过“类固醇激素生物合成途径”,即“雄激素信号途径”获得(图2A) 或“雄激素信号通路改变”图表页面。“改变的雄激素信号通路”反过来提供了与正常“雄激素信号途径”和“前列腺癌途径”的联系(图2B) 图表页面和癌症门户网站,而“前列腺癌途径”提供了与改变的途径和门户网站的相互链接。此外,“前列腺癌途径”页面还提供了前列腺肿瘤DO报告页面的链接,该页面列出了以某种方式与该疾病相关或怀疑具有易感性的所有基因,并对该术语进行了注释。上述癌症门户网站是迄今为止发布的几个疾病门户网站之一,针对乳腺、泌尿生殖道和胰胆管肿瘤。其他癌症类型将在未来成为目标。疾病门户项目的描述超出了本文的范围;感兴趣的用户可以查看主页中的“疾病”入口点或进行视频巡视(请参阅“路径数据入口点和导航功能”部分)。最近更新了“前列腺癌途径”图,以提供人类前列腺肿瘤中异常表达的miRNAs的信息;每个列出的miRNA都有一个链接到其在RGD和microRNA数据库miRBase中的条目(图2B、 插图)。有关更重要的路径图更新以及最新发布的更新的公告可以在最新消息部分和主页上的旋转横幅中找到(请重新访问图1A) ●●●●。

保存图片、插图等的外部文件。对象名称为bar010f1.jpg

显示RGD主页的部分视图,其中包含主要入口点、视频教程、旋转横幅和最新新闻部分,并带有指向Pathways条目的箭头(A类)以及Pathway条目带来的RGD路径资源页面的顶部,包含交互式路径图页面、路径套件和生理路径图,箭头指向“睾酮生物合成路径”(B).

保存图片、插图等的外部文件。对象名称为bar010f2.jpg

显示了“雄激素信号通路”交互式图表页面的部分视图(A类)对于“前列腺癌途径”,插图显示了前列腺癌潜在相关miRNA的列表,点击功能类图标即可访问该列表(B).

虽然用户可以选择路径旅行的方向甚至长度,但路径套件提供了一个易于遵循的路径视觉概述,无论是在更大的网络中连接的还是以其他方式相关的。每个套件都提供了一个大画面的即时快照,将各种类型的路径汇集在一起。它提供了一个网络路线图,该网络连接多条路径,并在适用时连接其改变的对应物、疾病和相关药物路径。当全球形势更加复杂或用户可能对某个主题不太熟悉时,这在疾病等情况下尤其有用。例如,虽然目前可用的大多数图表都涵盖了代谢、信号传递和调控途径,而疾病和药物途径的最新集合仍然很小,但第一批发布的套件已经解决了涉及疾病和药物的网络。例如,前列腺癌途径套件(图3)显示了从类固醇激素到睾酮生物合成以及通过雄激素受体到后续信号传递的“正常”途径,以及雄激素信号改变到前列腺癌的“缺陷”途径。最近出版的套件涉及维持葡萄糖稳态的许多方面(图1B) ●●●●。更有经验的用户可以很容易地从已发布的图表列表中找到相关路径,并根据自己的需要定制行程,并通过提供的链接找到问题的答案,例如葡萄糖是如何处理或存储的,系统如何响应其循环浓度的变化,这种反应在2型糖尿病中是否会减弱,如果是,是否正在开发药物。然而,不太熟悉的用户可能会发现仔细阅读这两间套房提供的旅行指南有助于实现葡萄糖稳态。”葡萄糖平衡代谢途径套件#1:葡萄糖和相关分子的代谢,顾名思义,汇集了葡萄糖代谢的各种途径,如氧化和转化、生物合成和储存葡萄糖稳态途径套件#2:葡萄糖稳态相关调节和信号”将胰岛素分泌和胰岛素反应性葡萄糖转运以及胰岛素和胰高血糖素信号途径结合在一起。这两个套件相互链接,可以从其中一个导航到2型糖尿病路径套件和糖尿病门户。因此,这两个假设用户可以获得相同的基本信息,尽管路线有所不同。每个路径套件都包含对所呈现内容的简要描述;个别路径图的图标根据适用的类别进行分组,并显示上面路径术语的名称和路径的简短描述。用户可以通过标题、图标或简短描述中的“单击此处”指示器链接到相应的路径图页面。

保存图片、插图等的外部文件。对象名称为bar010f3.jpg

显示前列腺癌路径套件。

一种新开发的资源由生理路径图表示。此功能是对门户资源的最新添加,其目标是提供系统级路径视图(重新访问图1B) ●●●●。

路径数据入口点和导航功能

RGD提供的一些路径入口点和导航功能已经在前面的章节中提到了。本节将简要总结当前如何访问路径数据,以及用户如何在各种路径数据和其他数据类型之间导航。一个明显的切入点是RGD网站主页上的“路径”;它提供了路径资源的概述,包含了所有已发布的交互式路径图页面和路径套件的动态列表,并链接到生理路径页面(图1A和B)。”主页上的疾病入口点提供了到目前为止已发布的五个疾病门户的链接:糖尿病、肥胖/代谢综合征、癌症(乳腺、泌尿生殖道和胰胆管)、心血管和神经。疾病门户搜索选项包括疾病(默认)和相关表型、生物过程和途径;结果提供了带注释的对象和链接以及工具的列表。通过选择类别中的给定类别和条目,可以缩小搜索范围。例如,在癌症门脉中,可以选择“细胞死亡途径”作为途径类别,然后选择“内在凋亡途径”或其中一种外源性死亡受体介导的途径。结果显示了注释到所选术语的大鼠、人类和小鼠基因数量的摘要,按物种列出的单个基因,可选择查看人类或小鼠GViewer或大鼠-人类或大鼠–小鼠综合征的大鼠基因GViewer,以及按词汇类型列出的GO注释概述。可以从基因列表或GViewer访问单个基因报告页面。

用户可以通过本体浏览器或基因组查看器搜索一个或多个本体,分别从主页上的数据/本体或基因组工具/GViewer访问,然后继续探索词汇表或查看感兴趣的术语的本体报告。例如,在本体浏览器中选择路径本体并键入“胰高血糖素”将显示本体中包含单词胰高血糖激素的所有术语。单击术语右侧的树图标将显示该术语在词汇表中的位置及其路径;单击一个术语将显示该术语的本体报告页面。如前所述,本体报告显示了术语及其定义、大鼠基因的GViewer、带注释的基因列表(跨越三个物种)、术语的路径,如果有交互式路径图可用,还显示了图的图标(图4A和B)。注释的默认模式是定期的;单击提供的切换按钮(中的箭头图4A) ●●●●。GViewer允许用户向基因组视图添加对象。例如,可以选择第二个本体术语来比较注释到这两个术语的老鼠基因。用户还可以选择从GViewer导出带注释对象的选定列表。从本体报告中,用户可以选择查看交互式路径图页面(如果存在),以探索词汇表或访问感兴趣基因的报告页面。基因报告页面包含本体列出的所有注释,以及支持参考和其他信息类型,以及指向同源人类和小鼠基因报告页面和外部源的链接。从注释列表中选择任何一个本体术语都会显示该术语的本体报告页面。

保存图片、插图等的外部文件。对象名称为bar010f4.jpg

显示“胰高血糖素信号通路”的“本体报告”页面的部分视图(A)以及本体论中“胰高血糖素信号通路”术语的路径(B).

RatMine公司[(http://ratmine.mcw.edu/ratmine/begin.do)]是另一种用于通过一些预定义模板或查询查找大鼠基因信息的工具,包括特定路径和其他本体术语的注释。可以进一步分析来自预定义查询或基于路径图和本体搜索得到的结果。例如,可以比较选定的数据集的共享或唯一表示的基因,或者查找跨多个本体的术语丰富性。其他资源和链接允许将数据集与蛋白质相关分析和可视化集成。

结论和未来方向

RGD采用了一种多层方法来获取、传播和可视化路径数据,包括本体开发和附带注释,以及提供路径图页面和相关工具。由路径套件提供的独特路径本体标识符和全局连接视图介导的路径“行走”允许用户探索各种类型路径之间的关系范围,而单个图表提供了当前所理解的特定路径的分子基础的图片。从2008年初开始,基因对通路术语的注释以及通路的图形表示构成了常规管理活动;它们也促进了本体论的扩展。如前所述,路径套件是一个相对较新的功能,第一个于2010年发布。定期发布新图表和相关注释;在此过程中,正在构建新套件,并对现有图表进行更新。这一点的一瞥被捕获为旋转横幅上的条目,并在“最新消息”部分进行简要总结;两者都位于RGD网站的主页上。截至本文撰写之时,数据库中有9400多条路径注释,已经发布了75多个交互式路径图。RGD提供的路径资源非常令人感兴趣,是用户社区的灵感来源,这可以从他们获得的点击量以及其他地方展示的升级或新趋势中得到证明。正在进行的工作将继续致力于增加当前的图表页面集合;未来的努力将寻求对相互关联的全球网络提供更全面的看法。这包括添加新的和更新的路径套件、更新的交互图以及在更广泛的生理学和系统生物学背景下整合分子路径。正在考虑将药物和疾病途径与一组相关的代谢、调节或信号途径以及改变的途径与相关的基因组、遗传和临床数据进行更好的协调和整合。随着信息范围的扩大和数据集成程度的加深,开发新的和/或升级现有工具将继续成为RGD的优先事项之一。

方法

Pathway Ontology正在使用GO Consortium开发的OBO-Edit软件工具进行构建(14). 正在使用Ariadne Genomics小组开发的pathway Studio软件工具构建路径图[http://www.ariadnegenomics.com/]. 该软件包包括ResNet哺乳动物数据库,其中包含大鼠、人类和小鼠基因、小分子、过程、疾病和相关信息的条目。此外,可以在ResNet中添加新特性,并为这些特性指定值。利用此功能可以为图中的路径提供PW ID,以及基因列表和小分子到PubChem、ChEBI或CTD中条目的链接。当路径图保存为html时,将创建一个路径名文件夹,其中包含图中所有实体的文件及其在ResNet中的关联信息。文件夹通过ftp-ed传输到RGD的网站;脚本解析文件夹中的文件以查找RGD:ID、PW:ID和ResNet中创建的其他链接。这允许图表中的条目链接到基因报告页面、基因动态列表、路径本体报告或PubChem(如适用)。正在使用WebGUI CMS构建图表页面。在CMS中为路径图页面创建了带有实体、关系和形状图例的路径模板。在模板中,将创建描述文章、缩写和参考以及Ariadne导入选项,如果适用,还将创建基因和其他对象(例如miRNAs)的列表。当图表页面上显示的基因太多或目标基因太多时,正在为类成员创建基因列表。HTTP代理实用程序用于引入并在页面中显示图表。在CMS中创建链接,例如到各种路径资源中的本体报告页面或条目的链接,以及到PubMed和Pfam数据库的链接。

基金

开放获取费用的资金来源:代表国家卫生研究院的国家心脏、肺和血液研究所[5罗1HL064541].

利益冲突。未声明。

工具书类

1Dwinell MR、Worthey EA、Shimoyama M等,《2009年大鼠基因组数据库:变异、本体论和途径》。核酸研究。2009;37:D744–D749。 [PMC免费文章][公共医学][谷歌学者]
2Shimoyama M、Petri V、Pasko D等。使用多本体集成复杂生物数据。公司。功能。基因组学。2005;6:373–378. [PMC免费文章][公共医学][谷歌学者]
三。Shimoyama M、Hayman GT、Laulederkind SJ等。大鼠基因组数据库管理员:谁、什么、在哪里、为什么。公共科学图书馆计算。生物。2009;5:e10000582。 [PMC免费文章][公共医学][谷歌学者]
4Ashburner M、Ball CA、Blake JA等。基因本体论:生物学统一的工具。基因本体联盟。自然发电机。2000;25:25–29. [PMC免费文章][公共医学][谷歌学者]
5Ogata H、Goto S、Sato K等。KEGG:《京都基因和基因组百科全书》。核酸研究。1999;27:29–34. [PMC免费文章][公共医学][谷歌学者]
6Kanehisa M、Goto S、Furumichi M等,KEGG,用于表征和分析涉及疾病和药物的分子网络。核酸研究。2010;38:D355–D360。 [PMC免费文章][公共医学][谷歌学者]
7Hewett M、Oiver DE、Rubin DL等。PharmGKB:药理学知识库。核酸研究。2002;30:163–165. [PMC免费文章][公共医学][谷歌学者]
8Thorn CF、Klein TE、Altman RB。药物基因组学和生物信息学:PharmGKB。药物基因组学。2010;11:501–505. [PMC免费文章][公共医学][谷歌学者]
9Joshi Tope G,Gillespie M,Vastrik I等。反应组:生物途径的知识库。核酸研究。2005;33:D428–D423。 [PMC免费文章][公共医学][谷歌学者]
10Matthews L、Gopinath G、Gillespie M等。人类生物途径和过程的反应组知识库。核酸研究。2009;37:D619–D622。 [PMC免费文章][公共医学][谷歌学者]
11Schaefer CF、Anthony K、Krupa S等,《PID:路径交互数据库》。核酸研究。2009;37:D674–D679。 [PMC免费文章][公共医学][谷歌学者]
12Hanahan D,Weinberg RA。癌症的标志。单元格。2000;100:57–70.[公共医学][谷歌学者]
13.Pujol A,Mosca R,Farrés J,Aloy P.揭示网络和系统生物学在药物发现中的作用。趋势药理学。科学。2010;31:115–123.[公共医学][谷歌学者]
14Day-Richter J、Harris MA、Haendel M等人。OBO-Edit——生物学家的本体编辑器。生物信息学。2007;23:2198–2200.[公共医学][谷歌学者]

文章来自数据库:《生物数据库与治疗杂志》由提供牛津大学出版社