跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
数据库(牛津)。2011; 2011年:bar015。
2011年5月4日在线发布。 数字对象标识:10.1093/数据库/bar015
PMCID公司:项目经理3092609
PMID:21546359

TparvaDB:支持的数据库小泰勒虫疫苗开发

摘要

我们描述了TparvaDB的开发,这是一个综合资源,通过提供一个集成的用户友好的数据库,该数据库包含所有基因组和当前可用的相关数据,可促进东海岸热疫苗开发的研究小泰勒虫.TparvaDB基于通用模型生物体数据库(GMOD)平台。它包含完整的参考基因组序列、表达序列标签(EST)、大规模并行签名测序(MPSS)表达标签数据以及来自公共和私有存储库的相关信息。Artemis注释工作台提供在线注释功能。TparvaDB代表了一种资源,将支持和促进正在进行的东海岸热疫苗开发和生物研究。

数据库URL: http://tparvadb.ilri.cgiar.org

介绍

小泰勒虫是一种蜱传播的血原虫寄生虫,可引起牛的急性疾病,通常是致命的疾病,即东海岸热(ECF)(1). ECF严重限制了撒哈拉以南非洲贫穷牲畜饲养者的生计。目前的控制方法包括使用杀螨剂来限制蜱类种群,对出现临床症状的牛进行药物治疗,并部署一种活疫苗,这种活疫苗涉及到潜在致死剂量的冷冻预处理子孢子感染,以及同时使用长效氧四环素治疗(2). 亚单位疫苗将为解决东部和南部非洲畜牧业发展的这一社会经济重要制约因素提供长期解决方案。

基因组序列的完成帕尔瓦锥虫穆古加()代表了寄生虫生物学研究的一个重要里程碑,并为针对该阶段寄生虫的疫苗开发候选裂殖体抗原的鉴定做出了贡献(4). 它也是顶复合体比较基因组学的重要资源,尤其是恶性疟原虫导致人类疟疾和环状木霉(5)热带牛泰勒虫病是一种牛的相关疾病,广泛分布于北非、南亚和东亚。到目前为止帕尔瓦锥虫感兴趣的科学家的基因组和相关信息由于缺乏用户友好的界面而受到限制,该界面不仅可以访问基因组数据,还可以访问MPSS中的大量表达数据(6)裂殖阶段的EST数据和其他未发表和已发表的微阵列表达数据(7). 此外,当前的访问系统不容易在新数据可用时更新注释和管理(8).

TparvaDB架构

为了满足提供综合资源以促进ECF疫苗和比较Apicocomplian基因组学开发研究的需要,开发了TparvaDB,为所有基因组和相关基因提供统一的平台帕尔瓦锥虫数据(图1). TparvaDB是使用通用模型生物数据库(GMOD)系统的组件构建的(http://www.gmod.org). TparvaDB的核心组件是Chado,一种本体驱动的关系数据库模式(9),使用PostgreSQL开源数据库管理系统(网址:http://www.postgresql.org). TparvaDB中使用的本体包括序列(10),基因(11)和关系(12)本体论。

保存图片、插图等的外部文件。对象名称为bar015f1.jpg

TparvaDB界面截图,可访问多个在线工具。

小泰勒虫GenBank格式的Muguga基因组数据被转换为GFF3格式,并使用Perl脚本加载到TparvaDB Chado数据库中。EST、MPSS和SignalP数据同样转换为GFF3格式并上传至数据库。TparvaDB中包含了几个工具来提供功能。其中包括GBrowse、NCBI Blast和在线注释工具Artemis(13).

GBrowse是一个独立于平台、可扩展的基于web的图形界面应用程序,用于可视化数据库中存储的基因组特征(14). 在TparvaDB中,GBrowse使用Bio::DB::Das::Chado perl接口直接连接到TparvaDB-Chado数据库,使用Bio::Graphics perl库创建图像。GBrowse允许同时对基因组进行概述,并结合设备对基因组的特定区域进行详细查看。用户可以查询感兴趣的染色体区域并可视化特定特征,例如映射到特定区域的注释基因、EST和MPSS数据(图2). 在线数据分析插件提供了有关可以下载的特定功能的详细信息。

保存图片、插图等的外部文件。对象名为bar015f2.jpg

GBrowse接口的典型示例。轨迹显示关于1号染色体区域中注释基因、预测信号肽、映射EST、%GC含量和MPSS特征的信息。

NCBI爆炸(15)该工具允许对来自帕尔瓦锥虫(Muguga)。未来,数据库将为其他帕尔瓦锥虫目前正在测序的分离物,完成后将被包括在内。

我们使用DNA序列查看器和注释工具Artemis实现了在线注释功能(13). Artemis通过使用iBATIS DataMapper API支持Chado数据库(http://ibatis.apache.org),允许实时连接到底层TparvaDB Chado数据库。拥有授权权限的用户可以远程登录Chado数据库并对进行更改帕尔瓦锥虫通过Artemis界面在线建立基因模型(图3).

保存图片、插图等的外部文件。对象名称为bar015f3.jpg

Artemis注释工具的屏幕截图,允许直接访问帕尔瓦锥虫TparvaDB数据库中的基因组数据用于在线注释。背景图像描绘了Artemis界面,前景图像描绘了Gene Builder视图。

小泰勒虫重新标注

如前所述,还有几个帕尔瓦锥虫目前正在对分离物进行测序,这将使比较基因组学分析能够帮助ECF疫苗研究。注释新测序基因组最有效的方法之一是使用计算工具和数据库将其与注释良好的密切相关基因组进行比较。为了提高参考基因组的质量,我们重新命名了T帕尔瓦Muguga基因组使用自原始注释以来可用的数据,最重要的是自第一个基因组测序以来生成的大型EST数据集。在这个练习中,我们使用TparvaDB重新命名帕尔瓦锥虫使用新数据的麻瓜基因组。小泰勒虫裂殖体和子孢子EST数据从NCBI dbEST数据库下载(16),映射到帕尔瓦锥虫使用PASA的基因组(17)和BLAT(18),并将结果加载到TparvaDB。原件帕尔瓦锥虫基因组数据和绘制的EST数据被可视化,基因模型使用Artemis手动注释。总共创建了13个新的基因模型,纠正了23个基因模型,如表1.

表1。

基于EST的重新标注的注释更改

染色体基因模型更改注释
1TP01_0115修改的CDS
1TP01_0289号修改的CDS添加外显子
1TP01_0869号修改的CDS添加外显子
1TP01_1252型新CDS
1TP01_1253型新CDS
1TP01_1254型修改的CDS添加外显子
1TP01_1255新CDS
2TP02_0127修改的CDS添加外显子
2第02_0140页修改的CDS添加外显子
2TP02_0173修改的CDS添加外显子
2第02页_0181修改的CDS添加外显子
2TP02_0209号修改的CDS添加外显子
2TP02_0236号修改的CDS添加外显子
2TP02_0247号修改的CDS添加外显子
2TP02_0942号修改的CDS添加外显子
2TP02_0980型新CDS
2TP02_0981新CDS
2TP02_0982号新CDS
2TP02_0983号新CDS
2第02页_0984新CDS
2TP02_0986新CDS
TP03_0029号修改的CDS添加外显子
TP03_0041号修改的CDSExon添加
TP03_0224号修改的CDS添加了四个外显子
TP03_0349号修改的CDSExon添加
TP03_0413号修改的CDS添加外显子
TP03_0542号修改的CDS添加外显子
TP03_0574号修改的CDS添加外显子
TP03_0792号修改的CDS添加外显子
TP03_0862号修改的CDS添加外显子
TP03_0945号新CDS
TP03_0946号新CDS
4TP04_0943号新CDS
4TP04_0566号修改的CDS添加外显子
4TP04_0945号新CDS
4TP04_0843号修改的CDS添加外显子

未来的发展帕尔瓦锥虫数据库

为了加快选择潜在的疫苗靶点,并确定广泛部署疫苗的影响和潜在限制帕尔瓦锥虫基因组正在测序。当这些新的基因组可用时,可以使用TparvaDB快速注释。我们计划在TparvaDB中加入一个比较基因组成分,以便于识别菌株之间的保守和分歧区域。比较基因组学组件可以通过GBrowse_syn实现(http://gmod.org/wiki/GBrowse_syn)基于GBrowse的synteny浏览器,或通过将TparvaDB与其他比较数据库系统(如Sybil)接口(http://sybil.sourceforge.net/). 此外,ECF疫苗开发项目正在生成关于其他候选抗原、牛I类MHC序列和其他免疫学数据的免疫学数据,这些数据也可以纳入TparvaDB。为了更有效地管理这些日益复杂的信息,我们计划实现一个基于BioMart的查询系统,这是一个面向查询的数据管理系统,提供类似于“数据挖掘”的复杂描述性数据搜索(19).

基金

向国际牲畜研究所提供的多边核心资金支持了这项工作。这是ILRI的出版物编号白细胞介素-201101开放获取费用的资金来源:国际牲畜研究所。

利益冲突。未声明。

工具书类

1Norval RAI、Perry BD、Young AS。非洲泰勒虫病的流行病学。伦敦:学术出版社;1992[谷歌学者]
2拉德利·DE。泰勒虫感染及免疫治疗方法。海牙:马丁努斯·尼霍夫出版社;1981[谷歌学者]
三。Gardner MJ、Bishop R、Shah T等小泰勒虫一种转化淋巴细胞的牛病原体。科学。2005;309:134–137.[公共医学][谷歌学者]
4.Graham SP、Pelle R、Honda Y等人。小泰勒虫免疫牛细胞毒性T淋巴细胞识别的候选疫苗抗原。程序。美国国家科学院。科学。美国。2006;103:3286–3291. [PMC免费文章][公共医学][谷歌学者]
5Pain A,Renauld H,Berriman M,等。宿主细胞转化寄生虫环状泰勒虫的基因组与帕尔瓦锥虫.科学。2005;309:131–133.[公共医学][谷歌学者]
6Bishop R,Shah T,Pelle R等。原生动物转录组的分析小泰勒虫使用MPSS显示,大多数基因在分裂期具有转录活性。核酸研究。2005;33:5503–5511. [PMC免费文章][公共医学][谷歌学者]
7Schmuckli-Maurer J、Casanova C、Schmied S等小泰勒虫亚群编码可变分泌蛋白基因家族。公共科学图书馆一号。2009;4:e4839。 [PMC免费文章][公共医学][谷歌学者]
8Shah T,de Villiers E,Nene V,et al.使用转录组注释重访的基因组:大规模并行签名测序(MPSS)的应用基因。2006;366:104–108.[公共医学][谷歌学者]
9Mungall CJ,Emmert DB。Chado案例研究:一种基于本体论的模块化模式,用于表示基因组相关生物信息。生物信息学。2007;23:i337–i346。[公共医学][谷歌学者]
10Eilbeck K,Lewis SE,Mungall CJ等。序列本体论:基因组注释统一的工具。基因组生物学。2005;6:R44。 [PMC免费文章][公共医学][谷歌学者]
11Ashburner M、Ball CA、Blake JA等。基因本体论:生物学统一的工具。基因本体联盟。自然遗传学。2000;25:25–29. [PMC免费文章][公共医学][谷歌学者]
12Smith B、Ceusters W、Klagges B等。生物医学本体论中的关系。基因组生物学。2005;6:R46。 [PMC免费文章][公共医学][谷歌学者]
13Carver T、Berriman M、Tivey A等。Artemis和ACT:查看、注释和比较存储在关系数据库中的序列。生物信息学。2008;24:2672–2676. [PMC免费文章][公共医学][谷歌学者]
14Stein LD、Mungall C、Shu S等。通用基因组浏览器:模型生物系统数据库的构建块。基因组研究。2002;12:1599–1610. [PMC免费文章][公共医学][谷歌学者]
15.Altschul SF、Madden TL、Schaffer AA等。缺口BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。核酸研究。1997;25:3389–3402. [PMC免费文章][公共医学][谷歌学者]
16Rodriguez-Tome P.搜索dbEST数据库。方法分子生物学。1997;69:269–283.[公共医学][谷歌学者]
17Haas BJ、Delcher AL、Mount SM等。使用最大转录比对组合改进拟南芥基因组注释。核酸研究。2003;31:5654–5666. [PMC免费文章][公共医学][谷歌学者]
18肯特·WJ。BLAT–类似BLAST的对齐工具。基因组研究。2002;12:656–664. [PMC免费文章][公共医学][谷歌学者]
19Smedley D、Haider S、Ballester B等。BioMart–生物查询变得简单。BMC基因组学。2009;10:22. [PMC免费文章][公共医学][谷歌学者]

文章来自数据库:生物数据库与治疗杂志由提供牛津大学出版社