跳到主要内容

南方牛蜱EST的全球比较分析,微小裂头螺

摘要

背景

南方的牛蜱,微小裂头螺是牛的一种经济上重要的寄生虫,在饲养过程中可以将多种病原微生物传播给其宿主。了解生物和基因组学微型罗氏菌对于开发控制这些蜱类的新方法至关重要。

结果

我们提出了一个全球比较基因组分析的基因指数微型罗氏菌由由42512个表达序列标签(EST)组装而成的13643个独特转录物组成,是微型罗氏菌基因。这些EST的来源物质包括来自不同组织、生命阶段和菌株的polyA RNA微型罗氏菌包括暴露于热、冷、寄主气味和杀螨剂的幼虫。使用RPS-Blast分析进行功能注释,确定了概念翻译基因索引中的保守蛋白域,并将GO术语分配给那些具有信息性BlastX点击的数据库转录本。Blast Score Ratio和SimiTri分析比较了微型罗氏菌数据库到其他真核蛋白质组和EST数据库,包括来自3个蜱类的数据库。用SimiTri方法分析了BmiGI中最丰富的蛋白质结构域。

结论

这些结果表明,大部分BmiGI条目在其他测序基因组中没有同源物。利用PartiGene注释管道进行的分析表明,64%的BmiGI成员无法被分配GO注释,因此,关于蜱类基因组中重要部分的可用信息很少。这突出了蜱虫生物学的重要见解,这些见解可能来自蜱虫基因组测序项目。全球比较分析发现一些蜱类基因具有意外的系统发育关系,详细分析归因于动物王国某些成员的基因丢失。一些蜱类基因与哺乳动物基因有密切的同源性。这一群体的成员很可能不会成为开发新型蜱虫控制技术的目标。

背景

微小裂头螺热带或南部牛蜱是影响全球牛群的病原体的最重要经济蜱媒之一[1]。蜱类传播原生动物(牛巴贝斯虫二联巴贝斯虫)和原核生物(边缘无浆虫)引起巴贝斯虫病和无浆体病的生物体,可导致牛奶和牛肉生产的严重农业损失以及牲畜运输的限制。影响微型罗氏菌由于美国养牛业的发展,美国农业部(USDA)在20世纪中期发起了一场运动,根除了美国的蜱虫[2]。这种蜱虫在墨西哥仍很流行,由于每年有超过100万头牛从墨西哥进口到美国,美国农业部制定了一项广泛的检疫计划来保持布菲卢斯美国重建的滴答声[].

杀螨剂在维持美国农业部检疫计划的成功以及控制墨西哥和世界其他地区的蜱虫感染方面发挥了关键作用。然而,关于抗杀螨剂的报告微型罗氏菌墨西哥人口[4,5]以及微型罗氏菌美国爆发疫情[6]强调需要开发新的蜱虫控制方法。了解蜱的基因组和基因表达谱应有助于这些控制技术的发展。一些报告描述了以获取和分析蜱虫表达序列标签(EST)为中心的项目。大多数报告都集中在蜱虫唾液腺中转录的基因上,如阑尾裂头鱼[7],杂色琥珀[8]以及肩胛硬蜱[9]。此外,从卵巢、唾液腺和血细胞中分离出1344个EST微型罗氏菌但序列尚未提交给Genbank[10]。唾液腺和卵巢中表达的基因是研究的诱人目标,因为这些组织参与关键的蜱-虫相互作用。在更一般的方法中,我们开发了一个微型罗氏菌EST数据库,BmiGI[11]源自不同组织、生命阶段和蜱类菌株,以促进利用分子生物学和基因组方法设计新型蜱类控制技术的研究。希望通过对数据库的分析,能够发现一些基因,这些基因可以克服由于抗杀螨剂而导致的蜱类控制问题,并识别病原体感染和传播过程中基于基因的脆弱性。在BmiGI版本1中,鉴定了53个推定的杀螨耐药性相关序列。在目前的研究中,我们已经组装了一个更新的基因索引[12]它包含的EST数量是版本1的两倍多。我们对BmiGI第2版的保守蛋白结构域进行了基因本体(GO)注释分析和RPS-Blast鉴定。使用比较基因组学分析工具Blast Score Ratio[13]和SimiTri[14]它提供了可视化输出,允许基因组之间的全局比较,我们比较了由概念翻译产生的蛋白质组微型罗氏菌EST数据库,包含来自智人,冈比亚按蚊,黑腹果蝇,秀丽隐杆线虫、和酿酒酵母我们还使用蛋白质组中几个最丰富的蛋白质结构域进行了更详细的SimiTri比较微型罗氏菌.

结果和讨论

BmiGI统计数据和GO注释

在BmiGI的第一版中,使用TIGR的自动注释流水线工具将EST聚类并组装成暂定一致序列(TC),将非聚类、非重叠序列定义为单子序列。共分析了20417个EST,组装产生8270个独特成员,包括5760个TC和2510个单体EST[11]。在第二版BmiGI中,新测序的EST总数为22095。这些新序列与BmiGI版本1中的EST结合,用于聚类生成BmiGI2版本,产生9403个TC和4240个单体。

随着EST测序的进行,获得的新序列数量显著减少。首批20417个EST产生了8270个BmiGI独特成员,回报率为41%。第二组包括22095个EST,产生了额外5373个BmiGI新成员,回报率为24%。在第二轮EST测序的最后阶段,观察到大约5%的返回率,并且对这个合并的标准化cDNA文库进行进一步的EST测速似乎不再是对资源的有效利用。如果对由特定感兴趣的靶组织合成的文库进行EST测序,如联神经节、卵巢或唾液腺,那么未来的EST序列可能会更有效。几个目标库的排序正在进行中。

的注释的最新版本D.黑腹果蝇基因组序列[15]注释19783个蛋白质编码转录物。最新的基因组组装冈比亚按蚊[16]已发现14089个基因转录本。假设微型罗氏菌与这两种节肢动物有相似数量的转录物,由13643个独特转录物组成的BmiGI组代表了微型罗氏菌然而,很可能BmiGI含有源自非编码RNA的EST,因为EST数据库已被证明含有非编码RNA[17]。此外,在使用BmiGI进行BLAST分析注释的过程中,注意到一些序列与牛序列具有很高的氨基酸同源性。这些很可能是由于成年蜱肠道中残留的牛血液造成的,成年蜱是采集的生命阶段之一,并包含在用于合成cDNA文库的混合RNA中。此外,一些序列似乎起源于原生动物,可能起源于蜱体内的共生生物或牛巴贝斯虫-感染幼虫包括在文库合成过程中。用于组装基因索引的自动注释管道不适合删除牛或原生动物序列,在使用BmiGI时应考虑这一点。然而,根据我们的经验,这些并不构成BmiGI条目的显著部分,并且应该可以通过它们与GenBank Blast搜索结果中的牛或原生动物序列的高度核苷酸同源性容易识别。

使用两种不同的方法,即TIGR自动注释管道和PartiGene开源软件包,对BmiGI进行功能注释,以指定GO术语并帮助识别基因功能。在BmiGI Version 2网络支持注释中,GO分析是使用TIGR自动注释管道进行的,其中注释的截止点是基于搜索E<1×10的非冗余蛋白质数据库-27。选取相似度至少为75%、覆盖率至少为50%的热门蛋白质,并将分配给该蛋白质的GO术语转移到TC查询中。严格的截止值用于最大限度地减少爆破分析中的误报注释,并且未指定GO项。如表所示1TIGR分析将1369、1321和1253个TC分别分配给分子功能、生物过程和细胞成分本体。催化活性和结合是分子功能类别中最重要的两个GO术语。生理过程和细胞过程是生物过程类别的前两个指定GO术语。最后,细胞内和细胞是细胞成分类别的前两个指定GO术语。

表1使用不同截止值的基因本体分配

我们希望尝试预测被TIGR管道指定为未知和未指定GO术语的TC的基因功能,并在可能的情况下包括单核细胞的GO注释分析。因此,我们尝试了PartiGene管道中的软件annot8r_blast2go[18],使用爆炸E值1×10-8和1×10-25(表1). 当E值设置为1×10时-25可以为2615个TC(占总TC的28%)和730个singleton(占总singleton的17%)分配GO注释。当E值设置为1×10时-8,3608个TC(38%)和1096个单线态(26%)可以被分配一个或多个GO项。因此,即使在Blast中使用相对自由的E值,也无法为66%的BmiGI成员分配GO注释。与TC相比,单体在总可能值中的比例更低,这很可能是因为与TC相比单体通常包含更短的序列长度。一些单体可能代表蜱类特有的低拷贝数基因的转录本,或者从低序列同源性基因到基因和蛋白质序列数据库中更好表示的生物体的转录本。

全球比较基因组学

我们有兴趣确定微型罗氏菌是其他后生动物基因组。西米特里[14]就是为了这个目的而开发的,它能够将一个目标基因组与其他三个基因组进行全局比较,结果显示在一个易于解释的三角形图形中。事实上,SimiTri分析用于比较几种线虫物种的EST和全基因组数据库,包括秀丽线虫,扭曲血蜱、和巴西尼波氏线虫并可视化这些线虫之间的进化关系[19]。Hughes等人[20]将SimiTri分析用于类似目的,以比较不同甲虫的翻译EST与甲虫的蛋白质组D.黑腹果蝇,智人、和秀丽线虫然而,由于我们的研究重点是开发新的牛害虫控制技术微型罗氏菌最具体地说,我们的比较分析是以这些优先事项为指导的。我们希望使用比较基因组分析来帮助优先选择可能的基因或蛋白质靶点,以开发新的控制技术,其中可能包括针对选定基因产品的疫苗或新型抑制剂的设计。理想情况下,控制技术不会对非目标生物体产生毒性,而哺乳动物的毒性是最令人担忧的。自然,与具有高靶向特异性的有效方法相比,对牛具有高度毒性的抗感染控制技术在牛身上的应用将受到限制。因此,我们选择了智人作为与BmiGI数据库进行比较基因组分析的代表性哺乳动物基因组,认为哺乳动物中没有同源成员的编码区域将为进一步研究提供更好的目标。同样,作为微型罗氏菌是一种节肢动物,我们选择了D.黑腹果蝇用于这些比较。由于牛会被线虫寄生在体内,我们选择秀丽线虫作为这类生物基因组的一个研究得很好的代表。最后冈比亚按蚊令人感兴趣的是,这种生物是一种以血液为食的节肢动物,它以与人类红细胞广泛相似的方式,向许多生物传播病毒B.牛B.二联胺寄生牛红细胞。

位置聚类揭示了来自微小R.plus以及那些来自被查询基因组的基因。此外,位于三角形边缘的基因与三角形相对顶点上表示的数据库没有显著匹配。使用BmiGI的概念翻译序列微型罗氏菌数据与其他四种后生动物基因组序列的数据组合进行了比较(智人,D.黑腹果蝇,秀丽线虫、和冈比亚按蚊)和单细胞生物酿酒酵母(图1). 与相比时酿酒酵母,D.黑腹果蝇智人(图第1页),扁虱的序列群更接近D.黑腹果蝇与其他两种生物相比,蜱虫似乎最远离酿酒酵母,自年以来的预期结果酿酒酵母是单细胞生物。虽然两者都有微型罗氏菌D.黑腹果蝇有些是节肢动物微型罗氏菌基因似乎与人类基因更相似D.黑腹果蝇如图所示第1页选择具有这些非典型基因相似性的基因,对其Blast结果进行更详细的检查,稍后将进行讨论。更换后酿酒酵母具有秀丽线虫(图1亿),大多数预测的关系似乎都集中在中心附近,但仔细检查表明,向D.黑腹果蝇基因组比秀丽线虫智人.更换秀丽线虫具有冈比亚按蚊导致了D.黑腹果蝇冈比亚按蚊,尽管一些非典型基因聚集在附近智人(图1c个). 最后,当微型罗氏菌基因与三个蜱类EST数据库进行了比较,阑尾鱼,I.肩胛骨、和A.杂色,大多数基因聚集在更接近附肢乳杆菌而不是其他两个勾号(图1天). 这一结果与这4种蜱类的系统发育分类相一致[21].

图1
图1

预测的SimiTri剖面 微型罗氏菌 基因.每个预测的蛋白质编码区微型罗氏菌使用BlastP或tick EST数据库(d)使用TBlastN(E值<1×10-8). 在每个配置文件中选择三个翻译的数据库进行比较。每个磁贴的位置表示其与通过Blast搜索原始分数计算的每个不同基因组中的点击数的相似性。颜色根据最高爆炸得分进行编码:红色>300;黄色>200;绿色>150;蓝色>100,紫色<100。

从系统发育的角度来看,蜱类和昆虫属于节肢动物门,与蜱和哺乳动物的基因相比,它们具有更多的基因相似性。然而,SimiTri分析揭示了一些非典型基因,这些基因与人类基因相比更接近D.黑腹果蝇冈比亚按蚊基因。图中圈出了三个最不典型的基因1a–c并在表中列出2TC14523在图1的所有三个比较中都包含与人类基因最相似的基因1a–cTC14523最受欢迎的是Dusty蛋白激酶(E-Value=1×10-138),一种具有双功能激酶结构域的蛋白质,其特定的生物学作用尚未确定。虽然大多数数据库将该蛋白归类为受体相互作用激酶,但详细分析表明,这是一种单拷贝独特激酶,似乎存在于所有脊椎动物中[22]。EST[GenBank:CD782617.1]来自阑尾鱼是一种寄生家畜的三宿主蜱类,与TC14523具有91%的核苷酸同源性。因此,至少有两只蜱拥有这种基因,了解这种基因在人类和蜱类中的功能将是非常有趣的。也许这个功能可以揭示为什么这种基因存在非典型的序列相似性微型罗氏菌为了用更有力的系统发育分析方法进一步研究TC14523与其他Dusty蛋白激酶的关系,我们对TC14523的概念编码区进行了BlastP和Clustal分析,然后生成了相应的系统发育树。2a个显示TC14523的编码区与海胆的一种Dusty蛋白激酶关系最密切,与各种水生物种和哺乳动物的几种Dusty蛋白质激酶相似。事实上,除了来自蜜蜂,节肢动物昆虫序列似乎在与微型罗氏菌顺序(图2a个,其他文件12). 也许这个基因已经从大多数昆虫中丢失,而双翅目昆虫中没有这个基因可以解释为什么TC14523聚集在附近智人在SimiTri图形分析中1a–c.

表2 SimiTri分析中的不典型基因
图2
图2

SimiTri分析中非典型基因的系统发生树分析图1a-c中圈出的非典型聚集基因通过BlastP分析和系统发育树进行分析,生成的系统发育树的输出按比例缩放,以显示序列之间的距离。BmiGI条目为TC14523(a)、TC9268(b)、TC13445(c)和TC12600(d),TC查询序列在图中以粗体下划线文本表示为Rhipicephalus microplus。用于生成树的路线包含在附加文件中2,4,6,8文本格式。整个树以pdf文件格式包含为附加文件1,,5、和7这里只包括显示最近相关序列的子树。

表中的另外两个非典型基因2TC7573和TC9268与肌动蛋白结合有关。TC7573的最大爆炸打击是Destrin(E-Value=1×10-78),一种肌动蛋白解聚因子[23]然而,TC7573显示了99%以上的核苷酸与各种EST的同源性Bos金牛cDNA文库,包括来自皮肤、肝脏和胎盘的文库,TC7573可能起源于牛。TC9268含有2个PDZ(突触后密度蛋白,盘大,带状蛋白-1)结构域,与syntenin序列相似(E值=1×10-76),由于其与信号传导和粘附分子的相互作用而参与多种生理过程[24]。EST[GenBank:CD791887]来自阑尾鱼TC9268的5'区具有85%的核苷酸同源性,因此该基因至少存在于两种蜱类中。BlastP和系统发育树分析(图2亿)显示TC9268的编码区与虾、蜜蜂、红萤虫和一些蚊子的编码区非常相似。A类果蝇属该基因没有出现在系统发育树中(图2亿,其他文件4),表明与TC9268密切相关的序列在果蝇中不存在,可能在该物种中丢失。事实上,秀丽线虫没有显示TC9268的近亲,并且两者都没有该基因编码区秀丽线虫D.黑腹果蝇将在图中解释其非典型聚集1亿.

TC13445的顶部冲击波为COP1(构成光形态1;E值=1×10-91),一种作为E3泛素连接酶的蛋白质,参与植物的光信号传导和哺乳动物的肿瘤发生[25]。A类阑尾鱼EST[GenBank:CD779568.1]与TC13445具有94%的核苷酸同源性。BlastP和树分析(图2厘米)显示除栗Tribolium castaneum与TC13445高度相似的同源序列似乎在昆虫中普遍缺失。这个锥栗木霉直系亲属与微型罗氏菌基因,与鱼类、灵长类和几种植物等多种生物的同源基因有着显著的相似性。尽管D.黑腹果蝇拟暗果蝇具有有限相似性的序列(E值=1×10-13)对于TC13445,树分析显示果蝇属序列与TC13445有些距离(图2厘米,其他文件56). 线虫似乎也没有TC13445的近亲,加上在D.黑腹果蝇与TC13445非常相似,有助于解释图中该序列的非典型聚集第1页1亿.

TC12600与含有层粘连蛋白a结构域的蛋白质(Q4RST5)具有显著的序列相似性(E值=1×10-124)存在于细胞外空间,在形态发生的信号传递过程中起作用,也起结构作用[26]。BlastP分析显示与微型罗氏菌序列为斑马鱼、河豚和各种哺乳动物(图二维),在系统发育树中缺少昆虫序列(图二维,其他文件78)表明该基因可能已从大多数昆虫中丢失。这些非典型聚集序列TC14523、TC9268、TC13445和TC12600可能代表了由蜱寄生在其哺乳动物宿主上的生活方式所导致的聚合进化的示例,蜱与哺乳动物面临相似的环境和进化压力。然而,在SimiTri分析中发现的非典型聚集(图1a–c,表2)似乎更可能是由于被选为查询基因组的节肢动物的基因丢失造成的,与仅限于三个基因组的SimiTri分析相比,通过对多个基因组中对齐序列的系统发育树分析更容易直观地显示这一事件。此外,双翅目昆虫在已测序基因组或大量收集EST的节肢动物中表现得更好。随着越来越多的非双翅目节肢动物序列可用,将更好地理解系统发育关系。

虽然SimiTri分析提供了目标基因组与其他三个基因组相似性的可视化结果,但有人认为,使用三个基因组的爆破得分总和对每个基因计算的距离进行标准化,只能表示与三个基因组之间的相对距离。最好有一种独立于比较基因组的测量方法。此外,最高度保守的序列集中在中心周围,对于指定保守基因和基因组特异基因没有明确的划分。Blast Score Ratio(BSR)方法是对SimiTri分析的改进,BSR用于将预测的BmiGI基因与其他基因组的基因进行比较[13]。使用BSR和爆炸搜索E值1×10-8,将翻译的BmiGI与秀丽线虫、冈比亚线虫、黑腹线虫智人以各种组合(图). 在所有三个比较中,D.黑腹果蝇是在Y轴上查询的蛋白质组,超过4000个数据点具有Blast命中率。每个数据点的坐标表示到两个不同基因组的距离,这是通过Blast分数除以参考来计算的。参考值是针对自身的每个基因的得分,是区分BSR方法和SimiTri的标准化因子。BSR分析中的一个有用的相似性检查是将图划分为象限,象限由0.4标记处从X轴和Y轴延伸的线定义[13]。象限A(橙色)表示仅存在于微型罗氏菌而象限B(绿色)中的基因与y轴上的基因组最相似。象限C(红色)中的基因与两个基因组相似,象限D(蓝色)中的基因组与x轴上的基因组最相似。所有三个图的一个共同特征是,更多数据位于斜率=1的对角线上方的区域,这表明这些肽与沿Y轴的蛋白质组的肽更相关,D.黑腹果蝇。在所有三个图的BSR象限A中一致发现约2300个肽,该象限最接近图的起源,表明这些基因在其他两个被查询的蛋白质组中没有紧密匹配。此外,通过比较与D.黑腹果蝇(803肽;图3a年象限B)到最相似的数字秀丽线虫(93肽;图3a年象限D),差异显著。毫不奇怪,当替换冈比亚按蚊对于的秀丽线虫(图3亿). 在这种情况下,303和183肽分别出现在象限B和D中。可以看出,图中的对角线周围聚集了更多的点3亿比数字3a年3立方厘米,表示微型罗氏菌,D.黑腹果蝇、和冈比亚按蚊蛋白质组与其他两个图谱的关系更密切。这也反映在象限C中的点数上,象限C代表所有三种蛋白质组的共同基因。图C象限中有1113、1613和1367个肽3a、3b、和3立方厘米分别是。图中的另一个有趣点3立方厘米是象限B中肽的数量(接近D.黑腹果蝇)和D(更接近智人)分别为529和332。有更多类似于智人与…相反D.黑腹果蝇这3个物种之间的系统发育距离可能超出预期。通过比较,BSR分析与D.黑腹果蝇秀丽线虫(图)在象限B和D中分别揭示了803和93个肽。图D象限中肽的详细分析3a年3立方厘米目前正在研究数量出乎意料的、与人类蛋白质组更相似的肽。基因丢失事件很可能发生在D.黑腹果蝇,智人、和秀丽线虫正如我们之前在SimiTri分析的非典型聚集基因中所讨论的那样,正在影响这种分布。同样值得注意的是,BmiGI来源于未经处理以去除共生微生物的蜱虫。已知其中一些蜱类感染了B.牛B.二联胺如前所述,BmiGI中的一些序列似乎来自B.牛.基因组分析B.牛在开发BmiGI版本2时不可用。尽管这一比例预计很低,但BSR象限A中的一些“独特”序列可能来自这些共生生物。同样值得注意的是,SimiTri分析显示的非典型基因与智人D.黑腹果蝇映射到图的象限D区域3立方厘米(更接近智人,数据未显示),表明两种方法的结果一致。

图3
图3

比较基因组学分析 微型罗氏菌 使用Blast Score Ratio的基因。采用BLAST评分比(BSR)方法[13]将预测的BmiGI基因与其他基因组进行比较。象限A(橙色)表示仅存在于微型罗氏菌而象限B(绿色)中的基因与y轴上的基因组最为相似。象限C(红色)中的基因与两个基因组相似,象限D(蓝色)中的基因组与x轴上的基因组最相似。使用x轴上的三个不同基因组进行了比较,秀丽线虫(a) ,冈比亚按蚊(b) 和智人(c) 反对D.黑腹果蝇在y轴上。

由于使用BmiGI进行比较分析,这是一个不完整的蜱类基因编码区数据库,因此一旦整个蜱类基因组可用于分析,SimiTri和BSR图可能会呈现不同的结果。事实上,一旦I.肩胛骨基因组可用并附有注释[27],可以轻松进行更全面的SimiTri和BSR分析I.肩胛骨结果与我们研究中的结果进行了比较。我们的感觉是微型罗氏菌目前在BmiGI中没有表达的基因编码区是在高度专业化的组织中或在蜱体内表达水平很低的基因。这些基因中有很大一部分可能参与调控过程或基因级联,并可能在许多节肢动物,甚至真核生物的生物体类别中具有保守特征。这些基因可能绘制在SimiTri图的中心部分和BSR图的象限C中。然而,在我们的EST测序过程中,可能还没有发现许多低丰度蜱特异性基因,也不会出现在BmiGI中。与SimiTri分析中使用的有机体中的基因几乎没有相似性或没有相似性的基因将导致数据点沿着图的边缘,而在BSR分析中,这些个体将绘制在象限A中。此外,可以调整爆炸分析E值,以作为SimiTri和BSR结果的过滤器。由于SimiTri和BSR仅绘制通过指定爆炸E值截止点的序列,因此可以通过改变E值来进行比较。如果一个查询序列没有对GenBank中的任何有机体进行Blast攻击,那么在SimiTri或BSR分析期间都不会绘制该序列。

BmiGI由69%的组装TC和31%的单线态组成。因此,prot4EST翻译数据包含大量由不完整开放阅读框翻译产生的小蛋白,并且在推导BmiGI时使用的polyA RNA选择方法生成的EST数据库中肯定存在3'末端偏差。在BmiGI的prot4EST翻译中,9494个TC中,18%和11%的翻译产物分别为<80和<60氨基酸。4238个单体翻译产物集的29%和11%的成员分别含有<80和<60氨基酸。BmiGI可能的3'末端偏倚和3'未翻译区域的普遍保守性质的结合可能导致BSR分析结果对蛋白质的偏倚,而与其他两个被查询的生物体不匹配,因此绘制在象限A中。尽管应记住这种可能的偏倚,prot4EST多肽预测管道包含ESTscan2.0,用于识别和分离可能的蛋白质编码区和5'和3'非翻译区[28],减少其对BSR分析的影响。如前一段所述,Blast E值也会影响BSR。与较长的蛋白质相比,这些小翻译产物对任何生物体的Blast命中率都较低,如果发生这种情况,则不会出现在BSR图上。

蛋白质结构域分析

由于blast搜索只对BmiGI的一小部分进行了搜索,因此我们进行了蛋白质域分析,以提取有关微型罗氏菌数据库。对保守域数据库进行的RPS-Blast搜索产生了3252个BmiGI条目,点击代表1620个独特域(E值为1×10-8). BmiGI条目点击数与域数的分布如图所示4,表明1050个域在BmiGI中仅表示一次,而2个域在40多个BmiGI-条目中表示。表中列出了十个最常见的域,这些常见的域可以分为两组。其中一组包括WD40、RNA识别基序(RRM)、丝氨酸蛋白酶抑制剂(serpin)和Kunitz型蛋白酶抑制剂(KU)结构域,这些结构域是参与蛋白质相互作用的常见结构模块。其他六个结构域主要具有酶功能,包括丝氨酸/苏氨酸蛋白激酶催化(STKc)、混合功能氧化酶(P450)、蛋白酶(类胰蛋白酶、肽酶M13)、酯酶(羧酯酶)和泛素结合酶E2催化结构域。

图4
图4

BmiGI2中发现的蛋白质结构域的分布使用RPS-Blast对BmiGI2中的假定翻译序列进行查询,并以E值<1×10为截止值-8。根据包含有问题域的BmiGI条目的数量对蛋白质域进行分组。每个组中的域总数显示在条形图上方。

表3 BmiGI版本2中最丰富的域

为了进一步分析这些域,我们检查了被识别为包含表中前五个域的序列的SimiTri剖面通过比较微型罗氏菌蛋白质组的序列秀丽线虫,D.黑腹果蝇智人(图5). 我们还将KU域包括在该分析中,因为KU域在I.肩胛骨[9]。除了WD40结构域之外,大多数数据点都聚集在中心,这表明这些序列的所有蛋白质组之间有着密切的相似性。对于WD40、RRM和类胰蛋白酶域,在秀丽线虫,由SimiTri绘图线上对齐的数据点表示D.黑腹果蝇智人(图5a、5b5天). 此外,WD40序列中可能存在不同的演化,因为数据在图中有所分散(图5a级)与其他域序列图中的紧密聚类相反(图5b–f). 有趣的是,对于STKc和KU域微型罗氏菌序列被发现在D.黑腹果蝇秀丽线虫并且不在智人,因为它映射到线条连接D.黑腹果蝇秀丽线虫(图5e、f). 在高等生物的进化发展过程中,可能丢失了相应的STKc和KU同源基因,智人每个域都在基本细胞过程中发挥作用。例如,WD结构域参与多种功能,如G蛋白偶联、RNA处理、囊泡运输和细胞分裂[29]。RRM域为调节转录后基因表达提供了一个可塑的RNA结合平台[30]。尤其重要的是KU和蛋白酶结构域,因为这些结构域对蜱虫作为吸血生物的作用至关重要[31].

图5
图5

6个选定蛋白质结构域的SimiTri图谱从RPS-Blast搜索(表3)中选择五个最丰富的蛋白质结构域和KU结构域进行SimiTri剖面分析。每个蛋白质域中的基因数据摘自图1b。所示的蛋白质结构域为:(a)中的WD40、(b)中的RNA识别基序、(c)中的P450、(d)中的胰蛋白酶样蛋白酶、(e)中的丝氨酸/苏氨酸激酶催化结构域和(f)中的Kunitz单位结构域。

结论

本研究对BmiGI第2版进行了分析,该版本包含了微型罗氏菌.我们的结果表明微型罗氏菌是唯一的,在其他测序基因组中没有同源物。E值=1×10-8,在13765名BmiGI成员中,只有34%的成员可以使用此相对自由的Blast E值分配一个或多个GO术语。

在遭受爆炸袭击的英国皇家骑警协会成员中,英国皇家骑兵协会分析发现大约2300名微小R.plus与中的序列不匹配的序列D.黑腹果蝇,智人,秀丽线虫,或冈比亚按蚊这突出了蜱类中存在独特的基因进化过程,并强调了对蜱类基因组进行测序以更好地了解蜱类生物学的重要性。在缺乏全基因组序列的情况下[32],EST数据是基因发现的良好资源,将有助于研究微型罗氏菌我们的全球比较分析发现一些蜱类基因具有意外的系统发育关系,详细分析归因于动物王国某些成员的基因丢失。

方法

微型罗氏菌EST序列

The construction of the微型罗氏菌标准化cDNA文库,生成EST,并组装成微型罗氏菌描述了基因指数[11]。简单地说,从经受各种环境暴露(包括热休克、冷休克、寄主气味、感染B.牛和各种杀螨剂。杀螨剂暴露试验是用几种微型罗氏菌其对拟除虫菊酯、有机磷和甲脒双甲脒的易感性水平各不相同。我们还包括从卵子、若虫、成虫和解剖的成虫蜱类器官中纯化的RNA。

比较基因组分析

使用TIGR的自动注释管道工具将EST聚类并组装成初步共识(TC)序列[33]和定义为单例序列的非聚集、非重叠序列。GO术语[34]使用基于BlastX搜索结果的自定义脚本自动分配。我们还使用了PartiGene[35]作为EST分析的另一个管道,此开源分析包提供了一些强大的注释选项,以与TIGR自动注释管道结果进行比较。PartiGene对BmiGI第2版进行了分析,为了保持一致性,BmiGI中的TC和单体数字命名保持一致。蛋白质编码区微型罗氏菌通过应用prot4EST确定[28]并使用Uniprot的数据进行爆炸[36]。GO术语仅根据Blast E值使用PartiGene包中的annot8r模块进行分配。

用于SimiTri分析[14],程序已下载[37]使用来自BmiGI的prot4EST翻译序列和临界E值<1×10进行BlastP搜索-8Blosum62被用作这些搜索的矩阵,以检测蛋白质之间微弱的相似性。预测的蛋白质组酿酒酵母,秀丽线虫,冈比亚按蚊,D.黑腹果蝇智人已下载[38]。根据蜱虫的EST数据库进行TblastN搜索,阑尾鱼A.杂色[39]以及I.肩胛骨[40]。非典型聚集微型罗氏菌基因通过对BmiGI第2版中提到的概念开放阅读框架的BlastP分析进行分析,然后使用ClustalW生成系统发育树[41]和Phylip系统发育推断包中的程序[42]。在Phylip软件包中,SEQBOOT使用默认值,除了1000个重复,PROTPARS使用默认值(除了10个混杂),CONSENSE和所有默认值。使用TREEVIEW查看共识树[43]。包含与BmiGI条目密切相关的序列的子树显示为图形,而用于生成树的整棵树和路线包含为附加文件1,2,,4,5,6,7,8.

在BLAST得分率(BSR)方法中[13],的概念翻译微型罗氏菌参考基因组(BmiGI第2版)与酿酒酵母,秀丽线虫,冈比亚按蚊,D.黑腹果蝇智人用作查询的1和查询2。使用BSR阈值0.4绘制图形输出文件并将其分为四个象限。

蛋白质结构域分析通过RPS-Blast搜索保守结构域数据库进行[44]使用截止E值<1×10-8。从BmiGI中提取感兴趣域的翻译序列,并使用上述协议进行SimiTri分析。

工具书类

  1. de Castro JJ:发展中国家畜牧业改良中的可持续蜱虫传播疾病控制。兽医寄生虫。1997, 71 (2–3): 77-97. 10.1016/S0304-4017(97)00033-2。

    第条 中国科学院 公共医学 谷歌学者 

  2. Graham OH,Hourigan JL:家畜节肢动物寄生虫根除计划。医学昆虫学杂志。1977, 13 (6): 629-658.

    第条 中国科学院 公共医学 谷歌学者 

  3. George JE、Davey RB、Pound JM:介绍了蜱类和蜱传疾病:威胁和根除方法。兽医诊所北美食品动画。2002, 18 (3): 401-416. 10.1016/S0749-0720(02)00030-0。

    第条 公共医学 谷歌学者 

  4. Miller RJ、Davey RB、George JE:墨西哥拟除虫菊酯抗性和对coumaphos敏感性的表征微小牛蜱(蜱螨亚纲:蜱科)。医学昆虫学杂志。1999, 36 (5): 533-538.

    第条 中国科学院 公共医学 谷歌学者 

  5. Li AY、Davey RB、Miller RJ、George JE:抗药性微小牛蜱(蜱螨:蜱科)和氧化解毒机制参与的证据。医学昆虫学杂志。2003, 40 (4): 482-490.

    第条 中国科学院 公共医学 谷歌学者 

  6. Miller RJ、Davey RB、George JE:首次报告有机磷耐药微小牛蜱(蜱螨亚纲:蜱科)在美国境内。医学昆虫学杂志。2005, 42 (5): 912-917. 10.1603/0022-2585(2005)042[0912:FROOBM]2.0.CO;2

    第条 中国科学院 公共医学 谷歌学者 

  7. Nene V、Lee D、Kang'a S、Skilton R、Shah T、de Villiers E、Mwaura S、Taylor D、Quackenbush J、Bishop R:女性唾液腺转录的基因阑尾裂头鱼感染蜱类小泰勒虫昆虫生物化学分子生物学。2004, 34 (10): 1117-1128. 10.1016/j.ibmb.2004.07.002。

    第条 公共医学 谷歌学者 

  8. Nene V,Lee D,Quackenbush J,Skilton R,Mwaura S,Gardner MJ,Bishop R:AvGI,一种在蜱类唾液腺转录的基因指数杂色琥珀《国际寄生虫学杂志》。2002, 32 (12): 1447-1456. 10.1016/S0020-7519(02)00159-5。

    第条 中国科学院 公共医学 谷歌学者 

  9. Ribeiro JM、Alarcon-Chaidez F、Francischetti IM、Mans BJ、Mather TN、Valenzuela JG、Wikel SK:唾液腺转录本注释目录肩胛硬蜱滴答声。昆虫生物化学分子生物学。2006, 36 (2): 111-129. 10.1016/j.ibmb.2005.11.005。

    第条 中国科学院 公共医学 谷歌学者 

  10. 桑托斯IK、瓦伦苏埃拉JG、里贝罗JM、德卡斯特罗M、科斯塔JN、科斯塔AM、达席尔瓦ER、内托OB、罗查C、达夫雷S、费雷拉BR、达席尔瓦JS、萨博MP、贝查拉GH:基因发现微小牛蜱牛蜱:卵巢、唾液腺和血细胞的转录体。Ann N Y科学院。2004, 1026: 242-246. 10.1196/annals.1307.037。

    第条 中国科学院 公共医学 谷歌学者 

  11. Guerrero FD、Miller RJ、Rousseau ME、Sunkara S、Quackenbush J、Lee Y、Nene V:BmiGI:表达于微小牛蜱热带/南部牛蜱。昆虫生物化学分子生物学。2005, 35 (6): 585-595. 10.1016/j.ibmb.2005.01.20。

    第条 中国科学院 公共医学 谷歌学者 

  12. 微小牛蜱基因索引第2版。[http://compbio.dfci.harvard.edu/tgi/cgi-bin/tgi/giman.pl?gudb=b_microplus]

  13. Rasko DA、Myers GS、Ravel J:通过BLAST评分比率对比较基因组分析进行可视化。BMC生物信息学。2005, 6: 2-10.1186/1471-2105-6-2.

    第条 公共医学中心 公共医学 谷歌学者 

  14. Parkinson J,Blaxter M:SimiTri–可视化序列组的相似关系。生物信息学。2003, 19 (3): 390-395. 10.1093/生物信息学/btf870。

    第条 中国科学院 公共医学 谷歌学者 

  15. 黑腹果蝇基因组序列5.1版。[http://flybase.bio.indiana.edu/static_pages/docs/release_notes.html]

  16. 冈比亚按蚊基因组组装。[http://www.ensembl.org/Anopheles_gambiae/index.html]

  17. Ota T、Suzuki Y、Nishikawa T、Otsuki T、Sugiyama T、Irie R、Wakamatsu A、Hayashi K、Sato H、Nagai K、Kimura K、Makita H、Sekine M、Obayashi M、Nishi T、Shibahara T、Tanaka T、Ishii S、Yamamoto J、Saito K、Kawai Y、Isono Y、Nakamura Y、Nagahari K、Murakami K、Yasuda T、Iwayanagi T、Wagatsuma M、Shiratori A、Sudo H、Hosoiri T、Kaku Y、Kodaira H,近藤H、杉原M、高桥M、神田K、横井T、福陆T、菊川E、大村Y、安倍KKamihara K、Katsuta N、佐藤K、田川M、山崎M、Ninomiya K、Ishibashi T、山下H、村川K、藤森K、田井H、Kimata M、渡边M、广冈S、千叶Y、石田S、小野Y、高口S、渡边S、Yosida M、Hotuta T、贵霜J、Kanehoho日K,高桥福井A、原H、Tanase T、野村Y、多哥S、高迈F、原R、武内K、有田M、Imose N、武藏K、铃木H、大岛A、佐佐木N、Aotsuka S、吉川Y、松下H、一原T、Shiohata N、Sano S、森雅S、Momiyama H、Satoh N、高美S、Terashima Y、铃木O、中川S、Senoh A、Mizoguchi H、Goto Y、Shimizu F、Wakebe H、,Hishigaki H、Watanabe T、Sugiyama A、Takemoto M、Kawakami B、Yamazaki M、Watanab K、Kumagai A、Itakura S、Fukuzumi Y、Fujimori Y、Komiyama M、Tashiro H、Tanigami A、Fujiwara T、Ono T、Yamada K、Fujii Y、Ozaki K、Hirao M、Ohmori Y、Kawabata A、Hikiji T、Kobatake N、Inagaki H、Ikema Y、Okamoto S、Okitani R、Kawaka M T、Noguki chi S、Itoh T、Shigeta K、,Senba T、Matsumura K、Nakajima Y、Mizuno T、Morinaga M、Sasaki M、Togashi T、Oyama M、Hata H、Watanabe M、Komatsu T、Mizushima-Sugano J、Satoh T、Shirai Y、Takahashi Y、Nakagawa K、Okumura K,Nagase T、Nomura N、Kikuchi H、Masuho Y、Yamashita R、Kakai K、Yada T、Nakamura Y、Ohara O、Isogai T、,Sugano S:21243条全长人类cDNA的完整测序和表征。自然遗传学。2004, 36: 40-45. 10.1038/ng1285。

    第条 公共医学 谷歌学者 

  18. Partigene注释管道。[http://www.nematodes.org/生物信息学/]

  19. Harcus YM、Parkinson J、Fernandez C、Daub J、Selkirk ME、Blaxter ML、Maizels RM:线虫表达序列标签的信号序列分析巴西尼波氏线虫以及寄生虫分泌蛋白的进化。基因组生物学。2004年,5:R39-10.1186/gb-2004-5-6-R39。

    第条 公共医学中心 公共医学 谷歌学者 

  20. Hughes J、Longhorn SJ、Papadopoulou A、Theodorides K、de Riva A、Mejia-Chang M、Foster PG、Vogler AP:密集分类EST采样及其在鞘翅目(甲虫)分子系统学中的应用。分子生物学进化。2005, 23 (2): 268-278. 10.1093/molbev/msj041。

    第条 公共医学 谷歌学者 

  21. Murrell A,Campbell NJ,Barker SC:硬蜱线粒体基因组(蜱亚纲:蜱总科:蜱亚科)中特异性标记的价值和保守tRNA序列的变化,用于系统发育推断。系统生物学。2003, 52 (3): 296-310.

    公共医学 谷歌学者 

  22. 彭杰、董伟、黄C-H:会议摘要#3实验生物学——推进生物医学前沿。2006, [http://www.eb2006-online.com/pdfs/007268.PDF?PHPSESSID=6bf6e0697d040eab4f884e8f284782e2]

    谷歌学者 

  23. Ono S:肌动蛋白解聚因子/辅酶丝和肌动蛋白相互作用蛋白1对肌动蛋白丝动力学的调节:扭曲丝的新叶片。生物化学。2003, 42 (46): 13363-13370. 10.1021/bi034600x。

    第条 中国科学院 公共医学 谷歌学者 

  24. Grembecka J、Cierpicki T、Devedjiev Y、Derevenda U、Kang BS、Bushweller JH、Derewenda ZS:合成酶PDZ串联与靶蛋白的结合。生物化学。2006, 45 (11): 3674-3683. 10.1021/bi052225年。

    第条 中国科学院 公共医学 谷歌学者 

  25. Dornan D、Shimizu H、Mah A、Dudhela T、Eby M、O'rourke K、Seshagiri S、Dixit VM:ATM参与DNA损伤后E3泛素连接酶COP1的自降解。科学。2006, 313 (5790): 1122-1126. 10.1126/科学.1127335。

    第条 中国科学院 公共医学 谷歌学者 

  26. Tunggal P,Smyth N,Paulsson M,Ott MC:层粘连蛋白:结构和遗传调控。显微镜研究技术2000,51(3):214-227。10.1002/1097-0029(20001101)51:3<214::AID-JEMT2>3.0.CO;2-J。

    第条 中国科学院 公共医学 谷歌学者 

  27. 肩胛硬蜱基因组序列。[http://www.entm.purdue.edu/igp/default.html]

  28. Wasmuth JD,Blaxter ML:prot4EST:从被忽视的基因组翻译表达序列标签。BMC生物信息学。2004年,5:187-10.1186/1471-21005-5-187。

    第条 公共医学中心 公共医学 谷歌学者 

  29. Smith TF、Gaitatzes C、Saxena K、Neer EJ:WD repeat:不同功能的通用架构。生物化学科学趋势。1999, 24 (5): 181-185. 10.1016/S0968-0004(99)01384-5。

    第条 中国科学院 公共医学 谷歌学者 

  30. Maris C,Dominguez C,Allain FH:RNA识别基序,调节转录后基因表达的塑料RNA-结合平台。2005年2月J日,272(9):2118-2131。10.1111/j.1742-4658.2005.04653.x。

    第条 中国科学院 公共医学 谷歌学者 

  31. Mans BJ,Louw AI,Neitz AW:蜱类噬血的进化:来自鸟兽属软蜱的凝血和血小板聚集抑制剂的共同来源。分子生物学进化。2002年,19(10):1695-1705。

    第条 中国科学院 公共医学 谷歌学者 

  32. Guerrero FD、Nene VM、George JE、Barker SC、Willadsen P:新目标基因组测序:微小牛蜱(蜱螨亚纲:蜱科)基因组项目。医学昆虫学杂志。2006, 43 (1): 9-16. 10.1603/0022-2585(2006)043[0009:SANTGT]2.0.CO;2

    第条 中国科学院 公共医学 谷歌学者 

  33. Quackenbush J、Cho J、Lee D、Liang F、Holt I、Karamycheva S、Parvizi B、Pertea G、Sultana R、White J:TIGR基因指数:高采样真核生物物种中基因转录序列的分析。《核酸研究》2001,29(1):159-164。10.1093/nar/29.1.159。

    第条 中国科学院 公共医学中心 公共医学 谷歌学者 

  34. Ashburner M、Ball CA、Blake JA、Botstein D、Butler H、Cherry JM、Davis AP、Dolinski K、Dwight SS、Eppig JT、Harris M、Hill DP、Issel-Tarver L、Kasarskis A、Lewis S、Matese JC、Richardson JE、Ringwald M、Rubin GM、Sherlock G:基因本体论:生物学统一的工具。基因本体联盟。自然遗传学。2000, 25 (1): 25-29. 10.1038/75556.

    第条 中国科学院 公共医学中心 公共医学 谷歌学者 

  35. Parkinson J、Anthony A、Wasmuth J、Schmid R、Hedley A、Blaxter M:PartiGene–构建部分基因组。生物信息学。2004, 20 (9): 1398-1404. 10.1093/bioinformatics/bth101。

    第条 中国科学院 公共医学 谷歌学者 

  36. Uniprot数据库。[http://www.pir.uniprot.org/database/download.shtml]

  37. SimiTri软件下载。[http://www.nemoodes.org/SimiTri网站/]

  38. 集成数据库。[http://www.ensembl.org/info/data/download.html]

  39. Dana Farber癌症研究所基因索引项目。[http://compbio.dfci.harvard.edu/tgi/tgipage.html]

  40. 国家生物技术信息中心。[网址:http://www.ncbi.nlm.nih.gov/]

  41. Thompson JD、Higgins DG、Gibson TJ:CLUSTAL W:通过序列加权、特定位置间隙惩罚和权重矩阵选择提高渐进式多序列比对的敏感性。《核酸研究》1994,22:4673-4680。10.1093/nar/22.22.4673。

    第条 中国科学院 公共医学中心 公共医学 谷歌学者 

  42. Felsenstein J:PHYLIP(系统发育推断包)版本3.67。由作者分发。[http://evolution.genetics.washington.edu/phylip.html]

  43. 页面RDM:TREEVIEW:在个人计算机上显示系统发育树的应用程序。计算机应用生物科学。1996, 12: 357-358.

    中国科学院 谷歌学者 

  44. Marchler-Bauer A、Anderson JB、DeWeese-Scott C、Fedorova ND、Geer LY、He S、Hurwitz DI、Jackson JD、Jacobs AR、Lanczycki CJ、Liebert CA、Liu C、Madej T、Marchler GH、Mazumder R、Nikolskaya AN、Panchenko AR、Rao BS、Showmaker BA、Simonyan V、Song JS、Thiessen PA、Vasudevan S、Wang Y、Yamashita RA、Yin JJ、,Bryant SH:CDD:保守领域比对的策划Entrez数据库。《核酸研究》2003,31(1):383-387。10.1093/nar/gkg087。

    第条 中国科学院 公共医学中心 公共医学 谷歌学者 

下载参考资料

致谢

M.W.得到了美国农业部CSREES拨款2005-35604-15440号的国家研究计划(给F.D.G.)的支持。作者非常感谢凯利·布雷顿博士和卡洛斯·苏亚雷斯博士以及本杂志指定的匿名审稿人提供的手稿审查和建议修订。本文仅报告研究结果。本出版物中提及商品名称或商业产品仅用于提供具体信息,并不意味着建议美国农业部予以认可。

作者信息

作者和附属机构

作者

通讯作者

与的通信费利克斯·D·格雷罗.

其他信息

竞争性利益

作者声明不存在相互竞争的利益。

作者的贡献

MW与SimiTri和BSR进行了比较基因组分析,实施了PartiGene管道分析并起草了手稿。GP和VMN参与了TIGR管道的生物信息分析。FG构思了这项研究,参与了其设计和协调,并帮助起草和修订了手稿。所有作者阅读并批准了最终手稿。

电子辅助材料

12864_2007_1081_MOESM1_ESM.pdf

附加文件1:TC14523的系统发育树。提供的数据显示了TC14523比对生成的整个树(PDF 399 KB)

12864_2007_1081_MOESM2_ESM.pdf

附加文件2:TC14523的Clustal W校准。此文件显示了用于生成TC14523系统发育树的比对(PDF 180 KB)

12864_2007_1081_MOESM3_ESM.pdf

附加文件3:TC9268的系统发育树。提供的数据显示了从TC9268对齐生成的整个树(PDF 146 KB)

12864_2007_1081_MOESM4_ESM.pdf

附加文件4:TC9268的Clustal W校准。此文件显示了用于生成TC9268系统发育树的比对(PDF 120 KB)

12864_2007_1081_MOESM5_ESM.pdf

附加文件5:TC13445的系统发育树。提供的数据显示了TC13445比对生成的整个树(PDF 362 KB)

12864_2007_1081_MOESM6_ESM.pdf

附加文件6:TC13445的Clustal W校准。此文件显示了用于生成TC13445系统发育树的比对(PDF 214 KB)

12864_2007_1081_MOESM7_ESM.pdf

附加文件7:TC12600的系统发育树。提供的数据显示了TC12600比对生成的整个树(PDF 157 KB)

12864_2007_1081_MOESM8_ESM.pdf

附加文件8:TC12600的Clustal W校准。此文件显示了用于生成TC12600系统发育树的比对(PDF 318 KB)

作者提交的原始图像文件

权利和权限

开放式访问本文经BioMed Central Ltd.许可发布。这是一篇开放存取文章,根据知识共享署名许可条款分发(https://creativecommons.org/licenses/by/2.0)它允许在任何介质中不受限制地使用、分发和复制原始作品,前提是正确引用了原始作品。

转载和许可

关于本文

引用这篇文章

Wang,M.,Guerrero,F.D.,Pertea,G。等。南方牛蜱EST的全球比较分析,微小裂头螺.BMC基因组学 8, 368 (2007). https://doi.org/10.1186/1471-2164-8-368

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/1471-2164-8-368

关键词