登录 以匿名身份登录/我的BiBiServ/注销
导航
PoSSuM搜索2
欢迎
下载
工具书类
作者:M.Beckstette,R.Homann

通过PSSM族模型的搜索空间缩减,HMM数据库搜索速度显著提高

将pssm描述为hmm。

动机

剖面隐马尔可夫模型(pHMM)是目前蛋白质家族最流行的建模概念。它们提供了敏感的家族描述符,使用pHMM搜索序列数据库已成为当今基因组注释管道中的标准任务。不利的一面是,使用pHMM进行搜索在计算上是昂贵的。

结果:

我们提出了一种新的方法,用于高效的蛋白质家族分类,并根据大规模分析场景的需要,使用pHMM加快数据库搜索。我们使用更简单的蛋白质家族模型,称为PSSM家族模型。对于快速数据库搜索,我们结合了全文索引、PSSM匹配分数的高效精确p值计算和快速片段链接。得到的方法非常适合预先过滤要搜索的序列集,以便使用pHMM进行后续数据库搜索。我们实现的分类性能仅略低于hmmsearch,但结果可以在运行时的一小部分中获得,加速比超过64倍。在实验中,该方法能够预先过滤序列空间,以便使用pHMM进行后续数据库搜索,我们的方法将使用hmmsearch搜索的序列数量减少到所有序列的0.80%。该过滤器速度非常快,与未过滤搜索相比,总加速比提高了43倍,同时保留了99.5%以上的原始结果。在UniProtKB-SwissProt上的hmmsearch无损过滤器设置中,我们观察到因子92的加速。

可利用性

非商业研究机构可以免费获得PoSSuM2软件包,包括PoSSuMsearch2程序。


请PoSSuMsearch2用户引用:
Beckstette、Michael和Homann、Robert和Giegerich、Robert and Kurtz、Stefan 通过PSSM族模型的搜索空间缩减,HMM数据库搜索速度显著提高,生物信息学,2009
建造于2015年3月4日(2:08aac7ff61f7)