跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010年10月15日;26(20):2534-40.
doi:10.1093/bioinformatics/btq485。 Epub 2010年8月24日。

GASST:全局对齐短序列搜索工具

附属公司

GASST:全局对齐短序列搜索工具

纪尧姆·里兹克等。 生物信息学. .

摘要

动机:能够产生大量序列数据的下一代测序技术的快速发展正导致广泛的新应用。这引发了对快速准确校准软件的需求。常用技术通常限制对准中的索引以提高速度,而更灵活的对准器对于大规模应用来说速度太慢。此外,随着生成的读取量越来越大,许多当前的对齐器变得效率低下。因此,我们的新校准器GASST(全球比对短序列搜索工具)的目标是实现2倍的高性能,对索引数量没有限制,其设计对长读取仍然有效。

结果:我们提出了一种新的高效过滤步骤,在使用代价高昂的动态规划算法进行检查之前,丢弃来自种子阶段的大多数对齐。我们使用一系列精心设计的过滤器,其复杂性和效率不断提高,以快速消除各种配置中的大多数候选对齐。主过滤器使用一个预计算表,其中包含相互对齐的四个短基本单词的对齐分数。该表被一种新算法多次重复使用,该算法旨在近似整个动态规划算法的得分。我们将GASST的性能与BWA、BFAST、SSAHA2和PASS进行了比较。我们发现,与其他最先进的对准器相比,GASST在广泛的配置中实现了高灵敏度,并且总体执行时间更快。

可利用性:GASSST是根据CeCILL软件许可证在以下位置发布的:http://www.irisa.fr/symbiose/projects/gassst/

联系人:guillaume.rizk@irisa.fr; dominique.lavenier@irisa.fr

补充信息:补充数据可在生物信息学在线获取。

PubMed免责声明

数字

图1。
图1。
计算半全局对齐(只有查询序列需要全局对齐),最大错误为1。(A类)动态编程。使用12 nt长序列和传统的动态规划算法,单元计算可以限制在一个频带内,但仍有34个单元需要计算。(B类)平铺算法。对于大小为4×4的预计算表分数,平铺算法只需三个步骤即可执行。第一步需要一个表访问,而第二步和第三步都需要三个表访问。这里,平铺算法给出的分数与完整的动态规划算法相同,在对齐中有两个错误。在一般情况下,平铺算法仅给出对齐中出现的错误数的下限。

类似文章

引用人

参考文献

    1. Burrows M,Wheeler D.技术报告124。加利福尼亚州帕洛阿尔托:数字设备公司;1994年,块分类无损数据压缩算法。
    1. Campagna D等人。PASS:对齐短序列的程序。生物信息学。2009;25:967.-公共医学
    1. Ferragina P,Manzini G.第41届计算机科学基础研讨会论文集(FOCS 2000),加利福尼亚州雷东多海滩,美国:2000。应用程序的机会主义数据结构;第390-398页。
    1. Homer,N.等人。Bfast:大规模基因组重新测序的比对工具。《公共科学图书馆·综合》。2009;4:e7767。-项目管理咨询公司-公共医学
    1. Jiang H,Wong W.SeqMap:将大量寡核苷酸映射到基因组中。生物信息学。2008;24:2395.-项目管理咨询公司-公共医学

出版物类型