跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010年3月1日;26(5):589-95.
doi:10.1093/bioinformatics/btp698。 Epub 2010年1月15日。

使用Burrows-Wheeler变换快速准确地进行长读取对齐

附属公司

使用Burrows-Wheeler变换快速准确地进行长读取对齐

Heng Li(李恒)等。 生物信息学. .

摘要

动机:在过去两年里,已经开发了许多将短测序读数与参考基因组对齐的程序。大多数算法对于短读非常有效,但对于大于200 bp的读来说效率很低或不适用,因为这些算法针对排序错误率低的短查询进行了大量专门调整。然而,一些测序平台已经产生了更长的读取时间,其他测序平台预计很快就会可用。对于较长时间的读取,基于散列的软件(如BLAT和SSAHA2)仍然是唯一的选择。尽管如此,就每单位时间对齐的碱基而言,这些方法要比短读校准器慢得多。

结果:我们设计并实现了一种新的算法,即Burrows-Wheeler Aligner的Smith-Waterman Alignment(BWA-SW)算法,该算法可以将长至1Mb的序列与具有数GB内存的大型序列数据库(例如人类基因组)对齐。该算法与SSAHA2一样精确,比BLAT更精确,并且比两者都快几到几十倍。

可利用性:http://bio-bwa.sourceforge.net

PubMed免责声明

数字

图1。
图1。
字符串的前缀trie和前缀DAWGGOOGOL公司’. (A类)前缀trie。符号“∧”表示字符串的开始。节点中的两个数字表示节点的SA间隔。(B类)通过折叠具有相同SA间隔的节点构建的前缀DAWG。例如,在前缀trie中,三个节点具有SA间隔[4,4]。他们的父母分别有间隔[1,2],[1,2]和[1,1]。在前缀DAWG中,[4,4]节点因此具有父节点[1,2]和[1,1]。节点[4,4]表示三个字符串OG公司’, ‘OGO公司'和'OGOL公司'前两个字符串是'的前缀OGOL公司’. (A) 修改自Li和Durbin(2009)的图1。

类似文章

引用人

  • 多区域非小细胞肺癌患者衍生异种移植模型中基因组瘤内异质性的表现。
    Hynds RE、Huebner A、Pearce DR、Hill MS、Akarca AU、Moore DA、Ward S、Gowers KHC、Karasaki T、Al Bakir M、Wilson GA、Pich O、Martínez-Ruiz C、Hossain ASMM、Pearse SP、Sivakumar M、Ben Aissa A、Grönroos E、Chandrasekharan D、Kollui KK、Towns R、Wang K、Cook DE、Bosshard-Carter L、Naceur-Lombardelli C、Rowan AJ、Veerih S、Litchfield K、,Crosbie PAJ、Dive C、Quezada SA、Janes SM、Jamal-Hanjani M、Marafioti T;TRACERx财团;McGranahan N,Swanton C。 Hynds RE等人。 国家公社。2024年5月31日;15(1):4653. doi:10.1038/s41467-024-47547-3。 国家公社。2024 PMID:38821942 免费PMC文章。
  • 寄生虫之旅:一种RNA病毒隐藏在弓形虫.
    Gupta P、Hiller A、Chowdhury J、Lim D、Lim DY、Saeij JPJ、Babaian A、Rodriguez F、Pereira L、Morales-Tapia A。 Gupta P等人。 病毒进化。2024年5月11日;10(1):牛肉040。doi:10.1093/ve/veae040。eCollection 2024年。 病毒进化。2024 PMID:38817668 免费PMC文章。
  • 在水稻FRIZLE PANICLE(FZP)缺陷遗传背景下控制小穗退化的基因组区域的鉴定。
    Wang SS、Tsai PH、Cheng SF、Chen RK、Chen KY。 Wang SS等人。 科学报告2024年5月30日;14(1):12451. doi:10.1038/s41598-024-63362-8。 科学代表2024。 PMID:38816469 免费PMC文章。
  • 北美马蹄苋(Chenopodium berlandieri)是一种改良安第斯藜(C.quinoa)的遗传资源。
    Maughan PJ、Jarvis DE、DE la Cruz-Torres E、Jaggi KE、Warner HC、Marcheschi AK、Bertero HD、Gomez-Pando L、Fuentes F、Mayta-Anco ME、Curti R、Rey E、Tester M、Jellen EN。 Maughan PJ等人。 科学报告2024年5月29日;14(1):12345. doi:10.1038/s41598-024-63106-8。 科学代表2024。 PMID:38811833 免费PMC文章。
  • 单体型解析的无间隙基因组和染色体片段代换系有助于野生稻的基因鉴定。
    黄J、张Y、李Y、邢M、雷C、王S、聂Y、王Y、赵M、韩Z、孙X、周H、王Y,郑X、肖X、樊W、刘Z、郭W、张L、程Y、钱Q、何H、杨Q、乔W。 黄杰等。 国家公社。2024年5月29日;15(1):4573. doi:10.1038/s41467-024-48845-6。 国家公社。2024 PMID:38811581 免费PMC文章。

工具书类

    1. Altschul SF等人。缺口BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。核酸研究1997;25:3389–3402.-项目管理咨询公司-公共医学
    1. Blumer A等人。最小的自动识别文本子单词的机器。西奥。计算。科学。1985;40:31–55.
    1. Burrows M,Wheeler DJ。技术报告124。加利福尼亚州帕洛阿尔托:数字设备公司;1994年,块分类无损数据压缩算法。
    1. Eid J等。单聚合酶分子的实时DNA测序。科学。2009;323:133–138.-公共医学
    1. Ferragina P,Manzini G.第41届计算机科学基础研讨会论文集(FOCS 2000),加利福尼亚州雷东多海滩,美国:2000。应用程序的机会主义数据结构;第390-398页。

出版物类型