跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2009年8月15日;25(16):2078-9.
doi:10.1093/bioinformatics/btp352。 Epub 2009年6月8日。

序列对齐/映射格式和SAMtools

附属公司

序列对齐/映射格式和SAMtools

Heng Li(李恒)等人。 生物信息学. .

摘要

总结:序列比对/映射(SAM)格式是一种通用比对格式,用于存储与参考序列的读取比对,支持不同测序平台产生的短读和长读(高达128 Mbp)。它风格灵活,尺寸紧凑,随机存取效率高,是1000基因组计划中的比对发布格式。SAMtools以SAM格式实现各种用于后处理对齐的实用程序,例如索引、变量调用程序和对齐查看器,从而提供处理读取对齐的通用工具。

可利用性:http://samtools.sourceforge.net。

PubMed免责声明

数字

图1。
图1。
扩展CIGAR和堆积输出的示例。()一对读数和三个单端读数的对齐。(b条)相应的SAM文件。@SQ公司'标题部分的行给出了引用序列的顺序。尤其是,r001型是读取对的名称。根据旗帜163(=1+2+32+128),映射到位置7的读取是对(128)中的第二个读取,并被视为正确配对(1+2);它的配对被映射到反向链(32)上的37。阅读r002号有三个柔软的(未对齐的)底座。SAM中显示的坐标是第一个对齐底座的位置。此对齐的CIGAR字符串包含P(P)(填充)正确对齐插入序列的操作。如果对齐器不支持多序列对齐,则可能缺少填充操作。阅读的最后六个基础第003期映射到位置9,前五个映射到反向链上的位置29。硬剪裁操作H(H)指示序列字段中不存在剪裁的序列。这个NM公司标签给出了不匹配的数量。阅读r004跨插入子对齐,由N个操作。(c(c))SAMtools简化的堆积输出。每行由参考名称、排序坐标、参考基数、覆盖位置的读取次数和读取基数组成。在第五个字段中,点或逗号表示与参考相同的基础;点或大写字母表示前向链上映射的read的基数,而反向链上的逗号或小写字母。

类似文章

  • bio-samtools2:Ruby中使用samtools分析和可视化序列和比对数据的包。
    Etherington GJ、Ramirez-Gonzalez RH、MacLean D。 Etherington GJ等人。 生物信息学。2015年8月1日;31(15):2565-7. doi:10.1093/bioinformatics/btv178。Epub 2015年3月29日。 生物信息学。2015 PMID:25819670
  • 使用Burrows-Wheeler变换快速准确地进行短读对齐。
    Li H,Durbin R。 李浩等。 生物信息学。2009年7月15日;25(14):1754-60. doi:10.1093/bioinformatics/btp324。Epub 2009年5月18日。 生物信息学。2009 PMID:19451168 免费PMC文章。
  • 根据多个基因组同时进行短读比对。
    Schneeberger K、Hagmann J、Ossowski S、Warthmann N、Gesing S、Kohlbacher O、Weigel D。 Schneeberger K等人。 基因组生物学。2009;10(9):R98。doi:10.1186/gb-2009-10-9-r98。Epub 2009年9月17日。 基因组生物学。2009 PMID:19761611 免费PMC文章。
  • 下一代测序序列比对算法综述。
    李浩,荷马·N。 李浩等。 简要生物信息。2010年9月;11(5):473-83. doi:10.1093/bib/bbq015。Epub 2010年5月11日。 简要生物信息。2010 PMID:20460430 免费PMC文章。 审查。
  • 基因组多序列比对的计算和分析。
    布兰切特·M·。 布兰切特·M·。 《基因组学与人类遗传学年鉴》。2007;8:193-213. doi:10.1146/annurev.genom.8080706.092300。 《基因组学与人类遗传学年鉴》。2007 PMID:17489682 审查。

引用人

工具书类

    1. Kent WJ等人。加州大学旧金山分校的人类基因组浏览器。基因组研究2002;12:996–1006.-项目管理咨询公司-公共医学
    1. Langmead B等人。短DNA序列与人类基因组的超快和记忆效率比对。基因组生物学。2009;10:R25。-项目管理咨询公司-公共医学
    1. Li H等。使用映射质量分数映射短DNA测序读取和调用变体。基因组研究2008;18:1851–1858.-项目管理咨询公司-公共医学
    1. Mardis ER。下一代DNA测序方法。每年。基因组学评论。2008;9:387–402.-公共医学

出版物类型