Mäkinen,韦利;瓦利马基,尼科;安提·拉克索宁;Riku Katainen 短读映射中向后回溯的统一视图。 (英语) Zbl 1284.92075号 Elomaa,Tapio(编辑)等人,《算法和应用》。在埃斯科·乌科宁60岁生日之际为他撰写的论文。柏林:施普林格出版社(ISBN 978-3-642-12475-4/pbk)。计算机科学课堂讲稿6060182-195(2010)。 摘要:在最近的高通量技术中,将短DNA读取映射到参考基因组是研究蛋白质-DNA相互作用(ChIP-seq)和选择性剪接(RNA-seq)等的核心任务。已经开发了几个用于该任务的工具(bowtie、bwa、SOAP2、TopHat),它们利用了Burrows-Wheeler变换及其反向回溯技术,将读取结果映射到基因组中的最佳近似值。这些工具针对较小的错误级别使用不同的定制机制来显著地修剪搜索阶段。我们提出了一种新的剪枝机制,它是迄今为止使用的裁剪机制的推广。它使用了一种新颖的想法,即使用压缩索引存储参考序列的固定长度子串的所有循环旋转,该索引能够利用创建的重复来平衡输入集的增长。对于RNA-seq,我们提出了一种新的方法,将动态规划与回溯相结合,以高效、正确地映射跨越两个外显子的所有读取。同样的机制也可以用于映射mate-pair读取。关于整个系列,请参见[Zbl 1187.68005号]. 引用于三文件 MSC公司: 92D20型 蛋白质序列,DNA序列 68第05页 数据结构 关键词:人基因组学;全文索引;压缩数据结构 PDF格式BibTeX公司 XML格式引用 \textit{V.Mäkinen}等人,Lect。注释计算。科学。6060、182--195(2010年;Zbl 1284.92075) 全文: 内政部