×

拼接TAPyR–一种有效的转录组比对方法。 (英语) Zbl 1415.92140号

概述:RNA-Seq是一种下一代测序(NGS)协议,用于对细胞中信使RNA进行测序,并在一次运行中生成数百万个短序列片段。这些读数可用于测量基因表达水平和识别新的基因剪接变体。RNA-Seq实验的关键步骤之一是将NGS读数映射到参考基因组。因为RNA-Seq读取可以跨越基因组中的多个外显子,所以这项任务具有挑战性。在过去的十年里,出现了用于RNA-Seq比对的工具,但大多数都分为两个阶段。首先,管道只映射引用中有直接匹配的读取,其余的被保留为初始未映射的读取。然后,他们使用基于启发式的方法、聚类甚至注释来决定在哪里对齐后者。这项工作为转录组比对问题提供了一个有效的计算解决方案,命名为SpliceTAPyR。它识别剪接连接的信号,并依靠压缩全文索引方法和简洁的数据结构在单个阶段有效地对齐RNA-Seq读取。通过这种方式,它可以实现与其他工具相同或更好的准确性,同时对最具竞争力的工具使用的内存和时间也少得多。

MSC公司:

92D20型 蛋白质序列,DNA序列
68瓦32 字符串上的算法
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Adams,M.等人,《互补DNA测序:表达序列标签和人类基因组计划》,《科学》252(5013)(1991)1651-1656。
[2] Baruzzo,G.等人,《基于模拟的RNA-seq对准器综合基准测试》,《自然方法》(2016)。
[3] Bentley,D.R.等人,《使用可逆终止剂化学进行准确的全人类基因组测序》,《自然》456(7218)(2008)53-59。
[4] Brown,P.O.和Botstein,D.,《用DNA微阵列探索基因组的新世界》,《自然遗传学》21(1999)33-37。
[5] M.Burrows和D.Wheeler,块排序无损数据压缩算法,数字SRC研究报告,Citeseer(1994)。
[6] Burset,M.、Seledtsov,I.和Solovyev,V.,《哺乳动物基因组中典型和非典型剪接位点的分析》,《核酸研究》28(21)(2000)4364-4375。
[7] Dobin,A.等人,《Star:超快速通用RNA-seq对准器》,《生物信息学》29(1)(2013)15-21。
[8] Engström,P.G.等人,《RNA-seq数据拼接比对程序的系统评估》,《自然方法》10(12)(2013)1185-1191。
[9] Fernandes,F.等人,用于重新测序应用的焦磷酸测序读数的有效比对,BMC生物信息12(1)(2011),第163页。
[10] Ferragina,P.和Manzini,G.,机会主义数据结构及其应用,计算机科学基础,2000年。诉讼程序。第41届年会,IEEE(2000),第390-398页。
[11] Ferragina,P.等人,序列和全文索引的压缩表示,ACM算法事务(TALG)3(2)(2007),第20页·Zbl 1321.68263号
[12] Fonseca,N.A.等人,《高通量测序数据映射工具》,生物信息学(2012),p.bts605。
[13] Langmead,B.等人,《短DNA序列与人类基因组的超快和记忆效率比对》,《基因组生物学》10(3)(2009年),第R25页。
[14] Li,H.和Durbin,R.,使用Burrows-Wheeler变换进行快速准确的短读对齐,生物信息学25(14)(2009)1754-1760。
[15] Manber,U.和Myers,G.,《后缀数组:在线字符串搜索的新方法》,《暹罗计算杂志》22(5)(1993)935-948·Zbl 0784.68027号
[16] Margulies,M.等人,《微细加工高密度微石反应器中的基因组测序》,《自然》437(7057)(2005)376-380。
[17] Needleman,S.B.和Wunsch,C.D.,《适用于搜索两种蛋白质氨基酸序列相似性的通用方法》,《分子生物学杂志》48(3)(1970)443-453。
[18] Rothberg,J.M.等人,《实现非光学基因组测序的集成半导体设备》,Nature475(7356)(2011)348-352。
[19] Sanger,F.、Nicklen,S.和Coulson,A.,用链终止抑制剂进行DNA测序,74(12)(1977)5463-5467。
[20] Trapnell,C.、Pachter,L.和Salzberg,S.L.,《Tophat:发现RNA-seq的剪接连接》,《生物信息学》25(9)(2009)1105-1111。
[21] Wang,K.et al.,Mapsplice:RNA-seq读数的精确映射,用于剪接连接发现,核酸研究(2010年),第gkq622页。
[22] Wang,Z.、Gerstein,M.和Snyder,M.,RNA-seq:转录组学的革命性工具,《自然评论遗传学》10(1)(2009)57-63。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。