×

具有有限数量间隙的全局和局部序列对齐。 (英语) Zbl 1325.68306号

作者提出了一种最多具有给定数量间隔的成对全局序列比对算法。他们的算法计算传统二维动态规划矩阵的三维变量,用于全局序列比对。这需要\(Theta(mk\ell)\)时间和\(Theta(mk)\)空格,其中\(m\)是较短序列的长度,\(k\)是允许的最大编辑距离,\(ell\)是对齐中允许的最大间距数。作者还提出了一种至多具有给定数量间隙的成对局部序列比对的类似算法。(这篇摘要略带转述了文章结论的第一段。)

MSC公司:

68瓦32 字符串上的算法
92D20型 蛋白质序列,DNA序列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Levenstein,V.I.,能够纠正删除、插入和反转的二进制代码(1966年),技术报告8,苏联物理学Doklady·Zbl 0149.15905号
[2] Sellers,P.H.,《进化距离的理论和计算》,SIAM J.Appl。数学。,第26787-793页(1974年)·Zbl 0291.92013号
[3] 瓦格纳,R.A。;Fischer,M.J.,串对串校正问题,J.ACM,21,168-173(1974)·Zbl 0278.68032号
[4] Gotoh,O.,一种改进的生物序列匹配算法,J.Mol.Biol。,162, 705-708 (1982)
[5] Gusfield,D.,《字符串、树和序列的算法:计算机科学和计算生物学》(1997),剑桥大学出版社:美国剑桥大学出版社·Zbl 0934.68103号
[9] Langmead,B。;特拉内尔,C。;波普,M。;Salzberg,S.L.,《短DNA序列与人类基因组的超快和记忆效率比对》,《基因组生物学》。,10,R25+(2009)
[10] Li,R。;Yu,C。;李毅。;Lam,T.-W。;Yiu,S.-M。;K.克里斯蒂安森。;Wang,J.,SOAP2:一种改进的超快短阅读对齐工具,生物信息学,1966-1967年,25(2009)
[11] Frousios,K。;伊利奥普洛斯,C.S。;Mouchard,L。;Pissis,S.P。;Tischler,G.,REAL:下一代测序的有效REad ALigner读取,(Zhang,A.;Borodovsky,M.;Øzsoyoglu,G.;Mikler,A。R.,《第一届ACM生物信息学和计算生物学国际会议论文集》。第一届ACM生物信息学和计算生物学国际会议论文集,BCB 2011(2010),ACM:ACM USA),154-159
[12] 李,H。;Durbin,R.,《使用Burrows-Wheeler变换进行快速准确的短读校准》,生物信息学,251754-1760(2009)
[13] 刘春明。;Wong,T。;吴,E。;罗,R。;Yiu,S.-M。;李毅。;王,B。;Yu,C。;朱,X。;Zhao,K。;Li,R。;Lam,T.-W.,SOAP3:基于超快GPU的并行比对工具,用于短读,生物信息学,28,6,878-879(2012)
[14] Langmead,B。;Salzberg,S.L.,《Bowtie 2的快速间隙-读数校准》,《自然方法》,4357-359(2013)
[15] Altschul,S.F。;Gish,W。;Miller,W。;Myers,E.W。;Lipman,D.J.,基本局部比对搜索工具,分子生物学杂志。,215, 403-410 (1990)
[16] Needleman,S.B。;Wunsch,C.D.,适用于寻找两种蛋白质氨基酸序列相似性的通用方法,J.Mol.Biol。,48, 443-453 (1970)
[17] Waterman,M.S。;Smith,T.F.,常见分子亚序列的鉴定,分子生物学杂志。,147, 195-197 (1981)
[18] Ng,S.B。;特纳,E.H。;罗伯逊,P.D。;弗利加尔,S.D。;Bigham,A.W。;Lee,C。;Shaffer,T。;Wong,M。;巴塔查吉,A。;Eichler,E.E。;Bamshad,M。;Nickerson,D.A。;Shendure,J.,《12个人类外显子的靶向捕获和大规模平行测序》,《自然》,461272-276(2009)
[19] Ostergaard,P。;医学硕士Simpson。;Brice,G。;Mansour,S。;康奈尔,F.C。;Onoufriadis,A。;Child,A.H。;黄,J。;Kalidas,K。;莫蒂默,P.S。;特伦巴斯,R。;Jeffery,S.,使用全外显子组测序结合连锁分析和表型描述快速鉴定原发性淋巴水肿中GJC2突变,医学遗传学杂志。,48, 251-255 (2010)
[20] 医学硕士Simpson。;医学博士欧文。;阿西尔马兹,E。;格雷,M.J。;Dafou,D。;Elmslie,F.V。;曼苏尔,S。;霍尔德,S.E。;大脑,C.E。;伯顿,B.K。;Kim,K.H。;Pauli,R.M。;阿夫蒂莫斯,S。;Stewart,H。;Kim,C.A。;Holder-Espinasse,M。;Robertson,S.P。;Drake,W.M。;Trembath,R.C.,NOTCH2突变导致Hajdu-Cheney综合征,这是一种严重且进行性骨质流失的疾病,《国家遗传学》。,43, 303-305 (2011)
[21] Flouri,T。;伊利奥普洛斯,C.S。;帕克,K。;Pissis,S.P.,GapMis-OMP:多核架构上的成对短读对齐,(Iliadis,L.S.;Maglogiannis,I.;Papadopoulos,H.;Karatzas,K.;Sioutas,S.,AIAI(2)。AIAI(2),IFIP信息和通信技术进展,第382卷(2012),施普林格),593-601
[22] 阿拉希奥提斯,北卡罗来纳州。;Berger,S。;Flouri,T。;Pissis,S.P。;Stamatakis,A.,libgapmis:扩展短读比对,BMC生物信息学,14,S4(2013)
[23] Flouri,T。;Frousios,K。;伊利奥普洛斯,C.S。;帕克,K。;Pissis,S.P。;Tischler,G.,《使用单个缺口进行序列比对的近似字符串匹配》,(第二届ACM生物信息学和计算生物学国际会议论文集。第二届美国医学会生物信息学与计算生物学国际大会论文集,BCB 2011(2011),ACM:ACM USA),490-492
[24] 阿拉希奥提斯,北卡罗来纳州。;Berger,S。;Flouri,T。;Pissis,S.P。;Stamatakis,A.,libgapmis:一个用于短读单间隙校准的超快库,(《生物信息学和生物医学研讨会国际会议论文集》,生物信息学与生物医学研讨会,BIBMW 2012(2012),688-695
[25] Flouri,T。;Frousios,K。;伊利奥普洛斯,C.S。;帕克,K。;Pissis,S.P。;Tischler,G.,GapMis:一种利用单个缺口进行成对序列比对的工具,《最新专利DNA基因序列》。,7, 84-95 (2013)
[26] 巴顿,C。;Flouri,T。;伊利奥普洛斯,C.S。;Pissis,S.P.,GapsMis:具有有限数量缺口的灵活序列比对,(《生物信息学、计算生物学和生物医学信息学国际会议论文集》,生物信息学,计算生物学和生物医学信息学会议论文集,BCB’13(2013),ACM:ACM纽约,NY,美国),402:402-402:411
[27] 克罗西莫尔,M。;Hancart,C。;Lecroq,T.,《字符串算法》(2007),剑桥大学出版社:美国剑桥大学出版社·Zbl 1137.68060号
[28] 国家生物技术信息中心(NCBI)(2014)
[29] 国家生物技术信息中心(NCBI)(2014)
[30] 水稻,P。;I·朗登。;Bleasby,A.,EMBOS:欧洲分子生物学开放软件套件,Trends Genet。,16, 276-277 (2000)
[31] 国家生物技术信息中心(NCBI)(2014)
[32] 米诺什,A.E。;Dom,J.C。;Himmelbauer,H.,《Illumina HiSeq和基因组分析仪系统生成的基因组高通量测序数据评估》,基因组生物学。,2012年1月12日(2011年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。