×

部分本地多路路线。 (英语) 兹比尔1403.68377

摘要:多序列比对是生物信息学和计算生物学中的一个重要工具,用于表示一组DNA、RNA或蛋白质序列之间的相互进化关系和相似性。最近,他们还对其他应用领域,特别是比较语言学领域,产生了相当大的兴趣。多序列比对可以看作是将字符串对字符串编辑问题推广到两个以上的字符串。随着计算设备功率的增加,精确的动态规划解决方案在实践中也变得可行,适用于三向和四向定线。对于两两(双向)情况,局部对齐和全局对齐之间存在明显区别。由于考虑了更多的序列,这种区分实际上可以独立于每个序列的两端,因此会产生一组丰富的局部对齐问题。到目前为止,这些基本上还没有被探索。在这里,我们介绍了一个通用的形式化框架,该框架提出了部分局部对齐问题的分类。这就产生了一个通用方案,用于指导特定局部对齐问题的精确动态规划解决方案的原则设计。

MSC公司:

68瓦32 字符串上的算法
第68季度第42季度 语法和重写系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abboud,A.、Backurs,A.、Williams,V.V.:LCS和其他序列相似性度量的紧密硬度结果。摘自:第56届计算机科学基础年会(FOCS),第59-78页。IEEE(2015)
[2] Abboud,A.,Hansen,T.D.,Williams,V.V.,William,R.:用编辑距离和朋友模拟分支程序:或者:polylog shaved是一个下限。摘自:美国计算机学会第四十八届年度计算理论研讨会论文集(STOC’16),纽约州纽约市,第375-388页(2016)·Zbl 1373.68233号
[3] Al Ait,L;Yamak,Z;Morgenstern,B;Morgenstern,B,DIALIGN在GOBICS-利用各种外部信息来源进行多重序列比对,《核酸研究》,41,w3-w7,(2013)·doi:10.1093/nar/gkt283
[4] 阿拉伯,M;伯恩特,M;锡德德森,CH;Tout,K,部分局部三元比对和线粒体基因组重排的序列特征,Alg。分子生物学。,12, 22, (2017) ·doi:10.1186/s13015-017-0113-0
[5] Altschul,SF,《多序列比对的缺口成本》,J.Theor。生物学,138297-309,(1989)·doi:10.1016/S0022-5193(89)80196-1
[6] 阿尔特舒尔,旧金山;吉什,W;米勒,W;迈尔斯,EW;Lipman,DJ,基本局部对齐搜索工具,J.Mol.Biol。,215, 403-410, (1990) ·doi:10.1016/S0022-2836(05)80360-2
[7] Angermüller,C;比格特,A;Söding,J,上下文特定氨基酸替代概率的判别模型,生物信息学,28,3240-3247,(2012)·doi:10.1093/bioinformatics/bts622
[8] 阿尔拉扎罗夫,V;Dinic,E;克伦罗德,M;Faradzev,I,关于有向图传递闭包的经济构造,Dokl。阿卡德。恶心。,11, 1209-1210, (1970) ·Zbl 0214.23601号
[9] Baichoo,S;Ouzounis,CA,序列比较、短读组装和基因组比对算法的计算复杂性,生物系统,156,72-85,(2017)·doi:10.1016/j.biosystems.2017.03.003
[10] TL贝利;威廉姆斯,N;Misleh,C;Wilfred,WL,MEME:发现和分析DNA和蛋白质序列基序,核酸研究,34,w369-w373,(2006)·doi:10.1093/nar/gkl198
[11] 巴塔查里亚,T.,雷茨拉夫,N.,布拉西,D.,克罗夫特,W.,Cysouw,M.,Hruschka,D.,Maddison,I.,Müller,L.,Smith,E.,Stadler,P.F.,Starostin,G.,Youn,H.:研究大数据时代的语言进化。J.语言演变。(2018)
[12] 布兰切特,M,基因组多序列比对的计算和分析,年。基因组学评论。,8, 193-213, (2007) ·doi:10.1146/annurev.genom.8080706.092300
[13] 布兰切特,M;Tompa,M,Footprinter:一个为系统发育足迹设计的程序,核酸研究,313840-3842,(2003)·doi:10.1093/nar/gkg606剂量单位
[14] 布兰切特,M;Schwikowski,B;Tompa,M,进化足迹算法,J.Compute。《生物学》,9,211-223,(2002)·doi:10.1089/10665270252935421
[15] 博尼佐尼,P;Della Vedova,G,《SP-核多序列比对的复杂性》,Theor。计算。科学。,259,63-79,(2001年)·Zbl 0972.68092号 ·doi:10.1016/S0304-3975(99)00324-2
[16] 布鲁德诺,M;查普曼,M;哥特根斯,B;巴佐格鲁,S;Morgenstern,B,大基因组序列的快速灵敏多重比对,BMC Bioninform。,4, 66, (2003) ·doi:10.1186/1471-2105-4-66
[17] 巴克尔,P;霍夫曼,K;States,DJ(编辑);阿加瓦尔,P(编辑);Gaasterland,T(编辑);Hunter,L(编辑);Smith,RF(编辑),基于对齐评分系统概率解释的序列相似性搜索算法,44-50,(1996),加利福尼亚州门洛帕克
[18] 布索蒂,G;雷内里,E;Erb,I;Zytnicki,M;威尔姆,A;Beaudoi,E;巴克尔,P;Notredame,C,Blastr-快速准确数据库搜索非编码rna,核酸研究,39,6886-6895,(2011)·doi:10.1093/nar/gkr335
[19] 卡里略,H;Lipman,D,《生物学中的多序列比对问题》,SIAM J.Appl。数学。,48, 1073-1082, (1988) ·Zbl 0652.92001号 ·doi:10.137/0148063
[20] 乔杜里亚,B;Garaib,G,从遗传算法的角度对多序列比对进行综述,基因组学,109,419-431,(2017)·doi:10.1016/j.ygeno.2017.06.007
[21] 科林里奇,PW;Kelly,S,Mergealign:通过动态重建一致性多序列比对来提高多序列比对性能,BMC Bioninform。,13, 117, (2012) ·doi:10.1186/1471-2105-13-117
[22] 科里尔,E;Pitschi,F;Morgenstern,B,多序列比对一致性问题的MIN-cut算法,生物信息学,261015-1021,(2010)·doi:10.1093/bioinformatics/btq082
[23] Cysouw,M.,Jung,H.:使用实际拼写进行同源识别和对齐。摘自:ACL计算形态学和音韵学特别兴趣小组第九次会议记录,第109-116页。计算语言学协会(2007)
[24] 杜威,TG,具有任意间隙惩罚函数的序列比对算法,J.Compute。生物学,8177-190,(2001)·doi:10.1089/106652701300312931
[25] 道尔,RD;Eddy,SR,RNA二级结构预测的几种轻量级随机上下文无关文法评估,BMC生物信息。,5, 71, (2004) ·doi:10.1186/1471-2105-5-71
[26] Eddy,SR,简化统计显著性估计的局部序列比对概率模型,PLoS Compute。生物,4,e1000069,(2008)·doi:10.1371/journal.pcbi.1000069
[27] Elias,I,《解决多重对齐的棘手问题》,J.Compute。生物学,13,1323-1339,(2006)·doi:10.1089/cmb.2006.13.1323
[28] 丰塞卡,北美;Rung,J;巴西,A;Marioni,JC,《高通量测序数据映射工具》,生物信息学,283169-3177,(2012)·doi:10.1093/bioinformatics/bts605
[29] Giegerich,R;Giancarlo,R(编辑);Sankoff,D(ed.),《解释和控制动态规划中的模糊性》,第1848、46-59(2002)号,柏林·Zbl 0964.90050号 ·doi:10.1007/3-540-45123-46
[30] Giegerich,R;迈耶,C;Steffen,P,《序列数据动态编程的一门学科》,科学。计算。掠夺。,51, 215-263, (2004) ·Zbl 1067.90157号 ·doi:10.1016/j.scico.2003.12.005
[31] Gotoh,O,一种改进的生物序列匹配算法,J.Mol.Biol。,162, 705708, (1982) ·doi:10.1016/0022-2836(82)90398-9
[32] Gotoh,O,用有效回溯程序对三个生物序列进行比对,J.Theor。生物学,121,327-337,(1986)·doi:10.1016/S0022-5193(86)80112-6
[33] 斯洛伐克古普塔;Kececioglu,JD;Schäffer,AA,《提高最短路径方法的实际空间和时间效率,以实现一对多序列的和对多序列比对》,J.Compute。生物学,2459-472,(1995)·doi:10.1089/cmb.1995.2.459
[34] 赫特尔,J;Jong,D;M·马兹(Marz,M);玫瑰,D;塔弗,H;Tanzer,A;Schierwater,B;Stadler,PF,附着毛霉菌基因组的非编码RNA注释,核酸研究,371602-1615,(2009)·doi:10.1093/nar/gkn1084
[35] Hirosawa,M;Totoki,Y;Hoshida,M;石川,M,多序列比对迭代算法的综合研究,计算。申请。生物科学。,11, 13-18, (1995)
[36] 霍夫曼,S;奥托,C;杜塞,G;Tanzer,A;兰根伯格,D;基督,S;Kunz,M;霍尔特,LM;Teupser,D;Hackermüller,J;Stadler,PF,《用于环状RNA、剪接、转剪接和融合检测的多裂映射算法》,《基因组生物学》。,2015年第34期(2014年)·doi:10.1186/gb-2014-15-2-r34
[37] Hogeweg,P;Hesper,B,序列集的对齐和种类树的构建:一种综合方法,J.Mol.Evol。,20, 175-186, (1984) ·doi:10.1007/BF022557378
[38] James Kent,W,BLAT-类BLAST比对工具,《基因组研究》,第12期,第656-664页,(2002年)·doi:10.1101/gr.229202
[39] Jones,N.C.,Pevzner,P.A.:生物信息学导论。麻省理工学院出版社,坎布里德(2004)。问题6.22·Zbl 1166.92300号
[40] Just,W,用SP-score进行多序列比对的计算复杂性,J.Compute。《生物学》,8615-623,(2001)·doi:10.1089/106652701753307511
[41] 加藤,K;Standley,DM,MAFFT:迭代求精和附加方法,《分子生物学方法》。,1079, 131-146, (2014) ·doi:10.1007/978-1-62703-646-78
[42] Kececioglu,J.D.:多序列比对中的最大权重跟踪问题。摘自:第四届组合模式匹配研讨会论文集,计算机科学讲稿第684卷,第106-119页。柏林施普林格(1993)
[43] Kececioglu,J.,Starrett,D.:精确对齐对齐。摘自:Bourne,P.E.,Gusfield,D.(编辑)《第八届ACM计算分子生物学研究会议论文集》,第85-96页。ACM,纽约州纽约市(2004年)
[44] Kececioglu,JD;伦霍夫,惠普;梅尔霍恩,K;Mutzel,P;雷内特,K;Vingron,M,序列比对问题的多面体方法,离散应用。数学。,104, 143-186, (2000) ·Zbl 0998.92017号 ·doi:10.1016/S0166-218X(00)00194-3
[45] 科纳古图,AS;威斯托克,J;Stuckey,PJ,《使用序列三联体优化和三残留交换成本的渐进多重比对》,J.Bioninform。计算。生物学,2719-745,(2004)·doi:10.1142/S0219720004000831
[46] Kondrak,G.:一种新的语音序列对齐算法。收录于:NAACL 2000第1次会议记录,计算语言学协会北美分会,第288-295页。Morgan Kaufmann Publishers,加利福尼亚州旧金山(2000)
[47] Kondrak,G,语音对齐和相似性,计算。人类。,37, 273-291, (2003) ·doi:10.1023/A:1025071200644
[48] 克鲁斯佩,M;Stadler,PF,来自三胞胎的渐进多序列比对,BMC Bioninform。,8, 254, (2007) ·doi:10.1186/1471-2105-8-254
[49] 列表,J-M;SJ Greenhill;Gray,RD,《历史语言学自动比较单词的潜力》,《公共科学图书馆·综合》,12,e0170046,(2017)·doi:10.1371/journal.pone.0170046
[50] 卢卡申,AV;罗莎,JJ,使用死端消除的局部多序列比对,生物信息学,15,947-953,(1999)·doi:10.1093/bioinformatics/15.11.947
[51] Manthey,B,加权多重序列比对的非逼近性,Theor。计算。科学。,296, 179-192, (2003) ·Zbl 1044.68160号 ·doi:10.1016/S0304-3975(02)00439-5
[52] Margulies,EH公司;布兰切特,M;Haussler,D;Green,ED,多物种保守序列的鉴定和表征,基因组研究,13,2507-2518,(2003)·数字对象标识代码:10.1101/gr.1602203
[53] 梅耶,A;Söding,J,Context similarity scoring improved protein sequence alignments in the middle zone,生物信息学,31674-681,(2015)·doi:10.1093/bioinformatics/btu697
[54] Miyazawa,S,基于残基对应概率的可靠序列比对方法,蛋白质工程,8999-1009,(1994)·doi:10.1093/蛋白质/8.10.999
[55] Morgenstern,B;法国,K;连衣裙,A;Werner,T,DIALIGN:通过多重序列比对发现局部相似性,生物信息学,14,290-294,(1998)·doi:10.1093/bioinformatics/14.3.290
[56] Morgenstern,B.,Stoye,J.,Dress,A.W.M.:一致等价关系:多序列比对的集合理论框架。技术报告,比勒费尔德大学,FSPM(1999)
[57] 密克斯坦,U;伊利诺伊州霍法克;Stadler,PF,随机配对比对,生物信息学,60,s153-s118,(2002)
[58] Needleman,SB;Wunsch,CD,《适用于搜索两种蛋白质氨基酸序列相似性的通用方法》,《分子生物学杂志》。,48, 443-453, (1970) ·doi:10.1016/0022-2836(70)90057-4
[59] 名称,C;希金斯,D;Heringa,J,T-coffee:一种新的多序列比对方法,J.Mol.Biol。,302, 205-217, (2000) ·doi:10.1006/jmbi.000.4042
[60] Otto,W.、Stadler,P.F.、Prohaska,S.J.:系统发育足迹和一致的局部比对集。摘自:Giancarlo,R.,Manzini,G.(eds.)CPM 2011,《计算机科学讲义》第6661卷,第118-131页。斯普林格,海德堡(2011)·Zbl 1339.92059号
[61] 奥夫查伦科,I;掠夺,GG;贾尔丁,BM;侯,M;马,J;RC哈迪逊;斯塔布斯,L;Miller,W,Mulan:《用于研究功能和进化的多序列局部比对和可视化》,《基因组研究》,第15期,第184-194页,(2005年)·doi:10.10101克/克3007205
[62] 奥弗林顿,J;唐纳利,D;约翰逊,理学硕士;萨利,A;Blundell,TL,《特定环境氨基酸替代表:三级模板和蛋白质折叠预测》,蛋白质科学。,1, 216-226, (1992) ·数字对象标识代码:10.1002/pro.5560010203
[63] 普罗哈斯卡,S;油炸,C;火焰,C;瓦格纳,G;Stadler,PF,《大基因簇的系统发育足迹调查:hox簇复制的应用》,分子系统学。演变。,31, 581-604, (2004) ·doi:10.1016/j.ympev.2003.08.009
[64] 普吕弗,K;斯坦泽尔,U;Hofreiter,M;巴博,S;Kelso,J;Green,RE,古DNA分析中的计算挑战,基因组生物学。,11,r47,(2010)·doi:10.1186/gb-2010-11-5-r47
[65] 劳什,T;科伦,S;杰尼索夫,G;杂草,D;埃姆德,A-K;Döring,A;Reinert,K,《一种基于一致性的一致性算法用于从头开始和引用引导的短读序列组装》,生物信息学,251118-1124,(2009)·doi:10.1093/bioinformatics/btp131
[66] Retzlaff,N.:计算语言的两步评分模型。摘自:de Haan,Ronald(编辑),ESSLLI 2014学生会议记录,第196-206页。TU Wien,维也纳,A(2014)。www.kr.tuwien.ac.at/drm/dehaan/stus2014/proceedings.pdf。2018年2月21日访问
[67] Sankoff,D,RNA折叠、排列和原序列问题的同步解决方案,SIAM J.Appl。数学。,45, 810-825, (1985) ·Zbl 0581.92012号 ·doi:10.1137/0145048
[68] Sankoff,D.,Kruskal,J.B.:时间扭曲、字符串编辑和大分子:序列比较的理论和实践。Addison Wesley,马萨诸塞州雷丁市(1983年)·Zbl 0952.68143号
[69] Setubal,J.C.,Meidanis,J.:计算分子生物学导论。PWS Pub,马萨诸塞州波士顿(1997)
[70] Shigemizu,D.,Maruyama,O.:使用系统发育足迹搜索选择性剪接事件的调控元件。收录:Jonassen,I.,Kim,J.(编辑)第四届生物信息学算法国际研讨会,第3240卷,第147-158页。斯普林格,海德堡(2004)
[71] 筛子,F;Higgins,DG,Clustal omega,用于准确对齐许多蛋白质序列,蛋白质科学。,27, 135-145, (2018) ·doi:10.1002/pro.3290
[72] 史密斯,TF;Waterman,MS,《常见分子子序列的识别》,《分子生物学杂志》。,147, 195-197, (1981) ·doi:10.1016/0022-2836(81)90087-5
[73] 斯坦纳,L;斯塔德勒,PF;Cysouw,M,计算历史语言学管道,Lang.Dyn。变更,189-127,(2011)·doi:10.1163/221058211X570358
[74] Tabei,Y;Asai,K,检测非编码RNA序列的局部多重比对方法,生物信息学,251498-1505,(2009)·doi:10.1093/bioinformatics/btp261
[75] 汤普森,JD;科尔,P;Ripp,右;Poch,O,Balibase 3.0:多序列比对基准的最新发展,《蛋白质》,61,127-136,(2005)·doi:10.1002/prot.20527
[76] 汤普森,JD;Linard,B;奥兰多·勒康普特;Poch,O,《多序列比对方法的综合基准研究:当前挑战和未来展望》,《公共科学图书馆·综合》,6,e18093,(2011)·doi:10.1371/journal.pone.0018093
[77] 王,L;蒋,T,关于多重序列比对的复杂性,J.Compute。生物学,1337-348,(1994)·doi:10.1089/cmb.1994.1.337
[78] 沃特曼,理学硕士;史密斯,TF;华盛顿州拜尔,《一些生物序列度量》,高级数学版。,20, 367-387, (1976) ·Zbl 0342.92003号 ·doi:10.1016/0001-8708(76)90202-4
[79] TJ惠勒;Kececioglu,JD,《通过对齐对齐进行多重对齐》,生物信息学,23,i559-i568,(2007)·doi:10.1093/bioinformatics/btm226
[80] 威尔,S;Missal,K;伊利诺伊州霍法克;斯塔德勒,PF;Backofen,R,《通过基因组尺度基于结构的聚类推断非编码RNA家族和类别》,《公共科学图书馆·计算》。生物,3,e65,(2007)·doi:10.1371/journal.pcbi.0030065
[81] 威尔,S;Siebauer,医学博士;Heyne,S;Engelhardt,J;斯塔德勒,PF;雷切,K;Backofen,R,Locarnascan:将热力学稳定性纳入序列和基于结构的RNA同源性搜索,Alg。分子生物学。,8, 14, (2013) ·doi:10.1186/1748-7188-8-14
[82] 山田,S;哦,Gotoh;Yamana,H,使用具有分段线性间隙成本的新型组对组序列比对算法提高多序列比对的准确性,BMC Bioninform。,7, 524, (2006) ·doi:10.1186/1471-2105-7-524
[83] Yi-Kuo,Y;Hwa,T,概率序列比对的统计意义和相关的局部隐马尔可夫模型,J.Compute。生物学,8249-282,(2001)·doi:10.1089/10665270152530845
[84] 张,Z;Gerstein,M,《小鼠和人类:系统发育足迹有助于发现调节元件》,J.Biol。,2, 11, (2003) ·doi:10.1186/1475-4924-2-11
[85] 锡德德森,CH;伊利诺伊州霍法克;Stadler,PF,对齐和折叠的产品语法,IEEE/ACM Trans。计算。生物信息学。,2015年12月507-519日·doi:10.1109/TCBB.2014.2326155
[86] 锡德德森,CH;Prohaska,SJ;Stadler,PF,通用数据结构上的代数动态编程,BMC Bioninform。,16、19:s2,(2015)·doi:10.1186/1471-2105-16-S19-S2
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。