×

多项式时间内带内的近似最优多重对准。 (英语) Zbl 1121.68125号

摘要:多序列比对是计算生物学中的一个基本问题。由于其臭名昭著的困难,在恒定带((c)-对角线)内对齐序列是生物信息学中的一种流行做法,具有良好的实际效果。然而,对于多序列,问题仍然是NP-hard。本文对这一问题进行了理论研究。特别是,对于任意小的(ε>0),我们提出了多项式时间算法,在SP对齐和一致(星)对齐的标准模型下,该算法产生的多重对齐(不一定是(c)-对角线)的成本最多为最佳对角线对齐成本的(1+epsilon)倍。我们的一致性对齐算法允许使用非常通用的评分方案。
为了证明我们的主要结果,我们还提供了SP对齐和一致性对齐的类似结果,平均每个序列只允许恒定数量的插入和删除间隙(任意长度)。这些结果本身很有趣,它们改进了[Li先生,Ma先生、和L·王《在许多序列中寻找相似区域》,J.Compute。系统。科学。65,第1期,73-96页(2002年;兹比尔1020.68040)].

MSC公司:

68周25 近似算法
92-08 生物学问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Altschul,S。;Lipman,D.,《树木、恒星和多序列比对》,SIAM J.Appl。数学。,49, 197-209 (1989) ·Zbl 0695.92006号
[2] V.Bafna,E.Lawler,P.Pevzner,多序列比对的近似算法,摘自:Proc。《组合模式匹配Conf.Asilomar》,1994年,第8年,第43-53页;V.Bafna,E.Lawler,P.Pevzner,多序列比对的近似算法,摘自:Proc。《组合模式匹配Conf.Asilomar》,1994年,第8年,第43-53页·Zbl 0911.68070号
[3] Chao,K。;皮尔逊,W.R。;Miller,W.,在指定的对角线带内对齐两个序列,CABIOS,8,481-487(1992)
[4] Gusfield,D.,保证误差界的多序列比对的有效方法,Bull。数学。生物,30,141-154(1993)·Zbl 0756.92020号
[5] Gusfield,D.,《字符串、树和序列的算法》(1997),剑桥大学出版社·Zbl 0934.68103号
[6] Fickett,J.W.,《快速最佳比对》,《核酸研究》,第12期,第175-180页(1984年)
[7] W.Just,《关于gap-0多重比对的计算复杂性》,手稿,1998年;W.Just,《关于gap-0多重比对的计算复杂性》,手稿,1998年
[8] J.Kececioglu,H.-P.Lenhof,K.Mehlhorn,P.Mutzel,K.Reinert,M.Vingron,《序列比对问题的多面体方法》,载于:P.Pevzner(编辑),计算生物学专刊,离散应用。数学。(1999),出版;J.Kececioglu,H.-P.Lenhof,K.Mehlhorn,P.Mutzel,K.Reinert,M.Vingron,序列比对问题的多面体方法,见:P.Pevzner(编辑),计算生物学特刊,离散应用。数学。(1999),出版·Zbl 0998.92017号
[9] M.Li,B.Ma,L.Wang,在许多序列中发现相似区域,在:Proc。第31届ACM交响乐团。《计算理论》,亚特兰大,1999年,第473-482页;M.Li,B.Ma,L.Wang,在许多序列中发现相似区域,在:Proc。第31届ACM交响乐团。《计算理论》,亚特兰大,1999年,第473-482页·Zbl 1346.68307号
[10] Motwani,R。;Raghavan,P.,《随机算法》(1995),剑桥大学出版社·Zbl 0849.68039号
[11] Papadimitriou,C.H。;Yannakakis,M.,《优化、近似和复杂性类》,J.Compute。系统科学。,43, 425-440 (1991) ·Zbl 0765.68036号
[12] 皮尔逊,W.R。;Lipman,D.,《生物序列比较的改进工具》,Proc。国家。阿卡德。科学。美国,85,2444-2448(1988)
[13] Pearson,W.R.,与FASTP和FASTA快速、敏感的序列比较,酶学方法。,183, 63-98 (1990)
[14] Pearson,W.R.,《搜索蛋白质序列库:Smith-Waterman和FASTA算法的敏感性和选择性比较》,基因组学,11635-650(1991)
[15] Pevzner,P.,《多重对齐、通信成本和图形匹配》,SIAM J.Appl。数学。,52, 1763-1779 (1992) ·Zbl 0766.68064号
[16] 桑科夫,D。;Kruskal,J.,《时间扭曲、字符串编辑和大分子:序列比较的理论与实践》(1983),Addison-Wesley
[17] Spouge,J.L.,《快速最佳对准》,CABIOS,7,1-7(1991)
[18] Stone,C.J.,《概率与统计课程》(1995),达克斯伯里出版社
[19] Ukkonen,E.,近似字符串匹配算法,Inform。控制,64,100-118(1985)·Zbl 0575.68090号
[20] Wang,L。;Jiang,T.,《关于多重序列比对的复杂性》,J.Compute。《生物学》,1337-348(1994)
[21] Wang,L。;姜涛(Jiang,T.)。;Lawler,E.L.,给定系统发育树比对的近似算法,算法,16,302-315(1996)·Zbl 0862.68119号
[22] Wang,L。;Gusfield,D.,树对齐的改进近似算法,J.算法,25255-273(1997)·Zbl 0895.68061号
[23] Waterman,M.S.,《计算生物学导论》(1995),查普曼和霍尔出版社·兹比尔08319011
[24] B.Y.Wu,G.Lancia,V.Bafna,K.Chao,R.Ravi,C.Y.Tang,最小布线成本生成树的多项式时间近似方案,in:Proc。第九届ACM-SIAM交响乐团。光盘。阿尔及利亚。,旧金山,1998年,第21-32页;B.Y.Wu,G.Lancia,V.Bafna,K.Chao,R.Ravi,C.Y.Tang,最小布线成本生成树的多项式时间近似方案,in:Proc。第九届ACM-SIAM研讨会。光盘。藻类。,旧金山,1998年,第21-32页·Zbl 0930.68103号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。