马斌;王路生;李明 多项式时间内带内的近似最优多重对准。 (英语) Zbl 1121.68125号 J.计算。系统。科学。 73,第6期,997-1011(2007). 摘要:多序列比对是计算生物学中的一个基本问题。由于其臭名昭著的困难,在恒定带((c)-对角线)内对齐序列是生物信息学中的一种流行做法,具有良好的实际效果。然而,对于多序列,问题仍然是NP-hard。本文对这一问题进行了理论研究。特别是,对于任意小的(ε>0),我们提出了多项式时间算法,在SP对齐和一致(星)对齐的标准模型下,该算法产生的多重对齐(不一定是(c)-对角线)的成本最多为最佳对角线对齐成本的(1+epsilon)倍。我们的一致性对齐算法允许使用非常通用的评分方案。为了证明我们的主要结果,我们还提供了SP对齐和一致性对齐的类似结果,平均每个序列只允许恒定数量的插入和删除间隙(任意长度)。这些结果本身很有趣,它们改进了[Li先生,Ma先生、和L·王《在许多序列中寻找相似区域》,J.Compute。系统。科学。65,第1期,73-96页(2002年;兹比尔1020.68040)]. MSC公司: 68周25 近似算法 92-08 生物学问题的计算方法 关键词:带内多序列比对;多项式时间近似算法 引文:Zbl 1020.68040号 软件:美国金融服务贸易协会 PDF格式BibTeX公司 XML格式引用 \textit{B.Ma}等人,《计算杂志》。系统。科学。73,第6号,997--1011(2007;Zbl 1121.68125) 全文: DOI程序 参考文献: [1] Altschul,S。;Lipman,D.,《树木、恒星和多序列比对》,SIAM J.Appl。数学。,49, 197-209 (1989) ·Zbl 0695.92006号 [2] V.Bafna,E.Lawler,P.Pevzner,多序列比对的近似算法,摘自:Proc。《组合模式匹配Conf.Asilomar》,1994年,第8年,第43-53页;V.Bafna,E.Lawler,P.Pevzner,多序列比对的近似算法,摘自:Proc。《组合模式匹配Conf.Asilomar》,1994年,第8年,第43-53页·Zbl 0911.68070号 [3] Chao,K。;皮尔逊,W.R。;Miller,W.,在指定的对角线带内对齐两个序列,CABIOS,8,481-487(1992) [4] Gusfield,D.,保证误差界的多序列比对的有效方法,Bull。数学。生物,30,141-154(1993)·Zbl 0756.92020号 [5] Gusfield,D.,《字符串、树和序列的算法》(1997),剑桥大学出版社·Zbl 0934.68103号 [6] Fickett,J.W.,《快速最佳比对》,《核酸研究》,第12期,第175-180页(1984年) [7] W.Just,《关于gap-0多重比对的计算复杂性》,手稿,1998年;W.Just,《关于gap-0多重比对的计算复杂性》,手稿,1998年 [8] J.Kececioglu,H.-P.Lenhof,K.Mehlhorn,P.Mutzel,K.Reinert,M.Vingron,《序列比对问题的多面体方法》,载于:P.Pevzner(编辑),计算生物学专刊,离散应用。数学。(1999),出版;J.Kececioglu,H.-P.Lenhof,K.Mehlhorn,P.Mutzel,K.Reinert,M.Vingron,序列比对问题的多面体方法,见:P.Pevzner(编辑),计算生物学特刊,离散应用。数学。(1999),出版·Zbl 0998.92017号 [9] M.Li,B.Ma,L.Wang,在许多序列中发现相似区域,在:Proc。第31届ACM交响乐团。《计算理论》,亚特兰大,1999年,第473-482页;M.Li,B.Ma,L.Wang,在许多序列中发现相似区域,在:Proc。第31届ACM交响乐团。《计算理论》,亚特兰大,1999年,第473-482页·Zbl 1346.68307号 [10] Motwani,R。;Raghavan,P.,《随机算法》(1995),剑桥大学出版社·Zbl 0849.68039号 [11] Papadimitriou,C.H。;Yannakakis,M.,《优化、近似和复杂性类》,J.Compute。系统科学。,43, 425-440 (1991) ·Zbl 0765.68036号 [12] 皮尔逊,W.R。;Lipman,D.,《生物序列比较的改进工具》,Proc。国家。阿卡德。科学。美国,85,2444-2448(1988) [13] Pearson,W.R.,与FASTP和FASTA快速、敏感的序列比较,酶学方法。,183, 63-98 (1990) [14] Pearson,W.R.,《搜索蛋白质序列库:Smith-Waterman和FASTA算法的敏感性和选择性比较》,基因组学,11635-650(1991) [15] Pevzner,P.,《多重对齐、通信成本和图形匹配》,SIAM J.Appl。数学。,52, 1763-1779 (1992) ·Zbl 0766.68064号 [16] 桑科夫,D。;Kruskal,J.,《时间扭曲、字符串编辑和大分子:序列比较的理论与实践》(1983),Addison-Wesley [17] Spouge,J.L.,《快速最佳对准》,CABIOS,7,1-7(1991) [18] Stone,C.J.,《概率与统计课程》(1995),达克斯伯里出版社 [19] Ukkonen,E.,近似字符串匹配算法,Inform。控制,64,100-118(1985)·Zbl 0575.68090号 [20] Wang,L。;Jiang,T.,《关于多重序列比对的复杂性》,J.Compute。《生物学》,1337-348(1994) [21] Wang,L。;姜涛(Jiang,T.)。;Lawler,E.L.,给定系统发育树比对的近似算法,算法,16,302-315(1996)·Zbl 0862.68119号 [22] Wang,L。;Gusfield,D.,树对齐的改进近似算法,J.算法,25255-273(1997)·Zbl 0895.68061号 [23] Waterman,M.S.,《计算生物学导论》(1995),查普曼和霍尔出版社·兹比尔08319011 [24] B.Y.Wu,G.Lancia,V.Bafna,K.Chao,R.Ravi,C.Y.Tang,最小布线成本生成树的多项式时间近似方案,in:Proc。第九届ACM-SIAM交响乐团。光盘。阿尔及利亚。,旧金山,1998年,第21-32页;B.Y.Wu,G.Lancia,V.Bafna,K.Chao,R.Ravi,C.Y.Tang,最小布线成本生成树的多项式时间近似方案,in:Proc。第九届ACM-SIAM研讨会。光盘。藻类。,旧金山,1998年,第21-32页·Zbl 0930.68103号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。