×

约束两两和中心星序列对齐问题。 (英文) Zbl 1354.90124号

摘要:序列比对是计算生物学中的一个基本问题,在理论计算机科学中也很重要。在本文中,我们考虑一组序列与给定约束序列的对齐问题。给定两个具有给定距离函数的序列\(A=A_1a_2\dots A_n\)和\(B=B_1b_2\dots B_n\)和一个约束序列\(C=C_1c_2\dots C_k\),我们的目标是找到\(A\)和\(B\)相对于约束\(C\)的最优序列比对。我们研究了这个问题的几种变体。如果\(C=C^k\),即\(C\)中的所有字符都相同,则最优约束成对序列比对可以在\(O(\min\{kn^2,(t-k)n^2)\)时间内求解,其中\(t\)是字符\(C\)在\(A\)和\(B\)中的最小出现次数。如果在最终对齐中,任意两个连续约束字符之间的对齐分数是由某个值上界的,称为GB-CPSA,我们给出了一个时间复杂度为(O(kn^4/logn)的动态规划。对于约束中心星序列比对(CCSA),我们证明了即使在二进制字母表上也能实现最优比对是NP-hard。此外,我们还证明了CCSA的一个否定结果,即在任何常数比内都没有多项式时间算法来近似CCSA。

MSC公司:

90C27型 组合优化
90立方厘米 动态编程

软件:

ClustalW公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altschul SF、Gish W、Miller W、Myers EW、Lipman DJ(1990)基本局部对齐搜索工具。分子生物学杂志215(3):403-410·doi:10.1016/S0022-2836(05)80360-2
[2] Bonizzoni P,Vedova GD(2001)使用sp-score进行多序列比对的复杂性,这是一个度量。计算机科学理论259(1-2):63-79·Zbl 0972.68092号 ·doi:10.1016/S0304-3975(99)00324-2
[3] Chin FYL,Santis AD,Ferrara AL,Ho NL,Kim SK(2004)约束序列问题的简单算法。Inf过程快报90:175-179·Zbl 1175.90400号 ·doi:10.1016/j.ipl.2004.02.008
[4] Chin FYL,Ho NL,Lam TW,Wong PWH(2005)高效约束多序列比对与性能保证。生物信息计算生物学杂志3(1):1-18·doi:10.1142/S0219720005000977
[5] Cormen TH,Leiserson CE,Rivest RL,Stein C(2009)算法简介,第3版。麻省理工学院出版社,剑桥·Zbl 1187.68679号
[6] Garey M,Johnson D(1979)《计算机与难处理性:NP完全性理论指南》。W.H.Freeman and Company,旧金山·Zbl 0411.68039号
[7] Gusfield D(1993)保证误差界的多序列比对的有效方法。布尔数学生物学55:141-154·Zbl 0756.92020号 ·doi:10.1007/BF02460299
[8] Iliopoulos CS,Rahman MS(2008)计算最长公共子序列问题变体的算法。计算机科学理论395(2-3):255-267·Zbl 1142.68068号 ·doi:10.1016/j.tcs.2008.01.009
[9] Larkin MA、Blackshields G、Brown NP、Chenna R、McGettigan PA、McWilliam H、Valentin F、Wallace IM、Wilm A、Lopez R、Thompson JD、Gibson TJ、Higgins DG(2007)ClustalW和ClustalX版本2。生物信息学23(21):2947-2948·doi:10.1093/生物信息系统/btm404
[10] Masek WJ,Paterson MS(1980)计算字符串编辑距离的更快算法。计算机系统科学杂志20(1):18-31·Zbl 0436.68044号 ·doi:10.1016/0022-0000(80)90002-1
[11] DM山(2004)《生物信息学:序列和基因组分析》,第2版。冷泉港实验室出版社
[12] Setubal J、Meidanis J(1997)《计算分子生物学导论》(第3章)。PWS出版公司,波士顿
[13] Tang CY,Lu CL,Chang MD-T,Tsai Y-T,Sun Y-J,Chao K-M,Chang J-M,Chiou Y-H,Wu C-M,Chang-H-T,Chou W-I(2003)约束多序列比对工具的开发及其在rnase家族比对中的应用。生物信息计算机生物学杂志1(2):267-287·doi:10.1142/S0219720003000095
[14] Wang L,Jiang T(1994)关于多序列比对的复杂性。计算机生物学杂志1(4):337-348·doi:10.1089/cmb.1994.1.337
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。