×

关于最长公共刚性子序列问题。 (英语) Zbl 1191.68216号

摘要:最长公共子序列问题(LCS)和最近子串问题(CSP)是寻找字符串中公共模式的两种模型,已经得到了广泛的研究。尽管LCS和CSP都是NP难算法,但相对于多项式时间近似算法,它们表现出非常不同的行为。虽然对于某些\(\delta>0\),LCS很难在\(n^{\delta}\)内近似,但CSP允许多项式时间近似方案。本文研究最长公共刚性子序列问题。这个问题与LCS和CSP都有相似之处,并且在生物序列的模体发现中有重要应用。我们证明,对于某些常数(delta>0),在比率\(n^{delta}\)内,它是近似LCRS的NP-hard,其中\(n\)是最大字符串长度。我们还表明,在比率\(\Omega(m)\)内,它是NP-Hard到近似LCRS,其中\(m\)是字符串数。

MSC公司:

68页第10页 搜索和排序
68吨10 模式识别、语音识别

软件:

TEIRESIAS公司
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Adebiyi,E.F.,Kaufmann,M.:在Levenshtein度量下提取常见主题:理论和实验。摘自:《生物信息学算法研讨会论文集》,第140–156页(2002年)·Zbl 1016.68677号
[2] Alimonti,P.,Kann,V.:三次图的一些APX-完备性结果。西奥。计算。科学。237, 123–134 (2000) ·Zbl 0939.68052号 ·doi:10.1016/S0304-3975(98)00158-3
[3] Alon,N.,Feige,U.,Wigderson,A.,Zuckerman,D.:去随机化图形产品。计算。复杂。5(1), 60–75 (1995) ·Zbl 0816.60070号 ·doi:10.1007/BF01277956
[4] Alon,N.,Spencer,J.:概率方法。威利,纽约(2000年)
[5] Arora,S.,Lund,C.:In:Hochbaum,D.(ed.)近似硬度,NP-hard问题的近似算法,第399-446页。PWS,波士顿(1996)
[6] Cheadle,C.、Ivashchenko,Y.、South,V.、Searfoss,G.、French,S.、Howk,R.、Ricca,G.和Jaye,M.:通过筛选随机噬菌体展示库鉴定src-sh3结构域结合基序。生物学杂志。化学。269(39), 24034–24039 (1994)
[7] 姜涛,李梅:关于最短公共超序列和最长公共子序列的逼近。SIAM J.计算。24(5), 1122–1139 (1995) ·Zbl 0853.68112号 ·网址:10.1137/S00975397979223842X
[8] Keich,U.,Pevzner,P.A.:在曙光区寻找图案。载:《第六届国际计算生物学年会论文集》,第195–204页(2002年)
[9] Lanctot,J.K.,Li,M.,Ma,B.,Wang,S.,Zhang,L.:区分字符串选择问题。Inf.计算。185(1), 41–55 (2003). 早期版本出现在SODA’99·Zbl 1069.68116号 ·doi:10.1016/S0890-5401(03)00057-9
[10] Li,M.,Ma,B.,Wang,L.:在许多字符串中寻找相似区域。摘自:1999年5月亚特兰大第三十一届ACM计算理论年会(STOC)会议记录,第473-482页(1999)·Zbl 1346.68307号
[11] Li,M.,Ma,B.,Wang,L.:在许多序列中发现相似区域。J.计算。系统。科学。65(1), 73–96 (2002). 早期版本出现在STOC'99·Zbl 1020.68040号 ·doi:10.1006/jcss.2002.1823
[12] Li,M.,Ma,B.,Wang,L.:关于最近的字符串和子字符串问题。《美国医学会期刊》49(2),157-171(2002)。早期版本出现在STOC'99和CPM'00·Zbl 1323.68635号 ·doi:10.1145/506147.506150
[13] Ma,B.:最近子串问题的多项式时间近似方案。作者:Giancarlo,R.,Sankoff,D.(编辑)组合模式匹配,第11届CPM年度研讨会,加拿大蒙特利尔,2000年6月21日至23日。计算机科学课堂讲稿,第1848卷,第99-107页。施普林格,柏林(2000)·Zbl 0964.68114号
[14] Ma,B.,Zhang,K.:关于最长公共刚性子序列问题。收录:Apostolico,A.,Crochemore,M.,Park,K.(编辑)组合模式匹配,第16届CPM年度研讨会,韩国济州岛,2005年6月19-22日。计算机科学课堂讲稿,第3537卷,第11-20页。柏林施普林格出版社(2005)·Zbl 1131.68495号
[15] Maier,D.:关于子序列和超序列的一些问题的复杂性。J.ACM 25、322–336(1978年)·Zbl 0371.68018号 ·数字对象标识代码:10.1145/322063.322075
[16] Papadimitriou,C.,Yannakakis,M.:优化、近似和复杂性类。J.计算。系统。科学。43, 425–440 (1991) ·Zbl 0765.68036号 ·doi:10.1016/0022-0000(91)90023-X
[17] Rajasekaran,S.,Balla,S..,Huang,C.:种植基序挑战问题的精确算法。载:《第三届亚太生物信息学大会论文集》,第249-259页(2005年)
[18] Rajasekaran,S.,Balla,S.,Huang,C.,Thapar,V.,Gryk,M.,Maciejewski,M.,Schiller,M.:主题搜索的精确算法。摘自:《第三届亚太生物信息学会议论文集》,第239-248页(2005)
[19] Rigoutsos,I.,Floratos,A.:生物序列中的组合模式发现:teiresias算法。生物信息学14(1),55–67(1998)·doi:10.1093/bioinformatics/14.1.55
[20] Stormo,G.,Hartzell,G.W.:从未对齐的DNA片段中识别蛋白质结合位点。程序。国家。阿卡德。科学。美国86(4),1183-1187(1999)·doi:10.1073/pnas.86.4.1183
[21] Waterman,M.,Arratia,R.,Galas,D.J.:几种序列中的模式识别:共识和对齐。牛市。数学。生物学46(4),515–527(1984)·Zbl 0565.92003年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。