跳到主要内容
文章

关于最近串和子串问题

出版:2002年3月1日出版历史
跳过抽象节

摘要

找到“靠近”每个给定字符串出现在计算分子生物学和编码中理论。这个问题有两个版本:最近字符串问题以及最近子串问题。给定一组字符串S公司= {12, ...,n个},每个长度,最近的字符串问题是找到最小的d日和长度为s的字符串每个距离都在汉明距离d以内εS公司。此问题来自当我们寻找距离不太远的代码时,编码理论一组给定的代码。最近的子串问题,以及其他输入整数,要求最小的d和字符串,长度为,在汉明距离d内远离子字符串,长度,每个si。这个问题比“最近的字符串”问题更难以捉摸。最近的子串问题是通过在保守区域,识别基因药物靶点并生成分子生物学中的遗传探针。是否有效率这两个问题的近似算法都是主要的开放问题在这个地区。我们给出了两个多项式时间近似近似比为1+ε的算法ε来解决这两个问题。

参考文献

  1. Arora,S.、Karger,D.和Karpinski,M.,1995年。NP-hard问题稠密实例的多项式时间近似格式。在第27届ACM计算理论年度研讨会论文集上。ACM,纽约,第284--293页。]]谷歌学者谷歌学者
  2. Ben-Dor,A.、Lancia,G.、Perone,J.和Ravi,R.,1997年。消除共识序列中的偏见。第八届组合模式匹配年会论文集。第247至261页。]]谷歌学者谷歌学者
  3. Berman,P.、Gumucio,D.、Hardison,R.、Miller,W.和Stojanovic,N.,1997年。1-失配问题的线性时间算法。算法和数据结构研讨会论文集。第126-135页。]]谷歌学者谷歌学者
  4. Dopazo,J.,Rodr&iaccute;guez,A.,S&aaccute;iz,J.C.和Sobrino,F.,1993年。高变异基因组PCR扩增引物的设计。CABIOS 9,123--125。]]谷歌学者谷歌学者
  5. Frances,M.和Litman,A.1997年。关于覆盖代码问题。理论。计算。系统。30, 113--119.]]谷歌学者谷歌学者
  6. Gąsieniec,L.、Jansson,J.和Lingas,A.1999。汉明中心问题的有效近似算法。第十届ACM-SIAM离散算法年会论文集。ACM,纽约,第S905-S906页。]]谷歌学者谷歌学者
  7. Gillman,D.1993年。在扩展器上随机游动的切尔诺夫界。第34届计算机科学基础年度研讨会论文集。IEEE Computer Society Press,Los Alamitos,Calif.,第680-691页。]]谷歌学者谷歌学者
  8. 古斯菲尔德,D.1993。保证误差界的多序列比对的有效方法。牛市。数学。生物学30,141--154.]]谷歌学者谷歌学者
  9. 古斯菲尔德,D.1997。字符串、树和序列的算法。剑桥大学出版社。]]谷歌学者谷歌学者
  10. Hertz,G.和Stormo,G.1995年。未比对DNA和蛋白质序列中一致模式的识别:惩罚差距的大偏差统计基础。第三届生物信息学和基因组研究国际会议论文集。第201至216页。]]谷歌学者谷歌学者
  11. Lawrence,C.和Reilly,A.,1990年。一种用于识别和表征未对齐生物聚合物序列中常见位点的期望最大化(EM)算法。蛋白质7,第41-51页。]]谷歌学者谷歌学者
  12. Lucas,K.、Busch,M.、Mösinger,S.和Thompson,J.A.,1991年。一种改进的微机程序,用于寻找适合作为聚合酶链反应引物或探针的基因或基因家族特异性寡核苷酸。卡比奥斯,7,525--529。]]谷歌学者谷歌学者
  13. Lanctot,K.、Li,M.、Ma,B.、Wang,S.和Zhang,L.,1999年。区分字符串选择问题。第十届ACM-SIAM离散算法年会论文集。ACM,纽约,第633-642页。也将出现在Inf.Compute.]]谷歌学者谷歌学者
  14. Li,M.、Ma,B.和Wang,L.,1999年。在许多字符串中查找类似区域。第31届美国计算机学会计算机理论年会论文集(佐治亚州亚特兰大)。ACM,纽约,第473-482页。]]谷歌学者谷歌学者
  15. Li,M.,Ma,B.和Wang,L.,2001年。在许多序列中发现相似的区域。J.计算。系统。科学。(第31届美国计算机学会计算理论年会特刊)即将出版。]]谷歌学者谷歌学者
  16. Liang,C.、Li,M.和Ma,B.,2001年。COPIA——共识模式识别和分析软件系统。手稿。软件可从以下网址获得:http://dna.cs.ucsb.edu/copia/copia_submit.html。]]谷歌学者谷歌学者
  17. 马,B.2000。最近子串问题的多项式时间近似格式。第11届组合模式匹配年度研讨会论文集(加拿大安大略省蒙特利尔)。第99至107页。]]谷歌学者谷歌学者
  18. Motwani,R.和Raghavan,P.,1995年。随机算法,剑桥大学出版社。]]谷歌学者谷歌学者
  19. 佩夫兹纳,P.A.2000。计算分子生物学——一种算法方法。麻省理工学院出版社,马萨诸塞州剑桥。]]谷歌学者谷歌学者
  20. Posfai,J.、Bhagwat,A.、Posfai、G.和Roberts,R.1989年。预测基序源自胞嘧啶甲基转移酶。编号。《酸类研究》17,2421--2435。]]谷歌学者谷歌学者
  21. Proutski,V.和Holme,E.C.,1996年。Primer master:PCR引物设计和分析的新程序。CABIOS 12,253--255。]]谷歌学者谷歌学者
  22. Raghavan,P.1988年。确定性算法的概率构造:近似打包整数程序。J.计算。系统。科学。37,2130-143.]]谷歌学者谷歌学者
  23. Schuler,G.D.、Altschul,S.F.和Lipman,D.J.,1991年。用于多重对齐构造和分析的工作台。蛋白质:结构。功能。遗传学。9, 180--190.]]谷歌学者谷歌学者
  24. Stormo,G.1990年。DNA中的共识模式。《分子进化:蛋白质和核酸序列的计算机分析》,R.F.Doolittle,Ed.《酶学方法》,第183卷,第211-221页。]]谷歌学者谷歌学者
  25. Stormo,G.和Hartzell III,G.W.,1991年。从未对齐的DNA片段中鉴定蛋白质结合位点。程序。国家。阿卡德。科学。美国88,5699--5703。]]谷歌学者谷歌学者
  26. 沃特曼,M.,1986年。一致同意的多序列比对。编号。《酸类研究》14,9095--9102。]]谷歌学者谷歌学者
  27. Waterman,M.、Arratia,R.和Galas,D.,1984年。多序列模式识别:一致性和对齐。牛市。数学。生物学46,515--527。]]谷歌学者谷歌学者
  28. Waterman,M.和Perlwitz,M.,1984年。序列比较的线条几何。牛市。数学。生物学46,567--577。]]谷歌学者谷歌学者

索引术语

  1. 关于最近串和子串问题

      建议

      评论

      登录选项

      请检查您是否可以通过登录凭据或您的机构访问此文章以获得完全访问权限。

      登录

      完全访问权限

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用eReader联机查看。

      电子阅读器