×

加权LCS问题的多项式时间近似算法。 (英语) Zbl 1335.68304号

摘要:我们考虑加权序列的著名最长公共子序列(LCS)问题的一个变体。加权序列确定每个符号出现在序列给定位置的概率(此类序列也称为位置加权矩阵(PWM))。该问题的两种可能版本由A.阿米尔等[J.离散算法8,No.3,273–281(2010;Zbl 1197.68086号)]它们被称为LCWS和LCWS2(最长公共加权子序列1和2)。我们解决了Amir等人[loc.cit.]在论文中提出的一个开放问题,即有界字母表的LCWS2问题的对数概率版本的可处理性,表明对于大小为2的字母表,它已经是NP-hard。我们还改进了Amir等人[loc.cit.]给出的(1/|varSigma|)-近似算法(其中,(varSigma)是字母表):我们使用(O(n^5)空间给出了LCWS2问题的多项式时间近似方案(PTAS)。对于同一问题,我们也只使用(O(n^2)空间给出了一个更简单的(1/2)-近似算法。

MSC公司:

68瓦32 字符串上的算法
2017年第68季度 问题的计算难度(下限、完备性、近似难度等)
68周25 近似算法

软件:

ClustalW公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Amir,A。;Chencinski,E。;伊利奥普洛斯,C.S。;科佩洛维茨,T。;张浩,属性匹配与加权匹配,理论。计算。科学。,395, 2-3, 298-310 (2008) ·Zbl 1142.68066号
[2] Amir,A。;哥特瑟夫,Z。;Shalom,B.R.,加权LCS,J.离散算法,8273-281(2010)·Zbl 1197.68086号
[3] Amir,A。;伊利奥普洛斯,C.S。;卡帕,O。;Porat,E.,加权序列中的近似匹配,(Lewenstein,M.;Valiente,G.,CPM.CPM,计算机科学讲义,第4009卷(2006年),施普林格),365-376·Zbl 1196.68340号
[4] 安东尼奥,P。;伊利奥普洛斯,C.S。;Mouchard,L。;Pissis,S.P.,《将短简并序列和加权序列映射到参考基因组的算法》,国际计算机杂志。生物药物设计。,2, 4, 385-397 (2009)
[5] 巴顿,C。;Pissis,S.P.,加权字符串中所有重复的最佳计算,(Iliopoulos,C.S.;Langiu,a.,ICABD.ICABD,CEUR Workshop Proceedings,vol.1146(2014),CEUR-WS.org),9-15
[6] Bergroth,L。;哈科宁,H。;Raita,T.,《最长通用子序列算法综述》(SPIRE(2000)),第39-48页
[7] Christodulakis,M。;伊利奥普洛斯,C.S。;Mouchard,L。;Perdikuri,K。;Tsakalidis,A.K。;Tsichlas,K.,生物加权序列的重复和规则计算,J.Compute。生物学,13,6,1214-1231(2006)
[8] Cygan,M。;库比卡,M。;Radoszewski,J。;W.莱特。;Waleń,T.,加权LCS问题的多项式时间近似算法,(Giancarlo,R.;Manzini,G.,CPM.CPM,计算机科学讲义,第6661卷(2011年),Springer),455-466·Zbl 1339.68314号
[9] Garey,M.R。;Johnson,D.S.,《计算机与不可纠正性:NP-完备性理论指南》(1979),W.H.Freeman·Zbl 0411.68039号
[10] Gusfield,D.,《字符串、树和序列的算法——计算机科学和计算生物学》(1997),剑桥大学出版社·Zbl 0934.68103号
[11] 伊利奥普洛斯,C.S。;马克里斯,C。;Panagis,Y。;Perdikuri,K。;Theodoridis,E。;Tsakalidis,A.K.,加权后缀树:处理分子加权序列的有效数据结构及其应用,Fundam。通知。,71, 2-3, 259-277 (2006) ·Zbl 1095.68029号
[12] 伊利奥普洛斯,C.S。;米勒,M。;Pissis,S.P.,来自高通量测序技术的退化序列和加权序列的并行算法,(Holub,J.;Zdárek,J.,弦论(2009),布拉格理工大学电气工程学院计算机科学与工程系布拉格弦论俱乐部),249-262
[13] 伊利奥普洛斯,C.S。;Mouchard,L。;Perdikuri,K。;Tsakalidis,A.K.,计算生物加权序列中的重复,J.Autom。语言梳。,10, 5/6, 687-696 (2005) ·Zbl 1140.68463号
[14] 伊利奥普洛斯,C.S。;Perdikuri,K。;Theodoridis,E。;Tsakalidis,A.K。;Tsichlas,K.,从加权序列中提取Motif,(Apostolico,A.;Melucci,M.,SPIRE.SPIRE,计算机科学讲义,第3246卷(2004),Springer),286-297·Zbl 1111.68770号
[15] Myers,E.W.,《果蝇的全基因组组装》,《科学》,287,5461,2196-2204(2000)
[16] 汤普森,J.D。;希金斯,D.G。;Gibson,T.J.,CLUSTAL W:通过序列加权、特定位置的间隙惩罚和权重矩阵选择提高渐进式多序列比对的敏感性,《核酸研究》,22,4673-4680(1994)
[17] Venter,J.C.,《人类基因组序列》,《科学》,2911304-1351(2001)
[18] 张,H。;郭,Q。;范,J。;Iliopoulos,C.S.,蛋白质加权序列中的松散和严格重复,蛋白质肽Lett。,17, 9, 1136-1142 (2010), (7)
[19] 张,H。;郭,Q。;Iliopoulos,C.S.,加权序列中交换的字符串匹配,(Zhang,J.;He,J.-H.;Fu,Y.,CIS.CIS,计算机科学讲义,第3314卷(2004),Springer),698-704·Zbl 1117.68384号
[20] 张,H。;郭,Q。;Iliopoulos,C.S.,《加权序列中模体发现问题的算法框架》,(Calamoneri,T.;Díaz,J.,CIAC.CIAC,《计算机科学讲稿》,第6078卷(2010),施普林格),335-346·Zbl 1284.68712号
[21] 张,H。;郭,Q。;Iliopoulos,C.S.,加权序列中的各种规则,(Chen,B.,AAIM.AAIM,计算机科学讲义,第6124卷(2010),Springer),271-280·Zbl 1286.68537号
[22] 张,H。;郭,Q。;Iliopoulos,C.S.,《在蛋白质加权序列中定位串联重复序列》,BMC生物信息学,14,S-8(2013),S2
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。