×

最小公共字符串划分问题的两个整数线性规划模型的计算性能评估。 (英语) Zbl 1339.90236号

摘要:在最小公共字符串分区(MCSP)问题中,给出了两个相关的输入字符串。“相关”是指两个字符串由相同的一组字母组成,在两个字符串中出现的次数相同。MCSP寻求将一个字符串划分为非重叠子字符串的最小基数,这也是对第二个字符串的有效划分。这个问题在生物信息学中有应用,例如在分析相关DNA或蛋白质序列中。对于长度小于约1000个字母的字符串,以前发布的整数线性规划(ILP)公式在使用最先进的解算器(如CPLEX)求解时会产生令人满意的结果。在这项工作中,我们提出了一个新的替代ILP模型,并与前一个模型进行了比较。虽然多面体研究表明这两个模型的线性规划松弛同样强大,但使用真实世界和人工创建的基准实例进行的综合实验比较表明,新公式具有显著的计算优势。

MSC公司:

90立方厘米 整数编程
90 C90 数学规划的应用

软件:

CPLEX公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Blum,C.,Lozano,J.A.,Pinacho Davidson,P.:最小公共字符串划分问题的迭代概率树搜索。In:Blesa,M.J.,Blum,C.,Voss,S.(编辑)HM 20104-9届混合元启发式国际研讨会论文集。计算机科学课堂讲稿,第8457卷,第154-154页。施普林格,柏林(2014)
[2] Blum,C.,Lozano,J.A.,Pinacho Davidson,P.:解决最小公共字符串划分问题的数学编程策略。欧洲药典。第242(3)号决议,第769-777号决议(2015年)·Zbl 1341.90107号 ·doi:10.1016/j.ejor.2014.10.049
[3] Chen,X.,Zheng,J.,Fu,Z.,Nan,P.,Zhong,Y.,Lonardi,S.,Jiang,T.:通过基因组重排分配同源基因。IEEE/ACM传输。计算。生物信息。2(4), 302-315 (2005) ·doi:10.1109/TCBB.2005.48
[4] Chrobak,M.,Kolman,P.,Sgall,J.:最小公共字符串划分问题的贪婪算法。作者:Jansen,K.,Khanna,S.,Rolim,J.D.P.,Ron,D.(eds.)《APPROX 2004-7届组合优化问题近似算法国际研讨会论文集》。计算机科学课堂讲稿,第3122卷,第84-95页。施普林格,柏林(2004)·兹比尔1106.68434
[5] Cormode,G.,Muthukrishnan,S.:移动的字符串编辑距离匹配问题。ACM事务处理。算法3(2),1-19(2007)·Zbl 1321.68551号 ·doi:10.1145/1186810.1186812
[6] Damaschke,P.:参数化的最小公共字符串分区。收录:Crandall,K.A.,Lagergren,J.(编辑)《WABI 2008年第八届生物信息学算法国际研讨会论文集》。计算机科学讲义,第5251卷,第87-98页。柏林施普林格出版社(2008)
[7] Ferdous,S.M.,Sohel Rahman,M.:借助蚂蚁解决最小公共字符串划分问题。Tan,Y.、Shi,Y.和Mo,H.(eds.)《2013年第4届ICSI国际群体智能进展会议论文集》。计算机科学课堂讲稿,第7928卷,第306-313页。柏林施普林格出版社(2013)·Zbl 1409.68270号
[8] Ferdous,S.M.、Sohel Rahman,M.:最小公共字符串划分问题的MAX-MIN蚁群系统(2014)。arXiv公司:1401.4539
[9] Fu,B。;姜浩。;杨,B。;朱,B。;王伟(编辑);Zhu,X.(编辑);Du,DZ(ed.),最小公共字符串划分问题的指数和多项式时间算法,第6831号,299-310(2011),柏林·Zbl 1342.68366号 ·doi:10.1007/978-3-642-22616-8_24
[10] Gallardo,J.E.:最短公共超序列问题的多级概率波束搜索算法。《公共科学图书馆·综合》7(12)(2012)·Zbl 1156.68617号
[11] Garey,M.R.,Johnson,D.S.:计算机与难处理性;NP-完备性理论指南。W.H.Freeman,旧金山(1979)·Zbl 0411.68039号
[12] Goldstein,A。;科尔曼,P。;郑,J。;Fleischer,R.(编辑);Trippen,G.(编辑),最小公共字符串划分问题:硬度和近似,第3341号,484-495(2005),柏林·Zbl 1116.68472号
[13] 戈尔茨坦,I。;勒文斯坦,M。;Giancarlo,R.(编辑);Manzini,G.(编辑),最小公共字符串分区的快速贪婪计算,第6661273-284号(2011),柏林·Zbl 1339.68332号 ·doi:10.1007/978-3642-21458-5_24
[14] He,D。;Mandoiu,I.(编辑);Zelikovsky,A.(编辑),最小公共字符串划分问题的新型贪婪算法,第4463、441-452号(2007),柏林·doi:10.1007/978-3-540-72031-7_40
[15] Hsu,W.J.,Du,M.W.:计算一组字符串的最长公共子序列。位数字。数学。24(1), 45-59 (1984). doi:10.1007/BF01934514·Zbl 0528.68049号
[16] Jiang,H.,朱,B.,朱,D.,朱,H.:重新讨论最小公共字符串分区。J.库姆。最佳方案。23(4), 519-527 (2012) ·Zbl 1244.90195号 ·doi:10.1007/s10878-010-9370-2
[17] Kaplan,H.,Shafrir,N.:移动编辑距离的贪婪算法。Inf.流程。莱特。97(1), 23-27 (2006) ·Zbl 1184.68639号 ·doi:10.1016/j.ipl.2005.08.010文件
[18] 科尔曼,P。;Jedrzejowicz,J.(编辑);Szepietowski,A.(编辑),重复数有界的字符串的近似反转距离,第3618号,580-590(2005),柏林·Zbl 1156.68617号 ·doi:10.1007/11549345_50
[19] 科尔曼,P。;瓦伦,T。;Erlebach,T.(编辑);Kaklamanis,C.(编辑),《重复字符串的反向距离:使用打击集的线性时间近似》,第4368号,第279-289页(2007年),柏林·兹比尔1129.68431 ·doi:10.1007/11970125_22
[20] Meneses,C.、Oliveira,C.、Pardalos,P.:基因组学中字符串选择和比较问题的优化技术。IEEE工程医学生物学。Mag.24(3),81-87(2005)·doi:10.1109/MEMB.2005.1436464
[21] Mousavi,S.,Babaie,M.,Montazerian,M.:一种改进的启发式算法,用于解决绝大多数字符串问题。《启发式杂志》18,239-262(2012)·doi:10.1007/s10732-011-9177-z
[22] 夏皮拉,D。;斯托尔,JA;Apostolico,A.(编辑);武田,M.(编辑),《使用移动操作编辑距离》,第2373、85-98号(2002年),柏林·兹比尔1077.68744 ·doi:10.1007/3-540-45452-79
[23] Smith,T.,Waterman,M.:常见分子子序列的识别。分子生物学杂志。147(1), 195-197 (1981) ·doi:10.1016/0022-2836(81)90087-5
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。