×

一种基于对偶的最大一致森林2-近似算法。 (英语) Zbl 1508.68416号

摘要:我们给出了两根二叉树上最大一致森林问题的一个2-近似算法。这个NP-hard问题在过去二十年中得到了广泛的研究,因为它可以用于计算两个系统发育树之间的根子树Prune-and-Regraft(rSPR)距离。我们的算法是组合的,其运行时间在输入大小上是二次的。为了证明逼近保证,我们构造了一个新的指数规模线性规划公式的可行对偶解。此外,我们还证明了该线性规划与已知公式相比具有更小的积分间隙,并且给出了一个等价的紧致公式,表明它可以在多项式时间内求解。

MSC公司:

68周25 近似算法
68瓦40 算法分析
90C27型 组合优化
92D15型 与进化有关的问题

软件:

rSPR
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾伦,BL;Steel,M.,《进化树上的子树转移操作及其诱导度量》,Ann.Comb。,5, 1, 1-15 (2001) ·Zbl 0978.05023号 ·doi:10.1007/s00026-001-8006-8
[2] Bender,M.A.,Farach-Colton,M.:重新审视生命周期评价问题。摘自:第四届拉丁美洲理论信息学研讨会论文集,第88-94页(2000年)·Zbl 0959.68133号
[3] 阀盖,ML;约翰,KS;马欣德鲁,R。;Amenta,N.,《近似系统发育之间的子树距离》,J.Compute。生物学,13,8,1419-1434(2006)·doi:10.1089/cmb.2006.13.1419
[4] 博德威奇,M。;McCartin,C。;Semple,C.,系统发育之间子树距离的3近似算法,J.Discret。算法,6,3,458-471(2008)·Zbl 1171.05317号 ·doi:10.1016/j.jda.2007.10.02
[5] 博德威奇,M。;Semple,C.,关于根子树修剪和重修剪距离的计算复杂性,Ann.Comb。,8, 4, 409-423 (2004) ·Zbl 1059.05035号 ·doi:10.1007/s00026-004-0229-z
[6] Chataigner,F.,近似\(k\)树上的最大协议林,Inf.Process。莱特。,93,5239-244(2005年)·Zbl 1173.68601号 ·doi:10.1016/j.ipl.2004.11.004
[7] 陈,J。;施,F。;Wang,J.,多棵二叉树上的近似最大一致森林,Algorithmica,76,4,867-889(2016)·Zbl 1352.68288号 ·doi:10.1007/s00453-015-0087-6
[8] 陈,Z-Z;Y.原田。;Wang,L。;蔡,Z。;Daescu,O。;Li,M.,《rSPR距离的新2-近似算法》,生物信息学研究与应用,128-139(2017),Cham:Springer International Publishing,Cham·doi:10.1007/978-3-319-59575-7_12
[9] Chen,Z.-Z.,Machida,E.,Wang,L.:rSPR距离的立方时间2近似算法。arXiv预印arXiv:1609.04029(2016)
[10] Chen,Z.Z.,Machida,E.,Wang,L.:rSPR距离的改进近似算法。在国际计算与组合数学会议上,第468-479页。斯普林格(2016)·Zbl 1476.68199号
[11] 达尔文:笔记本B:物种的变异(1837?-1838)。收录:约翰·范怀赫:查尔斯·达尔文在线全集(2002)。http://darwin-online.org.uk/
[12] Gascuel,O.,《进化和系统发育数学》(2005),牛津:牛津大学出版社,牛津·Zbl 1104.92332号
[13] 戈曼斯,墨西哥;威廉姆森,DP;Hochbaum,DS,近似算法的原对偶方法及其在网络设计问题中的应用,NP-hard问题的近似算法,144-191(1997),波士顿:PWS出版公司,波士顿
[14] Harel,D.:最低共同祖先问题的线性时间算法。《第21届计算机科学基础年度研讨会论文集》,第308-319页(1980)
[15] Harel,D。;Tarjan,RE,查找最近共同祖先的快速算法,SIAM J.Compute。,13, 2, 338-355 (1984) ·Zbl 0535.68022号 ·数字对象标识代码:10.1137/0213024
[16] 海因,J。;姜涛(Jiang,T.)。;Wang,L。;Zhang,K.,《关于比较进化树的复杂性》,《离散应用程序》。数学。J.库姆。算法信息计算。科学。,71, 1-3, 153-169 (1996) ·Zbl 0876.92020号
[17] Huson,D。;鲁普,R。;Scornavaca,C.,《系统发育网络:概念》(2010),剑桥:剑桥大学出版社,算法与应用,剑桥·doi:10.1017/CBO9780511974076
[18] 纳赫勒,L。;希思·L。;Ramakrishnan,N.,进化系统发育网络:模型和问题,《计算生物学和生物信息学问题解决手册》(2009),纽约:斯普林格,纽约
[19] Olver,N.,Schalekamp,F.,Stougie,L.,van Zuylen,A.:MAF算法和紧凑公式的实现。可在http://nolver.net/mafhttp://fransschalekamp.com/MAF (2018)
[20] 罗德里格斯,E.M.:Algoritmos para Comparaáo de Alvores Filogenéticas E o Problema dos Pontos de Recombinaço。巴西圣保罗大学博士论文(2003年)。第7章,在线阅读http://www.ime.usp.br/estela/studies/tese-traducao-cp7.ps.gz
[21] Rodrigues,E.M.,Sagot,M.-F.,Wakabayashi,Y.:最大协议森林问题的一些近似结果。摘自:《APPROX-RANDOM学报》,《计算机科学讲义》,第159-169页。斯普林格(2001)·Zbl 1001.92038号
[22] EM罗德里格斯;Sagot,M-F;Wakabayashi,Y.,《最大一致森林问题:近似算法和计算实验》,Theor。计算。科学。,374, 1-3, 91-110 (2007) ·Zbl 1164.68039号 ·doi:10.1016/j.tcs.2006.12.011
[23] Schalekamp,F.、van Zuylen,A.、van der Ster,S.:最大一致森林的基于对偶的2-近似算法。摘自:第43届国际自动化、语言和编程学术讨论会(ICALP)论文集,LIPIcs第55卷,第70:1-70:14页。莱布尼兹·泽特鲁姆·福尔·Informatik(2016)·Zbl 1388.68312号
[24] Semple,C。;Steel,M.,《系统发育学》(2003),牛津:牛津大学出版社,牛津·Zbl 1043.92026
[25] 施,F。;冯,Q。;你,J。;Wang,J.,两根二叉系统发育树最大一致树的改进近似算法,J.Comb。优化。,32, 1, 111-143 (2015) ·Zbl 1378.90085号 ·doi:10.1007/s10878-015-9921-7
[26] 钢,M。;Warnow,T.,Kaikoura树定理:计算最大一致子树,Inf.过程。莱特。,48, 2, 77-82 (1993) ·Zbl 0942.68578号 ·doi:10.1016/0020-0190(93)90181-8
[27] 范·埃尔塞尔,L。;Kelk,S。;Lekic,N。;Stougie,L.,非二进制协议森林的近似算法,SIAM J.Discret。数学。,28, 1, 49-66 (2014) ·兹比尔1311.68193 ·doi:10.137/120903567
[28] 惠登,C。;贝科,RG;Zeh,N.,最大一致森林的固定参数算法,SIAM J.Comput。,42, 4, 1431-1466 (2013) ·Zbl 1311.68079号 ·数字对象标识代码:10.1137/10845045
[29] 惠登,C。;Matsen,FA,计算无根子树剪枝和重接距离,IEEE/ACM Trans。计算。生物信息学。,16, 3, 898-911 (2019) ·doi:10.1109/TCBB.2018.2802911
[30] Whidden,C.,Zeh,N.:关于协议森林的近似值和FPT的统一观点。In:生物信息学算法。计算机科学课堂讲稿,第5724卷,第390-402页。施普林格,柏林-海德堡(2009)
[31] Wu,Y.,一种精确计算子树剪枝和再生距离的实用方法,生物信息学,25,2,190-196(2009)·doi:10.1093/bioinformatics/btn606
[32] Wu,Y.,Wang,J.:快速计算两个系统发育树的准确杂交数。生物信息学研究与应用。计算机科学课堂讲稿,第6053卷,第203-214页。施普林格,柏林-海德堡(2010)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。