×

计算系统发育网络之间的根三联体距离。 (英语) Zbl 1516.68065号

摘要:根三重态距离通过精确计算具有三个叶子标签(称为根三元组,或三胞胎简而言之)作为嵌入子树出现在其中一个树中,但不是同时出现在这两个树中。假设\(N_1=(V_1,E_1)\)和\(N_2=(V_2,E_2)\)是一个大小为\(N \)的公共叶标记集上的系统发育网络,其中\(N_i \)对于\(i\in\{1,2\}\)具有水平\(k_i\)和最大in度\(d_i\),并且网络的出界是无界的。写入\(N=\max(|V_1|,|V_2|)\)、\。以前的工作已经展示了如何在特殊情况下计算(k\le 1)中在(O(N\log N)时间内(N_1)和(N_2)之间的根三元组距离。对于\(k>1),没有已知的有效算法;直接应用Fortune等人从1980年开始的经典方法会导致运行时间为(Omega(N^6n^3)),并且唯一存在的非平凡算法对网络的进出度施加了限制(特别是,当允许非二进制顶点时,它不起作用)。在本文中,我们开发了两个没有此类限制的新算法。它们的运行时间分别是(O(N^2M+N^3)和(O(M+Nk^2d^2+N^2))。我们还提供了我们的算法的实现,评估了它们在模拟数据集和实际数据集上的性能,并对根三元组距离的当前定义在实践中的局限性进行了一些观察。我们的原型实现已经打包到第一个可公开使用的软件中,用于计算任意级别的无限制网络之间的根三元组距离。

MSC公司:

68兰特 计算机科学中的图论(包括图形绘制)
05二氧化碳
05C85号 图形算法(图形理论方面)
92D15型 与进化有关的问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Felsenstein,J.,推断系统发育(2004),桑德兰:Sinauer Associates Inc,桑德兰
[2] Nakhleh,L.,Sun,J.,Warnow,T.,Linder,C.R.,Moret,B.M.E.,Tholse,A.:开发用于评估系统发育网络重建方法的计算工具。第八届太平洋生物计算研讨会论文集(PSB 2003),第315-326页,2003·Zbl 1253.92044号
[3] 罗宾逊,DF;Foulds,LR,系统发育树比较,数学。生物科学。,53, 1, 131-147 (1981) ·Zbl 0451.92006号 ·doi:10.1016/0025-5564(81)90043-2
[4] 多布森,A.J.:比较树的形状。在组合数学III中,第95-100页。柏林施普林格(1975)·Zbl 0309.05102号
[5] GF Estabrook;法国麦克莫里斯;Meacham,CA,基于四个进化单元子树的无向系统发育树比较,系统。动物园。,34, 2, 193-200 (1985) ·doi:10.2307/2413326
[6] 摩尔,GW;古德曼,M。;Barnabas,J.,《从加性假设的角度对分子数据集提出的树状图问题进行迭代的方法》,J.Theor。《生物学》,38,3423-457(1973)·doi:10.1016/0022-5193(73)90251-8
[7] 罗宾逊,DF,《标记树与三价树的比较》,J.Combin,理论B,11,2,105-119(1971)·Zbl 0185.27704号 ·doi:10.1016/0095-8956(71)90020-7
[8] Penny,D。;沃森,EE;钢铁,文学硕士,来自语言和基因的树木非常相似,系统。《生物学》,42,3,382-384(1993)·doi:10.1093/sysbio/42.3382
[9] 海因,J。;姜涛(Jiang,T.)。;Wang,L。;Zhang,K.,关于比较进化树的复杂性,Dis。申请。数学。,71, 1, 153-169 (1996) ·Zbl 0876.92020号 ·doi:10.1016/S0166-218X(96)00062-5
[10] 芬登,CR;Gordon,AD,获得普通修剪过的树木,J.Class。,2, 1, 255-276 (1985) ·doi:10.1007/BF01908078
[11] McVicar,M。;萨克,B。;网格,C。;Lijffijt,J。;Spyropoulou,大肠杆菌。;De Bie,T.,SuMoTED:有根的无序单标签树之间的直观编辑距离,Pattern Recog。莱特。,79, 52-59 (2016) ·doi:10.1016/j.patrec.2016.04.012
[12] Huson,DH;鲁普,R。;Scornavaca,C.,《系统发育网络:概念、算法和应用》(2010),剑桥:剑桥大学出版社,剑桥·doi:10.1017/CBO9780511974076
[13] 甘贝特,P。;Huber,KT,《关于有界水平的系统发育网络编码》,J.Math。生物学,65,1,157-180(2012)·Zbl 1303.92080号 ·doi:10.1007/s00285-011-0456-y
[14] 蔡,C。;Jansson,J。;Sadakane,K。;Sung,W-K,计算系统发育网络的最大一致性,Theor。计算。科学。,335, 1, 93-107 (2005) ·Zbl 1091.68057号 ·doi:10.1016/j.tcs.2004.12.012
[15] 古斯菲尔德,D。;Eddhu,S。;Langley,C.,用约束重组优化、高效地重建系统发育网络,J.Bioninform。计算。生物学,2,1,173-213(2004)·doi:10.1142/S0219720004000521
[16] 霍普克罗夫特,J。;Tarjan,R.,《算法447:图形操作的有效算法》,Commun。美国医学会,16,6,372-378(1973)·数字对象标识代码:10.1145/362248.362272
[17] Jansson,J。;Lingas,A.,通过计算三角形计算受损树木之间的根三元组距离,J.Dis。阿尔戈。,25, 66-78 (2014) ·兹比尔1284.05293
[18] 班萨尔,理学硕士;Dong,J。;Fernández-Bacha,D.,比较和聚集部分分解树,Theor。计算。科学。,412, 48, 6634-6652 (2011) ·Zbl 1227.92040号 ·doi:10.1016/j.tcs.2011.08.027
[19] Brodal,G.S.,Fagerberg,R.,Pedersen,C.N.S.,Mailund,T.,Sand,A.:计算任意度树之间三元组和四元组距离的高效算法。《第二十四届ACM-SIAM离散算法年度研讨会论文集》,第1814-1832页。工业和应用数学学会,2013年·Zbl 1422.68337号
[20] Brodal,G.S.,Mampentzidis,K.:缓存计算树之间三元组距离的不经意算法。《第25届欧洲算法年会论文集》(ESA 2017),莱布尼茨国际信息学论文集(LIPIcs)第87卷,第21:1-21:14页。Dagstuhl-Leibniz-Zentrum fuer Informatik学校,2017年·Zbl 1442.68289号
[21] 克里奇洛,DE;丹麦珀尔;钱,CL,有根分叉系统发育树的三倍距离,系统。《生物学》,45,3,323-334(1996)·doi:10.1093/sysbio/45.3.323
[22] Griebel,T。;Brinkmeyer,M。;Böcker,S.,《EPoS:系统发育分析的模块化软件框架》,生物信息学,24,20,2399-2400(2008)·doi:10.1093/bioinformatics/btn364
[23] Jansson,J。;Rajaby,R.,根三元组距离的更实用算法,J.Compute。生物学,24,2,106-126(2017)·doi:10.1089/cmb.2016.0185
[24] 沙子,A。;霍尔特,MK;Johansen,J。;布罗达尔,GS;梅隆,T。;Pedersen,CNS,tqDist:一个用于计算二叉树或一般树之间的四元组和三元组距离的库,生物信息学,30,14,2079-2080(2014)·doi:10.1093/bioinformatics/btu157
[25] Jansson,J。;拉贾比,R。;Sung,W-K,一种计算受损树之间有根三元组距离的有效算法,J.Compute。生物学,26,9,893-907(2019)·doi:10.1089/cmb.2019.0033
[26] 财富,S。;霍普克罗夫特,J。;Wyllie,J.,定向子图同胚问题,Theor。计算。科学。,10, 2, 111-121 (1980) ·Zbl 0419.05028号 ·doi:10.1016/0304-3975(80)90009-2
[27] Byrka,J。;Gawrychowski,P。;KT Huber;Kelk,S.,最大化系统发育网络内三重态一致性的最坏情况最佳近似算法,J.Dis。阿尔戈。,8, 1, 65-75 (2010) ·Zbl 1181.90270号
[28] Perl,Y。;Shiloach,Y.,《寻找图中两对顶点之间的两条不相交路径》,J.ACM,25,1,1-9(1978)·Zbl 0365.68026号 ·数字对象标识代码:10.1145/322047.322048
[29] McKenzie,A。;Steel,M.,两种树模型的樱桃分布,数学。生物科学。,164, 1, 81-92 (2000) ·Zbl 0947.92021号 ·doi:10.1016/S0025-5564(99)00060-7
[30] 博德威奇,M。;Semple,C.,计算一致进化历史中杂交事件的最小数量,Dis。申请。数学。,155, 8, 914-928 (2007) ·Zbl 1111.92041号 ·doi:10.1016/j.dam.2006.08.008
[31] Marcussen,T。;Heier,L。;阿拉斯加州布赖斯廷;Oxelman,B。;Jakobsen,KS,《从基因树到过时的异源多倍体网络:被子植物堇菜属(堇菜科)的见解》,系统。生物学,64,1,84-101(2015)·doi:10.1093/sysbio/syu071
[32] Cardona,G。;罗塞洛,F。;Valiente,G.,Extended Newick:是时候对系统发育网络进行标准表示了,BMC Bioinform。,9, 1, 532 (2008) ·doi:10.1186/1471-2105-9-532
[33] Cardona,G。;拉布雷斯,M。;罗塞洛,F。;Valiente,G.,《系统发育网络的度量II:节点和三胞胎度量》,IEEE/ACM Trans。计算。生物信息学。,6, 3, 454-469 (2009) ·doi:10.1109/TCBB.2008.127
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。