×

更快地计算系统发育网络之间的罗宾逊-福兹距离。 (英语) Zbl 1398.92165号

摘要:罗宾逊-福兹距离是一种广泛用于比较系统发育树的度量标准,最近已被推广到系统发育网络。给定两个具有叶标签的系统发育网络(N_1},N_2}),每个网络最多有(m)个节点和(e)个边,Robinson-Foulds距离测量的是(N_1{})和(N_2}\)没有共享的后代叶簇数。计算\(N_{1}\)和\(N_{2}\)之间Robinson Foulds距离的已知最快算法在\(O(me)\)时间内运行。在本文中,我们将一般系统发育网络的时间复杂度提高到(O(ne/\log n)),并将有界度的一般系统发育网(假设单词RAM模型的单词长度为(lceil\log n\rceil)位)的时间复杂程度提高到(0(nm/log n),将叶外平面网络的时间复杂性提高到最佳(O(m)),以及优化(O(n)\)一级系统发育网络(即galled-trees)的时间。我们还介绍了系统发育网络最小扩散的自然概念,并说明了新算法的运行时间是如何依赖于此参数的。作为一个例子,我们证明了一个水平-(k+)网络的最小传播至多为\(k+1\),这意味着对于一个一级和一个水平-(k+)系统发育网络,我们的算法在\(O((k+1)e)\)时间内运行。

MSC公司:

92D15型 与进化有关的问题
65年第68季度 算法和问题复杂性分析
92立方厘米 系统生物学、网络
68瓦35 非数值算法的硬件实现(VLSI算法等)
92-04 生物相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arnborg,S。;科内尔·D·G。;Proskurowski,A.,在k树中查找嵌入的复杂性,SIAM J.代数离散。,8, 2, 277-284 (1987) ·兹比尔0611.05022
[2] 巴罗尼,M。;Semple,C。;Steel,M.,实时混合,系统。生物学,55,1,46-56(2006)
[3] Beiko,R.G。;哈洛·T·J。;Ragan,M.A.,原核生物基因共享的途径,Proc。国家。阿卡德。科学。美国,102,40,14332-14337(2005)
[4] 布莱恩特,D。;Moulton,V.,Neighbor-Net:构建系统发育网络的聚合方法,分子生物学。演变。,21, 2, 255-265 (2004)
[5] Cardona,G。;拉布雷斯,M。;罗塞洛,F。;Valiente,G.,一类树亲系统发育网络的距离度量,生物信息学,24,131481-1488(2008)
[6] Cardona,G。;Llabrés,M。;罗塞洛,F。;Valiente,G.,《系统发育网络的度量标准》。一: Robinson-Foulds度量的推广,IEEE ACM Trans。计算。生物学,6,1,46-61(2009)
[7] Cardona,G。;罗塞洛,F。;Valiente,G.,树-儿童系统发育网络的比较,IEEE Trans。计算。生物学,6,4,552-569(2009)
[8] 千叶,N。;西泽基,T。;Abe,S。;Ozawa,T.,《使用PQ树嵌入平面图的线性算法》,J.Compute。系统。科学。,30, 1, 54-76 (1985) ·Zbl 0605.68060号
[9] Choy,C。;Jansson,J。;Sadakane,K。;Sung,W.K.,计算系统发育网络的最大一致性,理论。计算。科学。,335, 1, 93-107 (2005) ·Zbl 1091.68057号
[10] Day,W.H.E.,《比较树木与标记树叶的最佳算法》,J.Classif。,2, 1, 7-28 (1985) ·Zbl 0589.62044号
[11] 杜立德,W.F.,《系统发育分类与通用树》,《科学》,284、5423、2124-2128(1999)
[12] Grünewald,S。;Forslund,K。;连衣裙,A。;Moulton,V.,QNet:从加权四分位构建系统发育网络的聚合方法,分子生物学。演变。,24, 2, 532-538 (2007)
[13] 古斯菲尔德,D。;Eddhu,S。;Langley,C.H.,《系统发育网络中虫瘿的精细结构》,INFORMS J.Compute。,16, 4, 459-469 (2004) ·Zbl 1402.92313号
[14] 古斯菲尔德,D。;Eddhu,S。;Langley,C.H.,利用约束重组优化、高效重建系统发育网络,J.生物信息学计算。生物学,2,1,173-213(2004)
[15] Hagerup,T.,对单词RAM进行排序和搜索,(第15届年度研讨会,计算机科学的理论方面,第15届年会,计算机科学理论方面,Lect.Notes Compute.Sci,vol.1373(1998),Springer)
[16] Jansson,J。;Nguyen,N.B。;Sung,W.-K.,《将有根的三联体组合成受损的系统发育网络的算法》,SIAM J.Compute。,第351098-1121页(2006年)·Zbl 1100.68081号
[17] Jin,G。;纳赫勒,L。;Snir,S.公司。;Tuller,T.,《系统发育网络的最大可能性》,生物信息学,22,21,2604-2611(2006)
[18] Jin,G。;纳赫勒,L。;斯尼尔,S。;Tuller,T.,《系统发育网络重建的高效简约方法》,生物信息学,23,2,123-128(2007)
[19] B.M.E.莫雷特。;纳赫勒,L。;沃诺,T。;Linder,C.R。;托尔斯,A。;Padolina,A。;Sun,J。;Timme,R.,《系统发育网络:建模、重建和准确性》,IEEE Trans。计算。生物,1,1,13-23(2004)
[20] Nguyen,N.B。;Nguyen,C.T。;Sung,W.-K.,计算系统发育网络之间基于三分区的距离的快速算法,J.Comb。最佳。,1223-242(2007年)·Zbl 1123.68139号
[21] 西泽基,T。;千叶,N.,《平面图:理论与算法》(2008),多佛·Zbl 0647.05001号
[22] Pattengale,N.D。;Gottlieb,E.J。;Moret,B.M.,《高效计算罗宾逊-福兹度量》,J.Compute。《生物学》,第14、6、724-735页(2007年)
[23] 波萨达·D·。;Crandall,K.A.,《种内基因谱系:树木嫁接到网络中》,《趋势经济学》。演变。,16, 1, 37-45 (2001)
[24] 罗宾逊,D.F。;Foulds,L.R.,系统发育树比较,数学。生物科学。,53, 1/2, 131-147 (1981) ·Zbl 0451.92006号
[25] Smets,B.F。;Barkay,T.,《水平基因转移:科学学科交叉点的视角》,国家微生物学评论。,3, 675-678 (2005)
[26] 斯特里默,K。;Moulton,V.,使用定向图形模型进行系统发育网络的可能性分析,分子生物学。演变。,17875-881(2000年)
[27] 斯特里默,K。;维夫,C。;Moulton,V.,使用定向图形模型进行重组分析,分子生物学。演变。,18, 1, 97-99 (2001)
[28] S.-J.Sul,G.Brammer,T.L.Williams,高效计算任意大小的Robinson*-Foulds距离矩阵,in:Proc。生物信息学第八届国际研讨会算法,Lect。《生物信息学注释》第5251卷,施普林格出版社,2008年。;S.-J.Sul,G.Brammer,T.L.Williams,高效计算任意大小的Robinson*-Foulds距离矩阵,in:Proc。生物信息学第八届国际研讨会算法,Lect。《生物信息学注释》第5251卷,施普林格出版社,2008年。
[29] S.-J.Sul,T.L.Williams,《罗宾逊-福兹距离矩阵算法的实验分析》,收录于:Proc。年第16届欧洲算法研讨会,Lect。注释计算。科学。,第5193卷,施普林格出版社,2008年。;S.-J.Sul,T.L.Williams,《罗宾逊-福兹距离矩阵算法的实验分析》,收录于:Proc。年第16届欧洲算法研讨会,Lect。注释计算。科学。,第5193卷,施普林格出版社,2008年。
[30] Valiente,G.,具有唯一节点标签的树和图的有效算法,(Kandel,A.;Bunke,H.;Last,M.,计算机视觉和模式识别中的应用图论。计算机视觉和模式识别中的应用图论,计算智能研究卷,第52卷(2007),施普林格),137-149·Zbl 1138.68506号
[31] Valiente,G.,《使用Perl和R的计算生物学中的组合模式匹配算法》(2009),Taylor&Francis/CRC出版社·Zbl 1169.68045号
[32] 范·埃尔塞尔,L。;Keijsper,J。;Kelk,S。;斯托吉,L。;黑根,F。;Boekhout,T.,从三胞胎构建二级系统发育网络,IEEE ACM Trans。计算。生物学,6,4,667-681(2009)
[33] 范·埃尔塞尔,L。;Kelk,S。;Mnich,M.,《唯一性、难处理性和精确算法:对k级系统发育网络的思考》,《生物信息学计算杂志》。生物学,7,4,597-623(2009)
[34] Wang,L。;马,B。;Li,M.,带重组的固定拓扑对齐,Disc。申请。数学。,104,1-3281-300(2000年)·Zbl 0965.92022号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。