×

在不进行集群分区的情况下计算最大协议林是愚蠢的。 (英语) Zbl 1442.68287号

Pruhs,Kirk(编辑)等人,第25届欧洲算法研讨会,2017年ESA,奥地利维也纳,2017年9月4-6日。诉讼程序。Wadern:Schloss Dagstuhl–Leibniz Zentrum für Informatik出版社。LIPIcs–莱布尼茨国际程序。通知。87,第56条,第14页(2017年)。
摘要:计算一对系统发育树的最大(非循环)一致森林(M(a)AF)是已知的固定参数可处理的;两种主要技术是核化和深度边界搜索。理论上,基于核函数的算法在这个问题上没有竞争力,但它们在实践中表现得非常好。我们解释了为什么会这样。我们的结果表明,在实践中,内核通常比理论上最坏的情况小得多,但不足以充分解释这些算法的良好性能,这可能并不令人惊讶。性能的关键是集群分区,这是几乎所有快速M(a)AF算法中使用的一种技术。从理论上讲,集群分区无济于事:有些实例是高度集群化的,而另一些实例则完全不是。然而,我们的实验表明,对于基于内核化的M(A)AF算法,集群划分可以带来显著的性能改进。相比之下,在使用指数搜索求解单个集群之前对其进行内核化,只会产生非常轻微的性能改进,甚至会影响性能;对于绝大多数输入,核化不会导致最大簇大小的减少。用于求解单个集群的算法的选择也会显著影响性能,尽管我们对其进行的有限实验并没有明确的胜利者;深度边界搜索、指数搜索与核化交织以及基于ILP的算法都取得了具有竞争力的性能。
关于整个系列,请参见[Zbl 1372.68019号].

MSC公司:

68瓦40 算法分析
05二氧化碳
68年第27季度 参数化复杂性、可处理性和核化
92D15型 与进化有关的问题

软件:

SPR超级树
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 本杰明·阿尔布雷希特(Benjamin Albrecht)、塞琳·斯科纳瓦卡(Céline Scornavaca)、阿尔贝托·森奇(Alberto Cenci)和丹尼尔·胡森(Daniel H.Huson)。最小杂交网络的快速计算。{生物信息学},28(2):191-1972012。
[2] M.Baroni、S.Grünewald、V.Moulton和C.Semple。限制杂交事件的数量,以保持进化历史的一致性。{数学生物学杂志},51(2):171-1822005·Zbl 1068.92034号
[3] M.Baroni、C.Semple和M.Steel。实时混合。{系统生物学},55:46-562006。
[4] 罗伯特·G·贝科。在一个一万亿人口的世界里讲述整个故事。{\it生物学指导},6(1):342011。
[5] M.Bordewich和C.Semple。计算一致进化历史中杂交事件的最小数量。{离散应用数学},155(8):914-9282007·兹比尔1111.92041
[6] 马格努斯·博德威奇(Magnus Bordewich)、塞琳·斯科纳瓦卡(Céline Scornavaca)、尼汉·托卡奇(Nihan Tokac)和马蒂亚斯·韦勒(Mathias Weller)。基于协议的系统发育距离的固定参数可处理性。数学杂志,74(1):239-2572017·Zbl 1354.05129号
[7] Magnus Bordenwich和Charles Semple。关于有根子树剪枝和再生距离的计算复杂性。《组合学年鉴》,8(4):409-4232005年·Zbl 1059.05035号
[8] Magnus Bordenwich和Charles Semple。计算两个门遗传树的杂交数是固定参数的。IEEE/ACM计算学报,4(3):458-4662007·Zbl 1111.92041号
[9] 乔舒亚·柯林斯(Joshua Collins)、西蒙·林茨(Simone Linz)和查尔斯·森普尔(Charles Semple)。在现实时间中量化杂交。计算生物学杂志,18(10):1305-13182011。
[10] 草地系统学工作组。禾草(禾本科)的系统发育和亚科分类。《密苏里植物园年鉴》,第373-457页,2001年。
[11] D.M.Hillis、C.Moritz和B.K.Mable,编辑。{\it分子系统学}。Sinauer Associates,1996年。
[12] 利奥·范·埃尔塞尔(Leo van Iersel)、史蒂文·凯尔克(Steven Kelk)、内拉·莱基奇(Nela Lekić)和利恩·斯托吉(Leen Stougie)。关于杂交数的指数时间算法的简短说明。{\it CoRR},abs/1312.12552013年·Zbl 1311.68193号
[13] 利奥·范·埃尔塞尔(Leo van Iersel)、史蒂文·凯尔克(Steven Kelk)、内拉·莱基奇(Nela Lekić)和利恩·斯托吉(Leen Stougie)。非二进制协议森林的近似算法。{it SIAM离散数学杂志},28(1):49-662014·Zbl 1311.68193号
[14] 利奥·范·埃尔塞尔和西蒙·林茨。用于计算多棵树的杂交数的二次核。{信息处理信件},113(9):318-3232013·Zbl 1287.68060号
[15] 史蒂文·凯尔克和塞琳·斯科纳瓦卡。从任意非二叉树集合构造最小系统发育网络的固定参数可处理性。{\it CoRR},abs/1207.70342012年·Zbl 1350.92036号
[16] 李志江。两棵多叉树杂交数的固定参数算法。达尔豪西大学计算机科学学院硕士论文,2015年。
[17] 李志江和泽诺伯特。计算两棵多叉树的软杂交网络的快速算法。手稿正在编写中·Zbl 1442.68287号
[18] 西蒙·林茨和查尔斯·森普尔。非二叉树的杂交。IEEE/ACM Transac-}计算生物学和生物信息学杂志,6(1):30-452009。
[19] 西蒙·林茨和查尔斯·森普尔。用于计算系统发育之间子树距离的聚类缩减。组合数学年鉴,15(3):465-4842011·Zbl 1234.05057号
[20] V.Rosas-Magallanes、P.Deschavanne、L.Qintana-Murci、R.Brosch、B.Gicguel和O.Neyrolles。毒力操纵子向结核分枝杆菌祖先的水平转移。{分子生物学与进化},23(6):1129-11352006。
[21] 海科·施密特。{\来自大数据集的系统发育树}。德国杜塞尔多夫海因里希-海因大学博士论文,2003年。
[22] 冯石、杰友和冯奇龙。改进的两棵树最大一致森林近似算法。第八届国际前沿研讨会论文集《算法》,第205-215页,2014年·Zbl 1388.90120号
[23] 克里斯·惠登(Chris Whidden)。最大协议森林的有效计算及其应用。达尔豪西大学计算机科学学院博士论文,2013年。
[24] 克里斯·惠登(Chris Whidden)、罗伯特·贝科(Robert G.Beiko)和诺伯特·泽(Norbert Zeh)。最大最小协议林的固定参数算法。{it SIAM计算机杂志},42(4):1431-14662013·Zbl 1311.68079号
[25] 克里斯·惠登(Chris Whidden)、罗伯特·贝科(Robert G.Beiko)和诺伯特·泽(Norbert Zeh)。多叉树的最大一致森林的固定参数和近似算法。{\it Algorithmica},74(3):1019-10542016年·Zbl 1333.68297号
[26] 克里斯·惠登和诺伯特·泽。计算有根二叉树在{itO}(2{itk}{itn})时间内的SPR距离。手稿正在编写中·兹比尔1333.68297
[27] 克里斯·惠登(Chris Whidden)、诺伯特·泽(Norbert Zeh)和罗伯特·贝科(Robert G.Beiko)。基于子树修剪和重嫁接距离的超级树。{系统生物学},63(4):566-5812014。
[28] 吴玉凤和王家印。快速计算两个系统发育树的准确杂交数。《第六届生物信息学国际研讨会论文集》,第203-214页。Springer-Verlag,2010年。
[29] :14
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。