文件Open Access徽标

在不进行集群分区的情况下计算最大协议林是愚蠢的

作者 李志江, 诺伯特·泽赫



PDF格式
缩略图PDF

文件

LIPIcs公司。ESA.2017.56.pdf版
  • 文件大小:0.67 MB
  • 14页

文件标识符

作者详细信息

李志江
诺伯特·泽赫

引用为获取BibTex

李志江和泽诺伯特。在不进行集群分区的情况下计算最大协议林是愚蠢的。第25届欧洲算法年会(ESA 2017)。莱布尼茨国际信息学论文集(LIPIcs),第87卷,第56:1-56:14页,达格斯图尔-莱布尼兹-泽特鲁姆信息学研究所(2017)
https://doi.org/10.4230/LIPIcs.ESA.2017.56

摘要

计算一对系统发育树的最大(非循环)一致森林(M(a)AF)是固定参数可处理的;两种主要技术是核化和深度边界搜索。理论上,基于核函数的算法在这个问题上没有竞争力,但它们在实践中表现得非常好。我们解释了为什么会这样。我们的结果表明,在实践中,内核通常比理论上最坏的情况小得多,但不足以充分解释这些算法的良好性能,这可能并不令人惊讶。性能的关键是集群分区,这是几乎所有快速M(a)AF算法中使用的一种技术。从理论上讲,集群分区无济于事:有些实例是高度集群化的,而另一些实例则完全不是。然而,我们的实验表明,对于基于内核化的M(A)AF算法,集群划分可以带来显著的性能改进。相比之下,在使用指数搜索求解单个集群之前对其进行内核化,只会产生非常轻微的性能改进,甚至会影响性能;对于绝大多数输入,核化不会导致最大簇大小的减少。用于求解单个集群的算法的选择也会显著影响性能,尽管我们对其进行的有限实验并没有明确的胜利者;深度边界搜索、指数搜索与核化交织以及基于ILP的算法都取得了具有竞争力的性能。
关键词
  • 固定参数牵引性
  • 协议林
  • 杂交
  • 子树修剪和重新修剪

韵律学

工具书类

  1. 本杰明·阿尔布雷希特(Benjamin Albrecht)、塞琳·斯科纳瓦卡(Céline Scornavaca)、阿尔贝托·森奇(Alberto Cenci)和丹尼尔·胡森(Daniel H.Huson)。最小杂交网络的快速计算。生物信息学,28(2):191-1972012。谷歌学者
  2. M.Baroni、S.Grünewald、V.Moulton和C.Semple。限制杂交事件的数量,以获得一致的进化历史。数学生物学杂志,51(2):171-1822005。谷歌学者
  3. M.Baroni、C.Semple和M.Steel。实时混合。系统生物学,55:46-562006。谷歌学者
  4. 罗伯特·G·贝科。在一个一万亿人口的世界里讲述整个故事。生物学指导,6(1):342011年。谷歌学者
  5. M.Bordewich和C.Semple。计算一致进化历史中杂交事件的最小数量。离散应用数学,155(8):914-9282007。谷歌学者
  6. 马格努斯·博德威奇(Magnus Bordewich)、塞琳·斯科纳瓦卡(Céline Scornavaca)、尼汉·托卡奇(Nihan Tokac)和马蒂亚斯·韦勒(Mathias Weller)。基于协议的系统发育距离的固定参数可处理性。《数学生物学杂志》,74(1):239-2572017。谷歌学者
  7. Magnus Bordenwich和Charles Semple。关于有根子树剪枝和再生距离的计算复杂性。组合数学年鉴,8(4):409-4232005。谷歌学者
  8. Magnus Bordenwich和Charles Semple。计算两个系统发育树的杂交数是固定参数的。IEEE/ACM计算生物学和生物信息学汇刊,4(3):458-4662007。谷歌学者
  9. 乔舒亚·柯林斯(Joshua Collins)、西蒙·林茨(Simone Linz)和查尔斯·森普尔(Charles Semple)。在现实时间中量化杂交。计算生物学杂志,18(10):1305–13182011。谷歌学者
  10. 草地系统学工作组。禾草(禾本科)的系统发育和亚科分类。《密苏里植物园年鉴》,第373-457页,2001年。谷歌学者
  11. D.M.Hillis、C.Moritz和B.K.Mable,编辑。分子系统学。Sinauer Associates,1996年。谷歌学者
  12. 利奥·范·埃尔塞尔(Leo van Iersel)、史蒂文·凯尔克(Steven Kelk)、内拉·莱基奇(Nela Lekić)和利恩·斯托吉(Leen Stougie)。关于杂交数的指数时间算法的简短说明。CoRR,abs/1312.12552013年。谷歌学者
  13. 利奥·范·埃尔塞尔(Leo van Iersel)、史蒂文·凯尔克(Steven Kelk)、内拉·莱基奇(Nela Lekić)和利恩·斯托吉(Leen Stougie)。非二进制协议森林的近似算法。SIAM离散数学杂志,28(1):49-662014。谷歌学者
  14. 利奥·范·埃尔塞尔和西蒙·林茨。用于计算多棵树的杂交数的二次核。信息处理快报,113(9):318–3232013。谷歌学者
  15. 史蒂文·凯尔克和塞琳·斯科纳瓦卡。从任意非二叉树集合构造最小系统发育网络的固定参数可处理性。CoRR,abs/1207.70342012年。谷歌学者
  16. 李志江。两棵多叉树杂交数的固定参数算法。达尔豪西大学计算机科学学院硕士论文,2015年。谷歌学者
  17. 李志江和泽诺伯特。计算两棵多叉树的软杂交网络的快速算法。手稿正在编写中。谷歌学者
  18. 西蒙·林茨和查尔斯·森普尔。非二叉树的杂交。IEEE/ACM计算生物学和生物信息学汇刊,6(1):30-452009。谷歌学者
  19. 西蒙·林茨和查尔斯·森普尔。用于计算系统发育之间子树距离的聚类缩减。组合数学年鉴,15(3):465–4842011。谷歌学者
  20. V.Rosas-Magallanes、P.Deschavanne、L.Qintana-Murci、R.Brosch、B.Gicguel和O.Neyrolles。毒力操纵子向结核分枝杆菌祖先的水平转移。分子生物学与进化,23(6):1129-11352006。谷歌学者
  21. 海科·施密特。来自大型数据集的系统发生树。德国杜塞尔多夫海因里希-海因大学博士论文,2003年。谷歌学者
  22. 冯石、杰友和冯奇龙。改进的两棵树最大一致森林近似算法。2014年,第8届算法前沿国际研讨会论文集,第205-215页。谷歌学者
  23. 克里斯·惠登(Chris Whidden)。最大协议森林的有效计算及其应用。达尔豪西大学计算机科学学院博士论文,2013年。谷歌学者
  24. 克里斯·惠登(Chris Whidden)、罗伯特·贝科(Robert G.Beiko)和诺伯特·泽(Norbert Zeh)。最大协议林的固定参数算法。SIAM计算机杂志,42(4):1431-14662013。谷歌学者
  25. 克里斯·惠登(Chris Whidden)、罗伯特·贝科(Robert G.Beiko)和诺伯特·泽(Norbert Zeh)。多叉树的最大一致森林的固定参数和近似算法。算法学,74(3):1019-10542016。谷歌学者
  26. 克里斯·惠登和诺伯特·泽。计算O(2^kn)时间内有根二叉树的SPR距离。手稿正在编写中。谷歌学者
  27. 克里斯·惠登(Chris Whidden)、诺伯特·泽(Norbert Zeh)和罗伯特·贝科(Robert G.Beiko)。基于子树修剪和重新嫁接距离的超级树。系统生物学,63(4):566-5812014。谷歌学者
  28. 吴玉凤和王家印。快速计算两个系统发育树的准确杂交数。第六届生物信息学研究与应用国际研讨会论文集,第203-214页。Springer-Verlag,2010年。谷歌学者
问题/备注/反馈
X(X)

Dagstuhl出版社反馈


感谢您的反馈!

已提交反馈

无法发送消息

请稍后再试或发送电子邮件