×

快速加入邻居。 (英语) Zbl 1161.92041号

摘要:重建一组物种的进化史是生物学中的一个基本问题,解决这个问题的方法基于两个特征:准确性和效率。邻近连接(NJ)是一种所谓的基于距离的方法,由于其良好的准确性和速度,已被系统发育社区所接受。它计算了分类群之间的距离,并在(Theta(n^{3})时间内生成了一棵系统发育树,即旨在描述分类群进化历史的树。除了在实践中表现良好外,NJ算法还有一个最佳重建半径。
本文的贡献是双重的:(1)我们提出了一种具有最佳重建半径和最佳运行时间复杂度(O(n^{2}))的快速邻域连接(FNJ)算法,(2)我们对NJ的正确性给出了一个大大简化的证明。初步实验表明,FNJ在实际应用中具有与NJ几乎相同的精度,表明最佳重建半径的性质对其良好性能至关重要。此外,我们还展示了如何提高计算所谓校正公式的运行时间。

MSC公司:

92D15型 与进化有关的问题
65年20月 数值算法的复杂性和性能
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿加瓦拉,R。;巴夫纳,V。;法拉赫,M。;帕特森,M。;Thorup,M.,《关于数值分类法的近似性(通过树度量拟合距离)》,SICOMP,28,3,1073-1085(1999)·Zbl 1012.65015号
[2] Atteson,K.,《系统发育重建邻接方法的性能》,《算法》,25(1999)·Zbl 0938.68747号
[3] G.S.Brodal,R.Fagerberg,T.Mailund,C.N.Pedersen,D.Phillips,《加快邻接树构建》,技术报告ALCOMFT-TR-03-1022003;G.S.Brodal、R.Fagerberg、T.Mailund、C.N.Pedersen、D.Phillips,《加快邻接树构建》,技术报告ALCOMFT-TR-03-1022003
[4] D.Coppersmith,S.Winograd,《通过算术级数进行矩阵乘法》,收录于:STOC’87,1987年,第1-6页;D.Coppersmith,S.Winograd,《通过算术级数进行矩阵乘法》,收录于:STOC’87,1987年,第1-6页·Zbl 0702.65046号
[5] M.Csürös,《具有数千个节点的进化树的快速恢复》,载于:RECOMB-01,第104-113页,2001年;M.Csürös,《具有数千个节点的进化树的快速恢复》,载于:RECOMB-01,第104-113页,2001年
[6] Desper,R。;Gascuel,O.,基于最小进化原理的快速准确系统发育重建算法,计算生物学杂志,19,5,687-705(2002)·Zbl 1016.68692号
[7] 伊莱亚斯一世。;Lagergren,J.,距离估计器的快速计算,BMC生物信息学,8,89(2007)
[8] 埃利亚斯一世。;Lagergren,J.,《Fast neighbor joining》,(第32届国际自动化、语言和编程学术讨论会论文集。第32届自动化、语言与编程国际学术讨论会文献集,ICALP’05。程序。第32届国际自动化、语言和编程学术讨论会。程序。第32届国际自动化、语言和编程学术讨论会,ICALP’05,计算机科学讲稿,第3580卷(2005年7月),Springer-Verlag,1263-1274·Zbl 1081.92030号
[9] Erdös,P.L。;钢铁,硕士。;洛杉矶斯克利。;Warnow,T.J.,一些日志足以构建(几乎)所有树(I),《随机结构与算法》,第14期,第153-184页(1999年)·兹比尔0945.60004
[10] Gascuel,O.,关于NJ算法及其未加权版本,(UNJ(1997),美国数学学会),149-170·Zbl 0933.92026号
[11] Huson,D.H。;Nettles,S。;Warnow,T.,磁盘覆盖,一种快速收敛的系统发育树重建方法,计算生物学杂志,6,3/4,369-386(1999)
[12] Jukes,T.H。;Cantor,C.R.,蛋白质分子的进化,哺乳动物蛋白质代谢,21-132(1969)
[13] Kimura,M.,通过核苷酸序列的比较研究估算碱基替代进化速率的简单模型,《分子进化杂志》,16,111-120(1980)
[14] Lagergren,J.,《将多项式运行时间与磁盘覆盖方法的快速收敛相结合》,《计算机与系统科学杂志》,65(2002)·Zbl 1059.68158号
[15] R.Mihaescu,D.Levy,L.Pachter,《为什么邻接连接工作》,《算法杂志》(2006),doi:10.1007/s00453-007-9116-4http://www.springerlink.com/content/w3206717365g8m01/R.Mihaescu,D.Levy,L.Pachter,《为什么邻接连接工作》,《算法杂志》(2006),doi:10.1007/s00453-007-9116-4http://www.springerlink.com/content/w3206717365g8m01/ ·Zbl 1187.68683号
[16] 纳赫勒,L。;B.M.E.莫雷特。;圣约翰,K。;Sun,J。;美国罗山。;Warnow,T.,大数据集快速系统发育方法的准确性,(PSB-02(2002)),211-222
[17] A.拉姆鲍特。;Grassly,N.C.,Seq-gen:DNA序列进化沿系统发育树的蒙特卡罗模拟应用,生物科学中的计算机应用,13,235-238(1997)
[18] 塞图,N。;Nei,M.,邻接法:重建系统发育树的新方法,分子生物学与进化,4406-425(1987)
[19] M.Sanderson,r8s软件包。http://ginger.ucdavis.edu/r8s/M.Sanderson,r8s软件包。http://ginger.ucdavis.edu/r8s/
[20] 中国佩德森。;Mailund,T.,Quickjoin快速相邻连接树重建,生物信息学(2004)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。