×

自适应内存编程:用于构建系统发育树的局部搜索并行算法。 (英语) Zbl 1214.92055号

摘要:分子和计算生物学最重要的方面之一是进化关系的重建。经过几十年的深入研究,该地区得到了很好的开发。尽管如此,仍然需要良好而有效的算法,能够在合理的时间内重建进化关系。由于这个问题在计算上很难解决,所以精确算法只适用于少数物种。在最大节俭方法中,当序列数增加时,计算时间增长得如此之快,以至于在实践中,对于仅包含大约20个序列的实例,可以找到最佳解决方案。正是由于这个原因,在实际应用中使用了启发式方法。本文提出了基于最大简约的并行自适应内存编程算法和一些已知的邻域搜索方法来构建系统发育树,并给出了计算实验结果。所提出的算法实现了超线性加速,并找到了高质量的解。

MSC公司:

92D15型 与进化有关的问题
2005年5月 并行数值计算
92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安德烈亚塔(Andreatta,A.A.);里贝罗,C.C.(2005)。系统发育问题的启发式。启发式杂志,86429-447·兹比尔1041.68546
[2] Barker,D.(2004)。LVB:在寻找系统发育树中的简约和模拟退火。生物信息学,20274–275·doi:10.1093/生物信息系统/btg402
[3] Blazewicz,J.、Formanowicz,P.、Kedziora,P.和;Wojciechowski,P.(2004)。进化历史重建的并行算法。计算机科学讲义:第3019卷(1138-1145页)。柏林:斯普林格。
[4] Day,W.H.E.,Jonhson,D.S.和;Sankoff,D.(1986年)。通过简约推断根系统发育的计算复杂性。数学生物科学,81,33–42·Zbl 0607.92002 ·doi:10.1016/0025-5564(86)90161-6
[5] Eck、R.V.和;Dayhoff,M.O.(1966年)。蛋白质序列和结构图谱。在国家生物医学研究基金会。马里兰州:银泉。
[6] 爱德华兹,A.W.F;Cavalli-Sforza,L.L.(1963年)。进化的重建。人类遗传学年鉴,27,105–106。
[7] 爱德华兹,A.W.F;Cavalli-Sforza,L.L.(1964年)。进化树的重建。在V.H.Heywood&J.McNeill(编辑),语音和系统发育分类,系统学协会出版:第6卷(第67-76页),伦敦。
[8] Fayad,M.和;Schmidt,D.(1997)。面向对象的应用程序框架。ACM通信,40,32–38·数字对象标识代码:10.1145/262793.262798
[9] Felsenstein,J.(1989年)。PHYLIP–系统发育推断包(3.2版),分支系统学,5。
[10] Felsenstein,J.(2004年)。推断系统发育。桑德兰:西诺联合公司。
[11] Felsenstein,J.(2005)。PHYLIP(系统发育推断包)3.6版。由作者西雅图华盛顿大学基因组科学系分发。
[12] Fitch,W.M.(1971)。定义进化过程:指定树拓扑的最小变化。系统动物学,20406–416·doi:10.2307/2412116
[13] Foulds,L.R.和;Graham,R.L.(1982)。系统发育史中的斯坦纳问题是NP-完全的。应用数学进展,3,43–49·Zbl 0489.92002号 ·doi:10.1016/S0196-8858(82)80004-3
[14] Goöffon,A.、Richer,J.M.和;郝建凯(2005)。最大简约问题的局部搜索。计算机科学讲义:第3612卷。ICNC’05–第一届自然计算国际会议(第678–683页)。柏林:斯普林格。
[15] Goöffon,A.、Richer,J.M.和;Hao,J.K.(2008)。累进树邻域应用于最大简约问题。IEEE/ACM计算生物学和生物信息学汇刊,5(1)。
[16] Glover,F.(1989)。禁忌搜索,第一部分,ORSA计算杂志,1190–206·兹比尔0753.90054 ·doi:10.1287/ijoc.1.3.190
[17] Glover,F.(1997)。禁忌搜索和自适应内存编程——进展、应用和挑战。巴尔(Barr)、赫尔加森(Helgason)和;Kenington(编辑)《元启发式、优化和随机建模技术进展》(第1-75页)。波士顿:Kluwer学院·兹伯利0882.90111
[18] Goloboff,P.(1999年)。在合理的时间内分析大型数据集:复合优化的解决方案。分支学,15,415–428·doi:10.1111/j.1096-0031.1999.tb00278.x
[19] Gusfield,D.(1997)。字符串、树和序列的算法。剑桥:剑桥大学出版社·Zbl 0934.68103号
[20] 亨迪医学博士;Penny,D.(1982年)。确定最小进化树的分枝定界算法。数学生物科学,59277-290·兹伯利04889.2004 ·doi:10.1016/0025-5564(82)90027-X
[21] Kedziora P.、Blazewicz J.、Formanowicz P.、Figlerowicz M.、Alejska M.、Jackowiak P.和Malinowska N;Fratczak,A.(2005)。慢性丙型肝炎诊断的计算方法。波兰科学院公报。《技术科学》,53273-281。
[22] Lin,Y.、Fang,S.和;Thorne,J.(2007)。最大简约系统发育的禁忌搜索算法。《欧洲运筹学杂志》,1761908-1917年·Zbl 1109.90342号
[23] 勒科夫,M.,&;Pimentel,R.A.(1985年)。数字瓦格纳计算机程序。分支分类学,1,47–66·doi:10.1111/j.1096-0031.1985.tb00410.x
[24] Mladenović,N.,&;Hansen,P.(1997)。可变邻域搜索。计算机与运筹学,241097-1100·Zbl 0889.90119号 ·doi:10.1016/S0305-0548(97)00031-2
[25] Nei,M.和;Kumar,S.(2000年)。分子进化和系统发育。纽约:牛津大学出版社。
[26] Nelesen,S.、Liu,K.、Zhao,D.、Linder,C.R.和;Warnow,T.(2008)。指导树对多重序列比对和随后的系统发育分析的影响。太平洋生物计算研讨会,13,25-36。
[27] 尼克松,K.C.(1999年)。简约棘轮,一种快速简约分析的新方法。分支系统学,15,407–414·doi:10.1111/j.1096-0031.1999.tb00277.x
[28] R开发核心团队(2008)《统计计算的语言和环境》。网址:http://www.R-project.org,R统计计算基础,ISBN 3-900051-07-0。
[29] Roshan,U.、Moret,B.M.E.、Williams,T.L.和;Warnow,T.(2004)。Rec-I-DCM3:一种重建大型系统发育树的快速算法技术。2004年IEEE计算系统生物信息学会议论文集。
[30] 里贝罗,C.C.,&Vianna,D.S.(2005)。使用新的邻域结构对系统发育问题进行GRASP/VND启发式。运筹学国际交易,12325-338·Zbl 1063.92039号 ·doi:10.1111/j.1475-3995.2005.498_1.x
[31] Stoye,J.、Evers,D.和;Meyer,F.(1998)。Rose:生成序列族。生物信息学,14(2),157-163·doi:10.1093/bioinformatics/14.2.157
[32] Setubal,J.和;Meidanis,J.(1997)。计算分子生物学导论。波士顿:PWS出版公司。
[33] Stamatakis,A.(2004年)。基于最大似然法的大型系统发育树推理的分布式并行算法和系统。德国慕尼黑理工大学博士论文。
[34] Taillard,E.D.、Gambardella,L.M.、Gendreau,M.和;Potvin,J.(2001)。自适应内存编程:元启发式的统一视图。欧洲运筹学杂志,135,1-16·Zbl 1051.90032号 ·doi:10.1016/S0377-2217(00)00268-X
[35] Tamura,K.、Dudley,J.、Nei,M.和;Kumar,S.(2007年)。MEGA4:分子进化遗传学分析(MEGA)软件版本4.0。分子生物学与进化,241596-1599·doi:10.1093/molbev/msm092
[36] Viana,G.V.R.,Gomes,F.A.C.,Meneses,C.N.和;Ferreira,C.E.(2009)。系统发育问题的多邻域局部搜索启发式算法的并行化。国际生物信息学研究与应用杂志(IJBRA),5,163-177·Zbl 05737182号 ·doi:10.1504/IJBRA.2009.024034
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。