埃伦·乌尔海姆;埃里克·福特;凯瑟琳·圣约翰 表征局部最优以实现最大节约型。 (英语) Zbl 1348.92116号 牛市。数学。生物。 78,第5期,1058-1075(2016)。 摘要:在最大简约最优性准则下找到最佳系统发育树是很难计算的。对于性能良好的数据集,我们量化了此类优化的发生。当使用最近邻交换操作时,即使对于“完美”序列数据,也可能出现多个局部最优,这导致爬山搜索永远不会达到全局最优。相反,我们表明,当通过子树剪枝和再嫁接度量定义邻居时,对于完美序列数据,存在单个局部最优,因此,每种搜索都会快速找到全局最优。我们进一步描述了在Cavender-Farris-Neyman和Jukes-Cantor进化模型下模拟的序列产生良好搜索空间的条件。 引用于1文件 MSC公司: 92D15型 与进化有关的问题 关键词:最大节俭;兼容性;系统发育岛;吸引盆地;树搜索 软件:PAUP公司*;TNT公司;RAxML公司 PDF格式BibTeX公司 XML格式引用 \textit{E.Urheim}等人,公牛。数学。生物学78,No.5,1058--1075(2016;Zbl 1348.92116) 全文: 内政部 参考文献: [1] Allen BL,Steel M(2001)进化树上的子树转移操作及其诱导度量。安·库姆5(1):1-15·Zbl 0978.05023号 ·doi:10.1007/s00026-001-8006-8 [2] Atteson K(1999)系统发育重建邻接方法的性能。算法25:251-278·Zbl 0938.68747号 ·doi:10.1007/PL00008277 [3] Bastert O,Rockmore D,Stadler PF,Tinhofer G(2002)《树木空间景观》。应用数学计算131(2-3):439-459·Zbl 1016.92024号 [4] Bordewich M,Gascuel O,Huber KT,Moulton V(2009)基于系统发育推断的平衡最小进化原则的拓扑运动一致性。IEEE/ACM Trans-Comput Biol Bioninform(TCBB)6(1):110-117·doi:10.1109/TCBB.2008.37 [5] Caceres AJJ、Castillo J、Jinnie J、St John K(2013)《SPR社区漫步》。IEEE/ACM Trans-Comput Biol生物信息10(1):236-239·doi:10.1109/TCBB.2012.136 [6] Cartwright RA(2005)带缺口的DNA组装(Dawg):模拟序列进化。生物信息学21(补充3):iii31-iii38·doi:10.1093/bioinformatics/bti1200 [7] Cavender JA(1978)《分类与信心》。数学生物科学40(3):271-280·Zbl 0391.92015号 ·doi:10.1016/0025-5564(78)90089-5 [8] Charleston MA(1995)关于组合优化问题的景观特征描述,特别关注系统发育问题。计算机生物学杂志2(3):439-450·doi:10.1089/cmb.1995.2.439 [9] Chen S,Montgomery J,Bolufé-Röhler A,Gonzalez-Fernandez Y(2015)特邀论文:阈值收敛综述。GECONTEC国际经济与技术修订3(1):1-13 [10] Cormen TH,Leiserson CE,Rivest RL,Stein C(2001)算法导论,第2版。麻省理工学院出版社,剑桥·Zbl 1047.68161号 [11] Dress A,Krüger M(1987)度量空间中的简约系统发育树和模拟退火。高级应用数学8(1):8-37·兹比尔0637.92024 ·doi:10.1016/0196-8858(87)90003-0 [12] Farach M,Kannan S(1999)反向进化的有效算法。JACM 46(4):437-449·Zbl 1065.68662号 ·doi:10.1145/320211.320212 [13] Farris JS(1970)计算瓦格纳树的方法。系统Zool 19:83-92·doi:10.307/24121028 [14] Farris JS(1973)推断进化树的概率模型。系统生物学22(3):250-256·doi:10.1093/sysbio/22.3.250 [15] Fitch WM(1971)《定义进化过程:特定树拓扑的最小变化》。系统Zool 20(4):406-416·doi:10.2307/2412116 [16] Fitch WM、Margoliash E等人(1967)构建系统发育树。科学155(760):279-284·doi:10.1126/science.155.3760.279 [17] Foulds LR,Graham RL(1982)系统发育中的Steiner问题是NP-完全的。高级应用数学3(1):43-49·Zbl 0489.92002号 ·doi:10.1016/S0196-8858(82)80004-3 [18] Garnier J,Kallel L(2001)多局部最优的局部搜索效率。SIAM J离散数学15(1):122-141·Zbl 0992.68039号 ·doi:10.1137/S0895480199355225 [19] Goloboff PA,Farris JS,Nixon KC(2008)TNT,一个免费的系统发育分析程序。分支分类学24(5):774-786·doi:10.1111/j.1096-0031.2008.00217.x [20] Hein J(1990)使用简约性重建重组序列的进化。数学生物科学98(2):185-200·Zbl 0692.92014号 ·doi:10.1016/0025-5564(90)90123-G [21] Hendy MD,Foulds LR,Penny D(1980)用l-聚类和集合划分证明系统发育树最小。数学生物科学51(1):71-88·Zbl 0443.92007号 ·doi:10.1016/0025-5564(80)90091-7 [22] Hendy MD,Penny D(1982)确定最小进化树的分支定界算法。数学生物学59(2):277-290·Zbl 0488.92004号 ·doi:10.1016/0025-5564(82)90027-X [23] Hillis DM、Mable BK、Moritz C(1996)《分子系统学》。桑德兰Sinauer Associates [24] Jukes TH、Cantor CR、Munro HN(1969)《哺乳动物蛋白质代谢》。Evol蛋白分子量3:21-132 [25] Kirkup B,Kim J(2003)《从起伏的山丘到锯齿状的山丘:用于系统发育评估的启发式搜索的缩放》。Mol Biol Evol(修订版) [26] 李明,特隆普J,张磊(1996)关于最近邻互通式立交距离的几点注记。摘自:COCOON’96:第二届计算与组合学国际年会会议记录。伦敦施普林格,第343-351页 [27] Maddison DR(1991)发现了多个最节俭的树木岛及其重要性。系统Zool 40(3):315-328·doi:10.2307/2992325 [28] Money D,Whelan S(2012)描述系统发育树搜索问题。系统生物学61(2):228-239·doi:10.1093/sysbio/syr097 [29] Moulton V,Steel M(1999)有限距离函数对树度量的收缩。离散应用数学91(1):215-233·Zbl 0914.05016号 ·doi:10.1016/S0166-218X(98)00128-0 [30] 内曼,J。;Gupta,SS(编辑);Yackeleds,J.(编辑),《进化的分子研究:新统计问题的来源》,1-27(1971),纽约·兹比尔0231.62010 [31] 尼克松KC(1999)简约棘轮法,一种快速简约分析的新方法。分支分类学15(4):407-414·doi:10.1111/j.1096-0031.1999.tb00277.x [32] Robinson DF(1971)标记树与配价三的比较。梳理论期刊B 11(2):105-119·Zbl 0185.27704号 ·doi:10.1016/0095-8956(71)90020-7 [33] Rokas A、Williams BL、King N、Carroll SB(2003)解决分子系统发育不一致的基因组尺度方法。自然425:798-804·doi:10.1038/nature02053 [34] Saitou N,Nei M(1987)邻接法:重建系统发育树的新方法。分子生物学进化4:406-425 [35] Semple C,Steel M(2003)《系统发育学》。牛津数学及其应用系列讲座,第24卷。牛津大学出版社·Zbl 1043.92026 [36] Stamatakis A,Blagojevic F,Antonopoulos CD,Nikolopoulos DS(2007)探索系统发育学的新搜索算法和硬件:RAxML与IBM细胞相遇。J VLSI信号处理系统48(3):271-286·doi:10.1007/s11265-007-0067-4 [37] Steel MA(1994)系统发育树的最大似然点并不是唯一的。系统生物学43(4):560-564·doi:10.1093/sysbio/43.4.560 [38] Swofford DL(2002)PAUP*。使用简约(*和其他方法)进行系统发育分析。版本4。Sinauer Associates,桑德兰 [39] Varón A,Vinh LS,Wheeler WC(2010)POY第4版:使用动态同源性进行系统发育分析。分支分类学26(1):72-85·网址:10.1111/j.1096-0031.2009.00282.x [40] Wheeler WC(2012)《系统学:讲座课程》。Wiley-Blackwell,纽约·数字对象标识代码:10.1002/9781118301081 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。