×

从合并下未展开的基因树的分布中识别有根物种树。 (英文) Zbl 1230.92033号

摘要:基因树是代表从多个群体中取样的基因祖先的进化树。物种树代表个体的种群,每个个体都有许多基因,分裂成新的种群或物种。合并过程是对种群内基因拷贝的祖先进行建模的过程,通常用于对给定一个固定物种树的基因树的概率分布进行建模。这种多物种合并模型为系统发育学家提供了一个框架,以便使用最大似然或贝叶斯方法从基因树推断物种树。因为合并模型是一个随时间变化的分支过程,所以通常假设所有树都在此设置中生根。然而,通过传统的系统发育方法推断出的基因树往往没有根。
我们研究了多物种合并模型下无根基因树的概率。我们表明,当有四个物种每个物种采样一个基因时,未生根基因树拓扑的分布确定了未生根物种树拓扑以及物种树边缘(分支长度)中的一些但不是全部信息。在这种情况下,无法识别物种树上的根位置。然而,对于每个物种采样一个基因的5个或更多物种,我们表明未生根基因树拓扑的分布确定了生根物种树拓扑及其所有内部分支长度。对于任何从中采样了一个以上基因的物种,通往物种树叶子的任何垂枝的长度也是可以识别的。

MSC公司:

92D15型 与进化有关的问题
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Allman ES,Rhodes JA(2003)序列突变的一般马尔可夫模型的系统发育不变量。数学生物科学186:113–144·Zbl 1031.92019 ·doi:10.1016/j.mbs.2003.08.004
[2] Allman ES,Rhodes JA(2006)系统发育模型的树拓扑的可识别性,包括covarion和混合模型。计算机生物学杂志13(5):1101–1113·doi:10.1089/cmb.2006.13101
[3] Allman ES,Rhodes JA(2008)确定具有不变位点的一般马尔可夫模型的进化树和替代参数。数学生物科学211(1):18–33·Zbl 1130.92039号 ·doi:10.1016/j.mbs.2007.09.001
[4] Allman ES,Rhodes JA(2009)共价子模型在系统发育学中的可识别性。IEEE/ACM Trans-Comput生物信息学6:76–88。http://doi.ieecomputersociety.org/10.109/TCBB.2008.52
[5] Allman ES,Holder MT,Rhodes JA(2010a)从过滤数据估算树木:形态系统发育模型的可识别性。《Theor生物学杂志》263:108–119·doi:10.1016/j.jtbi.2009.12.001
[6] Allman ES,PetrovićS,Rhodes JA,Sullivant S(2010b)基于组的模型的2-树混合物的可识别性。IEEE/ACM Trans-Comput生物信息学(第1-13页,待发布)
[7] Bandelt HJ,Dress A(1986)根据观测到的不同数据重建树的形状。高级应用数学7:209–343·Zbl 0613.62083号 ·doi:10.1016/0196-8858(86)90038-2
[8] Carstens B,Knowles LL(2007),尽管谱系分类不完整,但从基因树概率估算物种系统发育:以黑腹滨蝗为例。系统生物56:400–411·doi:10.1080/10635150701405560
[9] Cavender JA,Felsenstein J(1987)离散状态下简单情况下的系统发育不变量。J类4:57–71·Zbl 0612.62142号 ·doi:10.1007/BF01890075
[10] Cayley A(1857)关于称为树的分析形式的理论。菲尔·麦格13:172–176
[11] Cranston KA,Hurwitz B,Ware D,Stein L,Wing RA(2009)从水稻中高度不一致的基因树中选择树木。系统生物学58:489–500·doi:10.1093/sysbio/syp054
[12] Degnan JH(2010)给定物种树的种内抽样的基因树拓扑概率。收录:Knowles LL,Kubatko LS(eds)《物种树估算:实践和理论方面》。威利-布拉克韦尔。国际标准图书编号:978-0-470-52685-9
[13] Degnan JH,Rosenberg NA(2006)物种树与其最可能的基因树的不一致。公共科学图书馆遗传学2:762–768·doi:10.1371/journal.pgen.0020068
[14] Degnan JH,Rosenberg NA(2009)基因树不一致,系统发育推断和多物种合并。经济发展趋势24:332–340·doi:10.1016/星期三.2009.01.009
[15] Degnan JH,Salter LA(2005)合流过程下的基因树分布。进化59:24–37
[16] Degnan JH,DeGiorgio M,Bryant D,Rosenberg NA(2009)从基因树推断物种树的共识方法的特性。系统生物学58:35–54·doi:10.1093/sysbio/syp008
[17] Felsenstein J(1981)DNA序列进化树:最大似然方法。分子进化杂志17:368–376·doi:10.1007/BF01734359
[18] Felsenstein J(2004)推断系统发育。桑德兰Sinauer Associates
[19] Graham SW、Olmstead RG、Barrett SCH(2002)《具有遥远外群的系统发育树的生根:来自共线单子叶植物的案例研究》。分子生物学进化19:1769–1781·doi:10.1093/oxfordjournals.molbev.a003999
[20] Greuel GM,Pfister G,Schönemann H(2009)奇异3.1.0–用于多项式计算的计算机代数系统。http://www.singular.uni-kl.de
[21] Heled J,Drummond AJ(2010)从多焦点数据对物种树的贝叶斯推断。分子生物学进化27:570–580·doi:10.1093/molbev/msp274
[22] Hudson RR(1983)用蛋白质序列数据测试恒速中性等位基因模型。进化37:203–217·doi:10.2307/2408186
[23] Huelsenbeck JP,Bollback JP,Levine AM(2002)《推断系统发育树的根》。系统生物学51:32–43·doi:10.1080/106351502753475862
[24] Jennings WB,Edwards SV(2005),从30个基因树推断出的澳大利亚草雀物种历史。进化59:2033–2047
[25] Kim J,Rohlf FJ,Sokal RR(1993)使用邻接法进行系统发育估计的准确性。进化47:471–486·doi:10.307/2410065
[26] Kingman JFC(1982)关于大种群的系谱。应用概率杂志19A:27–43·doi:10.2307/3213548
[27] Kubatko LS,Carstens BC,Knowles LL(2009)STEM:使用合并下基因树的最大似然进行物种树估计。生物信息学25:971–973·doi:10.1093/bioinformatics/btp079
[28] Lake JA(1987)核酸序列分析的速率无关技术:进化简约性。分子生物学进化4:167–191
[29] Liu L,Pearl DK(2007)《基因树中的物种树:使用估计的基因树分布重建物种系统发育的贝叶斯后验分布》。系统生物学56:504–514·doi:10.1080/10635150701429982
[30] Liu L,Yu L,Pearl DK(2010)最大树:物种树的一致性估计。数学生物学杂志60:95–106·Zbl 1311.92138号 ·doi:10.1007/s00285-009-0260-0
[31] Maddison WP,Knowles LL(2006),尽管谱系分类不完整,但仍推断系统发育。系统生物学55:21–30·网址:10.1080/10635150500354928
[32] Mossel E,Roch S(2010)不完全谱系分类:从多个位点进行一致的系统发育评估。IEEE Comp生物信息学7:166–171·doi:10.1109/TCBB.2008.66
[33] Nei M(1987)分子进化遗传学。纽约哥伦比亚大学出版社
[34] Nordborg M(2001)凝聚理论。收录:Balding DJ,Bishop M,Cannings C(编辑)统计遗传学手册,第1版,第7章。纽约威利,第179-212页
[35] Pamilo P,Nei M(1988)基因树和物种树之间的关系。分子生物学进化5:568–583
[36] Poe S,Chubb AL(2004)《灌木丛中的鸟类:五个基因表明鸟类目具有爆炸性辐射。进化58:404–415
[37] Rokas A、Williams B、King N、Carroll S(2003)解决分子系统发育不一致的基因组尺度方法。自然425:798–804·doi:10.1038/nature02053
[38] Rosenberg NA(2002)基因树和物种树拓扑一致的概率。Theor Popul生物学61:225–247·Zbl 1040.92032号 ·doi:10.1006/tpbi.2001.1568
[39] Rosenberg NA(2007)计算合并历史。《计算机生物学杂志》14:360–377·doi:10.1089/cmb.2006.0109
[40] Saitou N,Nei M(1987)邻接法:重建系统发育树的新方法。分子生物学进化4:406–425
[41] Semple C,Steel M(2003)《系统发育学》。牛津大学出版社
[42] Slatkin M,Pollack JL(2008),祖先物种的细分在基因树中造成不对称。分子生物学进化25:2241–2246·doi:10.1093/molbev/msn172
[43] Steel M(1992)从定性特征和子树重建树的复杂性。J类9:91–116·Zbl 0766.9202号 ·doi:10.1007/BF02618470文件
[44] Strimmer K,von Haeseler A(1996)《令人困惑的四重奏:重建树拓扑的四重唱最大似然方法》。分子生物学进化13:964–969·doi:10.1093/oxfordjournals.molbev.a025664
[45] Tajima F(1983)有限种群中DNA序列的进化关系。遗传学105:437–460
[46] Takahata N(1989)三个相关种群的基因谱系:基因树和种群树之间的一致性概率。遗传学122:957–966
[47] TavaréS(1984)线性和系谱过程及其在种群遗传模型中的应用。Theor Popul生物学26:119–164·Zbl 0555.92011号 ·doi:10.1016/0040-5809(84)90027-3
[48] Wakeley J(2008)《凝聚理论》。Roberts&Greenwood Village公司
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。