×

物种树推断的贝叶斯加权三重和四重方法。 (英语) Zbl 1470.92221号

摘要:物种进化史的推断通常由物种树表示,但基因组不同部分的不同进化历史使其复杂化。由于不完全谱系排序(ILS)、基因复制和丢失以及水平基因转移等过程,基因组上的不同位点可能具有不同于基础物种树的历史(以及彼此)。多物种合并是在ILS存在下对物种和基因树进行推理的常用模型。本文介绍了Lily-T和Lily-Q两种新的多物种合并下的物种树推理方法。然后,我们使用模拟和经验数据,将其与两种常用方法SVDQuartets和ASTRAL进行比较。这两种方法通常都比SVDQuartes有所改进,在大多数模拟设置中,Lily-Q优于Lily-T。与ASTRAL的比较更具混合性——当无重组基因座的长度较短、聚合群体参数(θ)较小或内部分支长度较长时,Lily-Q往往优于ASTRAL。

MSC公司:

92D15型 与进化有关的问题
92B10型 数学生物学中的分类学、分支学、统计学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿夫尼,E。;科恩,R。;Snir,S.,加权四分位系统发育学,系统生物学,64,2,233-242(2015)·doi:10.1093/sysbio/syu087
[2] 奇夫曼,J。;Kubatko,L.,《聚结模型下SNP数据的四方推断》,生物信息学,30,23,3317-3324(2014)·doi:10.1093/bioinformatics/btu530
[3] 奇夫曼,J。;Kubatko,L.,具有时间可逆替代过程、特定位置速率变化和不变位置的合并模型下未根物种树拓扑的可识别性,理论生物学杂志,374,1,35-47(2015)·Zbl 1341.92047号 ·doi:10.1016/j.jtbi.2015.03.006
[4] Chou J,Gupta A,Yaduvanshi S,Davidson R,Nute M,Mirarab S,Warnow T(2015)SVD四重奏和其他基于联合的物种树估计方法的比较研究。BMC基因组学16(S2)。doi:10.1186/1471-2164-16-S10-S2
[5] DeGiorgio,M。;Degnan,JH,使用超矩阵根三元组快速一致估计物种树,分子生物学进化,27,3,552-569(2010)·doi:10.1093/molbev/msp250
[6] 德南,JH;Salter,LA,合并过程下的基因树分布,进化,59,1,24-37(2005)·doi:10.1111/j.0014-382.2005.tb00891.x
[7] Drummond,AJ;Rambaut,A.,BEAST:通过采样树进行贝叶斯进化分析,BMC Evol-Biol,7,214,1(2007)·doi:10.1186/1471-2148-7-214
[8] Efron,B.,《Bootstrap方法:又一次折刀》,《Ann Stat》,第7、1、1-26页(1979年)·Zbl 0406.62024号 ·doi:10.1214/aos/1176344552
[9] Gatesy,J。;梅雷迪斯,RW;詹妮卡,JE;西蒙斯,议员;墨菲,WJ;Springer,MS,《级联/合并混乱的解决:哺乳动物的分区合并支持和稳健的家族级树》,分支分类学,33,295-332(2017)·doi:10.1111/cla.12170
[10] Gatesy,J。;Springer,MS,《深层时间尺度的系统发育分析:不可靠的基因树,绕过隐藏支持,以及合并/连接难题》,分子系统发育进化,80,231-266(2014)·doi:10.1016/j.ympev.2014.08.013
[11] Harding,EF,随机分支生成根树形的概率,Adv Appl Probab,3,1,44-77(1971)·Zbl 0241.92012号 ·doi:10.2307/1426329
[12] 霍博思,A。;杜泰尔,JY;霍克斯,J。;Schierup,MH;Mailund,T.,《人类、黑猩猩和猩猩之间不完整的血统分类模式表明了猩猩最近的物种形成和广泛选择》,《基因组研究》,21,349-356(2011)·doi:10.1101/gr.114751.110
[13] Hudson,RR,在Wright-Fisher中性遗传变异模型下生成样本,生物信息学,18,2,337-338(2003)·doi:10.1093/生物信息/18.2.337
[14] WB詹宁斯;爱德华兹,SV,从30个基因树推断出的澳大利亚草雀物种历史,进化,59,9,2033-2047(2005)
[15] 朱克斯,TH;康托,CR,蛋白质分子的进化(1969),纽约:学术出版社,纽约·doi:10.1016/B978-1-4832-3211-9.50009-7
[16] Kingman,JFC,聚结剂,Stoch工艺应用,13,3,235-248(1982)·Zbl 0491.60076号 ·doi:10.1016/0304-4149(82)90011-4
[17] Kopp,A。;Barmina,O.,果蝇物种复合体的进化史,遗传学研究,85,1,23-46(2005)·doi:10.1017/S0016672305007317
[18] Kubatko,LS;卡斯滕斯,不列颠哥伦比亚省;Knowles,LL,STEM:使用合并下基因树的最大似然估计物种树,生物信息学,25,7,971-973(2009)·doi:10.1093/bioinformatics/btp079
[19] Kubatko,LS;Degnan,JH,在合并条件下从串联数据进行系统发育估计的不一致性,系统生物学,56,1,14-24(2007)·网址:10.1080/10635150601146041
[20] 刘,L。;Pearl,DK,《基因树中的物种树:使用估计的基因树分布重建物种系统发育的贝叶斯后验分布》,《系统生物学》,56,3,504-514(2007)·doi:10.1080/10635150701429982
[21] 刘,L。;Yu,L。;Edwards,SV,在合并模型下估算物种树的最大似然方法,BMC Evol-Biol(2010)·doi:10.1186/1471-2148-10-302
[22] Mahim M、Zahin W、Rezwana R、Bayzid MS(2020)wQFM:基于加权四分位的基因组尺度物种树估计的统计一致性。生物Rxiv。https://www.biorxiv.org/content/early/2020/12/01/2020.11.30.403352
[23] 米拉拉布,S。;里兹(Reaz,R.)。;Bayzid,理学硕士;Zimmermann,T。;斯文森,MS;Warnow,T.,ASTRAL:基于基因组尺度合并的物种树估计,生物信息学,30,17,i541-i548(2014)·doi:10.1093/bioinformatics/btu462
[24] 米拉拉布,S。;Warnow,T.,ASTRAL-II:基于聚合的物种树估计,包含数百个分类群和数千个基因,生物信息学,31,12,i44-i52(2015)·doi:10.1093/bioinformatics/btv234
[25] 奥格利维,HA;Bouckaert,RR公司;Drummond,AJ,StarBEAST2带来了更快的物种树推断和准确的替代率估算,《分子生物学进化》,34,8,2101-2114(2017)·doi:10.1093/molbev/msx126
[26] 帕拉迪斯,E。;Schliep,K.,ape 5.0:R中现代系统发育学和进化分析的环境,生物信息学,35526-528(2019)·doi:10.1093/生物信息系统/bty633
[27] Peng J,Swofford D,Kubatko L(2021)多物种联合下物种形成时间的估算(综述)
[28] 价格,MN;Dehal,PS;Arkin,AP,FastTree:使用轮廓而非距离矩阵计算大型最小进化树,分子生物学进化,261641-1650(2009)·doi:10.1093/molbev/msp077
[29] 兰博,A。;Grassly,NC,Seq-Gen:DNA序列沿系统发育树演化的蒙特卡罗模拟应用,Comput-Appl Biosci,13,3,235-238(1997)
[30] Rannala,B。;Yang,Z.,使用来自多个位点的DNA序列对物种分化时间和祖先种群大小的Bayes估计,遗传学,164,4,1645-1656(2003)·doi:10.1093/genetics/164.4.1645
[31] 罗宾逊,DF;Foulds,LR,系统发育树比较,Math Biosci,53,1,131-147(1981)·Zbl 0451.92006号 ·doi:10.1016/0025-5564(81)90043-2
[32] Roch,S。;Steel,M.,基于对齐序列数据集串联的似然树重建在统计上可能不一致,Theor Popul Biol,100c,56-62(2015)·Zbl 1331.92111号 ·doi:10.1016/j.tpb.2014.12.005
[33] Rokas,A。;威廉姆斯,BL;卡罗尔,S.,《解决分子系统发育不一致性的基因组尺度方法》,《自然》,425798-804(2003)·doi:10.1038/nature02053
[34] 罗森博格,NA,《计算合并历史》,《计算生物学杂志》,14,3,360-377(2007)·doi:10.1089/cmb.2006.0109
[35] Salter,L.,大型DNA数据集的似然曲面复杂性,系统生物学,50,6,970-978(2001)·doi:10.1080/106351501753462902
[36] Schliep,KP,Phangorn:R中的系统发育分析,生物信息学,27,4,592-593(2011)·doi:10.1093/bioinformatics/btq706
[37] 塞维利亚,G。;Frenkel,Z。;Snir,S.,TripletMaxCut:一个新的根超树工具包,Methods Ecol Evol,7,11,1359-1365(2016)·doi:10.1111/2041-210X.12606
[38] 施普林格,MS;Gatesy,J.,《深层时间尺度的系统发育分析:不可靠的基因树,绕过隐藏支持,以及合并/连接难题》,分子系统发育进化,94,1-33(2016)·doi:10.1016/j.ympev.2015.07.018
[39] 斯塔德勒,T。;Steel,M.,均匀物种形成模型下分支长度和幽门遗传多样性的分布,J Theor Biol,297,33-40(2011)·Zbl 1336.92056号 ·doi:10.1016/j.jtbi.2011年11月19日
[40] Stamatakis A(2014)RAxML第8版:大型系统发育分析和后期分析工具。生物信息学30(9):1312-1313,01
[41] 钢,M。;Penny,D.,《树木比较度量的分布——一些新结果》,《系统生物学》,42,2,136-141(1993)
[42] Swofford DL(2003)Paup*。使用简约(*和其他方法)的系统发育分析,版本4。Sinauer Associates公司。马萨诸塞州桑德兰
[43] Thawornwattana,Y。;Dalquen,D。;Yang,Z.,系统发育数据的联合分析自信地解决冈比亚按蚊物种复合体中的物种关系,分子生物学进化,35,10,2512-2527(2018)·doi:10.1093/molbev/msy158
[44] Wakeley J(2009)《凝聚理论:导论》。Roberts&Company Publishers,格林伍德村·Zbl 1366.92001号
[45] Wascher,M。;Kubatko,L.,SVD四分体的一致性和基于合并的物种树估计的最大可能性,系统生物学,70,1,33-48(2021)·doi:10.1093/sysbio/syaa039
[46] 温,D。;Nakhleh,L.,从多点序列数据共同估计网状系统发育和基因树,系统生物学,67,1,439-457(2018)·doi:10.1093/sysbio/syx085
[47] Whidden C,Matsen IV FA(2015)量化MCMC对系统发育树空间的探索。系统生物学64(3):472-491
[48] Yang,Z.,《分子进化:统计方法》(2014),纽约:牛津大学出版社,纽约·Zbl 1288.92002号 ·doi:10.1093/acprof:oso/9780199602605.001.0001
[49] Yang,Z.,《物种树估算和物种定界的BPP计划》,Curr Zool,61,5,854-865(2015)·doi:10.1093/czoolo/61.5.854
[50] 杨,Z。;Rannala,B.,《使用DNA序列的贝叶斯系统发育推断:马尔可夫链蒙特卡罗方法》,分子生物学进化,14717-724(1997)·doi:10.1093/oxfordjournals.molbev.a025811
[51] 张,C。;拉比,M。;Sayyari,E。;Mirarab,S.,ASTRAL-III:基于部分解析基因树的多项式时间物种树重建,BMC生物信息学,19,补编6,15-30(2018)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。