×

多态性软件系统发育模型的一致性和可识别性。 (英语) Zbl 1429.92109号

摘要:多态性软件系统发育模型(PoMo)是一种从全基因组数据估算物种树的替代方法。PoMo建立在DNA进化的标准替代模型上,但扩展了四个核苷酸碱基的经典字母表,以包括多态性状态。通过这样做,PoMo解释了祖先和当前的种群内变异,同时也适应了支配替代过程的种群级过程(例如遗传漂变、突变、等位基因选择)。PoMo已被证明在一些系统发育应用中是一个有价值的工具,但缺乏统计一致性的证据(可识别性是一致性的必要条件)。这里,我们证明了PoMo是可识别的,并且利用这个结果,我们进一步证明了最大值后部PoMo的(MAP)树估计是物种树的一致估计。我们用模拟数据集来补充我们的理论结果,模拟在表现出不完全谱系排序的自然种群中观察到的多样性。我们在贝叶斯框架中实现了PoMo,并表明MAP树可以很容易地恢复全基因组分析中采样的典型站点数的真树。

MSC公司:

92D15型 与进化有关的问题
92D10型 遗传学和表观遗传学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 奥尔曼,E.S。;阿内,C。;Rhodes,J.A.,《分子进化的马尔科夫模型与γ分布速率的可识别性》,《高级应用》。概率。,40, 01, 229-249 (2008) ·Zbl 1139.60335号
[2] Altshuler,D.L。;杜宾,R.M。;Abecasis,G.R。;Bentley,D.R。;查克拉瓦蒂,A。;克拉克·A·G。;柯林斯,F.S。;De La Vega,F.M。;唐纳利,P。;埃格霍姆,M。;弗利切克,P。;加布里埃尔,S.B。;Gibbs,R.A。;Knoppers,B.M。;兰德,E.S。;Lehrach,H。;Mardis,E.R。;McVean,G.A.,《人口规模测序的人类基因组变异图》,《自然》,467,7319,1061-1073(2010)
[3] Atteson,K.,《系统发育重建邻接方法的性能》,《算法》,25,2-3,251-278(1999)·Zbl 0938.68747号
[4] 贝根,D.J。;Holloway,A.K。;史蒂文斯,K。;Hillier,L.W。;波,Y.-P。;哈恩,M.W。;尼斯塔,P.M。;琼斯,C.D。;科恩,A.D。;杜威,C.N。;Pachter,L。;迈尔斯,E。;Langley,C.H.,《群体基因组学:模拟果蝇多态性和差异性的全基因组分析》,《公共科学图书馆生物学》。,5、11、e310(2007)
[5] 博尔赫斯,R。;Szöllősi,G.J。;Kosiol,C.,使用多态性软件模型量化大猩猩基因组中的GC-biased基因转换,遗传学,212,4,1321-1336(2019)
[6] 布卡特,R。;沃恩,T.G。;巴里多·索塔尼,J。;南卡罗来纳州杜什。;Fourment,M。;Gavryushkina,A。;Heled,J。;琼斯·G。;Kühnert,D。;De Maio,N。;Matschiner,M。;Mendes,F.K。;米勒,N.F。;奥格尔维,H.A。;杜普莱西斯,L。;Popinga,A。;A.拉姆鲍特。;Rasmussen,D.,BEAST 2.5:贝叶斯进化分析的高级软件平台,PLoS Compute。生物,15,4,e1006650(2019)
[7] Chai,J。;Housworth,E.A.,关于Rogers证明GTR+Γ+i模型的可识别性,系统。生物学,60,5713-718(2011)
[8] Chang,J。;Hartigan,J.,从当前物种的成对分布重建进化树,计算科学与统计:第23届界面研讨会论文集,254-257(1991)
[9] Chang,J.T.,进化树上马尔可夫模型的完全重建:可识别性和一致性,数学。生物科学。,137, 1, 51-73 (1996) ·Zbl 1059.92504号
[10] De Maio,N。;Schlötterer,C.公司。;Kosiol,C.,《使用多态性软件系统发育模型将类人猿基因组进化跨时间尺度联系起来》,《分子生物学》。演变。,30, 10, 2249-2262 (2013)
[11] De Maio,N。;施雷姆普夫,D。;Kosiol,C.,PoMo:基于等位基因频率的物种树估计方法,系统。生物学,641018-1031(2015)
[12] Durrett,R.,《DNA序列进化的概率模型、概率及其应用》(2008),纽约州施普林格:纽约市施普林格·Zbl 1311.92007年
[13] Felsenstein,J.,从离散特征数据估计进化树的最大似然和最小步长方法,系统。生物学,22,3240-249(1973)
[14] Felsenstein,J.,《节俭或兼容方法会产生积极误导的案例》,系统。生物学,27,4,401-410(1978)
[15] Hall,B.,《李群、李代数和表示:一个基本介绍》(2015),施普林格国际出版公司:施普林格瑞士国际出版公司·Zbl 1316.22001年
[16] Höhna,S。;兰迪斯,M.J。;Heath,T.A。;布索,B。;Lartillot,N。;B.R.摩尔。;Huelsenbeck,J.P。;Ronquist,F.,RevBayes:使用图形模型和交互式模型特定语言Syst的Bayesian系统发育推断。生物学,65,4726-736(2016)
[17] Jukes,T。;Cantor,C.,蛋白质分子的进化,哺乳动物蛋白质代谢,21-132(1969),Elsevier
[18] Kimura,M.,《通过核苷酸序列比较研究估算碱基替代进化速率的简单方法》,J.Mol.Evol。,16, 2, 111-120 (1980)
[19] 莱克,J.B。;卡登诺,C.M。;克雷珀,M.W。;泰勒,W。;Corbett-Detig,R.B。;史蒂文斯,K.A。;兰利,C.H。;Pool,J.E.,《果蝇基因组关联:623个果蝇基因组的种群基因组资源,包括来自单一祖先范围种群的197个,遗传学》,199,4,1229-1241(2015)
[20] 利奇,A.D。;Oaks,J.R.,《单核苷酸多态性(SNP)数据在系统发育学中的应用》,年。经济评论。进化。系统。,48, 1, 69-84 (2017)
[21] 龙,Q。;拉巴纳尔,F.A。;孟,D。;Huber,医学博士。;Farlow,A。;Platzer,A。;张,Q。;维尔姆松,B.J。;科特,A。;Nizhynska,V。;沃罗宁,V。;科特,P。;塞德曼,L。;Mandáková,T。;Lysak,医学硕士。;塞伦大学。;赫尔曼,I。;Nordborg,M.,《瑞典拟南芥品系的大规模基因组变异和强选择》,《自然遗传学》。,45, 8, 884-890 (2013)
[22] Maddison,W.P。;Knowles,L.L.,尽管谱系分类不完整,但推断系统发育,系统。生物学,55,1,21-30(2006)
[23] 米拉拉布,S。;Bayzid,M.S。;布索,B。;Warnow,T.,《统计装箱能够对鸟类树进行基于合并的准确估计》,《科学》,346,6215,1250463(2014)
[24] Moran,P.,遗传学中的随机过程,数学。程序。剑桥菲洛斯。Soc.,54,01,60(1958年)·Zbl 0091.15701号
[25] Pagel,M.,《推断生物进化的历史模式》,《自然》,401,6756,877-884(1999)
[26] Prado-Martinez,J。;苏曼特,P.H。;基德·J·M。;李,H。;Kelley,J.L。;Lorente-Galdos,B。;Veeramah,K.R。;沃纳,A.E。;T·D·奥康纳。;桑佩雷,G。;卡根,A。;Theunert,C。;卡萨尔斯,F。;阿尤尼,H。;Munch,K。;霍博思,A。;Halager,A.E。;Malig,M.,《大猩猩遗传多样性和种群历史》,《自然》,499,7459,471-475(2013)
[27] 罗杰斯,J。;Raveendran,M。;哈里斯,R.A。;梅隆,T。;Leppälä,K。;阿萨纳西亚迪斯,G。;Schierup,M.H。;Cheng,J。;Munch,K。;沃克,J.A。;Konkel,M.K。;乔丹,V。;斯蒂利,C.J。;贝克斯特罗姆,T.O。;C.Bergey。;Burrell,A。;施雷姆普夫,D。;诺尔,A。;Kothe,M.,《狒狒的比较基因组学和复杂种群历史》,科学。高级,5,1,eaau6947(2019)
[28] Rogers,J.S.,当替代率根据恒定位点和伽马分布变化时,系统发育树的最大似然估计是一致的,Syst。《生物学》,50,5713-722(2001)
[29] 施雷姆普夫,D。;Hobolth,A.,低突变率的多元中性wright-fisher模型平稳分布的另一种推导,以期从站点频率数据估计突变率,Theor。大众。生物学,11488-94(2017)·Zbl 1369.92075号
[30] 施雷姆普夫,D。;Minh,B.Q。;De Maio,N。;von Haeseler,A。;Kosiol,C.,可逆多态性软件系统发育模型及其在树推断中的应用,J.Theor。生物,407362-370(2016)·Zbl 1344.92117号
[31] Steel,M.,从马尔可夫模型下生成的树叶颜色中恢复树木,应用。数学。莱特。,7, 2, 19-23 (1994) ·Zbl 0794.60071号
[32] Steel,M.,已解析系统发育树的贝叶斯推断的一致性,J.Theor。《生物学》,336246-249(2013)·Zbl 1411.92223号
[33] 钢,M。;亨迪,医学博士。;Penny,D.,从核苷酸模式概率重建系统发育:一项调查和一些新结果,离散应用。数学。,88, 1-3, 367-396 (1998) ·兹伯利0940.92018
[34] Szöllsi,G.J。;Tannier,E。;道宾,V。;Boussau,B.,基因树与物种树的推理,系统。生物学,64,1,e42-e62(2015)
[35] 田岛,F。;Nei,M.,核苷酸序列之间进化距离的估计,分子生物学。演变。,1869-285年1月3日(1984年)
[36] Tavaré,S.,DNA序列分析中的一些概率和统计问题,Lect。数学。生命科学。,17, 2, 57-86 (1986) ·Zbl 0587.92015号
[37] Wald,A.,《关于最大似然估计一致性的注释》,Ann.Math。Stat.,20,4,595-601(1949)·Zbl 0034.22902号
[38] 吴杰。;Susko,E.,Rate-variation不需要通过两两序列比较来推翻系统发育推断,J.Theor。《生物学》,263,4587-589(2010)·Zbl 1406.92445号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。