×

统计系统发育学中跨位点的速率异质性的概括。 (英语) Zbl 07259255号

概述:系统发育学利用分子序列数据的比对来了解与物种相关的进化树。沿着分支,序列演化是使用以瞬时速率矩阵为特征的连续时间马尔可夫过程建模的。早期的模型假设相同的速率矩阵控制排列所有位置的替换,忽略演化压力的变化。通过使用乘法随机效应来增强这些模型,从而显著改进了系统发育推断和模型拟合,这些模型描述了选择性约束的变化结果,并允许位点以不同的速率进化,从而线性缩放基线速率矩阵,我们考虑使用二次变换而不是线性变换进行扩展。所得到的模型除了考虑选择约束的变化外,还考虑了一个位点上不同类型点突变的选择系数的变化。
我们推导了扩展模型的性质。对于某些非平稳过程,扩展给出了一个允许跨站点和分类群的序列组成变化的模型。我们采用贝叶斯方法,描述了用于后验推理的MCMC算法,并提供了软件。我们的二次模型被应用于跨越生命树的路线,并与现场成因和线性模型进行了比较。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Blanquart,S,Lartillot,N(2006)一种用于建模非平稳和非齐次序列进化的贝叶斯复合随机过程。分子生物学与进化, 23, 2058-71. ·doi:10.1093/molbev/msl091
[2] Blanquart,S,Lartillot,N(2008)氨基酸置换的位置和时间异质模型。分子生物学与进化, 25, 842-58. ·doi:10.1093/molbev/msn018
[3] Bryant,D(2003)《系统发育共识方法的分类》。Bioconsus,DIMACS系列由Janowitz,M,Lapointe,F-J,McMorris,FR,Mirkin,B,Roberts,FS编辑,第163-84页。普罗维登斯,RI:美国数学学会。 ·doi:10.1090/dimacs/061/11
[4] Cavalier-Smith,T(2006),通过过渡分析植根生命之树。生物学指导, 1, 1-83. ·doi:10.1186/1745-6150-1-19
[5] Cherlin,S(2016)使用统计系统发生学研究主要细胞辐射。博士论文,纽卡斯尔大学,英国泰恩河畔纽卡斯尔。
[6] Cherlin,S,Nye,TMW,Heaps,SE,Boys,RJ,Williams,TA,Embley,TM(2018)《研究不可逆性对推断植根系统发育的影响》。分子生物学与进化, 35, 984-1002. ·doi:10.1093/molbev/msx294
[7] Cox,CJ,Foster,PG,Hirt,RP,Harris,SR,Embley,TM(2008)真核生物的古细菌起源。美国国家科学院院刊, 105, 20356-361. ·doi:10.1073/pnas.0810647105
[8] Dutheil,J,Boussau,B(2008)Bio++库和程序套件中序列进化的非同源模型。BMC进化生物学, 28, 255.
[9] Edgar,RC(2004)《肌肉:高精度和高通量的多序列比对》。核酸研究, 32, 1792-97. ·doi:10.1093/nar/gkh340
[10] Embley,TM,Thomas,RH,Williams,RAD(1993)红色热菌16S rDNA序列中嗜热性偏差的降低进一步支持了红色热菌和脱诺克球菌之间的关系。系统与应用微生物学, 16, 25-9. ·doi:10.1016/S0723-2020(11)80247-X
[11] Felsenstein,J(1973)根据离散特征数据估计进化树的最大似然和最小步长方法。系统动物学, 22, 240-49. ·doi:10.2307/2412304
[12] Fitch,WM,Markowitz,E(1970)测定基因密码子变异性的改进方法及其在进化突变固定率中的应用。生物化学遗传学, 4, 579-93. ·doi:10.1007/BF00486096
[13] Foster,PG(2004)《成分异质性建模》。系统生物学,53485-95·doi:10.1080/10635150490445779
[14] Galtier,N(2001)类共价模型下的最大似然系统发育分析。分子生物学与进化, 18, 866-73. ·doi:10.1093/oxfordjournals.molbev.a003868
[15] Galtier,N,Lobry,JR(1997)原核生物基因组G+C含量、RNA二级结构和最佳生长温度之间的关系。分子进化杂志, 44, 632-36. ·doi:10.1007/PL00006186
[16] Gelman,A,Carlin,JB,Stern,HS,Dunson,DB,Vehtari,A,Rubin,DB(2013)贝叶斯数据分析,第三版佛罗里达州博卡拉顿:查普曼和霍尔/CRC。 ·doi:10.1201/b16018
[17] Gogarten,JP,Kibak,H,Dittrich,P,Taiz,L,Bowman,EJ,Bowmen,BJ,Manolson,MF,Poole,RJ,Date,T,Oshima,T(1989)液泡H+-ATPase的进化:真核生物起源的意义。美国国家科学院院刊, 86, 6661-65. ·doi:10.1073/pnas.86.17.6661
[18] Heaps,SE,Nye,TMW,Boys,RJ,Williams,TA,Embley,TM(2014)分子系统发育学中成分异质性的贝叶斯建模。遗传学和分子生物学中的统计应用, 13, 589-609. ·Zbl 1298.92071号 ·doi:10.1515/sagmb-2013-0077
[19] Huelsenbeck,JP(2002)测试dna替代的共价肽模型。分子生物学与进化, 19, 698-707. ·doi:10.1093/oxfordjournals.molbev.a004128
[20] Iwabe,N,Kuma,K,Hasegawa,M,Osawa,S,Miyata,T(1989),根据重复基因的系统发育树推断的古细菌、真核生物和真核生物的进化关系。美国国家科学院院刊, 86, 9355-59. ·doi:10.1073/pnas.86.23.9355
[21] Jayaswal,V,Wong,TKF,Robinson,J,Poladian,L,Jermain,LS(2014)核苷酸序列进化的混合模型,解释了跨位点和跨谱系替代过程的异质性。系统生物学, 63, 726-42. ·doi:10.1093/sysbio/syu036
[22] Kijima,M(1997)随机建模的马尔可夫过程,第1版伦敦:查普曼和霍尔,伦敦·Zbl 0866.60056号 ·doi:10.1007/9781-4899-3132-0
[23] Klopfstein,S,Vilhelmsen,L,Ronquist,F(2015)非平稳马尔可夫模型检测膜翅目形态的方向进化。系统生物学, 64, 1089-1103. ·doi:10.1093/sysbio/syv052
[24] Lake,JA,Skophammer,RG,Herbold,CW,Servin,JA(2009)基因组开端:扎根生命之树。英国皇家学会哲学学报B:生物科学, 364, 2177-85. ·doi:10.1098/rstb.2009.0035
[25] Lartillot,N,Philippe,H(2004)氨基酸替代过程中跨侧异质性的贝叶斯混合模型。分子生物学与进化, 21, 1095-1109. ·doi:10.1093/molbev/msh112
[26] Lartillot,N,Brinkmann,H,Philippe,H(2007)使用位置异质模型抑制动物系统发育中的长枝吸引人工制品。BMC进化生物学, 7, 1-14. ·doi:10.1186/1471-2148-7-S1-S4
[27] Martin,WF,Garg,S,Zimorski,V(2015)真核生物起源的内共生理论。英国皇家学会哲学学报B:生物科学,370个doi:10.1098/rstb.2014.0330·doi:10.1098/rstb.2014.0330
[28] Pagel,M,Meade,A,Crandall,K(2004)用于检测基因序列或特征状态数据中模式异质性的系统发育混合模型。系统生物学, 53, 571-81. ·doi:10.1080/106351150490468675
[29] Philippe,H,Brinkmann,H,Lavrov,DV,Littlewood,DTJ,Manuel,M,rheide,G,Baurain,D(2011)解决复杂的系统发育问题:为什么更多的序列还不够。PLOS生物学, 9, 1-10. ·doi:10.1371/journal.pbio.1000602
[30] Ronquist,F,Huelsenbeck,JP(2003)MRBAYES 3:混合模型下的贝叶斯系统发育推断。生物信息学, 19, 1572-74. ·doi:10.1093/bioinformatics/btg180
[31] Simon,C,Nigro,L,Sullivan,J,Holsinger,K,Martin,A,Grapputo,A,Franke,A,McIntosh,C(1996)12S核糖体RNA基因的替代模式和进化速度存在巨大差异。分子生物学与进化, 13, 923-32. ·doi:10.1093/oxfordjournals.molbev.a025660
[32] Sueoka,N(1988)定向突变压力和中性分子进化。美国国家科学院院刊, 85, 2653-57. ·doi:10.1073/pnas.85.8.2653
[33] Tuffley,C,Steel,M(1998),核苷酸替代的共价假说建模。数学生物科学, 147, 63-91. ·Zbl 0897.92025号 ·doi:10.1016/S0025-5564(97)00081-3
[34] Uzzell,T,Zorbin,KW(1971)将离散概率分布拟合到进化事件。科学类, 172, 1089-96. ·doi:10.1126/science.172.3988.1089
[35] Williams,TA,Foster,PG,Cox,CJ,Embley,TM(2013)真核生物的古老起源只支持生命的两个主要领域。自然, 504, 231-36. ·doi:10.1038/nature12779
[36] Williams,TA,Heaps,SE,Cherlin,S,Nye,TMW,Boys,RJ,Embley,TM(2015),生根系统发育树的新替代模型。英国皇家学会哲学学报B:生物科学,370 doi:10.1098/rstb.2014.0336·doi:10.1098/rstb.2014.0336
[37] Woese,CR,Kandler,O,Wheelis,ML(1990)《朝向生物的自然系统:古生菌、细菌和真核生物领域的提议》。美国国家科学院院刊, 87, 4576-79. ·doi:10.1073/pnas.87.12.4576
[38] Yang,Z(1993)当不同位点的替代率不同时,根据DNA序列进行系统发育的最大似然估计。分子生物学与进化, 10, 1396-1401.
[39] Yang,Z(1994)基于DNA序列的最大似然系统发育估计,不同位点的变化率:近似方法。分子进化杂志, 39, 306-14. ·doi:10.1007/BF00160154
[40] Yang,Z(1996)种群间速率变化及其对系统发育分析的影响。生态与进化趋势, 11, 367-72. ·doi:10.1016/0169-5347(96)10041-0
[41] Yang,Z,Roberts,D(1995)《利用核酸序列推断生命树早期分支的研究》。分子生物学与进化, 12, 451-58.
[42] Zwickl,DJ,Holder,MT(2004)贝叶斯系统发育学中的模型参数化、先验分布和一般时间可逆模型。系统生物学, 53, 877-88. ·doi:10.1080/10635150490522584
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。