×

根系统发育的非平稳链对称模型的完全重建。 (英语) Zbl 1370.92106号

摘要:了解物种之间的进化关系对生物科学具有根本重要性。根在任何系统发育树中的位置都是至关重要的,因为它为进化事件提供了顺序。目前在似然法或贝叶斯法中使用的流行核苷酸进化模型都无法在没有外源信息的情况下推断出根的位置。众所周知,最通用的核苷酸替代马尔可夫模型也无法识别根的位置,或适用于少于三个序列的多序列比对。我们证明,对于一个具有两个或多个序列的多序列比对的非平稳、股对称替代模型,可以识别根位置和完整模型,并在统计上一致估计其位置。我们还总结了早期的工作,以提供一种实用的方法来克服在系统发育模型中标记隐藏状态的计算难题。

MSC公司:

92D15型 与进化有关的问题
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴里·D·。;Hartigan,J.,《类人分子进化的统计分析》,《统计科学》。,2, 191-207 (1987) ·Zbl 0639.92010号
[2] 巴里·D·。;Hartigan,J.A.,同源DNA序列之间的异步距离,生物统计学,43,261-276(1987)·Zbl 0622.92012号
[4] Bulmer,M.,(β)-珠蛋白区域突变率的链对称性,J.Mol.Evol。,33, 305-310 (1991)
[6] 卡萨内拉斯,M。;Sullivant,S.,链对称模型,(Pachter,L.;Sturmfels,B.,计算生物学代数统计,第13卷(2005),剑桥大学出版社:剑桥大学出版社,英国剑桥),305-321·Zbl 1374.60139号
[7] Cavender,J.A。;Felsenstein,J.,离散状态下简单情况下的系统发育不变量,J.Classif。,4, 57-71 (1987) ·Zbl 0612.62142号
[8] Chang,J.T.,关于进化树可生存性和一致性的马尔可夫模型的完全重建,数学。生物科学。,137, 51-73 (1996) ·Zbl 1059.92504号
[9] Drummond,A.J。;Rambaut,A.,《野兽:采样树的贝叶斯进化分析》,BMC Evol。生物学,7,1(2007)
[10] Faith,D.P。;Baker,A.M.,《系统发育多样性(PD)和生物多样性保护——一些生物信息学挑战》,Evol。生物信息。,2 (2006)
[12] Francino,M.P。;Ochman,H.,灵长类动物复制的β-珠蛋白起源周围的链对称性,分子生物学。演变。,17, 416-422 (2000)
[13] González-Candelas,F。;Bracho,医学硕士。;Wróbel,B。;Moya,A.,《来自进化源的大规模丙型肝炎病毒暴发的法庭分析中的分子进化》,BMC Biol。,11, 76 (2013)
[14] Higham,N.J.,《矩阵的函数、理论和计算》(2008),SIAM:美国费城SIAM·Zbl 1167.15001号
[15] Huelsenbeck,J.P。;Bollback,J.P。;莱文,A.M.,推断系统发育树的根,系统。《生物学》,51,32-43(2002)
[16] 贾维斯,P.D。;Sumner,J.G.,链对称系统发育替代模型中的矩阵群结构和马尔可夫不变量,J.Math。生物学,73,259-282(2016)·Zbl 1343.92352号
[17] 贾亚斯瓦尔。;Ababneh,F。;杰米因,L.S。;Robinson,J.,降低一般马尔可夫进化模型的模型复杂性,分子生物学。演变。,28, 3045-3059 (2011)
[18] 贾亚斯瓦尔。;Wong,T.K。;罗宾逊,J。;Poladian,L。;Jermin,L.S.,核苷酸序列进化的混合模型,解释了跨位点和跨谱系的替代过程中的异质性,Syst。《生物学》,63,726-742(2014)
[19] 杰米因,L.S。;贾亚斯瓦尔。;Ababneh,F。;Robinson,J.,系统发育模型评估,生物信息学:数据序列。分析。演变。,331-364 (2008)
[20] 凯勒,B.D。;Yap,V.B。;张,R。;Huttley,G.A.,一般非平稳马尔可夫替代过程的遗传距离,系统。生物学,64,281-293(2015)
[21] 奈特·R。;麦克斯韦,P。;伯明翰,A。;Carnes,J。;Caporaso,J.G。;伊斯顿,不列颠哥伦比亚省。;伊顿,M。;哈马迪,M。;Lindsay,H。;刘,Z。;Lozupone,C。;麦克唐纳。;Robeson,M。;萨穆特·R。;斯密特,S。;韦克菲尔德,M.J。;维德曼,J。;Wikman,S。;Wilson,S。;Ying,H。;Huttley,G.A.,《从序列中获得意义的PyCogenta工具箱》,《基因组生物学》。,8,R171(2007)
[23] Lobry,J.,非随机条件下DNA进化的一般模型的性质,J.Mol.Evol。,40, 326-330 (1995)
[24] Lobry,J。;Lobry,C.,《当取代率不恒定时,非随机偏倚条件下DNA碱基组成的演变》,分子生物学。Evol.公司。,16, 719-723 (1999)
[25] 莫塞尔,E。;Roch,S.,《学习非奇异系统发育和隐马尔可夫模型》,Ann.Appl。概率。,16, 583-614 (2006) ·Zbl 1137.60034号
[26] 墨菲,W.J。;普林格尔,T.H。;克里德,T.A。;斯普林格,M.S。;Miller,W.,《利用基因组数据揭示胎盘哺乳动物系统发育的根源》,《基因组研究》,17,413-421(2007)
[27] Nickle,D.C。;Jensen,医学硕士。;Gottlieb,G.S。;Shriner,D。;学习,G.H。;罗德里戈,A.G。;Mullins,J.I.,《共识和祖传状态艾滋病毒疫苗》,《科学》,2991515-1518(2003)
[28] 波德西亚德洛,L。;Polz-Daewicz,M.,《临床研究中的分子进化和系统发育影响》,《农业年鉴》。环境。医学,20(2013)
[29] Posada,D.,jModelTest系统发育模型平均,分子生物学。演变。,25, 1253-1256 (2008)
[30] 塞内塔,E.,非负矩阵和马尔可夫链(2006),斯普林格科学;商业媒体:Springer Science;美国纽约商业媒体·Zbl 1099.60004号
[31] Squartini,F。;Arndt,P.F.,量化核苷酸替代过程的平稳性和时间可逆性,分子生物学。演变。,25, 2525-2535 (2008)
[32] Touchon,M。;Rocha,E.P.,《从GC倾斜到小波是基因组数据中成分不对称分析的温和指南》,《生物化学》,90,648-659(2008)
[33] Wu,C.I。;Maeda,N.,《两股DNA突变率的不平等》,《自然》,327169-170(1987)
[34] 杨,Z。;Roberts,D.,《利用核酸序列推断生命树早期分支》,《分子生物学》。演变。,12, 451-458 (1995)
[35] 雅普,V.B。;Pachter,L.,《啮齿动物基因组中进化热点的识别》,《基因组研究》,第14期,第574-579页(2004年)
[36] Yap,V.B。;Speed,T.,用不可逆替代模型建立系统发育树,BMC Evol。生物学,5,2(2005)
[37] 邹,L。;Susko,E。;菲尔德,C。;Roger,A.J.,Barry和Hartigan一般马尔可夫模型的参数在统计上是不可识别的,系统。生物学,60,872-875(2011)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。