×

利用log-det距离从基因组序列推断物种树。 (英文) Zbl 1415.92127号

摘要:在简单的非混合序列进化模型下,引入两个对齐DNA序列之间的对数集距离作为基因树统计一致性推断的工具。在这里,我们证明了对数集距离,再加上基于距离的树构建方法,还允许在适合于对齐基因组尺度序列数据的混合模型下对物种树进行一致推断。数据可能包括来自许多遗传位点的位点,这些位点在不同的基因树上进化,这是由于超长物种树上不完全的谱系排序,具有不同的时间可逆替换过程。基于距离的推理的简单性和速度表明,基于对数集的方法应作为判断更精细和计算密集的物种树推理方法的基准。

MSC公司:

92D15型 与进化有关的问题
92D20型 蛋白质序列,DNA序列
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] E.S.Allman、J.H.Degnan和J.A.Rhodes,{利用STAR方法进行物种树推断,以及推广},J.Compute。《生物学》,20(2013),第50-61页。
[2] E.S.Allman、J.H.Degnan和J.A.Rhodes,{通过无根STAR方法从基因分裂推断物种树},IEEE/ACM Trans。计算。生物信息。,15(2018年),第337-342页。
[3] M.Bayzid、S.Mirarab、B.Boussau和T.Warnow,{加权统计装箱:实现统计一致的基因组规模系统发育分析},《公共科学图书馆·综合》,10(2015),第1-40页。
[4] D.Bryant、R.Bouckaert、J.Felsenstein、N.A.Rosenberg和A.RoyChoudhury,{从双等位基因标记直接推断物种树:在完全合并分析中绕过基因树},Mol.Biol。演变。,98(2012),第1917-1932页。
[5] J.Chifman和L.Kubatko,{根据合并模型下SNP数据的四方推断},生物信息学,30(2014),第3317-3324页。
[6] J.Chou,A.Gupta,S.Yaduvanshi,R.Davidson,M.Nute,A.Mirarab,and T.Warnow,{it SVD四分位和其他基于联合的物种树估计方法的比较研究},BMC Genom。,16(2015),第1-11页。
[7] G.Dasarathy、R.Nowak和S.Roch,{从多个位点进行系统发育推断的数据要求:一种新的距离方法},IEEE/ACM Trans。计算。生物信息学。,12(2015),第422-432页。
[8] J.Degnan和N.Rosenberg,{物种树与其最可能基因树的不一致},《公共科学图书馆·遗传学》。,2(2006年),第762-768页。
[9] J.Heled和A.Drummond,{从多点数据对物种树的贝叶斯推断},《分子生物学》。演变。,27(2010),第570-580页。
[10] R.A.Horn和C.R.Johnson,《矩阵分析》,第二版,剑桥大学出版社,英国剑桥,2012年。
[11] L.S.Kubatko、B.C.Carstens和L.L.Knowles,{it STEM:使用合并下基因树的最大似然进行物种树估计},生物信息学,25(2009),第971-973页。
[12] L.S.Kubatko和J.H.Degnan,{在合并条件下从连锁数据进行系统发育估计的不一致性},系统。《生物学》,56(2007),第17-24页。
[13] J.Lake,{从DNA和蛋白质序列重建进化树:顺线性距离},Proc。美国国家科学院。科学。美国,91(1994),第1455-1459页。
[14] L.Liu和D.K.Pearl,{从基因树构建物种树:使用估计的基因树分布重建物种系统发育的贝叶斯后验分布},系统。《生物学》,56(2007),第504-514页。
[15] 刘立群,余立群,{从未根基因树估算物种树},系统。《生物学》,60(2011),第661-667页。
[16] L.Liu,L.Yu,and S.Edwards,{it估计合并模型下物种树的最大伪似然方法},BMC Evol。《生物学》,10(2010),302。
[17] L.Liu、L.Yu、D.K.Pearl和S.V.Edwards,{利用序列间的合并时间估算物种系统发育},系统。《生物学》,58(2009),第468-477页。
[18] P.Lockhart、M.Steel、M.Hendy和D.Penny,《在更现实的序列进化模型下恢复进化树》,《分子生物学》。演变。,11(1994年),第605-612页。
[19] C.Long和L.Kubatko,{在修改合并}下物种系统发育的可识别性和可重构性,Bull。数学。《生物学》,81(2019),第408-430页·Zbl 1410.92078号
[20] S.Mirarab和T.Warnow,{it ASTRAL-II:基于集合的物种树估计,包含数百个分类群和数千个基因},生物信息学,31(2015),pp.i44-i52。
[21] P.Pamilo和M.Nei,{基因树和种树之间的关系},分子生物学。演变。,5(1988年),第568-583页。
[22] B.Rannala和Z.Yang,{使用多基因座DNA序列对物种分化时间和祖先种群大小的Bayes估计},《遗传学》,164(2003),第1645-1656页。
[23] S.Roch和M.Steel,{\it Likelihood基于排列序列数据集的级联的树重建可能在统计上不一致},Theor。大众。《生物学》,100(2015),第56-62页·Zbl 1331.92111号
[24] F.Ronquist、M.Teslenko、P.van der Mark、D.Ayres、A.Darling、S.Ho¨hna、B.Larget、L.Liu、M.Suchard和J.Huelsenbeck,{it MrBayes 3.2:大型模型空间中的高效贝叶斯系统发育推断和模型选择},系统。《生物学》,61(2012),第539-542页。
[25] A.RoyChoudhury、J.Felsenstein和E.A.Thompson,{种群树似然计算的两阶段剪枝算法},《遗传学》,180(2008),第1095-1105页。
[26] J.Rusinko和M.McPartlon,{使用邻接连接估计物种树},J.Theoret。生物学,414(2017),第5-7页。
[27] C.Semple和M.Steel,《系统发育学》,牛津大学出版社,英国牛津,2003年·Zbl 1043.92026
[28] M.Steel,{从马尔可夫模型下生成的树叶颜色中恢复树木},应用。数学。莱特。,7(1994年),第19-24页·Zbl 0794.60071号
[29] P.Vachaspati和T.Warnow,{it ASTRID:来自节间距离的准确物种TRees},BMC基因组。,16(2015),第S3页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。