×

嘌呤/嘧啶对称的Lie-Markov模型。 (英语) Zbl 1339.60111号

摘要:连续时间马尔可夫链是系统发育推断的标准工具。如果假设同质性,则通过指定链中状态之间与时间无关的替换率来表示链。在应用程序中,根据情况,通常对速率有额外的限制。如果一个模型是以这种方式建立的,那么就有可能对其进行推广,并考虑到非均匀过程,其中与时间相关的速率满足相同的约束条件。因此,要求在某些时间限制下,在同一模型中存在该非均匀过程的均匀平均值是有用的。这导致了“Lie Markov模型”的定义,正如我们将要展示的,它是准确地说存在这种平均值的模型类别。这些模型形成了李代数,因此李群理论中的概念是其推导的核心。在本文中,我们专注于系统发育学和核苷酸进化的应用,并推导出完整的Lie-Markov模型层次结构,该模型考虑核苷酸分组为嘌呤和嘧啶,即嘌呤/嘧啶对称的模型。我们还讨论了如何处理将李群方法(最自然地定义在复域上)应用于马尔可夫过程的随机情况的微妙之处,其中参数值被限制为实数和正数。特别地,我们研究了随机速率矩阵锥在相关复李代数的环境空间中的几何嵌入。

MSC公司:

60J27型 离散状态空间上的连续时间马尔可夫过程
60J28型 连续时间Markov过程在离散状态空间中的应用
22电子60 李群的李代数
第62页第10页 统计学在生物学和医学中的应用;元分析
92D15型 与进化有关的问题
92D20型 蛋白质序列,DNA序列
52B99号 多面体和多面体
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alexandrov AD(2005)凸多面体。施普林格数学专著。柏林施普林格。ISBN 3-540-23158-7(由N.S.Dairbekov、S.S.Kutateladze和A.B.Sossinsky翻译自1950年俄文版,V.A.Zalgaller提供评论和参考书目,L.A.Shor和Yu.A.Volkov提供附录)·Zbl 1067.52011年
[2] Birkhoff G(1938)分析小组。泛美数学Soc 43(1):61-101。ISSN 0002-9947。doi:10.2307/1989902·Zbl 0018.20502号
[3] Blanes S,Casas F(2004)关于Baker-Campbell-Hausdorff公式的收敛和优化。线性代数应用378:135-158。ISSN 0024-3795。doi:10.1016/j.laa.2003.09.010·兹比尔1054.17005
[4] Bogoolski O(2008)群论导论。EMS数学教科书,欧洲数学学会(EMS),苏黎世。编号978-3-03719-041-8。doi:10.4171/041(从俄语原文翻译、修订和扩充)·Zbl 1215.20001号
[5] Campbell JE(1897)关于算子组合定律(第二篇论文)。Proc Lond数学Soc 28:381-390·JFM 28.0321.01号
[6] Casanellas M,Fernández-Sánchez J(2010)进化模型的相关系统发育不变量。数学纯粹应用杂志96:207-229·Zbl 1230.14063号 ·doi:10.1016/j.matpur.2010.11.002
[7] Casanellas M,Sullivant S(2005)链对称模型。收录:计算生物学代数统计。剑桥大学出版社,纽约,第305-321页。doi:10.1017/CBO9780511610684.020·Zbl 1374.60139号
[8] Casanellas M,Fernández-Sánchez J,Kedzierska A(2012)等变模型的系统发育混合空间。分子生物学算法7:33·doi:10.1186/1748-7188-7-33
[9] Davies EB(2010)可嵌入马尔可夫矩阵。电子J Probab 15(47):1474-1486。ISSN 1083-6489。doi:10.1214/EJP.v15-733·Zbl 1226.60102号
[10] Donten-Bury M,Michałek M(2012)基于群体模型的系统发育不变量。J Algebr统计3(1):44-63。国际标准刊号1309-3452·Zbl 1353.52008年
[11] Draisma J,Kuttler J(2008)关于等变树模型的理想。数学安344:619-644·Zbl 1398.62338号 ·doi:10.1007/s00208-008-0320-6
[12] Felsenstein J(1981)DNA序列进化树:最大似然方法。分子进化杂志17:368-376·doi:10.1007/BF01734359
[13] Fernández-Sánchez J(2013)嘌呤/嘧啶对称的李-马尔可夫模型代码。http://www.pagines.ma1.upc.edu/jfernandez/purine_pyrimidine.html
[14] Hasegawa M,Kishino H,Yano T(1988),DNA序列数据的系统发育推断。统计理论和数据分析,第二期(东京,1986年)。荷兰北部,阿姆斯特丹
[15] James G,Liebeck M(2001)《群体的表征和特征》,第2版。剑桥大学出版社,纽约·Zbl 0981.20004号 ·doi:10.1017/CBO9780511814532
[16] Johnson JE(1985)\[GL(n,{R})\]GL(n,R)中的Markov型李群。数学物理杂志26:252-257·Zbl 0554.22010号 ·doi:10.1063/1.526654
[17] Jukes T,Cantor C(1969)蛋白质分子的进化。In:哺乳动物蛋白质,代谢,第21-132页
[18] Kimura M(1980)通过核苷酸序列的比较研究估算碱基替代进化速率的简单方法。J摩尔进化16:111-120·doi:10.1007/BF01731581
[19] Kimura M(1981)同源核苷酸序列之间进化距离的估计。国家科学院学报78:1454-1458
[20] Michałek M(2011)《基于群体的系统发育模型的几何学》。《代数杂志》339:339-356。ISSN 0021-8693。doi:10.1016/j.jalgebra.2011.05.016·Zbl 1251.14040号
[21] Posada D,Crandall KA(1998)模型测试:测试DNA替代模型。生物信息学14:817-818·doi:10.1093/bioinformatics/14.9.817
[22] Rotman J(1995)《群论导论》,第4版,《数学研究生教材》第148卷。纽约州施普林格市,ISBN 0-387-94285-8·兹比尔0810.20001
[23] Sagan BE(2001)《对称群:表示、组合算法和对称函数》,第2版。,柏林春天数学研究生课程·Zbl 0964.05070号 ·doi:10.1007/978-1-4757-6804-6
[24] Semple C,Steel M(2003)《系统发育学》。牛津出版社·Zbl 1043.92026
[25] Stein W等人(2012)Sage数学软件(4.8版)。圣人发展团队。http://www.sagemath.org
[26] Sumner JG,Fernández-Sánchez J,Jarvis PD(2012a)Lie-Markov模型。《Theor生物学杂志》298:16-31。ISSN 0022-5193。doi:10.1016/j.jtbi.2011.12.017·Zbl 1397.92515号
[27] Sumner JG,Jarvis PD,Fernández-Sánchez J,Kaine BT,Woodhams MD,Holland BR(2012b)一般时间可逆模型对分子系统发育学有害吗?系统生物学61:1069-1074·doi:10.1093/sysbio/sys042
[28] TavaréS(1986)dna序列分析中的一些概率和统计问题。Lect Math Life Sci(美国数学学会)17:57-86·Zbl 0587.92015号
[29] Yap V,Pachter L(2004)啮齿动物基因组中进化热点的识别。基因组研究14(4):574-579·doi:10.1101/gr.1967904
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。