×

链对称系统发育替代模型中的矩阵群结构和马尔可夫不变量。 (英语) Zbl 1343.92352号

数学杂志。生物。 73,第2期,259-282(2016); 更正同上,第82号,第7号,第68号论文,第1页(2021年)。
小结:我们考虑了链对称系统发育替代模型的连续时间表示(其中速率参数在Watson-Crick碱基结合给出的核苷酸置换下保持不变)。将模型的底层结构作为矩阵组进行代数分析,导致基的变化,其中速率生成器矩阵由两部分块分解给出。我们应用表示论技术,对于任何(固定)数量的感兴趣的系统发育分类群\(L\)和多项式次数\(D\),提供了对相关马尔可夫不变量进行分类和枚举的方法。特别地,在二次和三次情形中,我们证明了分别存在精确的(frac{1}{3}(3^L+(-1)^L)和(6^{L-1})线性无关的马尔可夫不变量。此外,我们还给出了(i)具有任意数量分类群的二次情形和(ii)三分类群系统发育树特殊情形下的三次情形的马尔可夫不变量的显式多项式形式。最后,我们展示了我们的结果具有实际意义,因为二次马尔可夫不变量基于(i)替代率提供了系统发育距离的独立估计在内部Watson-Crick共轭对,和(ii)替代率穿过共轭碱基对。

MSC公司:

92D15型 与进化有关的问题
05年5月5日 对称函数和推广
20G05年 线性代数群的表示理论
17个B45 线性代数群的李代数
60J20型 马尔可夫链和离散时间马尔可夫过程在一般状态空间(社会流动、学习理论、工业过程等)上的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Allman ES、Jarvis PD、Rhodes JA、Sumner JG(2013)张量秩、不变量、不等式和应用。SIAM J矩阵分析A 34:1014-1045·Zbl 1295.15016号 ·doi:10.1137/120899066
[2] Allman ES,Rhodes JA(2008a)识别具有不变位点的一般马尔可夫模型的进化树和替代参数。数学生物科学211:18-33·Zbl 1130.92039号 ·doi:10.1016/j.mbs.2007.09.001
[3] Allman ES,Rhodes JA(2008b)一般马尔可夫模型的系统发育理想和变体。高级应用数学40:127-148·Zbl 1131.92046号 ·doi:10.1016/j.aam.2006.10.002
[4] Allman ES,Rhodes JA,Taylor A(2014)系统发育树上一般马尔可夫模型的半代数描述。SIAM J离散数学28:736-755·Zbl 1300.60085号 ·数字对象标识代码:10.1137/120901568
[5] Barry D,Hartigan JA(1987)同源DNA序列之间的异步距离。生物计量学43:261-276·Zbl 0622.92012号 ·doi:10.2307/2531811
[6] Casanellas M,Fernández-Sánchez J(2010)进化模型的相关系统发育不变量。数学纯粹应用杂志96:207-229·Zbl 1230.14063号 ·doi:10.1016/j.matpur.2010.11.002
[7] Casanellas M,Sullivant S(2005)《计算生物学代数统计》,第章:链对称模型。剑桥大学出版社,纽约,第305-321页·兹比尔1374.60139
[8] Cavender JA,Felsenstein J(1987)在离散状态的简单情况下的系统发育不变量。J类4:57-71·Zbl 0612.62142号 ·doi:10.1007/BF01890075
[9] Chang JT(1996)进化树上马尔可夫模型的完全重建:可识别性和一致性。数学生物科学137:51-73·Zbl 1059.92504号 ·doi:10.1016/S0025-5564(96)00075-2
[10] Draisma J,Kuttler J(2008)关于等变树模型的理想。数学安344:619-644·Zbl 1398.62338号 ·doi:10.1007/s00208-008-0320-6
[11] Erdmann K,Wildon MJ(2006)《李代数导论》。斯普林格·弗拉格,伦敦·Zbl 1139.17001号 ·doi:10.1007/1-84628-490-2
[12] Evans SN,Speed TP(1993),用于系统发育推断的一些概率模型的不变量。Ann Stat 21(1):355-377·Zbl 0772.92012号 ·doi:10.1214/aos/1176349030
[13] Felsenstein J(1981)DNA序列进化树:最大似然方法。分子进化杂志17:368-376·doi:10.1007/BF01734359
[14] Felsenstein J(1991)计算一些简单情况下的系统发育不变量。《Theor生物学杂志》152:357-376·doi:10.1016/S0022-5193(05)80200-0
[15] Felsenstein J(2004)推断系统发育。桑德兰Sinauer Associates
[16] Fernández-Sánchez J,Sumner JG,Jarvis PD,Woodhams MD(2015)嘌呤嘧啶对称的Lie Markov模型。数学生物学杂志70:855-891·Zbl 1339.60111号 ·doi:10.1007/s00285-014-0773-z
[17] Hendy MD(1989)简单进化树模型和可观测序列数据之间的关系。系统动物园38:310-321·doi:10.2307/2992397
[18] Hendy MD,Penny D,Steel M(1994)进化树的离散傅里叶分析。国家科学院院刊91:3339-3343·兹伯利0791.92017 ·doi:10.1073/pnas.91.8.3339文件
[19] Holland BR,Sumner JG,Jarvis PD(2013)一般马尔可夫模型下的低参数系统发育推断。系统生物学62:78-92·doi:10.1093/sysbio/sys072
[20] Jarvis PD,Sumner JG(2012)从嵌入子模型导出的系统发育速率矩阵的马尔可夫不变量。Trans-Comp生物信息学9:828-836·doi:10.1109/TCBB.2012.24
[21] Jarvis PD,Sumner JG(2014)《不变量理论中的冒险》。ANZIAM期刊56:105-115·Zbl 1309.81033号 ·doi:10.1017/S1446181114000327
[22] Kedzierska AM,Drton M,GuigóR,Casanellas M(2012)SPIn:通过线性不变量进行系统发育混合物的模型选择。分子生物学进化29:929-937·doi:10.1093/molbev/msr259
[23] Klaere S,Liebscher V(2012)三叉树上两状态马尔可夫模型的代数分析。数学生物科学237:38-48·Zbl 1241.92057号 ·doi:10.1016/j.mbs.2012.03.001
[24] Lake JA(1987)核酸序列分析的速率依赖技术:进化简约性。分子生物学进化4:167-191
[25] JA湖(1994)从DNA和蛋白质序列重建进化树:平行距离。美国国家科学院院刊91:1455-1459·doi:10.1073/pnas.91.4.1455
[26] Littlewood DE(1940)《群体性格理论》。牛津克拉伦登出版社
[27] Lockhart PJ,Steel MA,Hendy MD,Penny D(1994),在更现实的序列进化模型下恢复进化树。分子生物学进化11:605-612
[28] MacDonald IG(1979)《对称函数和霍尔多项式》。牛津克拉伦登出版社·兹比尔0487.20007
[29] Pachter L,Sturmfels B(eds)(2005)计算生物学代数统计。剑桥大学出版社,纽约·Zbl 1108.62118号
[30] Semple C,Steel M(2003)《系统发育学》。牛津大学出版社·Zbl 1043.92026
[31] Sturmfels B,Sullivant S(2005)系统发育不变量的保守理想。计算机生物学杂志12:204-228·兹比尔1391.13058 ·doi:10.1089/cmb.2005年12月20日
[32] Sumner JG、Charleston MA、Jermein LS、Jarvis PD(2008)马尔可夫不变量、完整性和系统发育学。《Theor生物学杂志》253:601-615·Zbl 1398.92188号 ·doi:10.1016/j.jtbi.2008.04.001
[33] Sumner JG,Fernández-Sánchez J,Jarvis PD(2012a)Lie-Markov模型。《Theor生物学杂志》298:16-31·兹比尔1397.92515 ·doi:10.1016/j.jtbi.2011.12.017
[34] Sumner JG,Holland BR,Jarvis PD(2012b)树和网络上一般马尔可夫模型的代数。公牛数学生物学74:858-880·Zbl 1235.92037号 ·doi:10.1007/s11538-011-9691-z
[35] Sumner JG,Jarvis PD(2009),马尔可夫不变量和四叉树的各向同性子群。《Theor生物学杂志》258:302-310·Zbl 1402.92323号 ·doi:10.1016/j.jpbi.2009.01.021
[36] Sumner JG,Jarvis PD,Fernández-Sánchez J,Kaine BT,Woodhams MD,Holland BR(2012c)一般时间可逆模型对分子系统发育学有害吗?系统生物学61:1069-1074·doi:10.1093/sysbio/sys042
[37] Székely LA,Steel MA,Erdős PL(1993)进化树上的傅里叶演算。高级应用数学14:200-216·Zbl 0794.05014号 ·doi:10.1006/aama.1993.1011
[38] TavaréS(1986)DNA序列分析中的一些概率和统计问题。数学与生命科学(AmSoc)17:57-86·Zbl 0587.92015号
[39] Weyl H(1950)群论和量子力学。美国多佛出版公司·Zbl 0041.56804号
[40] Wolfram Research Inc.(2010)Mathematica 8。Wolfram Research Inc,香槟
[41] Woodhams MD、Fernández-Sánchez J、Sumner JG(2015)与异质替代率一致的系统发育模型的新层次。系统生物学64:638-650·doi:10.1093/sysbio/syv021
[42] Yap VB,Pachter L(2004)啮齿动物基因组中进化热点的识别。基因组研究14:574-579·doi:10.1101/gr.1967904
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。