×

系统发育树的信息几何。 (英语) Zbl 1460.92141号

摘要:我们提出了一个新的系统发育树空间,称为wald空间。其动机是开发一个适用于系统发育统计分析的空间,但其几何学基于比现有空间更具生物学原理的假设:在wald空间中,如果树在遗传序列数据上诱导类似的分布,则树是相近的。作为点集,wald空间包含先前开发的Billera-Holmes-Vogtmann(BHV)树空间;它还包含断开连接的森林,如边积(EP)空间,但没有EP空间的某些奇点。我们研究了wald空间上的两个相关几何。第一个是由每棵树上的两状态对称马尔可夫替换过程所诱导的特征分布的Fisher信息度量的几何结构。度量与Kullback-Leibler散度成正比,或者如我们所示,与任何(f)-散度等价。第二个几何体是通过类似的方式获得的,但在每棵树上使用相关的连续值高斯过程,它可以被视为协方差矩阵仿射不变度量的迹度量。我们推导了一种梯度下降算法,将协方差矩阵的环境空间投影到wald空间。对于这两种几何,我们推导了在多项式时间内计算测地线的计算方法,并在数值上表明了两种信息几何(离散和连续)非常相似。特别是,测地线是外在近似的。与BHV几何形状的比较表明,我们的规范空间和生物激发空间有着本质上的不同。

MSC公司:

92D15型 与进化有关的问题
53A35型 非核素微分几何

软件:

贝叶斯先生
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 右侧亚当斯;Castoe,TA,《概率物种树距离:在用于估算物种树的基于模型的相同框架内实现多物种合并以比较物种树》,《系统生物学》,69,1,194-207(2020)·doi:10.1093/sysbio/syz031
[2] Allen,BL公司;Steel,M.,进化树上的子树转移操作及其诱导度量,Ann Comb,5,1,1-15(2001)·Zbl 0978.05023号 ·doi:10.1007/s00026-001-8006-8
[3] 奥尔曼,ES;阿内,C。;Rhodes,JA,具有γ分布率的分子进化马尔科夫模型的可识别性,Adv Appl Probab,40,1,229-249(2008)·Zbl 1139.60335号 ·doi:10.1239/aap/1208358894
[4] Ballmann,W。;格罗莫夫,M。;Schroeder,V.,非正曲率流形。数学进展(1985年),巴塞尔:Birkhäuser,巴塞尔·Zbl 0591.53001号 ·doi:10.1007/978-1-4684-9159-3
[5] Baák,M.,《计算哈达玛空间中的中位数和平均数》,SIAM J Optim,24,3,1542-1566(2014)·Zbl 1306.49046号 ·数字对象标识代码:10.1137/140953393
[6] Billera,L。;霍姆斯,S。;Vogtman,K.,系统发育树空间的几何,高级应用数学,27733-767(2001)·Zbl 0995.92035号 ·doi:10.1006/aama.2001.0759
[7] 布里德森,MR;Haefliger,A.,《非正曲率的度量空间》(2011),柏林:施普林格出版社,柏林·Zbl 0988.53001号
[8] 布莱恩特,D。;北加尔提尔。;Poursat,M-A;Gascuel,O.,分子系统发育学中的似然计算,进化和系统发育数学,33-62(2005),牛津:牛津大学出版社,牛津·Zbl 1090.62120号
[9] 伊利诺伊州德莱顿;科洛耶登科,A。;Zhou,D.,协方差矩阵的非核素统计,及其在扩散张量成像中的应用,Ann Appl Stat,3,3,1102-1123(2009)·Zbl 1196.62063号 ·doi:10.1214/09-AOAS249
[10] Engström,A。;Hersh,P。;Sturmfels,B.,《Toric立方体》,《Rendiconti del Circolo Matematico di Palermo》,第62、1、67-78页(2013年)·Zbl 1315.52011年5月 ·doi:10.1007/s12215-013-0115-9
[11] Feragen A、Owen M、Petersen J、Wille M、Thomsen L、Dirksen A、de Bruijne M(2013)《树木解剖大规模分析的树空间统计和近似值》。参加:第23届医学成像信息处理国际会议(IPMI)
[12] Garba MK(2019)系统发育树的信息几何。纽卡斯尔大学数学、统计与物理学院博士论文
[13] MK加尔巴;Nye,TMW公司;男孩,RJ,树木之间的概率距离,系统生物学,67,2,320-327(2018)·doi:10.1093/sysbio/yx080
[14] 吉尔·J。;Linusson,S。;莫尔顿,V。;Steel,M.,系统发育树边积空间的正则分解,Adv Appl Math,41,2,158-176(2008)·Zbl 1149.05305号 ·doi:10.1016/j.aam.2006.07.007
[15] Hansen,TF;马丁斯,EP,《微观进化过程和宏观进化模式之间的转换:种间数据的相关结构》,《进化》,50,4,1404-1417(1996)·doi:10.1111/j.1558-5646.1996.tb03914.x
[16] 胡尔森贝克,JP;Ronquist,F.,MrBayes:系统发育树的贝叶斯推断,生物信息学,17,8,754-755(2001)·doi:10.1093/bioinformatics/17.8.754
[17] Kim,J.,切片超维橙子:系统发育估计的几何结构,分子系统发育进化,17,1,58-75(2000)·doi:10.1006/mpev.2000.0816
[18] Lee,JM,黎曼流形:曲率导论(1997),柏林:Springer,柏林·Zbl 0905.53001号 ·数字对象标识代码:10.1007/b98852
[19] Lenglet,C。;罗森,M。;德里奇,R。;Faugeras,O.,《多元正态分布流形的统计:扩散张量MRI处理的理论和应用》,《数学成像杂志》,第25、3、423-444页(2006年)·Zbl 1478.62387号 ·doi:10.1007/s10851-006-6897-z
[20] Lin,B。;Yoshida,R.,热带费马-韦伯点,SIAM J离散数学,32,2,1229-1245(2018)·Zbl 1420.14148号 ·doi:10.1137/16M1071122
[21] Lin B,Monod A,Yoshida R(2018)系统发育树空间概率和统计的热带基础。arXiv预打印arXiv:1805.12400
[22] 米勒,E。;M.欧文。;Provan,JS,用于平均度量系统发育树的多面体计算几何,Adv Appl Math,68,51-91(2015)·Zbl 1329.68266号 ·doi:10.1016/j.aam.2015.04.002
[23] Moakher,M.,对称正定矩阵几何平均值的微分几何方法,SIAM J Matrix Ana Appl,26,735-747(2005)·Zbl 1079.47021号 ·doi:10.1137/S089547979803436937
[24] 莫尔顿,V。;Steel,M.,《剥橘子的进化史》,《高级应用数学》,33,4,710-727(2004)·Zbl 1067.92045号 ·doi:10.1016/j.aam.2004.03.003
[25] Nye,TMW,系统发育树空间的主成分分析,Ann Stat,39,5,2716-2739(2011)·Zbl 1231.62110号 ·doi:10.1214/11-AOS915
[26] Nye,T.,在系统发育树空间中构建主测地线的算法,IEEE ACM Trans-Comput Biol,11,2,304-315(2014)·doi:10.1109/TCBB.2014.2309599
[27] Nye,TMW公司;唐,X。;Weyenberg,G。;Yoshida,R.,主成分分析和系统发育树空间中Fréchet均值的位置,Biometrika,104,4,901-922(2017)·Zbl 07072335号 ·doi:10.1093/biomet/asx047
[28] M.欧文。;Provan,JS,树空间测地距离的快速计算算法,IEEE ACM Trans-Comput Biol,8,1,2-13(2011)·doi:10.1109/TCBB.2010.3
[29] 罗杰斯,JS,《基于核苷酸序列的系统发育树最大似然估计的一致性》,《系统生物学》,46,2,354-357(1997)·doi:10.1093/sysbio/46.2354
[30] 萨森,I。;Verdu,S.,f-发散不等式,IEEE Trans-Inf理论,62,11,5973-6006(2016)·Zbl 1359.94363号 ·doi:10.1109/TIT.2016.2603151
[31] Schmidt FR,Clausen M,Cremers D(2006)流形上测地线变分计算的形状匹配。参加:联合模式识别研讨会。Springer,第142-151页
[32] Semple,C。;Steel,M.,系统发育学。牛津数学及其应用系列讲座(2003),牛津:牛津大学出版社,牛津·Zbl 1043.92026
[33] Skovgaard,LT,多元正态模型的黎曼几何,Scand J Stat,11,4,211-223(1984)·Zbl 0579.62033号
[34] Speyer博士。;Sturmfels,B.,《热带格拉斯曼人》,Adv Geom,4,3,389-411(2004)·Zbl 1065.14071号 ·doi:10.1515/advg.2004.023
[35] 钢,MA;Penny,D.,《树木比较度量的分布——一些新结果》,《系统生物学》,42,2,126-141(1993)
[36] Willis,A.,《系统发育树的置信集》,美国统计协会期刊,114,525,235-244(2019)·Zbl 1462.62693号 ·doi:10.1080/01621459.2017.1395342
[37] Yang,Z.,计算分子进化(2006),牛津:牛津大学出版社,牛津·doi:10.1093/acprof:oso/9780198567028.001.0001
[38] 吉田,R。;张,L。;Zhang,X.,热带主成分分析及其在系统发育学中的应用,《公牛数学生物学》,81,2,568-597(2019)·Zbl 1410.92082号 ·doi:10.1007/s11538-018-0493-4
[39] Zwiernik,P。;Smith,JQ,树累积量和二叉树模型的几何,Bernoulli,18,1,290-321(2012)·兹比尔1235.62004 ·doi:10.3150/10-BEJ338
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。