×

关于Colless指数的最小值和实现它的分支树。 (英语) Zbl 1443.92126号

综述:树木平衡的测量在系统发育树的分析中起着重要作用。这方面最古老、最受欢迎的指数之一是有根分叉树的Colless指数,由D.科利斯[《系统发育学综述:系统发育系统的理论与实践》,《动物系统学》31,100-104(1982)]。虽然已经建立了系统发育树在不同概率模型下的许多统计特性,但对其最小值和实现最小值的树知之甚少。在本手稿中,我们填补了文献中的这一空白。首先,我们推导了带(n)叶的树的最小Colless索引的递归表达式和闭合表达式。令人惊讶的是,这些表达式显示了最小Colless指数和所谓的Blancmange曲线(分形曲线)之间的联系。然后,我们完整地描述了达到这个最小值的树形,并介绍了生成它们的算法和计算它们的递归方法。在关注两类具有最小Colless指数的极值树(最大平衡树和底部贪婪树)之后,我们得出结论,即所有具有最小Colles指数的树也都具有最小Sackin指数,这是另一种流行的平衡指数。

MSC公司:

92D15型 与进化有关的问题
05二氧化碳
05C90年 图论的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿加波,P。;Purvis,A.,《八个树形统计数据检测非随机多样化的能力:通过模拟两种枝状发生模型进行的比较》,Syst Biol,51866-872(2002)
[2] 奥尔德斯,D。;奥尔德斯,D。;Pemantle,R.,枝状图上的概率分布,随机离散结构。数学及其应用IMA卷,1-18(1996),纽约:施普林格,纽约·Zbl 0841.92015号
[3] Aldous,D.,《进化树的随机模型和描述性统计,从Yule到今天》,《统计科学》,16,23-34(2001)·Zbl 1127.60313号
[4] PC公司Allaart;Kawamura,K.,《高木函数:调查》,《真实分析交换》,第37期,第1-54页(2012年)·Zbl 1248.26007号
[5] Avino M,Garway TN,et al(2018)基于树形的共生性比较研究方法。生物Rxiv 10.1101/388116
[6] 布鲁姆,MG;François,O.,《关于系统发育树不平衡的统计测试:重访Sackin和其他指数》,Math Biosci,195,141-153(2005)·Zbl 1065.62183号
[7] 布鲁姆,MG;François,O.,哪些随机过程描述了生命之树?系统发育树失衡的大规模研究,Syst Biol,55,685-691(2006)
[8] 布鲁姆,MGB;弗朗索瓦,O。;Janson,S.,对系统发育树平衡敏感的两种统计的平均值、方差和极限分布,Ann Appl Probab,16,2195-2214(2006)·Zbl 1124.05025号
[9] 北卡罗来纳州博托鲁西。;杜兰德,E。;布鲁姆,M。;François,O.,apTreeshape:系统发育树形状的统计分析,生物信息学,22363-364(2005)
[10] 布鲁尔,AVZ;Rindal,E.,《现实检验:对Smith的回复》,《分支学》,29,464-465(2013)
[11] Cardona,G。;Mir,A。;Rosselló,F.,Yule模型下几个平衡指数方差的精确公式,《数学生物学杂志》,671833-1846(2013)·Zbl 1281.92051号
[12] Chalmandrier,L。;Albouy,C.,《印度-澳大利亚群岛空间多样性和荟萃种群模型的比较》,《俄罗斯社会开放科学》,5171366(2018)
[13] Colless,D.,《系统发育学评论:系统发育系统学的理论与实践》,Syst Zool,31,100-104(1982)
[14] Colless,D.,分支图和物候图的相对对称性:一项实验研究,《系统生物学》,44,102-108(1995)
[15] 科罗拉多,TM;Mir,A。;罗塞洛,F。;Valiente,G.,基于根四分位的系统发育树平衡指数,《数学生物学杂志》,79,1105-1148(2019)·Zbl 1416.05069号
[16] 库尼亚,T。;Giribet,G.,深腹足类关系的同余拓扑,Proc R Soc B,28620182776(2019)
[17] Drummond,AJ;何,SYW;菲利普斯,MJ;Rambaut,A.,《放松的系统发育学和自信的年代测定》,《公共科学图书馆·生物》,4,e88(2006)
[18] Duchene,S。;布卡特,R。;杜兴,DA;斯塔德勒,T。;Drummond,AJ,使用后验预测模拟的叶动力学模型充分性,Syst Biol,68,358-364(2018)
[19] Farris,J。;Källersjö,M.,《不对称与解释》,分支系统学,第14期,第159-166页(1998年)
[20] Felsenstein,J.,《类推系统发育》(2004),西努埃尔:西努埃尔联合公司,西努尔
[21] Fischer M(2018)有根二叉树Sackin平衡指数的极值。arXiv预印本arXiv:1801.10418v3
[22] Fischer M,Liebscher V(2015)关于未展开树木的平衡。arXiv预打印arXiv:1510.07882·Zbl 1457.05109号
[23] Ford DJ(2005)《枝形图的概率:阿尔法模型简介》。斯坦福大学博士论文。arXiv预打印arXiv:math/0511246
[24] Fusco,G。;Cronk,QC,评估大型系统发育形状的新方法,《Theor Biol杂志》,175,235-243(1995)
[25] Futuyma,DJ,《进化、科学与社会:进化生物学与国家研究议程》(1999),新泽西:新泽西州立大学
[26] 宾夕法尼亚州戈洛波夫;阿里亚斯,JS;Szumik,CA,《比较树形:超越对称》,Zool Scr,46,637-648(2017)
[27] Hayati,M。;Shadgar,B。;Chindelevitch,L.,评估树形统计的新分辨率函数,PloS ONE,14,e0224197(2019)
[28] Heard,SB,分支系统树、多酚系统树和随机生成系统树之间的树平衡模式,进化,461818-1826(1992)
[29] 希利斯,D。;布尔,J。;怀特,M.,《实验系统发育:已知系统发育的生成》,《科学》,255589-592(1992)
[30] 霍尔顿,T。;威尔金森,M。;Pisani,D.,《现代树木形状重建方法》,《系统生物学》,63436-441(2014)
[31] Kayondo,H。;Mwalili,S。;Mango,J.,《推断结构化宿主的多类型出生死亡参数及其在非洲艾滋病毒流行中的应用》,Comput-Mol Biosci,9,108-131(2019)
[32] 金曼,JFC,《合并随机过程应用》,13,235-248(1982)·Zbl 0491.60076号
[33] 柯克帕特里克,M。;Slatkin,M.,《寻找系统发育树形式的进化模式》,《进化》,4711171-1181(1993)
[34] Kubo,T。;Iwasa,Y.,从分子系统发育推断分支和灭绝率,进化,49,694-704(1995)
[35] Matsen,F.,《树形统计的几何方法》,《系统生物学》,55,652-61(2006)
[36] McKenzie,A。;Steel,M.,两种树木模型的樱桃分布,Math Biosci,164,81-92(2000)·Zbl 0947.92021号
[37] Metzig,C。;Ratmann,O。;Bezemer,D。;Colijn,C.,《来自动态网络的系统发育》,《公共科学图书馆·计算生物学》,15,e1006761(2019)
[38] Mir,A。;罗斯洛,F。;Rotger,L.,一种新的系统发育树平衡指数,Math Biosci,241125-136(2013)·Zbl 1303.92084号
[39] Mir,A。;Rotger,L。;Rosselló,F.,Sound Colless-like多叉树平衡指数,《公共科学图书馆·综合》,13,e0203401(2018)
[40] 摩尔,AO;Heard,SB,《从系统发育树形状推断进化过程》,Q Rev Biol,72,31-54(1997)
[41] 密歇根州纳尔逊;霍姆斯,EC,《流行性流感的演变》,《Nat Rev Genetics》,第8期,196-205页(2007年)
[42] Piel WH、Chan L、Dominus MJ等(2009)TreeBASE v.2:系统发育知识数据库。收录:e-BioSphere 2009
[43] Poon,AF,核ABC的植物学推断及其在HIV流行病学中的应用,分子生物学进化,32,2483-2495(2015)
[44] Purvis A(1996)使用种间系统发育来测试宏观进化假设。收录:Harvey PH、Brown AJL、Maynard Smith J、Nee S(编辑)新系统发育的新用途。牛津大学出版社,牛津,第153-168页
[45] Purvis,A。;弗里茨,S。;罗德里格斯,J。;哈维,P。;Grenyer,R.,《哺乳动物系统发育的形状:模式、过程和尺度》,Philos Trans R Soc B,366,2462-2477(2011)
[46] Purvis,A。;Katzourakis,A。;Agapow,P-M,《评估系统发育树形状:对Fusco和Cronk方法的两种修改》,《Theor生物学杂志》,21499-103(2002)
[47] Rindal,E。;Brower,AVZ,基于模型的系统发育分析是否比简约性更好?《利用经验数据进行的检验》,《分支学》,27,331-334(2011)
[48] Rogers,JS,Colless树失衡对末端分类群数量的反应,Syst Biol,42102(1993)
[49] MJ Sackin,“好”和“坏”症状图,Syst Zool,21225-226(1972)
[50] Saulnier E、Alizon S、Gascuel O(2016)评估从系统发育推断流行病学参数的近似贝叶斯计算方法的准确性。bioRxiv,050211。10.1101/050211
[51] 萨维奇,HM,《进化的形状:系统树拓扑》,Biol J Linn Soc,20,225-244(1983)
[52] 邵,K。;Sokal,R.,《树木平衡》,系统动物园,39,266-276(1990)
[53] Semple,C。;Steel,M.,《系统发育学》(2003),牛津:牛津大学出版社,牛津·Zbl 1043.92026
[54] Sloane NJA(1964)整数序列在线百科全书(OEIS)。网址:http://oeis.org。上次访问时间:2019年7月8日
[55] Slowinski,J.,两种模型下(n)树的概率:不对称内部节点并非不可能的证明,Syst Zool,39,89-94(1990)
[56] Sober,E.,系统发育推断方法的实验测试,系统生物学,42,85-89(1993)
[57] Stam,E.,系统发育不平衡是否只反映了偏见?,进化,561292-1295(2002)
[58] Steel,M.,《系统发育:进化中的离散和随机过程》(2016),纽约:SIAM,纽约·Zbl 1361.92001号
[59] 斯蒂奇,M。;Manrubia,SC,进化模型中系统发育树的拓扑特性,《欧洲物理杂志》B,70,583-592(2009)·Zbl 1188.05154号
[60] Takagi,T.,无导数连续函数的一个简单示例,Tokyo Sugaku Butsurigakkwai Hokoku,1,F176-F177(1901)
[61] Verboom G、Boucher F、Ackerly D等人(2019)物种选择制度和系统发育树形状。《系统生物学》(出版)。10.1093/sysbio/syz076
[62] Vos、RA;Balhoff,JP;Caravas,JA,NeXML:比较数据和元数据的丰富、可扩展和可验证的表示,《系统生物学》,61675-689(2012)
[63] JC威利斯;GU Yule,《动植物进化和地理分布的一些统计及其意义》,《自然》,109177-179(1922)
[64] Wu,T。;Choi,K.,关于两种进化模型下的联合子树分布,Theor Popul Biol,108,13-23(2015)·Zbl 1343.92371号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。