×

系统发育树的统计。 (英语) Zbl 1101.92305号

摘要:本文提出了从统计学角度估计和验证系统发育树的问题。这个问题很难解决,足以证明几个问题:我们类比四舍五入实数,并处理排名数据。在这两种情况下,正如在系统发育中一样,感兴趣的参数都不是实数。然后,我们用几何术语提出了这个问题,使用了树的自然空间上的距离和度量。我们没有解决树空间上的推理问题,但提出了一些连贯的解决方法。

MSC公司:

92D15型 与进化有关的问题
62页第10页 统计学在生物学和医学中的应用;元分析

软件:

拆分树菲利普
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aldous,D.,《进化树的随机模型和描述性统计,从Yule到今天》,Statist。科学。,16, 23-34 (2001) ·Zbl 1127.60313号
[2] 阿米特,Y。;Geman,D.,用随机树进行量化和识别,神经计算。,9, 1545-1588 (1997)
[3] 阿罗,K.,《社会选择与个人价值观》(1963年),威利出版社:威利纽约
[4] Bandelt,H.J。;福斯特,P。;塞克斯,不列颠哥伦比亚省。;理查兹,M.B.,《使用中值网络绘制人类群体线粒体肖像》,《遗传学》,141743-753(1995)
[5] Baryshnikov,Y.M.,《拓扑和离散社会选择在理论研究中的应用》,《社会选择世界》。,14, 199-209 (1997) ·Zbl 0886.90007号
[6] 贝里,V。;Gascuel,O.,《包层选择和诱导增益的自举树阈值的解释》,分子生物学。演变。,13, 999-1011 (1996)
[7] Billera,L.公司。;霍姆斯,S。;Vogtmann,K.,《树空间的几何》,高级应用。数学。,27, 771-801 (2001)
[8] Billera,L.,Holmes,S.,Vogtmann,K.,2002年。系统发育树问题的几何视角。技术报告xx,统计,加州斯坦福红杉厅,邮编94305。;Billera,L.,Holmes,S.,Vogtmann,K.,2002年。系统发育树问题的几何透视图。技术报告xx,统计,加州斯坦福红杉厅,94305。
[9] 布兰切特,M。;Kunisawa,T。;Sankoff,D.,动物线粒体系统发育中的基因顺序断点证据,分子进化杂志。,49, 193-203 (1999)
[10] Breiman,L.,Bagging预测因子,马赫数。学习,24123-140(1996)·Zbl 0858.68080号
[11] Brooks,D.R.,Hennig的寄生虫学方法提出了解决方案,系统。动物园。,30, 229-249 (1981)
[12] Chichilnisky,G.,《社会选择与偏好空间的拓扑》,高等数学。,37, 165-176 (1980) ·兹比尔0446.90004
[13] Chor,B.,Snir,S.,2002年。分子钟下的四个分类单元ML分支:分析溶液。新西兰惠蒂安加分类学会议,新西兰惠蒂安加。;Chor,B.,Snir,S.,2002年。分子钟下的四个分类单元ML分支:分析溶液。新西兰惠蒂安加系统发育会议,新西兰惠蒂安加。
[14] 库珀,A。;Penny,D.,《鸟类跨越白垩纪-第三纪边界的大规模生存分子证据》,《科学》,2751109-1113(1997)
[15] Critchlow,D.E.,《分析部分排名数据的度量方法》(1985),施普林格-弗拉格:柏林施普林格·Zbl 0589.62041号
[16] 克里奇洛,D.E。;Pearl,D.K。;钱,C.,有根分叉系统发育树的三倍距离,系统。《生物学》,45,323-334(1996)
[17] Dasgupta,B.,He,X.,Jiang,T.,Li,M.,Tromp,J.,Wang,L.,Zhang,L.《计算进化树之间的距离》。第八届ACM-SIAM离散算法年会论文集,1997年1月5日至7日,路易斯安那州新奥尔良。;Dasgupta,B.,He,X.,Jiang,T.,Li,M.,Tromp,J.,Wang,L.,Zhang,L.《计算进化树之间的距离》。第八届ACM-SIAM离散算法年会论文集,1997年1月5日至7日,洛杉矶新奥尔良·Zbl 0936.92026号
[18] Diaconis,P.,1988年。概率统计中的群表示。数理统计研究所。;Diaconis,P.,1988年。概率统计中的群表示。数理统计研究所·Zbl 0695.60012号
[19] Diaconis,P.,谱分析的推广及其在排序数据中的应用,Ann.Statist。,17, 949-979 (1989) ·Zbl 0688.62005号
[20] Diaconis,P.,1992年。作为统计对称的充分性。收录于:美国数学学会百年出版物,第二卷(普罗维登斯,RI,1988),美国数学学会,F.Browder(Ed.),普罗维登思。RI,第15-26页。;Diaconis,P.,1992年。作为统计对称的充分性。收录于:美国数学学会百年出版物,第二卷(普罗维登斯,RI,1988),美国数学学会,F.Browder(Ed.),普罗维登思。RI,第15-26页·Zbl 0928.62006号
[21] Diaconis,P。;Holmes,S.,Matchings和系统发育树,Proc。国家。阿卡德。科学。美国,9514600-14602(1998),(电子版)·兹比尔0908.92023
[22] Diaconis,P.,Holmes,S.,2001年。在树上随机漫步和比赛。技术报告,统计部,斯坦福,CA 94305。;Diaconis,P.,Holmes,S.,2001年。在树上随机漫步和比赛。技术报告,统计部,斯坦福,CA 94305·Zbl 1007.60071号
[23] 连衣裙,A。;Huson,D。;Moulton,V.,使用splitstree分析和可视化序列和距离数据,Appl。数学。,71, 95-109 (1996) ·Zbl 0879.92020
[24] Dress,A.、Holland,B.、Huber,K.、Koolen,J.、Moulton,V.、Weyer-Menkhoff,J.,2001年。增量加性和增量超加性映射、Gromov树和Farris变换。离散应用程序。数学。,提交出版。;Dress,A.、Holland,B.、Huber,K.、Koolen,J.、Moulton,V.、Weyer-Menkhoff,J.,2001年。增量加性和增量超加性映射、Gromov树和Farris变换。离散应用程序。数学。,提交出版·Zbl 1056.92042号
[25] Durbin,R.、Eddy,S.、Krogh,A.、Mitchison,G.,1998年。生物序列分析。剑桥大学出版社,英国剑桥。;Durbin,R.、Eddy,S.、Krogh,A.、Mitchison,G.,1998年。生物序列分析。剑桥大学出版社,英国剑桥·兹比尔0929.92010
[26] Edwards,A.,分支扩散过程分支点的估计,J.R.Statist。Soc.B,32,155-174(1970年)(含讨论)·Zbl 0203.50801号
[27] Efron,B.,为什么不是每个人都是贝叶斯?,美国统计局。,40,1-5(1986年),(c/r:P5-11;第330-331页)·Zbl 0587.62003号
[28] 埃夫隆,B。;Halloran,E。;Holmes,S.,系统发育树的Bootstrap置信水平,Proc。国家。阿卡德。科学。美国,93,13429-13434(1996)·兹比尔0871.62092
[29] Farris,J.,《关于比较分类树的形状》,系统。动物园。,2, 50-54 (1973)
[30] Farris,J.S.,《系统发育分析的逻辑基础》(Platnick,N.;Funk,V.,《分支系统学进展》(1983),哥伦比亚大学出版社:哥伦比亚大学出版社,纽约),7-36
[31] Felsenstein,J.,《系统发育的统计推断(讨论)》,J.R.Statist。Soc.A,146,246-272(1983)·兹伯利0528.62090
[32] Felsenstein,J.,使用bootstrap方法对系统发育的置信极限,进化,39,783-791(1985)
[33] Felsenstein,J.,1993年。;Felsenstein,J.,1993年。
[34] Felsenstein,J.,《统计系统发育学的麻烦增长》,系统。《生物学》,50,465-467(2001)
[35] 惠誉,W.M。;Markowitz,E.,《测定基因密码子变异性的改进方法及其在进化突变固定率中的应用》,《生物化学》。遗传学,4579-593(1970)
[36] 弗林格,医学硕士。;Verducci,J.S.E.,《排名数据的概率模型和统计分析》(1992年),施普林格-弗拉格:柏林施普林格
[37] Hammersley,J.,《关于估计限制参数》,J.R.Statist。Soc.序列号。B、 12,192-240(1950),(有讨论)·Zbl 0040.22202号
[38] Hein,J.,一种新的方法,在给定系统发育时,同时为任意数量的同源序列校准和重建祖先序列,Mol.Biol。演变。,6, 649-668 (1989)
[39] Hendy,M.D.,《寻找进化树的最近树算法的组合描述》,《离散数学》。,96, 51-58 (1991) ·Zbl 0746.05059号
[40] 亨迪,医学博士。;Penny,D.,系统发育数据的光谱分析,J.分类,10,5-23(1993)·Zbl 0772.92014号
[41] 亨迪,医学博士。;Penny,D。;Steel,M.A.,进化树的离散傅里叶分析,Proc。国家。阿卡德。科学。,91, 3339-3343 (1994) ·Zbl 0791.92017号
[42] Hillis,D.M.,《推断复杂系统发育》,《自然》,383130(1996)
[43] 霍奇斯,J.L.J.,莱曼,E.L.,1961年。比较正常分数和Wilcoxon测试。摘自:第四届伯克利数理统计与概率研讨会论文集,加州伯克利,第1卷,第307-317页。;霍奇斯,J.L.J.,莱曼,E.L.,1961年。比较正常分数和Wilcoxon测试。摘自:《第四届伯克利数理统计与概率研讨会论文集》,加州伯克利,第1卷,第307-317页·兹比尔0113.13305
[44] 霍姆斯,S.,1999年。谱系:概述。摘自:Halloran,E.,Geisser,S.(编辑),《统计学与遗传学》,IMA,第81卷。纽约州斯普林格-Verlag。;霍姆斯,S.,1999年。谱系:概述。收录:Halloran,E.,Geisser,S.(编辑),统计学和遗传学,IMA,第81卷。纽约州斯普林格·弗拉格·Zbl 0939.92024号
[45] Huelsenbeck,J。;Ronquist,F.,贝叶斯先生。系统发育树的贝叶斯推断,生物信息学,17754-755(2001)
[46] Huson,D.,2000年。拆分树。网址。网址:http://www.mathematik.unibielefeld.de/huson/系统发育学/splitstree.html;Huson,D.,2000年。拆分树。网址。网址:http://www.mathematik.unibielefeld.de/huson/系统发育学/splitstree.html
[47] 克鲁格,A.C。;Farris,J.S.,定量系统发育学和无尾类进化,系统。动物园。,18, 1-32 (1969)
[48] Lake,J.A.,《根据DNA和蛋白质序列重建进化树》,期刊。国家。阿卡德。科学。,91, 1455-1459 (1994)
[49] Lehmann,E.L.,《非参数:基于等级的统计方法》(1975),霍尔登·戴:加州旧金山霍尔登·戴·Zbl 0354.62038号
[50] Lehmann,E.L。;Casella,G.,《点估计理论》(1998),施普林格:施普林格柏林·Zbl 0916.62017号
[51] 李,S。;珀尔,D.K。;Doss,H.,使用mcmc构建系统发育树,J.Am.Statist。协会,95,493-503(2000)
[52] Li,W.H.,《分子进化》(1997),西奈尔:西奈尔-波士顿
[53] Lo,S.-H.,《通过新的解释从物种问题到一般覆盖问题》,Ann.Statist。,20, 1094-1109 (1992) ·Zbl 0778.62028号
[54] 洛克哈特,宾夕法尼亚州。;钢铁硕士。;亨迪,M。;Penny,D.,《在更现实的序列进化模型下恢复进化树》,Mol.Biol。演变。,11, 605-612 (1994)
[55] 洛克哈特,P.J。;Larkum,A.W.D。;钢铁,硕士。;Waddell,P.J。;Penny,D.,《叶绿素和细菌叶绿素的进化——序列分析中不变位点的问题》,Proc。国家。阿卡德。科学。,93, 1930-1934 (1996)
[56] 洛克哈特,P.J。;钢铁硕士。;巴布鲁克。;Huson,D.H。;Howe,C.J.,共价肽模型描述了氧光合作用的进化,分子生物学。演变。,15, 1183-1188 (1998)
[57] Mallows,C.L.,《非完全排名模型》,I.Biometrika,44,114-130(1957)·Zbl 0087.34001号
[58] Marden,J.I.,分析和建模等级数据(1995),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0853.62006号
[59] Mau,B。;牛顿,医学硕士。;Larget,B.,通过马尔可夫链蒙特卡罗方法进行贝叶斯系统发育推断,生物统计学,55,1-12(1999)·Zbl 1059.62675号
[60] Page,R.,《关于共识、信心和全部证据》,《分支学》,第12期,第83-92页(1996年)
[61] 第页,R。;霍姆斯,E.,《分子进化,系统发育方法》(2000),布莱克威尔科学:牛津布莱克威尔科学
[62] Penny,D。;Holmes,S.,《末日01进化过程中的生物数学》,Trends Ecol。演变。,16, 275-276 (2001)
[63] Pezner,P.,《计算分子生物学,算法方法》(2000年),麻省理工学院出版社:麻省理学院出版社剑桥·Zbl 0972.92011号
[64] A.拉姆鲍特。;北卡罗来纳州格拉斯利,Seq-Genan应用于DNA序列沿系统发育树演化的蒙特卡罗模拟,计算。申请。生物科学。,13, 235-238 (1997)
[65] Robbins,H.,《经验贝叶斯估计问题》,Proc。国家。阿卡德。科学。,77, 6988-6989 (1980) ·兹比尔0456.62029
[66] 罗宾斯,H.,《关于经验贝叶斯估计的一些思考》,《统计年鉴》。,11, 713-723 (1983) ·Zbl 0522.62024号
[67] Robbins,H.,均值和方差的线性经验Bayes估计,Proc。国家。阿卡德。科学。,82, 1571-1574 (1985) ·Zbl 0559.62034号
[68] 桑德森,M.J。;多诺霍,M.J。;Piel,W。;Eriksson,T.,Treebasea系统发育分析原型数据库和浏览生命系统发育的交互式工具,《美国医学杂志》,第81卷,第183页(1994年)
[69] Sanderson,M。;Purvis,A。;Henze,C.,《组装生命树的系统发生超树》,Trends Ecol。演变。,130105-109(1998年)
[70] 桑科夫,D。;Blanchette,M.,基因组重排的系统发育不变量,J.Compute。《生物学》,6431-445(1999)
[71] Sankoff,D.,Cedergren,R.,1983年。树关联的三个或多个序列的同时比较。收录:时间扭曲、字符串编辑和大分子:序列比较的理论与实践。Addison-Wesley,纽约,第253-264页。;Sankoff,D.,Cedergren,R.,1983年。树关联的三个或多个序列的同时比较。收录:时间扭曲、字符串编辑和大分子:序列比较的理论与实践。Addison-Wesley,纽约,第253-264页。
[72] Schwikowski,B。;Vingron,M.,广义树对齐问题的延迟路径启发式,J.Compute。《生物学》,第4期,第415-431页(1997年)
[73] Steel,M.A.,系统发育树的最大似然点并不是唯一的。生物学,43,560-564(1994)
[74] 钢,M。;Penny,D.,Parsimony,分子系统发育学中模型的可能性和作用,分子生物学。演变。,17, 839-850 (2000)
[75] 钢铁硕士。;Szekely,L.A.,《反转随机函数》,《Ann.Combin.》,第3期,第103-113页(1999年)·Zbl 0966.92018号
[76] 钢铁硕士。;Szekely,L.A.,《反演随机函数(II):离散最大似然估计的显式界及其应用》,SIAM J.离散数学。,15262-575(2002年)·Zbl 1055.62522号
[77] 钢,M。;连衣裙,A。;Bockner,S.,超树和一致树方法的一些简单但基本的限制,系统。《生物学》,42,363-368(2000)
[78] 斯特里默,K。;Moulton,V.,使用定向图形模型进行系统发育网络的可能性分析,分子生物学。演变。,17, 875-881 (2000)
[79] Tang,H。;Lewontin,R.,DNA和蛋白质序列差异变异区的定位,遗传学,153485-495(1999)
[80] 塔夫利,C。;Steel,M.,在一个简单的场地替代模型下最大可能性和最大节约之间的联系,Bull。数学。生物学,59,581-607(1997)·兹伯利0933.62118
[81] Tukey,J.,1975年。数学和数据的图像化。摘自:《国际数学家大会论文集》,第2卷,温哥华,第523-531页。;Tukey,J.,1975年。数学和数据的图像化。载:《国际数学家大会论文集》,第2卷,温哥华,第523-531页·Zbl 0347.6202号
[82] Van-Lint,J。;Wilson,R.,《组合数学课程》(1992),剑桥大学出版社:剑桥大学出版社·Zbl 0769.05001号
[83] 冯·海斯勒,A。;Churchill,G.,《层序演化的网络模型》,J.Mol.Evol。,37, 77-85 (1993)
[84] Wheeler,W.,1991年。数据集之间的一致性:DNA序列系统发育分析中的贝叶斯方法。宫本茂M.M.,Cracraft,J.(编辑)。DNA序列的系统发育分析。纽约州威利。;Wheeler,W.,1991年。数据集之间的一致性:DNA序列系统发育分析中的贝叶斯方法。宫本茂M.M.,Cracraft,J.(编辑)。DNA序列的系统发育分析。纽约州威利。
[85] Yang,Z.,基于可变速率DNA序列的最大似然系统发育估计,《分子进化杂志》。,39, 306-314 (1994)
[86] Yang,Z.,DNA序列进化的时空过程模型,遗传学,139993-1005(1995)
[87] 杨,Z。;Rannala,B.,使用DNA序列的贝叶斯系统发育推断,马尔可夫链蒙特卡罗方法,分子生物学。演变。,14, 717-724 (1997)
[88] Youden,W.J.,《持久价值,技术计量学》,第14期,第1-11页(1972年)
[89] 扎尔基赫,A。;Li,W.H.,系统发育完全和部分引导技术的置信度估计,分子系统发育。演变。,4, 44-63 (1995)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。