×

基因复制和物种形成事件的自举算法。 (英语) 兹比尔1346.92045

Botón-Fernández,María(编辑)等人,《计算生物学算法》。2016年6月21日至22日在西班牙特鲁希略举行的2016年AlCoB第三届国际会议。诉讼程序。查姆:施普林格(ISBN 978-3-319-38826-7/pbk;978-3-3169-38827-4/电子书)。9702计算机科学课堂讲稿。生物信息学课堂讲稿,106-118(2016)。
摘要:基于系统发育树的经典非参数自举,我们提出了一种新的自举方法来定义对基因复制和物种形成事件的支持。虽然这种方法可以用于注释正形和副序,但我们展示了如何使用它来验证树和解的可靠性,以及如何应用于未生根基因树的生根问题。我们提出了一种计算bootstrap值的线性时间算法,并证明了我们的方法与经典的非参数bootstrapping的对应性。最后,基于模拟数据和9个酵母基因组,我们对生根方法进行了比较研究,并使用我们的自举方法评估了它们的性能。这些软件和示例是公开的。
关于整个系列,请参见[Zbl 1337.92004号].

MSC公司:

92D10型 遗传学和表观遗传学
92D15型 与进化有关的问题
92-04 生物相关问题的软件、源代码等
62F40型 引导、折刀和其他重采样方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Arvestad,L.、Berglund,A.、Lagergren,J.、Sennblad,B.:基于复制和序列进化综合模型的基因树重建和正形分析。摘自:RECOMB,第326–335页(2004年)·数字对象标识代码:10.1145/974614.974657
[2] Bender,M.A.,Farach-Colton,M.:重新审视生命周期评价问题。收录:Gonnet,G.H.,Viola,A.(编辑)LATIN 2000。LNCS,第1776卷,第88-94页。斯普林格,海德堡(2000)·Zbl 0959.68133号 ·doi:10.1007/10719839_9
[3] Beretta,S.,Dondi,R.:通过叶片移除和修改进行基因树校正:可处理性和近似性。摘自:Beckmann,A.,Csuhaj-Varjú,E.,Meer,K.(编辑)CiE 2014。LNCS,第8493卷,第42-52页。斯普林格,海德堡(2014)·兹比尔1432.68187 ·doi:10.1007/978-3-319-08019-2-5
[4] Chaudhary,R.,Boussau,B.,Burleigh,J.G.,Fernandez-Baca,D.:评估从多拷贝基因推断物种树的方法。系统。生物学64(2),syu128(2014)
[5] Chaudhary,R.、Burleigh,J.G.、Eulenstein,O.:基于重复、重复和丢失以及深度合并的基因树协调的高效错误纠正算法。BMC生物信息。13(补充10),S11(2012)·doi:10.186/1471-2105-13-S10-S11
[6] Durand,D.,Halldórsson,B.V.,Vernot,B.:基因树重建的混合微进化方法。J.计算。生物13(2),320–335(2006)·兹比尔1119.92351 ·doi:10.1089/cmb.2006.13.320
[7] Farris,J.S.:从距离矩阵估计系统发育树。《美国国家》106(951),645-668(1972)·doi:10.1086/282802
[8] Felsenstein,J.:菲利普。http://evolution.genetics.washington.edu/phylip.html
[9] Felsenstein,J.:系统发育的置信极限:一种使用bootstrap的方法。进化。39, 783–791 (1985) ·doi:10.2307/2408678
[10] Gogarten,J.P.,Kibak,H.,Dittrich,P.,Taiz,L.,Bowman,E.J.,Bowman,B.J.,Manolson,M.F.,Poole,R.J.,Date,T.,Oshima,T.:液泡H+-atpase的进化:真核生物起源的意义。程序。美国国家科学院。科学。86(17), 6661–6665 (1989) ·doi:10.1073/pnas.86.17.6661
[11] Goodman,M.,Czelusniak,J.,Moore,G.W.,Romero-Herrera,A.E.,Matsuda,G.:将基因谱系整合到物种谱系中,这是一种简约策略,由珠蛋白序列构建的枝序图说明。系统。Zool(动物园)。28(2), 132–163 (1979) ·doi:10.2307/2412519
[12] Górecki,P.,Eulenstein,O.:算法:基因树和解和基因复制问题的同时错误纠正和根源。BMC生物信息。13(补充10),S14(2012)·doi:10.1186/1471-2105-13-S10-S14
[13] Górecki,P.,Burleigh,J.G.,Eulenstein,O.:未根基因树的GTP超树:基于nni的局部搜索的线性时间算法。收录人:Bleris,L.、Mndoiu,I.、Schwartz,R.、Wang,J.(编辑)ISBRA 2012。LNCS,第7292卷,第102-114页。斯普林格,海德堡(2012)·Zbl 06138931号 ·doi:10.1007/978-3-642-30191-9_11
[14] Górecki,P.,Tiuryn,J.:DLS-树:进化场景模型。理论。计算。科学。359(1–3), 378–399 (2006) ·Zbl 1097.68053号 ·doi:10.1016/j.tcs.2006.05.019
[15] Górecki,P.,Eulenstein,O.,Tiuryn,J.:无根树木和解:一种统一的方法。IEEE/ACM传输。计算。生物信息学。10(2), 522–536 (2013) ·doi:10.1109/TCBB.2013.22
[16] Górecki,P.,Tiuryn,J.:从整个基因组推断系统发育。生物信息学23(2),e116–e122(2007)·doi:10.1093/bioinformatics/btl296
[17] Guindon,S.,Delsuc,F.,Dufayard,J.,Gascuel,O.:用PhyML估计最大似然系统发育。方法分子生物学。537, 113–137 (2009) ·doi:10.1007/978-1-59745-251-9_6
[18] Guindon,S.,Gascuel,O.:一种简单、快速、准确的算法,用于通过最大似然估计大型系统发育。系统。生物学52(5),696–704(2003)·doi:10.1080/10635150390235520
[19] Hahn,M.W.:系统发育树协调方法中的偏差:脊椎动物基因组进化的意义。基因组生物学。8(7),R141+(2007)·doi:10.1186/gb-2007-8-7-r141
[20] Hallett,M.T.,Lagergren,J.:横向基因转移问题的高效算法。收录于:RECOMB,第149-156页(2001年)·数字对象标识代码:10.1145/369133.369188
[21] Holland,B.,Penny,D.,Hendy,M.:分子钟下的外群错位和系统发育不准确——一项模拟研究。系统。《生物学》52、229–238(2003)·doi:10.1080/10635150390192771
[22] Huelsenbeck J.P.、Bollback J.P.和Levine A.M.:推断系统发育树的根。系统。生物学51(1),32–43(2002)·doi:10.1080/106351502753475862
[23] Iwabe,N.、Kuma,K.、Hasegawa,M.、Osawa,S.、Miyata,T.:根据重复基因的系统发育树推断的古细菌、真核生物和真核生物的进化关系。程序。美国国家科学院。科学。86(23), 9355–9359 (1989) ·doi:10.1073/pnas.86.23.9355
[24] 马,B.,李,M.,张,L.:从基因树到物种树。SIAM J.计算。30(3), 729–752 (2000) ·Zbl 0968.68057号 ·doi:10.1137/S0097539798343362
[25] Maddison,W.P.,Maddison,D.:梅斯基特:进化分析的模块化系统(2015)·Zbl 0222.65016号
[26] Page,R.:从基因到生物系统发育:调和树和基因树/物种树问题。分子系统学。进化。7(2), 231–240 (1997) ·doi:10.1006/mpev.1996.0390
[27] Page,R.D.M.:树木之间的地图和基因、生物和区域之间历史关联的分支分析。系统。生物学43(1),58–77(1994)
[28] Park,H.J.,Jin,G.,Nakhleh,L.:通过最大简约性推断的基于Bootstrap的hgt支持。BMC演变。生物学10(1),1-11(2010)·doi:10.1186/1471-2148-10-1
[29] Rambaut,A.,Grassly,N.C.:Seq-Gen:沿着系统发育树的DNA序列进化的蒙特卡罗模拟应用。计算。申请。Biosci公司。13, 235–238 (1997)
[30] Rasmussen,M.D.,Kellis,M.:使用基因座树对基因复制、丢失和合并进行统一建模。基因组研究22(4),755-765(2012)·doi:10.1101/gr.123901.111
[31] Sanderson,M.J.,McMahon,M.M.:利用广泛的基因重复从EST数据推断被子植物的系统发育。BMC演变。生物7(补充1),S3(2007)·doi:10.1186/1471-2148-7-S1-S3
[32] Swenson,K.、Doroftei,A.、El-Mabrouk,N.:协调和物种树推断的基因树校正。分子生物学算法。7(1), 31 (2012) ·doi:10.1186/1748-7188-7-31
[33] Génolevures Consortium:Géno levures:蛋白质家族和完整半丝酵母菌酵母蛋白质组和基因组之间的共有性。《核酸研究》37(补充1),D550–D554(2009)·Zbl 05746588号 ·doi:10.1093/nar/gkn859
[34] Wu,Y.,Rasmussen,M.D.,Bansal,M.S.,Kellis,M.:Treefix:使用物种树进行统计信息基因树错误纠正。系统。生物学62,110–120(2012)·doi:10.1093/sysbio/sys076
[35] Yu,Y.,Warnow,T.,Nakhleh,L.:基于MDC的多基因座系统发育推断算法。收录:Bafna,V.,Sahinalp,S.C.(编辑)RECOMB 2011。LNCS,第6577卷,第531-545页。斯普林格,海德堡(2011)·Zbl 05900514号 ·doi:10.1007/978-3-642-20036-647
[36] Zmasek,C.,Eddy,S.:Rio:利用同源基因重采样推断,通过自动系统发育组学分析蛋白质组。BMC生物信息。3(1), 14 (2002) ·Zbl 05325848号 ·doi:10.1186/1471-2105-3-14
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。