×

最佳匹配图和基因树与物种树的协调。 (英语) Zbl 1434.05035号

摘要:计算生物学中的各种问题,尤其是正畸学的评估,都是通过相互最佳匹配来解决的。使用最佳匹配的进化定义,捕捉概念背后的直觉,我们严格阐明了在重复/丢失场景假设下互惠最佳匹配、正形学和进化事件之间的关系。我们证明了正交图是倒数最佳匹配图(RBMG)的子图。我们进一步给出了RBMG作为一个有向图识别正确的正态关系的条件。通过计算机模拟,我们发现,在没有水平转移的情况下,大多数假阳性的正畸分配都可以被识别为所谓的好四分位,从而得到纠正。然而,水平转移也可能引入假阴性正畸分配。

MSC公司:

05二氧化碳
05C62号 图形表示(几何和交点表示等)
05C90年 图论的应用
92B10型 数学生物学中的分类学、分支学、统计学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿德里安·奥尔登霍夫(Adrian M.Altenhoff)。;布里吉特·博埃克曼(Brigitte Boeckmann);萨尔瓦多卡佩拉·古蒂雷斯;Daniel A.Dalquen。;托德·德卢卡(Todd Deluca);克里斯托弗·福斯伦德;韦尔塔·塞帕斯,詹姆;本杰明·利纳德;塞西尔·佩雷拉;普里什茨(Pryszcz)、莱斯泽克(Leszek P.)。;费比安·施雷伯;达席尔瓦,阿兰·索萨;Szklarczyk,Damian;火车,Clément-Marie;博克,佩尔;奥德尔·勒康普特;冯·梅林(Von Mering),克里斯蒂安(Christian);塞纳里奥斯,伊奥安尼斯;Kimmen Sjölander;延森(Lars Juhl Jensen);Martin,Maria J。;马蒂厄·穆法托;Toni Gabaldón;刘易斯,苏珊娜E。;保罗·D·托马斯。;埃里克·桑纳默尔(Erik Sonnhammer);Christophe Dessimoz,《寻求正交曲线的标准化基准测试》,《自然方法》,第13、5、425-430页(2016年)
[2] 美国奥尔滕霍夫;斯图德,Ra;罗宾森·里查维,M。;Dessimoz,C.,《解决直系图猜想:直系图在功能上往往弱于Paralog,但明显更相似》,《公共科学图书馆·Comp Biol》,8,e1002514(2012)
[3] 班萨尔,M。;阿尔姆,E。;Kellis,M.,《基因重复、水平转移和丢失的协调问题的高效算法》,生物信息学,28,i283-i291(2012)
[4] Böcker,S。;Briesemeister,S。;Klau,Gw,《集群编辑的精确算法:评估和实验》,《算法》,60,316-334(2011)·兹比尔1215.68169
[5] Böcker,S。;《Dress,Awm,Recovering symbol dated,root trees from symbol ultrametrics》,《高等数学》,138105-125(1998)·Zbl 0912.05031号
[6] 科内尔,Dg;Lerchs,H。;Steward Burlingham,L.,互补可约图,离散应用数学,3163-174(1981)·Zbl 0463.05057号
[7] Dalquén,Da;Anisimova,M。;Gonnet,Gh;Dessimoz,C.,ALF-A基因组进化模拟框架,Mol Biol Evol,2911115-1123(2011)
[8] Datta,Rs;米查姆,C。;B.萨马德。;Neyer,C。;Sjölander,K.,Berkeley PHOG:PhyloFacts orthology group prediction web server,核酸研究,37,W84-W89(2009)
[9] Dondi,R。;Lafond,M。;El-Mabrouk,N.,《加权和未加权正畸和副相关关系的近似校正》,《分子生物学算法》,12,4(2017)
[10] Doyon,Jp;Chauve,C。;Hamel,S.,《基因/物种树协调和节约型模型的空间》,《Comp Biol杂志》,第16期,1399-1418页(2009年)
[11] Doyon,Jp;V.Ranwez。;道宾,V。;Berry,V.,《系统发育协调的模型、算法和程序》,Brief Bioninform,12392-400(2011)
[12] Doyon,Jp;斯科纳瓦卡,C。;肯塔基州戈尔布诺夫;Szöllősi,Gj;V.Ranwez。;贝里,V。;Tannier,E.,《基因/物种树与损失、重复和转移的节约型协调的有效算法》,比较基因组学:国际研讨会,RECOMB-CG 2010,93-108(2010),柏林:斯普林格,柏林
[13] 杜法亚德,Jf;杜雷特。;佩内尔,S。;M.古伊。;Rechenmann,F。;Perriere,G.,《系统发育树中的树模式匹配:同源基因序列数据库中同源基因或同源基因的自动搜索》,生物信息学,212596-2603(2005)
[14] 埃伦菲赫特,A。;Rozenberg,G.,2-结构理论,第一部分:族、基本子类和态射,Theor Comp Sci,70277-303(1990)·Zbl 0701.05051号
[15] 埃伦菲赫特,A。;Rozenberg,G.,《二结构理论,第二部分:通过标记树族的表示》,《Theor Comp Sci》,70,305-342(1990)·Zbl 0701.05052号
[16] Fitch,Wm,区分同源蛋白和类似蛋白,系统Zool,19,99-113(1970)
[17] Fitch,Wm,《同源性:对一些问题的个人看法》,《基因趋势》,16,227-231(2000)
[18] Gabaldón,T。;Koonin,Ev,《基因正形学的功能和进化影响》,《Nat Rev Genet》,第14期,第360-366页(2013年)
[19] Geiß,M。;安德斯,J。;斯塔德勒,Pf;威塞克,N。;Hellmuth,M.,从惠誉的异种关系重建基因树,《数学生物学杂志》,77,1459-1491(2018)·Zbl 1396.05025号
[20] 盖伊,M。;查韦斯,E。;González Laffitte,M。;López Sánchez,A。;斯塔德勒,Bmr;瓦尔迪维亚,迪;Hellmuth,M。;埃尔南德斯·罗萨莱斯,M。;Stadler,Pf,最佳匹配图,《数学生物学杂志》,782015-2057(2019)·Zbl 1415.92133号
[21] Manuela Geiß;彼得·斯塔德勒(Peter F.Stadler)。;Marc Hellmuth,《互惠最佳匹配图》,《数学生物学杂志》,80,3865-953(2019)·Zbl 1433.05303号
[22] Górecki,P。;Tiuryn,J.,《DLS-trees:进化场景模型》,《Theor Comp Sci》,359378-399(2006)·Zbl 1097.68053号
[23] 吉奥,R。;穆奇尼克,I。;Smith,Tf,《古代分子系统发育重建》,分子系统发育进化,6189-213(1996)
[24] Hellmuth,M.,《生物学上可行的基因树、调和图和信息三元组》,Alg-Mol Biol,12,23(2017)
[25] Hellmuth,M。;Hernandez-Rosales,M。;胡贝尔,Kt;莫尔顿,V。;斯塔德勒,Pf;Wieseke,N.,《矫形关系、符号超测量学和齿状图》,《数学生物学杂志》,66,399-420(2013)·Zbl 1408.05038号
[26] Hellmuth,M。;Huber,K。;Moulton,V.,《事件标记基因树与MUL树和物种网络的协调》,《数学生物学杂志》,791885-1925(2019)·Zbl 1423.05185号
[27] Hellmuth,M。;Seemann,Cr,《惠誉异质关系的替代表征》,《数学生物学杂志》,79,969-986(2019)·Zbl 1420.92082号
[28] Hellmuth,M。;斯塔德勒,Pf;Wieseke,N.,《异种学的数学:二元图、符号超计量、二元结构和二元关系的树表示系统》,《数学生物学杂志》,75,299-237(2017)·Zbl 1368.05023号
[29] 马克·赫尔穆特(Marc Hellmuth);尼古拉斯·威塞克(Nicolas Wieseke),《从序列数据(包括同源、同源和异种)到基因和物种树》,《进化生物学》,373-392(2016),查姆:斯普林格国际出版社,查姆
[30] Hellmuth,M。;威塞克,N。;Lechner,M。;伦霍夫,Hp;米登多夫,M。;Stadler,Pf,《与paralogs的系统基因组学》,美国国家科学院学报,1122058-2063(2015)
[31] Hernandez-Rosales,M。;Hellmuth,M。;威塞克,N。;Huber,Kt;莫尔顿,V。;Stadler,Pf,《从事件标记基因树到物种树》,BMC Bioninform,13,S6(2012)
[32] Hoáng,Ct;卡明斯基,M。;Sawada,J。;Sritharan,R.,《寻找和列出诱导路径和循环》,Discr Appl Math,161633-641(2013)·Zbl 1259.05094号
[33] Innan,H。;Kondrashov,F.,《基因重复的进化:模型之间的分类和区分》,《Nat Rev Genet》,第11期,第97-108页(2010年)
[34] 贾米森,B。;Olariu,S.,识别线性时间中的稀疏图,SIAM J Comput,21381-406(1992)·Zbl 0763.05093号
[35] 詹森,Lj;朱利安,P。;库恩,M。;冯·梅林,C。;穆勒,J。;Doerks,T。;Bork,P.,eggNOG:基因同源群的自动构建和注释,《核酸研究》,36,D250-D2504(2008)
[36] Keller Schmidt,S。;Klemm,K.,《作为基于创新的分支过程的宏观进化模型》,《高级复杂系统》,第15期,1250043页(2012年)
[37] Koonin,E.,Orthologs,paralogs,and evolutional genomics,《基因年鉴》,39,309-338(2005)
[38] 库恩,Ts;摩尔人,阿瑟;Thomas,Gh,《一个简单的多体系统发育测定解析器》,《Ecol Evo方法》,2427-436(2011)
[39] Lafond,M。;Dondi,R。;El-Mabrouk,N.,《直系关系和基因树之间的联系:校正视角》,《算法分子生物学》,11,4(2016)
[40] Lafond,M。;El-Mabrouk,N.,《矫形学和寄生虫学约束:可满足性和一致性》,BMC Genom,15,S12(2014)
[41] Lechner,M。;Hernandez-Rosales,M。;多尔·D·。;威塞克,N。;Thévenin,A。;Stoye,J。;哈特曼,Rk;Sj普罗哈斯卡;Stadler,Pf,《结合聚类和合成的超大数据集矫形检测》,PLoS ONE,9,e105015(2014)
[42] 李,L。;小Cj Stoeckert;Roos,Ds,OrthoMCL:真核生物基因组的同源群鉴定,《基因组研究》,13,2178-2189(2003)
[43] 刘,Y。;Wang,J。;Guo,J。;Chen,J.,《复杂度和有向图编辑的参数化算法》,Theor Comp Sci,461,45-54(2012)·兹比尔1253.68179
[44] Nichio,Btl;马尔乔科斯基,Jn;Raittz,Rt,《矫形分析的新工具:前景展望的简要回顾》,Front Genet,8,165(2017)
[45] Nöjgaard,N。;盖伊,M。;Merkle,D。;Stadler,Pf公司;威塞克,N。;Hellmuth,M.,《时间一致性协调图和禁止的时间旅行》,《Alg-Mol-Biol》,第13、2页(2018年)
[46] 页码,Rdm;Charleston,Ma,调和树和不协调基因和物种树,DIMACS Ser离散数学和Theor计算科学,37,57-70(1997)·Zbl 0892.92011号
[47] Purvis,A。;Garland,T.Jr,《连续性状比较分析中的多元性》,《系统生物学》,42,569-575(1993)
[48] Acj Roth;贡内特,Gh;Dessimoz,C.,用于大规模正畸推断的OMA算法,BMC Bioninform,9518(2008)
[49] Rusin,Ly;Lyubetskaya,E。;肯塔基州戈尔布诺夫;Lyubetsky,V.,《基因和物种树的调和》,生物医药研究国际,2014,642089(2014)
[50] Sayyari,E。;Mirarab,S.,《使用四分位频率测试系统发育物种树中的多体》,《基因》,9,E132(2018)
[51] Sonnhammer,E.L.L。;Gabaldon,T。;Sousa Da Silva,A.W。;Martin,M。;罗宾森·里查维,M。;Boeckmann,B。;P.D.托马斯。;Dessimoz,C.,《大数据和寻求正交曲线的其他挑战》,生物信息学,30,21,2993-1998(2014)
[52] Stadler PF、GeißM、Schaller D、López A、Gonzalez Laffitte M、Valdivia D、Hellmuth M、Hernandez Rosales M(2020)从最佳点击到最佳匹配。技术代表2001.00958,arXiv·Zbl 07340472号
[53] 风暴,Ce;Sonnhammer,El,从系统发育树进行的自动直系推断和直系可靠性计算,生物信息学,18,92-99(2002)
[54] 斯图德,Ra;Robinson-Rechavi,M.,我们对直系图相似,但直系图不同有多大信心?,Trends Genet,25210-216(2009)
[55] 塔图索夫,Rl;叶甫库宁;Lipman,Dj,蛋白质家族的基因组观点,《科学》,278631-637(1997)
[56] 托菲格,A。;Hallett,M。;Lagergren,J.,《同时识别重复和横向基因转移》,IEEEACM Trans-Comput Biol Bioninform,8517-535(2011)
[57] 弗诺,B。;Stolzer,M。;Goldman,A。;Durand,D.,《与非二元物种树的协调》,《计算生物学杂志》,第15期,981-1006页(2008年)
[58] Aj维莱拉;Severin,J。;Ureta-Vida,A。;Heng,L。;杜宾,R。;Birney,E.,EnsemblCompara GeneTrees:脊椎动物中完整的、可重复的系统发育树,基因组研究,19327-335(2009)
[59] Zallot,R。;哈里森,Kj;科拉茨科夫斯基,B。;De Crécy-Lagard,V.,《paralogs的功能注释:祝福与诅咒》,《生活》,6,39(2016)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。