×

最佳匹配图中不正确的正交赋值的完整特征。 (英语) Zbl 1460.92149号

摘要:基因组尺度的正畸分配通常基于相互最佳匹配。在没有水平基因转移(HGT)的情况下,每对直系同源基因形成相互最佳匹配。因此,在倒数最佳匹配图中,不正确的正畸分配总是假阳性。我们考虑了重复/丢失场景,并描述了明确的假阳性(u-fp)正交分配,即最佳匹配图(BMG)中不能对应于解释BMG的任何基因树的正交的边。此外,我们提供了一个多项式时间算法来识别BMG中的所有u-fp正交分配。模拟结果表明,所有不正确的正畸分配中,至少有75%可以用这种方式检测到。所有结果仅依赖于BMG的结构,而不依赖于关于潜在基因或物种树的任何先验知识。

MSC公司:

第92天 与进化有关的问题
05C90年 图论的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Altenhoff AM、Boeckmann B、Capella-Gutierrez S、Dalquen DA、DeLuca T、Forslund K、Huerta-Cepas J、Linard B、Pereira C、Pryszcz LP、Schreiber F、Sousa DA Silva A、Szklarczyk D、Train CM、Bork P、Lecompte O、von Mering C、Xenarios I、Sjölander K、Juhl Jensen L、Martin MJ、Muffato M、Orthologs财团Quest、Gabaldón T、Lewis SE、Thomas PD、,Sonnhammer E,Dessimoz C(2016)在寻求正交曲线的过程中进行标准化基准测试。《自然方法》13:425-430。doi:10.1038/nmeth.3830
[2] Böcker,S。;服装,AWM,从符号超几何中恢复象征性过时的根树,《高等数学》,138105-125(1998)·Zbl 0912.05031号 ·doi:10.1006/aima.1998.1743
[3] 布莱恩特,D。;Steel,M.,叶标记树集的扩展操作,高级应用数学,16,425-453(1995)·Zbl 0863.92012号 ·doi:10.1006/aama.1995.1020
[4] Chang WC,Eulenstein O(2006)《基因树与明显多体的调和》。作者:Chen DZ,Lee DT(编辑)计算与组合数学。COCOON 2006,施普林格,柏林,海德堡,莱克特。票据构成。科学。,第4112卷,第235-244页,doi:10.1007/11809678_26·Zbl 1162.92314号
[5] 科内尔DG;Lerchs,H。;伯林厄姆,LS,补可约图,离散应用数学,3163-174(1981)·Zbl 0463.05057号 ·doi:10.1016/0166-218X(81)90013-5
[6] Delsuc,F。;Brinkmann,H。;Philippe,H.,《系统基因组学与生命树的重建》,《Nat Rev Genet》,第6期,第361-375页(2005年)·数字对象标识代码:10.1038/nrg1603
[7] DeSalle,R。;Absher,R。;Amato,G.,物种和系统发育解析,《生态进化趋势》,9297-298(1994)·doi:10.1016/0169-5347(94)90034-5
[8] Dessimoz,C。;Boeckmann,B。;ACJ罗斯;Gonnet,GH,《在COG数据库中检测非正态性以及使用基因组特定最佳点击对正态性进行分组的其他方法》,《核酸研究》,34,3309-3316(2006)·数字对象标识代码:10.1093/nar/gkl433
[9] 多永,JP;V.Ranwez。;道宾,V。;Berry,V.,《系统发育协调的模型、算法和程序》,Brief Bioninform,12392-400(2011)·doi:10.1093/bib/bbr045
[10] 惠誉,WM,区分同源蛋白和类似蛋白,Syst Zool,19,99-113(1970)·doi:10.2307/2412448
[11] Gabaldón,T。;Koonin,EV,基因正形学的功能和进化含义,《自然评论遗传学》,14,360-366(2013)·doi:10.1038/nrg3456
[12] 加尔宾,MY;Kristensen,DM;堪萨斯州马卡洛瓦;Wolf,YI;Koonin,EV,微生物基因组分析:COG方法,Brief Bioinform,21063-1070(2019)·doi:10.1093/bib/bbx117
[13] 盖伊,M。;查韦斯,E。;González Laffitte,M。;López Sánchez,A。;斯塔德勒,BMR;DI Valdivia;Hellmuth,M。;埃尔南德斯·罗萨莱斯,M。;Stadler,PF,最佳匹配图,《数学生物学杂志》,782015-2057(2019)·Zbl 1415.92133号 ·doi:10.1007/s00285-019-01332-9
[14] GeißM、Chávez E、González Laffitte M、López Sánchez A、Stadler BMR、Valdivia DI、Hellmuth M、Hernández Rosales M、Stadler-PF(2020a)最佳匹配图(更正)。arxiv.org/1803.10989v4·Zbl 1415.92133号
[15] 盖伊,M。;冈萨雷斯-拉菲特(González Laffitte),ME;López Sánchez,A。;DI Valdivia;Hellmuth,M。;埃尔南德斯·罗萨莱斯,M。;Stadler,PF,《最佳匹配图和基因树与物种树的调和》,《数学生物学杂志》,80,1459-1495(2020)·Zbl 1434.05035号 ·doi:10.1007/s00285-020-01469-y
[16] 盖伊,M。;斯塔德勒,PF;Hellmuth,M.,《往复式最佳匹配图》,《数学生物学杂志》,80,865-953(2020)·兹比尔1433.05303 ·doi:10.1007/s00285-019-01444-2
[17] Górecki,P。;Tiuryn,J.,《DLS-trees:进化场景模型》,《Theor Comp Sci》,359,378-399(2006)·Zbl 1097.68053号 ·doi:10.1016/j.tcs.2006.05.019
[18] 吉奥,R。;穆奇尼克,I。;Smith,TF,《古代分子系统发育重建》,分子系统发育进化,6189-213(1996)·doi:10.1006/mpev.1996.0071
[19] O.黑根。;Stadler,T.,TreeSimGM:在R中模拟具有物种形成和灭绝的谱系特异性变化的一般Bellman-Harris模型下的系统发育树,方法Ecol Evol,9754-760(2018)·doi:10.1111/2041-210X.12917
[20] Hanada,K。;A.Tezuka。;Nozawa,M。;铃木,Y。;苏加诺,S。;AJ长野;伊藤,M。;Morinaga,SI,拟南芥基因复制数百万年后重复基因的功能分化,DNA Res,25227-339(2018)·doi:10.1093/dnares/dsy005
[21] Hellmuth,M.,《生物可行性基因树、调和图和信息三元组》,《算法分子生物学》,12,23(2017)·doi:10.1186/s13015-017-0114-z
[22] Hellmuth,M。;Hernandez-Rosales,M。;KT Huber;莫尔顿,V。;斯塔德勒,PF;Wieseke,N.,《矫形关系、符号超测量学和齿状图》,《数学生物学杂志》,66,399-420(2013)·Zbl 1408.05038号 ·文件编号:10.1007/s00285-012-0525-x
[23] Hellmuth,M。;威塞克,N。;Lechner,M。;惠普Lenhof;米登多夫,M。;Stadler,PF,《与paralogs的系统基因组学》,美国国家科学院学报,1122058-2063(2015)·doi:10.1073/pnas.1412770112
[24] Hellmuth M,Fritz A,Wieseke N,Stadler PF(2020a)有向图编辑问题的技术:模块合并等价于编辑(P_44)。艺术离散应用数学3:P2.01。doi:10.26493/2590-9770.1252.e71·Zbl 1441.05195号
[25] Hellmuth,M。;盖伊,M。;Stadler,PF,倒数最佳匹配图修改问题的复杂性,Theor Comp Sci,809384-393(2020)·Zbl 1443.92120号 ·doi:10.1016/j.tcs.2019.12.033
[26] Hernandez-Rosales,M。;Hellmuth,M。;威塞克,N。;KT Huber;莫尔顿,V。;Stadler,PF,《从事件标记基因树到物种树》,BMC Bioninform,13,Suppl.19,S6(2012)·doi:10.1186/1471-2105-13-S19-S6
[27] 韦尔塔·塞帕斯,J。;Szklarczyk,D。;海勒,D。;Hernndez-Plaza,A。;福斯伦德,SK;库克,H。;门德,DR;Letunic,I。;Rattei,T。;Jensen,L。;冯明,C。;Bork,P.,eggNOG 5.0:基于5090种生物和2502种病毒的等级、功能和系统发育注释的同源资源,《核酸研究》,47,D309-D314(2018)·doi:10.1093/nar/gky1085
[28] Keller-Schmidt,S。;Klemm,K.,《作为基于创新的分支过程的宏观进化模型》,《高级复杂系统》,第15卷,第1250页,第043页(2012年)·doi:10.1142/S0219525912500439
[29] Kendall,DG,《关于广义出生和死亡过程》,Ann Math Stat,19,1-15(1948)·Zbl 0032.17604号 ·doi:10.1214/aoms/1177730285
[30] 克里曼,RM;Andolfatto,P。;炔,JA;德波利斯,F。;克里特曼,M。;贝里,AJ;麦卡特,J。;Wakeley,J。;嘿,J.,果蝇复合种起源和分化的群体遗传学,遗传学,1561913-1931(2000)
[31] Lafond,M。;El-Mabrouk,N.,《矫形学和寄生虫学约束:可满足性和一致性》,BMC Genomics,15,S12(2014)·doi:10.186/1471-2164-15-S6-S12
[32] Lafond,M。;Chauve,C。;Dondi,R。;El-Mabrouk,N.,《用于纠正基因树中可疑重复的Polyotomy细分》,生物信息学,30,i519-i526(2014)·doi:10.1093/bioinformatics/btu463
[33] Lafond,M。;Dondi,RD;El-Mabrouk,N.,《直系关系和基因树之间的联系:校正视角》,《算法分子生物学》,11,4(2016)·兹比尔1383.92054 ·doi:10.1186/s13015-016-0067-7
[34] Lechner,M。;芬迪,S。;斯坦纳,L。;Marz,M。;斯塔德勒,PF;Prohaska,SJ,Proteinotho:在大规模分析中检测(co)正交,BMC Bioninform,12,124(2011)·doi:10.1186/1471-2105-12-124
[35] Liao,D.,《协同进化:分子机制和生物学意义》,《美国人类遗传学杂志》,64,24-30(1999)·doi:10.1086/302221
[36] Linard,B。;汤普森,JD;Poch,O。;Lecompte,O.,OrthoInspector:综合矫形分析和视觉探索,BMC Bioninform,12,11(2011)·doi:10.1186/1471-2105-12-11
[37] 刘,Y。;Wang,J。;郭杰。;Chen,J.,《复杂度和有向图编辑的参数化算法》,Theor Comp Sci,461,45-54(2012)·Zbl 1253.68179号 ·doi:10.1016/j.tcs.2011.11.040
[38] Maddison,W.,重建多体枝序图上的特征进化,分支系统学,5365-377(1989)·doi:10.1111/j.1096-0031.1989.tb00569.x
[39] McKee TA、McMorris FR(1999)《交集图理论专题》。Soc Ind Appl Math doi:10.137/1.978089871902·Zbl 0945.05003号
[40] 尼赫特,荷兰;WT克拉克;Radivojac,P。;Hahn,MW,利用哺乳动物的比较功能基因组数据测试正交猜想,《公共科学图书馆·Comp Biol》,7,e1002,073(2011)·doi:10.1371/journal.pcbi.1002073
[41] Nichio,BTL;马绍科斯基,JN;Raittz,RT,《矫形分析的新工具:前景展望的简要回顾》,Front Genet,8,165(2017)·doi:10.3389/fgene.2017.00165
[42] Nöjgaard,N。;盖伊,M。;Merkle,D。;斯塔德勒,PF;威塞克,N。;Hellmuth,M.,时间一致性调和图和禁止的时间旅行,Algorithms Mol Biol,13,2(2018)·Zbl 1443.92122号 ·doi:10.1186/s13015-018-0121-8
[43] 第页,RDM;马萨诸塞州查尔斯顿,《协调树和不协调基因和物种树》,DIMACS Ser离散数学理论计算科学,37,57-70(1997)·Zbl 0892.92011号 ·doi:10.1090/dimacs/037/04
[44] 潘博士。;Zhang,L.,Tandemly排列脊椎动物基因组中的基因,Comp Funct Genomics,2008,545269(2008)·doi:10.1155/2008/545269
[45] ACJ罗斯;Gonnet,生长激素;Dessimoz,C.,用于大规模正畸推断的OMA算法,BMC Bioninform,9518(2008)·doi:10.1186/1471-2105-9-518
[46] 拉辛,LY;Lyubetskaya,E。;肯塔基州戈尔布诺夫;Lyubetsky,V.,《基因和物种树的调和》,生物医药研究国际,2014,642089(2014)·doi:10.1155/2014/642089
[47] Sayyari,E。;Mirarab,S.,《使用四分位频率测试系统发育物种树中的多染色体》,《基因》,9,132(2018)·doi:10.3390/genes9030132
[48] Schaller D,Geiß,Stadler PF,Hellmuth M(2020)最佳匹配图修改问题的复杂性。arXiv:2006.02249·Zbl 1443.92120号
[49] Semple,C.,重建最小根树,离散应用数学,127489-503(2003)·Zbl 1038.05014号 ·doi:10.1016/S0166-218X(02)00250-0
[50] Semple,C。;Steel,M.,《系统发育遗传学》,牛津数学及其应用系列讲座(2003),英国牛津:牛津大学出版社,英国牛津·Zbl 1043.92026
[51] 塞图巴尔,JC;斯塔德勒,PF;塞图巴尔,JC;斯塔德勒,PF;Stoye,J.,《基因phyologenies and orthologous groups》,比较基因组学,1-28(2018),海德堡:施普林格,海德堡·doi:10.1007/978-1-4939-7463-4_1
[52] Sonnhammer,ELL;Ùstlund,G.,InParoid 8:273个蛋白质组(主要是真核生物)之间的形态分析,《核酸研究》,43,D234-D239(2015)·doi:10.1093/nar/gku1203
[53] 索里亚,PS;KL McGary;Rokas,A.,《每个段落的功能差异》,《分子生物学进化》,31984-992(2014)·doi:10.1093/molbev/msu050
[54] 斯塔德勒,PF;盖伊,M。;沙勒,D。;洛佩兹,A。;Gonzalez-Laffitte,M。;Valdivia,D。;Hellmuth,M。;Hernandez Rosales,M.,《从最相似的序列对到系统发育最佳匹配》,《分子生物学算法》,15,5(2020)·doi:10.1186/s13015-020-00165-2
[55] 斯坦布利安,M。;格雷罗,RF;哈恩,MW;Radivojac,P.,《重新审视直系猜想:直系和副直系在功能预测中的价值》,生物信息学,36,i219-226(2020)·doi:10.1093/bioinformatics/btaa468
[56] 斯文森,KM;多罗夫蒂,A。;El-Mabrouk,N.,《协调和物种树推断的基因树校正》,《分子生物学算法》,第7期,第31页(2012年)·doi:10.1186/1748-7188-7-31
[57] 高桥,K。;Terai,Y。;西田,M。;Okada,N.,通过逆转录子插入分析揭示的坦噶尼喀湖蝉类鱼类之间的系统发育关系和古代不完整谱系分类,分子生物学进化,182057-2066(2001)·doi:10.1093/oxfordjournals.molbev.a003747
[58] Tatusov,RL;Koonin,EV;DJ Lipman,蛋白质家族的基因组观点,《科学》,278631-637(1997)·doi:10.1126/science.278.5338.631
[59] Tatusov,RL;加尔佩林,MY;DA纳塔莱;Koonin,EV,《COG数据库:蛋白质功能和进化的基因组尺度分析工具》,《核酸研究》,28,33-36(2000)·数字对象标识代码:10.1093/nar/28.133
[60] 列车,CM;格洛弗,新墨西哥州;Gonnet,生长激素;阿尔滕霍夫,AM;Dessimoz,C.,Orthologous matrix(OMA)algorithm 2.0:对非对称进化速率更稳健,对层次结构更具扩展性的直系群推断,生物信息学,33,i75-i82(2017)·doi:10.1093/bioinformatics/btx229
[61] Tsur,D.,齿轮图边缘修正问题的快速算法,Inf Process Let,158,105,946(2020)·Zbl 1432.68371号 ·doi:10.1016/j.ipl.2020.105946
[62] 弗诺,B。;Stolzer,M。;Goldman,A。;Durand,D.,《与非二元物种树的协调》,《计算生物学杂志》,第15期,981-1006页(2008年)·doi:10.1089/cmb.2008.0092
[63] Zallot,R。;哈里森,KJ;科拉茨科夫斯基,B。;de Crécy-Lagard,V.,《paralogs的功能注释:祝福与诅咒》,《生活》,6,39(2016)·doi:10.3390/life6030039
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。