×

最佳匹配图。 (英语) Zbl 1415.92133号

J.数学。生物。 78,编号7,2015-2057(2019); 更正同上,第82号,第6号,第47号文件,第9页(2021年)。
摘要:最佳匹配图作为正形检测算法中的第一个处理中间体自然出现。设(T)是一个系统发育(基因)树(T),(sigma)是(T)的叶子对物种的分配。如果基因\(x\)和\(y\)位于不同的物种中,并且\(y\)与物种\(西格玛(y)\)中包含的所有其他基因相比,可能是\(x\)的许多(进化)近亲之一,则最佳匹配图\(G,\西格玛)\)是一个包含从\(x\)到\(y\)的弧的有向图。这里,我们刻画了最佳匹配图,并证明了它可以在三次时间和二次空间中决定(G,sigma)是否以这种方式从树中导出。如果答案是肯定的,则有一个唯一的最小可分辨树来解释\(G,\ sigma)\,它也可以用立方时间构造。

MSC公司:

92D15型 与进化有关的问题
92天10分 遗传学和表观遗传学
05C90年 图论的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aho A,Sagiv Y,Szymanski T,Ullman J(1981)用关系表达式优化应用程序从最低共同祖先推断树。SIAM J计算10:405-421·Zbl 0462.68086号 ·数字对象标识代码:10.1137/021030
[2] Aho AV,Garey MR,Ullman JD(1972)有向图的传递约简。SIAM J计算1:131-137·Zbl 0247.05128号 ·数字对象标识代码:10.1137/021008
[3] Altenhoff AM、Boeckmann B、Capella Gutierrez S、Dalquen DA、DeLuca T、Forslund K、Jaime HC、Linard B、Pereira C、Pryszcz LP、Schreiber F、DA Silva AS、Szklarczyk D、Train CM、Bork P、Lecompte O、von Mering C、Xenarios I、Sjölander K、Jensen LJ、Martin MJ、Muffato M、Gabaldón T、Lewis SE、Thomas PD、Sonnhammer E、Dessimoz C(2016)寻求正交曲线的标准化基准。自然方法13:425-430·doi:10.1038/nmeth.3830
[4] Altenhoff AM,Dessimoz C(2009),直系生物推断项目和方法的系统发育和功能评估。公共科学图书馆计算生物学5:e1000262·doi:10.1371/journal.pcbi.1000262
[5] Bork P,Dandekar T,Diaz Lazcoz Y,Eisenhaber F,Huynen M,Yuan Y(1998)预测功能:从基因到基因组再到基因组。分子生物学杂志283:707-725·doi:10.1006/jmbi.1998.2144
[6] Bryant D,Steel M(1995),叶标树的扩展操作。高级应用数学16:425-453·Zbl 0863.92012号 ·doi:10.1006/1995年10月19日
[7] Bull JJ,Pease CM(1989)《组合数学和各种交配类型系统》。进化43:667-671·doi:10.1111/j.1558-5646.1989.tb04263.x
[8] Crespelle C,Paul C(2006)有向齿图的完全动态识别算法和证书。离散应用数学154:1722-1741·Zbl 1110.68096号 ·doi:10.1016/j.dam.2006.03.005
[9] Dalquen DA,Dessimoz C(2013)《双向最佳点击》错过了植物和动物等复制丰富分支中的许多直系图。基因组生物进化5:1800-1806·doi:10.1093/gbe/evt132
[10] Deng Y,Fernández-Bacha D(2018)《根系统发育树的快速兼容性测试》。算法80:2453-2477·Zbl 1392.68451号 ·doi:10.1007/s00453-017-0330-4
[11] Dondi R、Lafond M、El-Mabrouk N(2017)《加权和未加权正畸和副相关关系的近似校正》。算法分子生物学12:4·Zbl 1383.92054号 ·doi:10.1186/s13015-017-0096-x
[12] Elmasry A(2010)子集偏序:计算与组合。收录:Sedgewick R,Golin M(编辑)第七届分析算法与组合学研讨会论文集(ANALCO)。费城工业和应用数学学会,第27-33页·Zbl 1430.68198号
[13] Force A、Lynch M、Pickett FB、Amores A、Yl Yan、Postlethwait J(1999),通过互补性退化突变保存重复基因。遗传学151:1531-1545
[14] GeißM,Anders J,Stadler PF,Wieseke N,Hellmuth M(2018)从惠誉的异种关系重建基因树。数学生物学杂志77:1459-1491·Zbl 1396.05025号 ·doi:10.1007/s00285-018-1260-8
[15] Gries D,Martin AJ,van de Snepscheut JLA,Udding JT(1989)非循环图的传递约简算法。科学计算程序12:151-155·Zbl 0678.68061号 ·doi:10.1016/0167-6423(89)90039-7
[16] Grünewald S,Steel M,Swenson MS(2007),系统发育中的封闭操作。数学生物科学208:521-537·Zbl 1119.92048号 ·doi:10.1016/j.mbs.2006.11.005
[17] Harel D,Tarjan RE(1984)查找最近共同祖先的快速算法。SIAM J计算13:338-355·Zbl 0535.68022号 ·数字对象标识代码:10.1137/0213024
[18] Hellmuth M(2017)生物可行性基因树、调和图和信息三元组。分子生物学算法12:23·doi:10.1186/s13015-017-0114-z
[19] Hellmuth M、Hernandez-Rosales M、Huber KT、Moulton V、Stadler PF、Wieseke N(2013)《矫形关系、符号超测量学和齿形图》。数学生物学杂志66:399-420·Zbl 1408.05038号 ·文件编号:10.1007/s00285-012-0525-x
[20] Hellmuth M,Marc T(2015)关于有向图的笛卡尔骨架和强乘积的因子分解。Theor计算机科学565:16-29·Zbl 1315.05135号 ·doi:10.1016/j.tcs.2014.10.045
[21] Hellmuth M、Stadler PF、Wieseke N(2017)《异种学的数学:二元图、符号超度量、二元结构和二元关系的树表示系统》。数学生物学杂志75:199-237·Zbl 1368.05023号 ·doi:10.1007/s00285-016-1084-3
[22] Hellmuth,M。;威塞克,N。;Pontarotti,P.(编辑),《从序列数据(包括直系、旁系和异种)到基因树和物种树》,373-392(2016),Cham
[23] Hellmuth M,Wieseke N(2018)《关系和图的树表示:符号超度量和有向图边缘分解》。J Comb选项36:591-616·Zbl 1402.90147号 ·doi:10.1007/s10878-017-0111-7
[24] Hellmuth M、Wieseke N、Lechner M、Lenhof HP、Middendorf M、Stadler PF(2015)《来自paralogs的系统发育学》。美国国家科学院院刊112:2058-2063·doi:10.1073/pnas.1412770112
[25] Hernandez-Rosales M、Hellmuth M、Wieseke N、Huber KT、Moulton V、Stadler PF(2012)《从事件标记基因树到物种树》。BMC生物信息13:S6·doi:10.1186/1471-2105-13-S19-S6
[26] Jahangiri-Tazehkand S,Wong L,Eslahchi C(2017)OrthoGNC:一种基于基因邻域保护的准确识别同源基因的软件。基因组蛋白质组学生物信息学15:361-370·doi:10.1016/j.gpb.2017年7月02日
[27] Kumar S(2005)《分子钟:四十年的进化》。《Nat Rev Genet》6:654-662·doi:10.1038/nrg1659
[28] Lafond M、Dondi R、El-Mabrouk N(2016)《直系关系和基因树之间的联系:校正视角》。算法分子生物学11:4·兹比尔1383.92054 ·doi:10.1186/s13015-016-0067-7
[29] Lafond M,El-Mabrouk N(2014)《矫形学和寄生虫学约束:可满足性和一致性》。BMC基因组学15:S12·doi:10.1186/1471-2164-15-S6-S12
[30] Lechner M、FindeißS、Steiner L、Marz M、Stadler PF、Prohaska SJ(2011)《蛋白质原:大规模分析中(共)同源基因的检测》。BMC生物信息12:124·doi:10.1186/1471-2105-12-124
[31] Lechner M、Hernandez-Rosales M、Doerr D、Wieseke N、Thévenin A、Stoye J、Hartmann RK、Prohaska SJ、Stadler PF(2014)《结合聚类和合成的超大数据集正畸检测》。公共图书馆ONE 9:e105015·doi:10.1371/journal.pone.0105015
[32] McKenzie R(1971)具有自反关系的结构的基数乘法。基金数学70:59-101·Zbl 0228.08002号 ·doi:10.4064/fm-70-1-59-101
[33] Moreno-Hagelsieb G,Latimer K(2008),选择BLAST选项以更好地检测正交曲线,作为相互最佳点击。生物信息学24:319-324·doi:10.1093/bioinformatics/btm585
[34] Nieselt-Struwe(2001)四元映射,相似映射过程的推广。分子生物学进化18:1204-1219·doi:10.1093/oxfordjournals.molbev.a003907
[35] Overbeek R,Fonstein M,D’Souza M,Pusch GD,Maltsev N(1999)《利用基因簇推断功能耦合》。美国国家科学院院刊96:2896-2901·doi:10.1073/pnas.96.6.2896
[36] Pritchard P(1995)计算子集偏序的简单次二次算法。Inf流程Let 56:337-341·Zbl 0875.68463号 ·doi:10.1016/0020-0190(95)00165-4
[37] Rauch Henzinger M,King V,Warnow T(1999)从同胚子树构建树,应用于计算进化生物学。算法24:1-13·Zbl 0936.68026号 ·doi:10.1007/PL00009268
[38] Schieber B,Vishkin U(1988)关于寻找最低共同祖先:简化和并行化。SIAM J计算17:1253-1262·Zbl 0669.68049号 ·数字对象标识代码:10.1137/0217079
[39] Semple C(2003)重建最小根树。离散应用数学127:489-503·Zbl 1038.05014号 ·doi:10.1016/S0166-218X(02)00250-0
[40] Semple C,Steel M(2003)《系统发育学》。牛津大学出版社·Zbl 1043.92026
[41] 塞图巴尔,JC;斯塔德勒,PF;Setubal,JC(编辑);斯塔德勒,PF(编辑);Stoye,J.(编辑),《基因系统学和同源群》,第1704、1-28号(2018年),海德堡·doi:10.1007/978-1-4939-7463-4_1
[42] Sumner DP(1973)《图形中点的确定》。离散数学5:179-187·Zbl 0265.05124号 ·doi:10.1016/0012-365X(73)90109-X
[43] Tatusov RL,Koonin EV,Lipman DJ(1997)蛋白质家族的基因组观点。科学278:631-637·doi:10.1126/science.278.5338.631
[44] Train CM、Glover NM、Gonnet GH、Altenhoff AM、Dessimoz C(2017)Orthologous matrix(OMA)algorithm 2.0:对非对称进化速率更为稳健,对层次化直系群推理更具可扩展性。生物信息学33:i75-i82·doi:10.1093/bioinformatics/btx229
[45] Wall DP、Fraser HB、Hirsh AE(2003)《检测假定的正交曲线》。生物信息学19:1710-1711·doi:10.1093/bioinformatics/btg213
[46] Wolf YI,Koonin EV(2012),细菌和古生物基因组中直系基因和双向最佳点击之间的紧密联系。基因组生物进化4:1286-1294·doi:10.1093/gbe/evs100
[47] Yu C,Zavaljevski N,Desai V,Reifman J(2011)QuartetS:大规模正畸检测的快速准确算法。核酸研究39:e88·doi:10.1093/nar/gkr308
[48] 扎克坎德尔,E。;保林,LB;Kasha,M.(编辑);Pullman,B.(编辑),《分子疾病、进化和基因异质性》,189-225(1962),纽约
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。