×

基因树和解包括替换转移是NP-hard和FPT。 (英语) Zbl 1423.92205号

概述:系统发生树说明了基因和物种的进化历史。尽管基因是随着所属物种的进化而进化的,但物种树和基因树往往并不相同。其原因是基因水平上的进化事件,如复制或转移。这些差异通过系统发育和解来处理,系统发育和解形式上是基因树节点与物种树节点和分支之间的映射。我们研究用基因转移替代现有基因的和解模型,这是一个生物学上重要的事件,但从未包含在和解模型中。这个问题与经典子树剪枝重植(SPR)距离问题的过时版本很相似,即剪枝后的子树只能在靠近根的分支上重植。我们证明了包含置换转移的协调问题是NP-hard问题,并且,如果物种形成和置换转移是唯一允许的进化事件,那么它对于协调的权重是固定参数可处理的。我们证明了这些结果可以推广到已过时的SPR问题。

MSC公司:

92D10型 遗传学和表观遗传学
2017年第68季度 问题的计算难度(下限、完备性、近似难度等)

软件:

rSPR
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abby SS、Tannier E、Gouy M、Daubin V(2012),横向基因转移是生命树的支撑。美国国家科学院院刊109(13):4962-4967。https://doi.org/10.1073/pnas.1116871109 ·doi:10.1073/pnas.1116871109
[2] Allen BL,Steel M(2001)子树转移操作及其在进化树上的诱导度量。安·库姆5(1):1-15。https://doi.org/10.1007/s00026-001-8006-8 ·Zbl 0978.05023号 ·doi:10.1007/s00026-001-8006-8
[3] Bansal MS、Alm EJ、Kellis M(2012)基因复制、水平转移和丢失的和解问题的高效算法。生物信息学28(12):283-291。https://doi.org/10.1093/bioinformatics/bts225 ·doi:10.1093/bioinformatics/bts225
[4] Bansal MS、Alm EJ、Kellis M(2013)《重新审视和解:在与重复、转移和损失进行和解时处理多重优化》。计算机生物学杂志20(10):738-754。https://doi.org/10.1089/cmb.2013.073 ·doi:10.1089/cmb.2013.0073
[5] Beiko RG,Hamilton N(2006),横向遗传转移事件的系统发育鉴定。BMC进化生物学6(1):15。https://doi.org/10.1186/1471-2148-6-15 ·doi:10.186/1471-2148-6-15
[6] Bonet ML,John KS(2009)使用SAT.vol 5584高效计算进化树度量。LNCS公司。施普林格,柏林。第4-17页。https://doi.org/10.1007/978-3-642-02777-2_3 ·Zbl 1247.68247号
[7] Bordwich M,Semple C(2005)关于有根子树修剪和重修剪距离的计算复杂性。安·库姆8(4):409-423。https://doi.org/10.1007/s00026-004-0229-z ·Zbl 1059.05035号 ·doi:10.1007/s00026-004-0229-z
[8] Chan Y,Ranwez V,Scornavaca C(2015)探索基因/物种与转移的协调空间。数学生物学杂志71(5):1179-1209。https://doi.org/10.1007/s00285-014-0851-2 ·Zbl 1369.92070号 ·doi:10.1007/s00285-014-0851-2
[9] Chauve C,El-Mabrouk N(2009)《基因家族进化的新视角:和解中的损失和与超级树的联系》。计算机科学课堂讲稿(包括人工智能子系列课堂讲稿和生物信息学课堂讲稿)5541 LNBI,第46-58页。https://doi.org/10.1007/978-3-642-02008-7_4
[10] Chen ZZ,Fan Y,Wang L(2015)快速准确计算rSPR距离。J Comb Optim杂志29(3):605-635。https://doi.org/10.1007/s10878-013-9695-8 ·Zbl 1322.90103号 ·doi:10.1007/s10878-013-9695-8
[11] Chen J,Shi F,Wang J(2016)多棵二叉树上的近似最大一致森林。算法76(4):867-889。https://doi.org/10.1007/s00453-015-0087-6 ·Zbl 1352.68288号 ·doi:10.1007/s00453-015-0087-6
[12] Choi SC、Rasmussen MD、Hubisz MJ、Gronau I、Stanhope MJ、Siepel A(2012)《链球菌中的替代和加性水平基因转移》。分子生物学进化29(11):3309-3320。https://doi.org/10.1093/molbev/mss138 ·doi:10.1093/molbev/mss138
[13] Dasgupta B、Ferrarini S、Gopalakrishnan U、Paryani NR(2006)横向基因转移问题的不近似结果。J Comb Optim杂志11(4):387-405。https://doi.org/10.1007/s10878-006-8212-8 ·Zbl 1135.92025号 ·doi:10.1007/s10878-006-8212-8
[14] Doyon JP、Scornavaca C、Ranwez V、Berry V(2010)基因/物种树与损失、重复和转移的节约型协调的有效算法。摘自:比较基因组学:国际研讨会,RECOMB-CG 2010,加拿大渥太华,2010年10月9日至11日,会议记录(10月),第93-108页。https://doi.org/10.1007/978-3-642-16181-0_9
[15] Doyon JP、Ranwez V、Daubin V、Berry V(2011),系统发育和解的模型、算法和程序。生物信息通报12(5):392-400。https://doi.org/10.1093/bbib/bbr045 ·doi:10.1093/bib/bbr045
[16] Even S,Itai A,Shamir A(1976)《关于时间表和多商品流问题的复杂性》。SIAM J计算5(4):691-703。https://doi.org/10.1137/0205048 ·Zbl 0358.90021号 ·数字对象标识代码:10.1137/0205048
[17] Garey MR,Johnson DS(1979)《计算机与难处理性:NP完备性理论指南》。W.H.Freeman&Co.,纽约·Zbl 0411.68039号
[18] Garey M,Johnson D,Stockmeyer L(1976)一些简化的NP-完全图问题。计算机科学理论1(3):237-267。https://doi.org/10.1016/0304-3975(76)90059-1 ·Zbl 0338.05120号 ·doi:10.1016/0304-3975(76)90059-1
[19] Goodman M、Czelusniak J、Moore GW、Romero-Herrera AE、Matsuda G(1979)将基因谱系整合到其物种谱系中,这是一种由珠蛋白序列构建的谱系图说明的简约策略。系统生物学28(2):132-163。https://doi.org/10.1093/sysbio/28.2.132 ·doi:10.1093/sysbio/28.2.132
[20] Hallett MT,Lagergren J(2001)横向基因转移问题的高效算法。摘自:第五届计算生物学国际年会论文集。2001年重建。ACM,纽约,第149-156页。https://doi.org/10.1145/369133.369188
[21] HasićD,Tannier E(2019)基因树物种树与基因转换的协调。数学生物学杂志。https://doi.org/10.1007/s00285-019-01331-w网址 ·Zbl 1415.92134号
[22] Hein J,Jiang T,Wang L,Zhang K(1996)关于比较进化树的复杂性。离散应用数学71(1-3):153-169。https://doi.org/10.1016/S0166-218X(96)00062-5 ·Zbl 0876.92020号 ·doi:10.1016/S0166-218X(96)00062-5
[23] Hickey G,Dehne F,Rau-Chaplin A,Blouin C(2008),无根树的SPR距离计算。进化生物信息4:17-27。https://doi.org/10.4137/EBO.S419 ·doi:10.4137/EBO。第419页
[24] Keeling PJ,Palmer JD(2008),真核生物进化中的水平基因转移。《Nat Rev Genet》9:605-618。https://doi.org/10.1038/nrg2386 ·doi:10.1038/nrg2386
[25] Linz S,Semple C(2011)用于计算系统发育之间子树距离的聚类缩减。安库姆15(3):465-484。https://doi.org/10.1007/s00026-011-0108-3 ·Zbl 1234.05057号 ·doi:10.1007/s00026-011-0108-3
[26] Merkle D,Middendorf M,Wieseke N(2010)用于推断共系起源的参数自适应动态规划方法。BMC生物信息11(1):S60。https://doi.org/10.1186/1471-2105-11-S1-S60 ·doi:10.1186/1471-2105-11-S1-S1-S60
[27] Nakhleh L(2012)物种系统发育推断和基因树和解的计算方法。生物化学34(1):13-23。https://doi.org/10.1016/j.immuni.2010.12 17 ·doi:10.1016/j.immuni.2010.117
[28] Raman V、Ravikumar B、Rao S(1998)简化的NP-完全MAXSAT问题。Inf过程Lett 65(1):1-6。https://doi.org/10.1016/S0020-0190(97)00223-8 ·Zbl 1339.68122号 ·doi:10.1016/S0020-0190(97)00223-8
[29] Rice DW,Palmer JD(2006)质体中的一种特殊水平基因转移:由一个遥远的细菌副原生质体进行基因替换,并证明半植体和隐植体质体是姐妹体。BMC生物4(1):31。https://doi.org/10.1186/1741-7007-4-31 ·doi:10.1186/1741-7007-4-31
[30] Scornavaca C、Paprotny W、Berry V、Ranwez V(2013)以紧凑的方式表示一组对账。生物信息计算生物学杂志11(02):1250025。https://doi.org/10.1142/S021972012500254 ·doi:10.1142/S021972012500254
[31] Shi F,Feng Q,Chen J,Wang L,Wang J(2013)系统发育树之间的距离:一项调查。清华科技18(5):490-499。https://doi.org/10.109/TST.2013.6616522 ·doi:10.1109/TST.2013.6616522
[32] Shi F,Feng Q,You J,Wang J(2016)二叉树最大一致树的改进近似算法。J Comb Optim杂志32(1):111-143。https://doi.org/10.1007/s10878-015-9921-7 ·Zbl 1378.90085号 ·doi:10.1007/s10878-015-9921-7
[33] Song YS(2006)全序系统发育树上的亚树-树-树和再生操作的特性。安·库姆10(1):147-163。https://doi.org/10.1007/s00026-006-0279-5 ·兹比尔1092.05015 ·doi:10.1007/s00026-006-0279-5
[34] Suchard MA(2005)水平基因转移的随机模型:在树空间中随机漫步。遗传学170(1):419-431。https://doi.org/10.1534/genetics.103.025692 ·doi:10.1534/genetics.103.025692
[35] Szöllősi GJ,Tannier E,Lartillot N,Daubin V(2013),从死者进行横向基因转移。系统生物学62(3):386-397。https://doi.org/10.1093/sysbio/syt003 ·doi:10.1093/sysbio/syt003
[36] Szöllősi GJ,Tannier E,Daubin V,Boussau B(2015)《基因树与物种树的推断》。系统生物学64(1):42-62。https://doi.org/10.1093/sysbio/syu048 ·doi:10.1093/sysbio/syu048
[37] Tofigh A,Hallett M,Lagergren J(2011),复制和横向基因转移的同步鉴定。IEEE ACM Trans-Comput生物信息8(2):517-535。https://doi.org/10.109/TCBB.2010.14 ·doi:10.1109/TCBB.2010.14
[38] Whidden C,Matsen F(2018)计算未生根子树修剪与再修剪距离。IEEE ACM Trans-Comput生物信息:1-1。https://doi.org/10.109/TCBB.2018.2802911 ·Zbl 1380.92048号
[39] Whidden C,Beiko RG,Zeh N(2010)计算根协议林的快速FPT算法:理论和实验。柏林施普林格,第141-153页。https://doi.org/10.1007/978-3-642-13193-6_13 ·doi:10.1007/978-3-642-13193-6_13
[40] Whidden C,Beiko RG,Zeh N(2016)多叉树最大一致森林的固定参数和近似算法。算法74(3):1019-1054。https://doi.org/10.1007/s00453-015-9983-z ·Zbl 1333.68297号 ·数字对象标识代码:10.1007/s00453-015-9983-z
[41] Wu Y(2009)精确计算子树修剪和再生距离的实用方法。生物信息学25(2):190-196。https://doi.org/10.1093/bitinformatics/btn606 ·doi:10.1093/bioinformatics/btn606
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。