×

基于重复丢失协调的基因树校正通用框架。 (英语) Zbl 1443.92128号

Schwartz,Russell(编辑)等人,第17届生物信息学算法国际研讨会,2017年WABI,美国马萨诸塞州波士顿,2017年8月21日至23日。诉讼程序。Wadern:达格斯图尔宫——莱布尼茨Zentrum für Informatik。LIPIcs–莱布尼茨国际程序。通知。88,第8条,第14页(2017年)。
摘要:由于基因树和物种系统发育在生物学研究中起着关键作用,因此对可用的树有尽可能多的信心是至关重要的。由于系统发育工具容易出错,因此使用校正方法来改进初始树是一项常见任务。存在各种修正方法。在本文中,我们重点讨论了那些基于重复损失协调模型的问题。多边形分解方法包括收缩弱支撑分支,然后以最小化与给定物种树的协调距离的方式细化获得的非二叉树。另一方面,超树方法将一组分离的子树作为输入,这些子树要么是为分离的正交组获得的,要么是通过将初始树的上部分支移除到某个级别,然后以最优的方式将其合并,以保持初始树的拓扑。基于明显不同的模型,这两类问题一直被视为两个独立的领域。本文给出了一个统一的观点,表明这两类问题实际上是我们称之为更一般问题的特例标签GTC,其输入包括一个要修正的边缘标记基因树。将树视为一组三元组,我们还将三重GTC输入包含一组应保存在纠正树中的基因三联体的问题。这两个通用模型可以统一、理解和比较基于重复损失对账的树形校正方法的原理。我们证明了这一点标签GTC是的特例三重GTC然后,我们开发适当的算法来处理这两个一般的校正问题。
关于整个系列,请参见[Zbl 1372.68022号].

MSC公司:

92D15型 与进化有关的问题
92天10分 遗传学和表观遗传学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[2] 如果E的所有边都标记为0,那么根据引理7,E的所有边缘都是终端边。因为E覆盖了{\T},所以{\tE}({\tT})的所有边{\it E}(T)标记为0。因此,根据定理1,问题简化为SGT。
[3] .{\itTrp}1=S{\itTrp}({\itt}{\iti})|{\itT}{\it i}∈T};
[4] B.Boussau、G.J.Szöllősi、L.Duret、M.Gouy、E.Tannier、。,和V.Daubin。物种和基因树的基因组尺度共同估计。{基因组研究},23:323-332013。
[5] K.Chen、D.Durand和M.Farach-Colton。注意:使用基因家谱确定基因重复的日期。计算生物学杂志,7:429-4472000。
[6] .{\itTrp}2={\itT rp}({\itx,y})|({\it x,y{){\它是T}}的终端边;
[7] 否则,让{\it T}0={\it LabelGT C}({\it S,T,}T{\it,l}),以及E的任何边({\itx}{\it i}{\iti,y}{\it i})标记为1并预先提供在{\itT}0中,让{\ ity}{\iti i}0成为{\it T}0的节点,这样l({\ITy}{\iti}0)=l({\ty}{\ iti})。由于{\itT}|L({\ity}{\iti})是{\itt}的一个完整子树,那么{\itT}0[{\ity}0{\iti}]也是{\itt}0的一个完全子树,它可以独立于树{\it T}0的剩余部分构造为{\it-T}0[{\ty}{\ti}0]={\itLabelGT C}({\it S,T}[{\it y}{\ iti}]{\T,}T|L({\T y}{\T i}){\T,L}|{\T E}({\T T}[{\T y{{\iti}]))(在算法的步骤2.a.中计算)。其次,所获得的子树必须充分嫁接到剩余树{{\itT}[{\ity}{\iti}]∈T|({\itx}{\it i}{\ it,y}{\ iti})∈E{\it和l}({\it x}{\ iti}{\它i}{,y}{\iti})=0}的超生成树的分支上。在这种情况下,这个问题也被简化为T上的SGT问题:({\itx}{\iti}{\it,y}{\itii})∈E{\it和l}({\it x}{\ iti},y}{\iti})=0}它i})∈E{它和l}({它x}{它i}{它,y}{他i}在步骤2.a中计算的值被压缩为与叶集L({\itT}0[{\ity}0{\iti}])相关联的单个叶节点{\ity}{\iti}*(在算法的步骤2.b.到2.e.中计算)。该算法最坏的情况是停止情况,它直接被简化为SGT算法,其时间复杂度在{\itO}(4{\itk}{\it.}({\itn}+1){\itk}{\it.k})。J型
[8] .{\itTrp}3={\itT rp}({\itx,y})|({\it x,y{){\它是T}}的非终结边。因此,L({itT})的树{itT}0保持所有树{itT{iti}∈T的拓扑,如果它保持{itT rp}1;它保留了{它E}({它T})的所有终端边,如果它保留了}它Trp}2,并且它保留了如果{它T rp}3的所有非终端边。{it-Trp}中包含或排除{it-TRP}1、{it-Trp}2和{it-Terp}3的组合({it-Trpm}=∅的情况除外)导致了该定理的7种情况。J型
[9] J.费尔森斯坦。分子序列的系统发育:推断和可靠性。《年鉴》,22:521-5651988。
[10] E.Jacox、C.Chauve、G.J.Szolosi、Y.Ponty和C.Scornavaca。埃塞特拉:利用简约性进行综合基因树-物种树和解。{生物信息学},32(13):2056 2058,2016。
[11] M.Lafond、E.Noutahi和N.El-Mabrouk。具有加权协调代价的高效非二元基因树解析。在《组合模式匹配》(Combinational Pattern Matching)一书中,LIPIcs Leibniz In-国际信息学论文集,第54卷。Schloss Dagstuhl Leibniz Zentrum fuer Informatik出版社,2016年·兹比尔1380.68484
[12] M.Lafond、A.Ouangraoua和N.El-Mabrouk。重建超生成树以最小化和解。{\it BMC-Genomics},16:S4,2015年。2015年RECOMB-CG特刊。
[13] N.El-Mabrouk M.Lafond、C.Chauve和A.Ouangraoua。使用超级树和调和构建和校正基因树。2017年{亚太生物信息学会议}。IEEE/ACM TCBB即将推出。
[14] :13
[15] N.Nguyen、S.Mirarab和T.Warnow。MRL和SuperFine+MRL:新的超级树方法。{《分子生物学学报》,7(3),2012年。
[16] :14
[17] Thi Hau Nguyen、Vincent Ranwez、Stéphanie Pointet、Anne-Muriel Arigon Chifolleau、Jean Philippe Doyon和Vincent Berry。和解和局部基因树重排可以互惠互利。{\it Algorithms Mol Biol},8(1):2013年12月。doi:10.1186/1748-7188-8-12。
[18] E.Noutahi、M.Semeria、M.Lafond、J.Seguin、L.Gueguen、N.El-Mabrouk和E.Tannier。基因组进化指导下的高效基因树校正。{\it Plos.One},11(8),2016年。
[19] M.D.Rasmussen和M.Kellis。一种快速准确的基因树重建的贝叶斯方法。{分子生物学与进化},28(1):273-2902011。
[20] 贾马尔·萨比尔(Jamal S.M.Sabir)、罗伯特·贾森(Robert K.Jansen)、迪维亚·阿拉萨潘(Dhivya Arasapan)、维吉尼·卡尔德龙(Virginie Calderon)、伊曼纽·努塔希(Emmanuel Noutahi)、郑春芳(Chunfang Zheng)、琼君公园(Seongjun Park)、梅沙尔·萨比尔(Meshaal J.Sabier)、穆罕默德·巴森(Mohammed N.Baeshen)、纳希德·哈吉拉(Nahid H.Hajrah)、穆哈迈德·基米。罗汉果的核基因组和罗汉果科一个医学相关分支中生物碱多样性的进化。{自然科学报告},6(33782),2016年。
[21] F.Schreiber、M.Patricio、M.Muffato、M.Pignatelli和A.Bateman。Treefam v9:一个新的网站,有更多的物种和直系动物。{核酸研究},2013年。doi:10.1093/nar/gkt1055。
[22] C.斯科纳瓦卡、L.van Iersel、S.Kelk和D.Bryant。无根系统发育树的一致性问题是FPT。{图算法与应用杂志},18(3):385-3922014·Zbl 1295.05239号
[23] A.J.Villela、J.Severin、A.Ureta-Vida、L.Heng、R.Durbin和E.Birney。类基因树:脊椎动物的完整、重复软件系统发育树。{\it Genome}{\it Research},19:327-3352009。
[24] Y.C.Wu、M.D.Rasmussen、M.S.Bansal和M.Kellis。TreeFix:使用物种树进行统计信息的基因树纠错。{\it系统生物学},62(1):110-1202013。
[25] Y.Zheng和L.Zhang。与非二元基因树的重新协调。2014年,《计算机科学讲义》第8394卷,第418-432页。重组程序。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。