×

通过祖先状态重建对分子序列进行全局比对。 (英语) Zbl 1250.92034号

小结:我们考虑树上的跟踪重建问题(TRPT):二进制序列通过树信道广播,在树信道中我们允许替换、删除和插入;我们试图从叶子上接收到的序列重建原始序列。TRPT的动机是计算生物学中的多序列比对问题。我们给出了一个简单的递归过程,在低突变率下提供了强大的重建保证。据我们所知,这是在存在indels的情况下,对树进行的第一个严格的轨迹重建结果。

理学硕士:

92D15型 与进化有关的问题
92立方厘米 系统生物学、网络
60J85型 分支过程的应用
92-08 生物问题的计算方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] A.Andoni,M.Braverman,A.Hassidim,《插入和删除的系统发育重建》,预印本,2010年。;A.Andoni,M.Braverman,A.Hassidim,《插入和删除的系统发育重建》,预印本,2010年。
[2] A.Andoni,C.Daskalakis,A.Hassidim,S.Roch,通过祖先状态重建实现分子序列的全球比对,收录于:ICS,2010年。;A.Andoni,C.Daskalakis,A.Hassidim,S.Roch,通过祖先状态重建实现分子序列的全球比对,收录于:ICS,2010年·Zbl 1250.92034号
[3] 安多尼,A。;Krauthgamer,R.,《编辑距离的平滑复杂性》,《计算机课堂讲稿》。科学。,5125, 357-369 (2008) ·Zbl 1153.68563号
[4] 巴图,T。;Kannan,S。;Khanna,S。;McGregor,A.,从随机轨迹重建字符串,(SODA'04:第十五届ACM-SIAM离散算法年会论文集(2004),工业和应用数学学会:美国宾夕法尼亚州费城工业和应用数学家学会),910-918·Zbl 1318.68206号
[5] 北卡罗来纳州伯杰。;凯尼恩,C。;莫塞尔,E。;Peres,Y.,《树和双曲线图上的Glauber动力学》,Probab。理论相关领域,131,3,311-340(2005),Kenyon,Mossel和Peres的扩展摘要,发表于第42届IEEE计算机科学基础研讨会论文集,FOCS,2001,568-578·Zbl 1075.60003号
[6] 巴特纳加,N。;维拉,J.C。;维戈达,E。;Weitz,D.,《树上颜色的重建》,SIAM J.离散数学。,25, 2, 809-826 (2011) ·Zbl 1298.05060号
[7] 布莱赫,P.M。;Ruiz,J。;Zagrebnov,V.A.,《关于Bethe晶格上Ising模型的极限Gibbs态的纯度》,J.Stat.Phys。,79, 1-2, 473-482 (1995) ·Zbl 1081.82515号
[8] C.Borgs、J.T.Chayes、E.Mossel、S.Roch,对于大致对称的二进制信道,Kesten-Stagum重构界很紧。,摘自:FOCS,2006年,第518-530页。;C.Borgs、J.T.Chayes、E.Mossel、S.Roch,对于大致对称的二进制信道,Kesten-Stagum重构界很紧。,摘自:FOCS,2006年,第518-530页。
[9] Cavender,J.A.,《分类学与信心》,《数学》。生物科学。,40, 3-4 (1978) ·Zbl 0391.92015号
[10] Daskalakis,C。;莫塞尔,E。;Roch,S.,最优系统发育重建,(STOC'06:第38届ACM计算理论年会论文集(2006),ACM:ACM纽约),159-168·Zbl 1301.92054号
[11] C.Daskalakis,S.Roch,无排列系统发育重建,摘自:RECOMB,2010年,第123-137页。;C.Daskalakis,S.Roch,无排列系统发育重建,摘自:RECOMB,2010年,第123-137页。
[12] Edgar,R.C.,《肌肉:高精度和高通量的多序列比对》,《核酸研究》,32,5,1792-1797(2004),网址:http://nar.oxfordjournals.org/cgi/content/abstract/32/5/1792
[13] Elias,I.,《解决多重对齐的棘手问题》,J.Compute。《生物学》,13,7,1323-1339(2006),pMID:17037961。网址:http://www.liebertonline.com/doi/abs/10.1089/cmb.2006.13.1323
[14] 埃文斯,W.S。;凯尼恩,C。;佩雷斯,Y。;舒尔曼,L.J.,《树上的广播和伊辛模型》,《Ann.Appl。概率。,10, 2, 410-433 (2000) ·Zbl 1052.60076号
[15] Farris,J.S.,推断进化树的概率模型,系统。动物园。,22, 4, 250-256 (1973)
[16] Gerschenfeld,A。;Montanari,A.,随机图模型的重构,(FOCS’07:第48届IEEE计算机科学基础年会论文集(2007),IEEE计算机学会:IEEE计算机协会,华盛顿特区,美国),194-204
[17] 希金斯,D.G。;Sharp,P.M.,Clustal:在微型计算机上执行多序列比对的软件包,Gene,73,1,237-244(1988)
[18] Higuchi,Y.,关于树上极限Gibbs态的评论,Publ。Res.Inst.数学。科学。,13, 2, 335-348 (1977) ·Zbl 0376.60096号
[19] 霍伦斯坦,T。;Mitzenmacher,M。;帕尼格拉希,R。;Wieder,U.,《具有恒定删除概率的轨迹重建及相关结果》,(SODA’08:第十九届ACM-SIAM离散算法年会论文集(2008),工业与应用数学学会:美国宾夕法尼亚州费城工业与应用数理学会),389-398·Zbl 1192.94064号
[20] Ioffe,D.,关于Bethe晶格上Ising模型无序态的极值,Lett。数学。物理。,37, 2, 137-143 (1996) ·Zbl 0848.60090号
[21] Janson,S。;Mossel,E.,树上的鲁棒重建由第二个特征值Ann.Probab决定。,322630-2649(2004),网址:http://www.stat.berkeley.edu/mossel/publications/robust.pdf ·Zbl 1061.60105号
[22] S.Kannan,A.McGregor,《从随机迹重建字符串的更多信息:插入和删除》,《ISIT学报》,2005年,第297-301页。;S.Kannan,A.McGregor,《从随机记录道重建字符串的更多信息:插入和删除》,收录于:《ISIT学报》,2005年,第297-301页。
[23] Katoh,K。;三泽,K。;库马,K.-i。;Miyata,T.,MAFFT:一种基于快速傅里叶变换的快速多序列比对新方法,《核酸研究》,30,14,3059-3066(2002),URL:http://nar.oxfordjournals.org/cgi/content/abstract/30/14/3059
[24] Kesten,H。;Stigum,B.P.,《不可分解多维Galton-Watson过程的附加极限定理》,《数学年鉴》。统计人员。,37, 1463-1481 (1966) ·Zbl 0203.17402号
[25] Levenshtein,V.I.,序列的有效重建,IEEE Trans。通知。理论,47,1,2-22(2001)·Zbl 1029.94019号
[26] Levenshtein,V.I.,《从其子序列或超序列高效重建序列》,J.Comb。理论Ser。A、 9310-332(2001年)·Zbl 0992.68155号
[27] 刘凯。;Raghavan,S。;Nelesen,S。;Linder,C.R。;Warnow,T.,《序列比对和系统发育树的快速准确大规模联合估计》,《科学》,324,5934,1561-1564(2009),URL:http://www.sciencemag.org/cgi/content/abstract/324/5934/1561
[28] Loytynoja,A。;Goldman,N.,《系统发育差异位置防止序列比对和进化分析中的错误》,《科学》,320,5883,1632-1635(2008),URL:http://www.sciencemag.org/cgi/content/abstract/320/5883/1632
[29] 马蒂内利,F。;辛克莱,A。;Weitz,D.,《树木上的Glauber动力学:边界条件和混合时间》,Comm.Math。物理。,250, 2, 301-334 (2004) ·Zbl 1076.82010年
[30] Metzler,D.,基于片段插入和删除模型的统计比对,生物信息学,19,4,490-499(2003),URL:http://bioinformatics.oxfordjournals.org/cgi/content/abstract/19/4/490
[31] R.Mihaescu,C.Hill,S.Rao,通过学习祖先序列快速重建系统发育,CoRR abs/0812.1587。;R.Mihaescu,C.Hill,S.Rao,通过学习祖先序列进行快速系统发育重建,CoRR abs/0812.1587·兹比尔1266.68237
[32] 米克洛斯,I。;伦特,G.A。;Holmes,I.,进化序列比对的“长指数”模型,《分子生物学》。演变。,21,3529-540(2004),网址:http://mbe.oxfordjournals.org/cgi/content/abstract/21/3/529
[33] Mossel,E.,周期树上的递归重建,随机结构算法,13,1,81-97(1998),URL:http://www.stat.berkeley.edu/mossel/publications/recursive.ps ·兹比尔0959.05112
[34] Mossel,E.,《树上的重建:超越第二特征值》,Ann.Appl。概率。,11,1,285-300(2001),网址:http://www.stat.berkeley.edu/mossel/publications/secd.ps ·Zbl 1021.90008号
[35] Mossel,E.,《关于重建祖先数据和系统发育的不可能性》,J.Compute。生物,10,5,669-678(2003)
[36] Mossel,E.,系统发育中的相变,Trans。阿默尔。数学。《社会学杂志》,356,6,2379-2404(2004)·Zbl 1041.92018年
[37] 莫塞尔,E。;Peres,Y.,《树木信息流》,Ann.Appl。概率。,13, 3, 817-844 (2003) ·Zbl 1050.60082号
[38] Navarro,G.,《近似字符串匹配导览》,ACM Compute。Surv公司。(CSUR),33,1,31-88(2001)
[39] G.Navarro,R.Baeza-Yates,E.Sutinen,J.Tarhio,近似字符串匹配的索引方法,技术委员会公报第19期。;G.Navarro,R.Baeza Yates,E.Sutinen,J.Tarhio,近似字符串匹配的索引方法,技术委员会公告,19。
[40] Neyman,J.,《进化的分子研究:新统计问题的来源》(Gupta,S.S.;Yackel,J.《统计决策理论及相关主题》(1971),学术出版社:纽约学术出版社),1-27·Zbl 0231.62010号
[41] C.Notredame,D.Higgins,J.Heringa,T-coffee:快速准确多序列比对的新方法。;C.Notredame,D.Higgins,J.Heringa,T-coffee:快速准确多序列比对的新方法。
[42] 佩雷斯,Y。;Roch,S.,《树上的重建:线性估计的指数矩界》,电子。公共概率。,16,251-261(2011),(电子版)·Zbl 1237.60068号
[43] 里瓦斯,E。;Eddy,S.R.,插入和删除的概率系统发育推断,公共科学图书馆计算。生物学,4,9,e100172(2008)
[44] S.Roch,《树上的马尔可夫模型:重建与应用》,博士论文,加州大学伯克利分校,2007年。;S.Roch,《树上的马尔可夫模型:重建和应用》,博士论文,加州大学伯克利分校,2007年。
[45] S.Roch,基于距离的系统发育重建的序列长度要求:打破多项式障碍,in:FOCS,2008年,第729-738页。;S.Roch,基于距离的系统发育重建的序列长度要求:打破多项式障碍,收录于:FOCS,2008年,第729-738页。
[46] Roch,S.,《从进化距离矩阵中提取所有系统发育信息》,《科学》,327,5971,1376-1379(2010),URL:http://dx.doi.org/10.1126/science.1182300 ·兹比尔1226.92058
[47] Sankoff,D.,序列的最小变异树,SIAM J.Appl。数学。,28,135-42(1975),网址:http://link.aip.org/link/?SMM/28/35/1 ·Zbl 0315.05101号
[48] Semple,C。;Steel,M.,(系统发育学。系统发育学、数学及其应用系列,第22卷(2003),牛津大学出版社)·Zbl 1043.92026
[49] Sly,A.,Potts模型的重建,(STOC'09:第41届ACM计算理论年会论文集(2009),ACM:美国纽约州纽约市ACM),581-590·Zbl 1304.68137号
[50] Sly,A.,《随机着色的重构》,公共数学。物理。,288, 3, 943-961 (2009) ·Zbl 1274.60163号
[51] A.Sly,吉布斯测度的时空混合,博士论文,加州大学伯克利分校,2009年。;A.Sly,吉布斯测度的时空混合,博士论文,加州大学伯克利分校,2009年。
[52] Suchard,医学硕士。;Redeling,B.D.,BAli-Phy:同步贝叶斯排列和系统发育推断,生物信息学,22,16,2047-2048(2006),URL:http://bioinformatics.oxfordjournals.org/cgi/content/abstract/22/16/2047
[53] Thorne,J.L。;基希诺,H。;Felsenstein,J.,DNA序列最大似然比对的进化模型,J.Mol.Evol。,33, 2, 114-124 (1991)
[54] Thorne,J.L。;岸信夫,H。;Felsenstein,J.,《走向现实:序列进化的改进似然模型》,J.Mol.Evol。,34, 1, 3-16 (1992)
[55] 桑顿,J.W.,《复活古老基因:灭绝分子的实验分析》,《自然评论遗传学》。,5, 5, 366-375 (2004)
[56] 维斯瓦纳坦,K。;Swaminathan,R.,《插入-删除通道上的改进字符串重建》,(SODA’08:第十九届ACM-SIAM离散算法年会论文集(2008),工业和应用数学学会:美国宾夕法尼亚州费城工业和应用数理学会),399-408·Zbl 1192.94072号
[57] Wang,L。;Jiang,T.,《关于多重序列比对的复杂性》,J.Compute。生物学,1,4,337-348(1994)
[58] Wang,L。;姜涛(Jiang,T.)。;Lawler,E.L.,给定系统发育树比对的近似算法,算法,16,3,302-315(1996)·Zbl 0862.68119号
[59] Wong,K.M。;Suchard,医学硕士。;Huelsenbeck,J.P.,《比对不确定性和基因组分析》,《科学》,319,5862,473-476(2008),网址:http://www.sciencemag.org/cgi/content/abstract/319/5862/473 ·Zbl 1226.92028号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。