×

稀疏RNA折叠:时间和空间有效的算法。 (英语) Zbl 1247.68106号

Kucherov,Gregory(编辑)等,组合模式匹配。2009年6月22日至24日在法国里尔举行的CPM 2009第20届年度研讨会。诉讼程序。柏林:施普林格出版社(ISBN 978-3-642-02440-5/pbk)。计算机科学课堂讲稿5577,249-262(2009)。
摘要:RNA单链折叠的经典算法需要(O(nZ))时间和(O(n ^{2})空间,其中,(n)表示输入序列的长度,(Z)是满足(n)的稀疏参数。我们展示了如何降低该算法的空间复杂度。空间缩减是基于这样一种观察,即在算法的某个阶段之后,子问题的某些解不会被检查,并且可能会从内存中丢弃。这产生了一个\(O(nZ)\)时间和\(O(Z)\)空间算法,该算法输出最优折叠的基数以及相应的二级结构。空间有效性方法还扩展到了相关的RNA同时折叠对齐问题,并可用于将该问题的最快算法的空间复杂度从\(O(n^{2}m^{2{)\)降低到\(O)(nm^2+\ tilde{Z})\,其中\(n\)和\(m\)表示要对齐的输入序列的长度,并且\(tilde{Z}\)是满足\(nm\leq\tilde{Z}\leqn^{2}m^{2{)的稀疏参数。
此外,我们还展示了如何加快RNA单链折叠的基本布线最大化变体。通过结合两种独立的现有技术来实现加速,这两种技术限制了在这些算法的瓶颈计算中需要检查的表达式的数量。这产生了一个时间和空间算法,其中,L表示输入序列折叠的最大基数。
其他在线支持材料可在以下网址找到:
http://www.cs.bgu.ac.il/zakovs/RNAfold/CPM09\_支持\_material.pdf
关于整个系列,请参见[Zbl 1165.68013号].

MSC公司:

65年第68季度 算法和问题复杂性分析
92D20型 蛋白质序列,DNA序列

软件:

百万倍
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Consortium,A.F.B.,Backofen,R.,Bernhart,S.H.,Flamm,C.,Fried,C.,Fritzsch,G.,Hackermuller,J.,Hertel,J.、Hofacker,I.L.,Missal,K.,Mosig,A.,Prohaska,S.J.,Rose,D.,Stadler,P.F.,Tanzer,A.,Washietl,S.,Will,S.:RNA无处不在:结构化RNA的全基因组注释。实验动物学杂志B部分:分子和发育进化308(1),1-25(2007)
[2] Zuker,M.:用于核酸折叠和杂交预测的Mfold web服务器。核酸研究(13),3406–3415(2003)·doi:10.1093/nar/gkg595
[3] Hofacker,I.L.:维也纳RNA二级结构服务器。核酸研究(13),3429–3431(2003)·doi:10.1093/nar/gkg599
[4] Zuker,M.:RNA结构的计算机预测。方法酶制剂。 180, 262–288 (1989) ·Zbl 0681.92011号 ·doi:10.1016/0076-6879(89)80106-5
[5] Tinoco,I.、Borer,P.、Dengler,B.、Levine,M.、Uhlenbeck,O.、Crothers,D.、Gralla,J.:改进核糖核酸二级结构的估算。《自然与新生物学》246,40-41(1973)·doi:10.1038/newbio246040a0
[6] Waterman,M.,Smith,T.:RNA二级结构:完整的数学分析。数学生物科学42,257–266(1978)·Zbl 0402.92016年 ·doi:10.1016/0025-5564(78)90099-8
[7] Nussinov,R.,Jacobson,A.B.:预测单链RNA二级结构的快速算法。PNAS 77(11),6309–6313(1980)·doi:10.1073/pnas.77.11.6309
[8] Zuker,M.,Stiegler,P.:利用热力学和辅助信息对大RNA序列进行最佳计算机折叠。核酸研究9(1),133–148(1981)·doi:10.1093/nar/9.1.133
[9] Akutsu,T.:随机无上下文语言的RNA二级结构预测和识别的近似和精确算法。组合优化杂志3,321–336(1999)·Zbl 0972.92012号 ·doi:10.1023/A:1009898029639
[10] Wexler,Y.,Zilberstein,C.,Ziv Ukelson,M.:可访问基序和RNA折叠复杂性的研究。《计算生物学杂志》14(6),856–872(2007)·Zbl 1302.92103号 ·doi:10.1089/cmb.2007.R020
[11] Chan,T.M.:加权图中所有对最短路径的更多算法。In:程序。第39届计算理论研讨会(STOC),第590-598页(2007年)·Zbl 1231.05245号 ·doi:10.1145/1250790.1250877
[12] Sankoff,D.:RNA折叠、排列和原序列问题的同步解决方案。SIAM应用数学杂志45(5),810-825(1985)·Zbl 0581.92012号 ·doi:10.1137/0145048
[13] Mathews,D.H.,Turner,D.H.:Dynalign:一种发现两个RNA序列共同的二级结构的算法。《分子生物学杂志》317(2),191-203(2002)·doi:10.1006/jmbi.2001.5351
[14] Havgaard,J.、Lyngso,R.、Stormo,G.、Gorodkin,J.:序列相似性小于40的RNA序列的成对局部结构比对·doi:10.1093/bioinformatics/bti279
[15] Ziv-Ukelson,M.,Gat-Viks,I.,Wexler,Y.,Shamir,R.:RNA共折叠的快速算法,第174-185页(2008)
[16] Will,S.,Reiche,K.,Hofacker,I.L.,Stadler,P.F.,Backofen,R.:通过基因组尺度基于结构的聚类推断非编码RNA家族和类别。PLOS计算生物学3(4),e65(2007)·doi:10.1371/journal.pcbi.0030065
[17] Gardner,P.P.,Giegerich,R.:比较RNA结构预测方法的综合比较。BMC生物信息学5,140(2004)·doi:10.1186/1471-2105-5-140
[18] Jansson,J.,Ng,S.K.,Sung,W.K.,Willy,H.:一种更快、更节省空间的算法,用于通过比对推断RNA序列的弧形注释。《算法》46(2),223-245(2006)·Zbl 1101.68105号 ·doi:10.1007/s00453-006-1207-0
[19] Durbin,R.、Eddy,S.、Krogh,A.、Mitchison,G.:生物序列分析:蛋白质和核酸的概率模型。剑桥大学出版社,剑桥(1998)·Zbl 0929.92010号 ·doi:10.1017/CBO9780511790492
[20] Hirschberg,D.S.:计算最大公共子序列的线性空间算法。ACM通讯18(6),341-343(1975)·Zbl 0301.68042号 ·doi:10.1145/360825.360861
[21] Hirschberg,D.S.:最长公共子序列问题的算法。JACM 24、664–675(1977年)·Zbl 0402.68041号 ·doi:10.1145/322033.322044
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。