×

通过图树分解快速从头计算预测RNA假结。 (英语) 兹比尔1143.92016

摘要:由于自由能模型下核苷酸相互作用的序列构象难以计算,包括假结在内的RNA二级结构的预测仍然是一个挑战。优化算法通常假设预测的RNA结构为受限类,但仍需要高次多项式时间复杂度,使用成本太高。启发式方法可能产生时间效率高的算法,但它们不能保证预测结构的最佳性。
本文介绍了一种新的、有效的算法,用于预测结构不受限制的带有伪结的RNA结构。基于图树分解开发了新的预测技术。特别是,基于简化的能量模型,用图定义了茎重叠关系,其中一个专门的最大独立集对应于所需的最佳结构。这样的图是树可分解的;在图的树分解上进行动态规划可以得到一个有效的优化算法。最后的结构预测基于在更全面的自由能模型下重新排列次优结构列表。新算法是基于从不同资源中提取的大量RNA序列集进行评估的。它显示出整体敏感性和特异性,优于或可与以前的优化和启发式算法相比较,但所需时间明显少于比较的优化算法。

MSC公司:

92C40型 生物化学、分子生物学
05C90年 图论的应用
90 C90 数学规划的应用
92-08 生物问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abrahams J.、van den Berg M、van Batenburg E.和Pleij C.(1990年)。通过计算机模拟预测RNA二级结构,包括假结。核酸研究18:3035–3044·doi:10.1093/nar/18.10.3035
[2] Adams P.L.、Stahley M.R.、Kosek A.B.、Wang J.和Strobel S.A.(2004年)。具有两个外显子的自剪接族i内含子的晶体结构。自然430:45-50·doi:10.1038/nature02642
[3] Akutsu T.(2000)。带有伪结的RNA二级结构预测的动态规划算法。离散应用程序。数学。104: 45–62 ·Zbl 0956.92019号 ·doi:10.1016/S0166-218X(00)00186-4
[4] Bodlaender,H.L.:树宽有界的图类。荷兰乌得勒支大学计算机科学系技术代表RUU-CS-86-22(1986)
[5] Bodlaender,H.L.:有界树宽图上的动态编程算法。摘自:第十五届国际自动化学术讨论会论文集,语言与编程,第105-119页。Springer Verlag,《计算机科学讲义》,第317卷,(1987)
[6] Brown J.(1999)。核糖核酸酶p数据库。核酸研究27:314·Zbl 05435094号 ·doi:10.1093/nar/27.1314
[7] Chen J.-H.、Le S.-Y.和Maize J.V.(2000)。RNA常见二级结构的预测:遗传算法方法。核酸研究28(4):991–999·doi:10.1093/nar/28.4.991文件
[8] Dirks R.和Pierce N.(2003年)。一种用于包括假结的核酸二级结构的配分函数算法。J.计算。化学。24: 1664–1677 ·Zbl 05428255号 ·文件编号:10.1002/jcc.10296
[9] Durbin R.、Eddy S.R.、Krogh A.和Mitchison G.J.(1998年)。生物序列分析:蛋白质和核酸的概率模型。剑桥大学出版社·兹比尔0929.92010
[10] Eddy S.R.和Durbin R.(1994年)。使用协方差模型进行RNA序列分析。核酸研究22:2079–2088·doi:10.1093/nar/22.11.2079
[11] Giedroc D.、Theimer C.和Nixon P.(2000年)。参与刺激核糖体框架移动的RNA假结的结构、稳定性和功能。分子生物学杂志。298: 167–185 ·doi:10.1006/jmbi.000.3668
[12] Hicks,I.V.,Koster,A.M.C.A.,Kolotoglu,E.:离散优化的分支和树分解技术。摘自:《运筹学教程:信息》,新奥尔良,2005年(2005)
[13] 季毅、徐旭、斯多摩G.D.(2004)。预测未对齐序列中常见RNA二级结构基序(包括假结)的图论方法。生物信息学20(10):1591–1602·doi:10.1093/bioinformatics/bth131
[14] 柯安、周凯、丁峰、凯特·J.H.和杜德纳J.A.(2004)。一个构象开关控制着丙型肝炎病毒核酶的催化作用。性质429:201–205·doi:10.1038/nature02522
[15] Knudsen B.和Hein J.(2003)。Pfold:使用随机无上下文文法预测RNA二级结构。核酸研究31(13):3423–3428·兹伯利05436016 ·数字对象标识代码:10.1093/nar/gkg614
[16] Lyngso R.B.和Pedersen C.N.S.(2000年)。基于能量模型的RNA假结预测。J.计算。生物7(3-4):409-427·doi:10.1089/106652700750050862
[17] Mathews D.H.、Sabina J.、Zuker M.和Pederson C.N.S.(1999年)。热力学参数对序列的依赖性增加了对RNA二级结构的预测。分子生物学杂志。288: 911–940 ·doi:10.1006/jmbi.1999.2700
[18] Nussinov R.、Pieczenik G.、Griggs J.和Kleitman D.(1978年)。循环匹配算法。SIAM J.应用。数学。35: 68–82 ·Zbl 0411.92008号 ·数字对象标识代码:10.1137/0135006
[19] Ren J.、Rastegart B.、Condon A.和Hoos H.H.(2005年)。HotKnots:启发式预测RNA二级结构,包括假结。RNA 11:1194-1504·doi:10.1261/rna.7284905
[20] Rivas E.和Eddy S.R.(1999)。一种用于RNA结构预测的动态规划算法,包括伪结。分子生物学杂志。285:2053–2068年·doi:10.1006/jmbi.1998.2436
[21] Robertson N.和Seymour P.D.(1986年)。图子图形ii。树木宽度的算法方面。J.算法7:309–322·Zbl 0611.05017号 ·doi:10.1016/0196-6774(86)90023-4
[22] 阮J.、Stormo G.D.和Zhang W.(2004)。一种预测带有伪结的RNA二级结构的迭代循环匹配方法。生物信息学20(1):58–66·doi:10.1093/bioinformatics/btg373
[23] Sakakibara Y.、Brown M.、Hughey R.、Mian I.S.、Sjölander K.、Underwood R.C.和Haussler D.(1994年)。tRNA建模的随机无上下文文法。核酸研究22:5112–5120·doi:10.1093/nar/22.23.5112
[24] Schimmel P.(1989年)。与翻译装置组件相互作用的RNA假结。单元格58(1):9–12·doi:10.1016/0092-8674(89)90395-4
[25] Serra M.J.、Turner D.H.和Freier S.M.(1995年)。预测RNA的热力学性质。酶制剂。259: 243–261
[26] Song,Y.,Liu,C.,Malmberg,R.L.,Pan,F.,Cai,L.:基于树分解的RNA结构快速搜索,包括基因组中的假结。摘自:《2005年计算系统生物信息学会议论文集》,第223-234页。IEEE计算机学会(2005)
[27] Sprinzl M.、Horn C.、Brown M.、Ioudovitch A.和Steinberg S.(1998年)。tRNA序列和tRNA基因序列的编译。核酸研究26:148–153·Zbl 05437027号 ·doi:10.1093/nar/26.1148
[28] Steffen P.、Voss B.、Rehmsmeier M.、Reeder J.和Giegerich R.(2006年)。Rnashapes:基于抽象形状的集成RNA分析包。生物信息学22(4):500–503·Zbl 05325691号 ·doi:10.1093/bioinformatics/btk010
[29] Tabaska J.、Cary R.、Gabow H.和Stormo G.(1998年)。一种能够识别假结和碱基三联体的RNA折叠方法。生物信息学14(8):691–699·doi:10.1093/bioinformatics/14.8.691
[30] Uemura Y.、Hasegawa A.、Kobayashi S.和Yokomori T.(1999)。用于RNA结构预测的树邻接文法。西奥。计算。科学。210: 277–303 ·Zbl 0912.68121号 ·doi:10.1016/S0304-3975(98)00090-5
[31] van Batenburg F.、Gultyaev A.、Pleij C.、Ng J.和Oliehoek J.(2000年)。伪碱基:带有RNA伪结的数据库。核酸研究28:201–204·Zbl 05434971号 ·doi:10.1093/nar/28.1201
[32] Zuker M.和Stiegler P.(1981年)。利用热力学和辅助信息优化大RNA序列的计算机折叠。核酸研究9(1):133–148·Zbl 05437422号 ·doi:10.1093/nar/9.1.133
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。