×

稀疏化可以在实践中预测长RNA的接吻发夹假结结构。 (英语) Zbl 1443.92140号

Schwartz,Russell(编辑)等人,第17届生物信息学算法国际研讨会,2017年WABI,美国马萨诸塞州波士顿,2017年8月21日至23日。诉讼程序。Wadern:达格斯图尔宫——莱布尼茨Zentrum für Informatik。LIPIcs–莱布尼茨国际程序。通知。88,第12条,第13页(2017年)。
摘要:虽然计算RNA二级结构预测是RNA研究中的一个重要工具,但在实践中,它仍然基本上局限于无假结结构(或充其量非常简单的假结)。在这里,我们通过减少最初的高空间消耗,使复杂假结(包括接吻发夹结构)的预测切实可行。为此,我们将稀疏化技术和其他节省空间的修改应用于伪结预测算法的递归H.-L.陈等人[“核酸中亲吻发夹和4链MFE预测的(O(n^5)算法”,《计算机生物学杂志》第16期,第6期,803–815页(2009年;doi:10.1089/cmb.2008.0219)](CCJ算法)。因此,在序列长度(n)和非最优可分解片段(“候选”)的数量(Z)中,自由能最小化的理论空间复杂度降低为(Theta(n^3+Z))。稀疏CCJ算法,稀疏CCJ,进行了详细介绍。此外,我们还提供并比较了三代CCJ实现,它们不断改进了空间需求:原始CCJ实现、我们的第一个修改实现和我们的最终稀疏实现。最新的两个实现实现了已建立的HotKnots DP09能量模型。在我们的实验中,使用244GB的RAM,原始CCJ实现无法处理超过195个基数的序列;稀疏CCJ在这个空间限制内处理伪结数据集(长度可达400个基)。所有三种CCJ实现都可以在https://github.com/HosnaJabbari/CCJ网站.
有关整个系列,请参见[Zbl 1372.68022号].

MSC公司:

92D20型 蛋白质序列,DNA序列
92-08 生物问题的计算方法

软件:

IP结;github
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[2] 阿克苏(T.Akutsu)。带有伪结的RNA二级结构预测的动态规划算法。{\it-Disc.App.Math.},104(1-3):45-622000·Zbl 0956.92019号
[3] M.S.Andronescu、C.Pop和A.E.Condon。改进的自由能参数用于RNA假结二级结构预测。{it RNA(纽约)},16(1):26-422010年1月。
[4] R.Backofen、D.Tsur、S.Zakov和M.Ziv-Ukelson。稀疏RNA折叠:节省时间和空间的算法。{\it离散算法杂志},9(1):12-312011年3月。doi:10.1016/j.jda.2010.09.001·Zbl 1216.92033号
[5] K.-Y.Chang和I.Tinoco。HIV TAR发夹环及其补体的RNA亲吻发夹复合体的结构。《分子生物学杂志》,269(1):52-661997年5月。doi:10.1006/jmbi.1997.1021。
[6] H.L.Chen、A.Condon和H.Jabbari。用于预测亲吻发夹和核酸中4链MFE的o(n(5))算法。计算生物学杂志:计算分子细胞生物学杂志,16(6):803-8152009年6月。doi:10.1089/cmb.2008。0219.
[7] H.Jabbari.{预测RNA假结二级结构的算法}。不列颠哥伦比亚大学博士论文,2015年3月。
[8] R.B.林瑟。简单模型中伪结预测的复杂性。在{\it ICALP'04}中,第919-9312004页·Zbl 1099.68037号
[9] R.B.林瑟和C.N.佩德森。基于能量模型的RNA假结预测。《计算生物学》,7(3-4):409-4272000。
[10] W.J.Melchers、J.G.Hoenderop、H.J.Bruins Slot、C.W.Pleij、E.V.Pilipenko、V。Agol和J.M.Galama。柯萨奇B病毒3'非翻译区两个主要发夹环的亲吻是负链RNA合成所需复制起源的基本结构特征。{病毒学杂志},71(1):686-6961997年1月。
[11] T.R.Mercer、M.E.Dinger和J.S.Mattick。长非编码RNA:功能洞察。《自然评论遗传学》,10(3):155-1592009年3月。doi:10.1038/nrg2521。
[12] M.Möhl、R.Salari、S.Will、R.Backofen和S.C.Sahinalp。RNA结构预测的稀疏化,包括假结。{\it分子生物学算法},5(1):39+,2010年12月。doi:10.1186/1748-7188-5-39。
[13] :13
[14] R.Nussinov和A.B.Jacobson。预测单链RNA二级结构的快速算法。美国国家科学院学报,77(11):6309-63132080年11月。doi:10.1073/pnas.77.11.6309。
[15] J.Reeder和R.Giegerich。基于热力学的实用伪结折叠算法的设计、实现和评估。{it BMC生物信息学},2004年5月。
[16] E.Rivas和S.R.Eddy。一种用于RNA结构预测的动态规划算法,包括伪结。《分子生物学杂志》,285(5):2053-20681999。
[17] R.Salari、M.Mohl、S.Will、S.C.Sahinalp和R.Backofen。通过稀疏折叠进行时间和空间有效的RNA-RNA相互作用预测。在Bonnie Berger编辑的《计算分子生物学研究》第6044卷《计算机科学讲义》第31章第473-490页。施普林格柏林/海德堡,柏林,海德堡。doi:10.1007/978-3642-12683-3_31。
[18] 佐藤(K.Sato)、加藤(Y.Kato)、滨田(M.Hamada)、阿克苏(T.Akutsu)和浅井(K.Asai)。IPknot:使用整数编程快速准确地预测具有假结的RNA二级结构。{生物信息学},27(13):i85-i932011年7月。
[19] J.Sperschneider、A.Datta和M.J.Wise。预测两个RNA序列的假结结构。{生物信息学(英国牛津)},28(23):3058-30652012年12月。
[20] Y.Uemura、A.Hasegawa、S.Kobayashi和T.Yokomori。RNA结构预测的树邻接文法。{\it Theor.Comput.Sci.},210(2):277-3031999·Zbl 0912.68121号
[21] M.H.Verheije、R.C.L.Olsthoorn、M.V.Kroese、P.J.M.Rottier和J.J.M Meulenberg。3'非编码序列和编码序列之间的接吻相互作用对猪动脉病毒RNA复制至关重要。{病毒学杂志},76(3):1521-15262002年2月。doi:10.128/jvi.76.3.1521-1526.2002。
[22] Y.Wexler、C.Zilberstein和M.Ziv-Ukelson。可访问基序和RNA折叠复杂性的研究。计算生物学杂志:计算分子杂志,14(6):856-8722007。doi:10.1089/cmb.2007.r020·Zbl 1302.92103号
[23] 重新审视稀疏RNA折叠:空间效率最低自由能结构预测。分子生物学算法:AMB},2016年11月·Zbl 1367.92090号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。