摘要
1 RNA形状工作室
1.1 RNA抽象形状分析工具的集成
代数动态规划(ADP)框架允许我们在高抽象级别上表达用于序列分析的动态规划算法。它们由签名、树文法和评估代数组成(吉格里奇等。,2004年a). 代数上强大的乘积运算允许人们通过组合可用的组件,基本上只需一次按键,就可以导出新类型的分析(Steffen和Giegerich,2005年). 依靠最近的B埃尔曼的GAP系统(索索夫等。, 2013)它实现了ADP框架,我们建立了一个组件库,使我们能够集成几种已建立的RNA结构分析工具:RNA形状,RNAalishapes形状和pknots公司RG,包括其最近的延期第页K(K)国际空间站作为衍生产品,我们获得了迄今为止不可用的功能:例如第页K(K)国际空间站,我们现在可以对包含假结的结构进行抽象形状分析,直至亲吻发夹图案的复杂性。新工具第页A类锂K(K)国际空间站可以从对齐的序列中预测接吻发夹图案。随着集成的进行,这些工具的功能也以多种方式进行了扩展。图1提供了概述。
图1。
RNA形状工作室的参数。新功能由表示+。新参数以黄色突出显示。新的分析模式以绿色阴影显示
1.2集成工具及其新功能
1.2.1 RNA延伸形状
人们普遍认为,预测最小自由能的单一结构并不能充分反映RNA结构形成的微妙性和多功能性。RNA形状工具引入了抽象形状的概念(吉格里奇等。,2004年b;Voß等。, 2006)-通过螺旋排列对结构进行(数学上精确的)表征。例如,‘[[][][]]'表示三叶草形状,以及‘[_[_[]_]]'一个5′凸起的单茎环和一个内环。经典抽象形状分析报告最小自由能结构不同的形状类或由形状累积的玻尔兹曼结构概率。这提供了关于给定RNA序列折叠空间的天气学信息,无需启发式或采样。延伸RNA形状,我们添加了不同的处理悬空碱基的模式(与RNA一致折叠选项−d0,−第1天和−第2天) (詹森等。, 2011;洛伦兹等。, 2011)计算碱基对概率和最大期望精度(MEA)折叠(卢等。, 2009).
1.2.2 RNA延伸alishapes形状
的工作Voß(2006)结合了RNA的思想假丝和RNA形状并基于预先对齐的RNA序列执行形状分析。我们添加了结构守恒指数、不同悬空基模型、MEA折叠和窗口模式的计算。RIBOSUM评分(伯恩哈特等。, 2008)添加用于评估序列相似性。
1.2.3扩展至第页K(K)国际空间站
在泰斯等。(2010年)的想法pknots公司反应堆(Reeder和Giegerich,2004年)被扩展到预测(除了无缺口结构和H型假结外)以任意嵌套方式呈现接吻发夹基序的RNA结构,需要时间和空间。我们添加了形状分析、概率、不同的折叠策略和不同的悬垂基础模型。这个-铸造选项提供了RNA中伪结结构的比较预测铸造方法(Reeder和Giegerich,2005年). 还包括窗口模式。
1.2.4新工具第页A类锂K(K)国际空间站
程序第页A类锂K(K)国际空间站允许预测假结,包括对齐序列中的接吻发夹。它由其他工具的语法和代数组成,继承了所有对它有意义的特性和选项。
1.2.5公用设施
所有工具都增加了实用程序,以计算折叠能量或序列的抽象形状,这些序列具有来自外部源的结构,其方式与工具的能量模型一致。图形图案描述工具L共基序(Reeder公司等。, 2007)现在使用RNA形状工作室的模块。K系列不我n个F类机架(泰斯等。, 2008)预测−1核糖体移码的工具也已更新。
2应用案例:MERS中的一种帧移位激励元件
冠状病毒家族包含移码刺激元件(巴拉诺夫等。, 2005)在这种情况下,移码是由一个光滑的位点和一个H型或K型假结共同促成的。R(右)家庭(伯格等。, 2013)虽然R的工具家庭无法显式建模伪节点。第页K(K)国际空间站(泰斯等。, 2010)英寸-强制执行模态分析表明,对于11个家族成员,最小自由能结构为H型,另外11个为K型伪结,并且只有一个成员的纯嵌套结构具有最佳能量。
最近测序的MERS基因组(KF958702.1)带有同源移码位点,而触发元件的结构尚不清楚。结构预测第页K(K)国际空间站对于下游100 bp的延伸段,湿滑场地证明存在最稳定的K型假结(参见图2). 第二次跑步第页K(K)国际空间站这一次以概率模式显示,这个特殊的K型假结的形状类别具有压倒性的玻尔兹曼概率;没有为其他形状类留下太多概率质量。
图2。
RNA形状工作室结果页面,用于折叠MERS示例第页K(K)国际空间站VARNA的插图(达尔蒂等。, 2009)
3可用性
RNA形状工作室可在http://bibiserv.cebitec.uni-bielefeld.de/rnashapestudio用户可以访问B埃尔曼的GAP存储库中所有组件的源代码,并根据自己的目标组合或扩展它们。例如,在Reinkensmeier公司等。(2011)用于定义中建联合体-主题家族根瘤菌目.
利益冲突:未声明。
参考文献
等sars-cov基因组解码中的程序化核糖体移码
, 病毒学
, 2005
,卷。 332
(第498
-510
) 等RNAlifold:改进的RNA比对共识结构预测
, BMC生物信息学
, 2008
,卷。 9
第页。 474
等Rfam11.0:RNA家族10年
, 核酸研究。
, 2013
,卷。 41
(第D226型
-D232型
) 等VARNA:RNA二级结构的交互式绘制和编辑
, 生物信息学
, 2009
,卷。 25
(第1974
-1975
) 等序列数据动态规划的一门学科
, 科学。计算。程序。
, 2004年a
,卷。 51
(第215
-263
) 等RNA的抽象形状
, 核酸研究。
, 2004年b
,卷。 32
(第4843
-4851
) ,等人迷失在折叠空间?RNA二级结构预测热力学模型的四种变体的比较
, BMC生物信息学
, 2011
,卷。 12
第页。 429
等维也纳RNA软件包2.0
, 算法分子生物学。
, 2011
,卷。 6
第页。 26
等通过最大化期望配对精度改进RNA二级结构预测
, 核糖核酸
, 2009
,卷。 15
(第1805
-1813
) , . 一种实用的基于热力学的伪结折叠算法的设计、实现和评估
, BMC生物信息学
, 2004
,卷。 5
第页。 104
, . 共识形状:一种替代Sankoff算法的RNA共识结构预测方法
, 生物信息学
, 2005
,卷。 21
(第3516
-3523
) 等运动基序:从图形基序描述到RNA基序搜索
, 生物信息学
, 2007
,卷。 23
第页。 i392型
等根瘤菌中反式编码sRNA的保存和发生
, 基因
, 2011
,卷。 2
(第925
-956
) 等Bellman的GAP——一种用于序列分析中动态编程的语言和编译器
, 生物信息学
, 2013
,卷。 29
(第551
-556
) , . 使用对代数的多功能声明式动态规划
, BMC生物信息学
, 2005
,卷。 6
第页。 224
等KnotInfrasme:对-1核糖体移码事件的预测
, 核酸研究。
, 2008
,卷。 36
(第6013
-6020
) 等, . 包含接吻发夹基序的RNA二级结构预测
, 生物信息学中的算法,计算机科学讲稿第6293卷
, 2010
施普林格
柏林-海德堡
(第52
-64
) . 对齐RNA的结构分析
, 核酸研究。
, 2006
,卷。 34
(第5471
-5481
) 等RNA形状的完整概率分析
, BMC生物。
, 2006
,卷。 4
第页。 5
作者注释
©作者2014。牛津大学出版社出版。
这是一篇根据知识共享署名许可条款分发的开放获取文章(http://creativecommons.org/licenses/by/4.0/)它允许在任何介质中不受限制地重用、分发和复制原始作品,前提是正确引用了原始作品。