跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2003年7月1日;31(13): 3429–3431.
数字对象标识:10.1093/nar/gkg599
预防性维修识别码:PMC169005型
PMID:12824340

维也纳RNA二级结构服务器

摘要

维也纳RNA二级结构服务器为维也纳RNA软件包中最常用的功能提供了一个web界面,用于分析RNA二级架构。目前,它提供了从单个序列预测二级结构、预测一组对齐序列的一致二级结构以及设计折叠成预定义结构的序列。所有三项服务均可通过维也纳RNA网络服务器访问,网址为网址:http://rna.tbi.univie.ac.at/.

简介

生物分子在结构和功能之间表现出密切的相互作用。因此,除了编码蛋白质外,越来越多的具有复杂功能的RNA分子带来了对RNA结构预测方法的需求。虽然预测三级结构通常是不可行的,但RNA二级结构领域是计算方法非常成功的一个例子。

第一个预测RNA序列最优二级结构的实用动态规划算法可以追溯到20多年前(1). 从那时起,它们被扩展到允许预测次优结构(2)和热力学系综(4),允许为预测指定置信水平或“明确性”(5).

最近,有几种方法解决了预测一组相关RNA序列的一致结构的问题(611). 这种保守的结构特别有趣,因为尽管序列发生变化,但结构的守恒意味着结构必须具有重要的功能。通过使用序列协变增强能量规则,这些方法也获得了更好的预测精度。

维也纳RNA包(12)是一个免费软件包,用于实现RNA二级结构的预测和分析的各种算法。然而,该软件包主要面向Unix命令行用户和程序员。对于不太懂计算机的用户或偶尔的用户,它既不提供点击式图形用户界面,也不提供预编译的二进制文件。

维也纳RNA网站试图通过一个易于使用的web界面提供对最流行功能的访问来解决这些缺点。它由三个CGI脚本组成,分别相当于RNAfold、RNAlifold和RNAinverse命令行程序。虽然出于性能原因,服务器必须限制请求大小,但它们会为每个请求返回等效的命令行调用。这样,如果用户的需求超出web服务的限制,用户可以更轻松地过渡到本地安装的软件。

RNA折叠服务器

在这三种服务中,RNAfold服务器提供了最基本和最广泛的功能。输入由必须键入或粘贴到输入表单的文本字段中的单个序列组成。

在最简单的情况下,服务器仅使用Zuker和Stiegler的经典算法预测单个序列的最小自由能(mfe)结构(1). 除了mfe折叠外,服务器还可以通过John McCaskill的配分函数算法计算平衡基配对概率(4).

默认情况下,特纳组的RNA能量参数(13)但也可以通过选择John SantaLucia提供的DNA参数集来处理单链DNA序列(14).

折叠服务器输出由一个静态html页面组成,该页面将预测的mfe结构显示为括号中的字符串,并链接到为可视化而生成的绘图。可以生成三种类型的绘图。首先,使用naview布局方法将预测的mfe结构绘制为传统的二级结构图(15). 成对概率可以在所谓的“点图”中可视化:在n个×n个我们为每一对可能的画(j个)面积与概率成正比的盒子。最后,我们制作了一个山形图,描述了预测的mfe和配对概率。山区是指xy公司-绘制包围序列位置的碱基对数量的图(对于配对概率平均的封闭对的数量)。请参见图图11所有三种表示的示例。

保存图片、插图等的外部文件。对象名称为gkg59901.jpg

RNAfold服务生成的二级结构和结构集合的三种表示:结构图、山图和点图。从点图中可以清楚地看到,该序列有两个几乎同样好但非常不同的折叠。

二级结构图和点图始终以Postscript格式生成。Postscript的使用不仅是因为它提供了最高的打印质量,还因为它允许将实际数据嵌入到文件中,例如,所有成对概率都以易于解析的格式包含在点图中。另一方面,Postscript文件不能用于网页上的内联图像,并且需要其他软件进行查看(例如gsview、,http://www.ghostscript.com/).

一个合适的替代方案是可缩放矢量图形(SVG)的新标准(http://www.w3.org/Graphics/SVG). 使用支持SVG的浏览器的用户(通常通过使用Adobe的SVG插件,http://www.adobe.com/svg/)可以在SVG中请求结构图,这允许一些交互,例如切换注释。目前,服务器接受的序列最大长度为4000nt,序列最多300个当较长的作业被提交到批处理队列时,nt将被立即处理,在这种情况下,用户将在完成后收到电子邮件通知。

Alifold服务器

Alifold服务通过使用改进的动态编程算法,在标准能量模型中添加协方差项,预测一组对齐RNA或DNA序列的一致二级结构(11)同样,它支持mfe结构和配对概率的预测。用法与RNAfold服务几乎相同。通过输入表单上传预先计算的序列比对,而不是键入输入序列。目前,只接受Clustal格式的比对。服务器限制上传大小和对齐长度,当前限制为10Kb和2000分别为nt。

结果再次显示在Postscript图中,这些图通过序列变化信息得到了增强。在结构图中,支持预测结构的突变用圆圈标记,在点图和山图中,颜色用于指示不同对类型的数量。在线帮助页面上可以找到这些表示的示例和详细解释(网址:http://www.tbi.univie.ac/~ivo/RNA/alifoldcgi.html).

反向折叠服务器

找到折叠成预定义结构的序列是结构预测问题的逆问题。通常,设计这样的序列是有用的,例如为了实验测试关于功能结构的假设。虽然这通常是为非常短的序列手动完成的,但它很快就会变得冗长且容易出错。

我们的反向折叠服务将序列设计视为序列空间中的一个优化问题,通过启发式解决(12). 基于mfe和配分函数折叠,还有两种变体。在第一种情况下,我们最小化了预测的mfe结构和期望的目标结构之间的差异。在第二种情况下,我们优化了热力学系综中目标结构的频率。虽然mfe优化通常会产生略微稳定的序列,即具有许多可供选择的折叠,但通过分配函数优化会产生对目标结构具有强烈偏好的序列。

输入仅由括号表示法中所需的结构组成。当前最大结构长度为100搜索所需的时间因目标结构的普遍性而异。大多数有效的二级结构字符串从来不会作为某些序列的mfe结构出现(即许多序列设计问题没有解决方案),而其他一些则极为常见(例如,请参阅16). 相反,该算法执行的搜索步骤数可以很好地指示序列空间中结构的频率。

未来计划

此处介绍的维也纳RNA二级结构服务器仅提供对维也纳RNA软件包中功能子集的基本访问。然而,它们为偶尔需要RNA结构预测的用户提供了一个方便的界面,并为那些新进入该领域的用户提供一个浅的学习曲线。

目前正在进行进一步改进结果可视化的工作,例如通过绘制带有各种明确性度量的注释的结构图。随着支持SVG的浏览器越来越广泛,SVG图形和客户端javascript的组合应该允许用户以交互方式探索预测的结构。

服务器生成的输出网页是为交互式用户设计的,因此不适合自动解析和进一步处理结果。为了促进与其他程序和web服务的互操作,我们计划以标准化数据交换格式提供输入和输出。最近提出的RNAML格式是一个很有希望的候选者(17),一种基于XML的语言,用于存储有关RNA序列和结构的信息。

虽然服务器目前运行在一款过时的双机Pentium II 450上MHz机器,使用批处理排队系统可以在必要时将作业分配给其他机器。

致谢

这项工作得到了奥地利Fonds zur Förderung der Wissenschaftlichen Forschung、FWF 15893和P-13545-MAT项目的支持。

参考文献

1Zuker M.和Stiegler,P.(1981)使用热力学和辅助信息优化较大RNA序列的计算机折叠。核酸研究。9, 133–148.[PMC免费文章][公共医学][谷歌学者]
2Zuker M.(1989)《动态编程算法在RNA二级结构预测中的应用》。在Waterman,M.S.(编辑)中,DNA序列的数学方法CRC出版社,佛罗里达州博卡拉顿,第159–184页。[谷歌学者]
三。Wuchty S.、Fontana,W.、Hofacker,I.L.和Schuster,P.(1999)RNA的完全次优折叠和二级结构的稳定性。生物聚合物49, 145–165. [公共医学][谷歌学者]
4McCaskill J.S.(1990)RNA二级结构的平衡配分函数和碱基对结合概率。生物聚合物29, 1105–1119. [公共医学][谷歌学者]
5Zuker M.和Jacobson,A.B.(1995)《RNA二级结构预测中的“确定”区域:小亚单位核糖体RNA的分析》。核酸研究。23, 2791–2798.[PMC免费文章][公共医学][谷歌学者]
6Gorodkin J.、Heyer,L.J.和Stormo,G.D.(1997)在一组RNA序列中发现最重要的常见序列和结构基序。核酸研究。25, 3724–3732.[PMC免费文章][公共医学][谷歌学者]
7Hofacker I.L.、Fekete,M.、Flamm,C.、Huynen,M.A.、Rauscher,S.、Stolorz,P.E.和Stadler,P.F.(1998)《完整RNA病毒基因组中保守RNA结构元素的自动检测》。核酸研究。26, 3825–3836.[PMC免费文章][公共医学][谷歌学者]
8Lück R.,Graf,S.和Steger,G.(1999)《构造:保守二级结构的热力学控制预测工具》。核酸研究。27, 4208–4217.[PMC免费文章][公共医学][谷歌学者]
9Juan V.和Wilson,C.(1999)基于自由能和系统发育分析的RNA二级结构预测。分子生物学杂志。289, 935–947. [公共医学][谷歌学者]
10Knudsen B.和Hein,J.(1999)使用随机无上下文文法和进化历史预测RNA二级结构。生物信息学15, 446–454. [公共医学][谷歌学者]
11Hofacker I.L.、Fekete,M.和Stadler,P.F.(2002),对齐RNA序列的二级结构预测。分子生物学杂志。319, 1059–1066. [公共医学][谷歌学者]
12Hofacker I.L.、Fontana,W.、Stadler,P.F.、Bonhoeffer,S.、Tacker,M.和Schuster,P.(1994)RNA二级结构的快速折叠和比较。莫纳什。化学。125, 167–188.[谷歌学者]
13Mathews D.、Sabina,J.、Zucker,M.和Turner,H.(1999)热力学参数的扩展序列依赖性提供了对RNA二级结构的稳健预测。分子生物学杂志。288, 911–940. [公共医学][谷歌学者]
14SantaLucia J.Jr.(1998)《聚合物、哑铃和寡核苷酸DNA最近邻热力学的统一观点》。程序。美国国家科学院。科学。美国95,1460–1465。[PMC免费文章][公共医学][谷歌学者]
15Bruccoleri R.E.和Heinrich,G.(1988)核酸二级结构显示的改进算法。CABIOS公司4, 167–173. [公共医学][谷歌学者]
16Schuster P.、Fontana,W.、Stadler,P.F.和Hofacker,I.L.(1994)《从序列到形状再到背面:RNA二级结构的案例研究》。程序。伦敦皇家学会B255, 279–284. [公共医学][谷歌学者]
17Waugh A.、Gendron P.、Altman R.、Brown J.、Case D.、Gautheret D.、Harvey S.、Leontis N.、Westbrook J.、Westof E。.(2002)RNAML:交换RNA信息的标准语法。核糖核酸8, 707–717.[PMC免费文章][公共医学][谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社