跳到主要内容

精细调节黄昏区的结构RNA比对

摘要

背景

一种广泛使用的发现RNA中保守二级结构的方法是首先构建多序列比对,然后折叠比对,基于热力学和协方差优化评分。这种方法在75%的序列相似性附近效果最好。然而,在相似度低于55%的“曙光区”,序列比对往往会模糊第二阶段中使用的协方差信号。因此,虽然共识结构的整体形状仍然可以找到,但无法可靠地估计保守程度。

结果

基于可用方法的组合,我们提出了一个名为平面ACstar用于改善曙光带结构线形中的结构保护。通过对齐折叠构建共识结构后,平面ACstar放弃原始序列比对,单独重新折叠序列,但与共识一致,使用纯结构比对方法对结构进行比对,而不考虑序列,并从结构比对中导出改进的序列比对,重新提交给比对折叠,只要结构守恒得到改善,这个循环就可以迭代,但通常只需一步。

结论

使用工具ClustalW公司,RN验证、和RNAforester公司,我们发现,对于序列一致性为30-55%的序列,结构保守性平均可以提高10%,从以下方面衡量变化较大RN验证结构保护指数。

背景

介绍

RNA分子的生物学功能通常由分子的三维结构决定。在进化过程中,结构往往比碱基的确切序列更保守。因此,相关但发散的序列之间的强烈结构一致性可以被视为保留功能作用的指标。

按照中介绍的分类[1]一个RNA分子家族的结构一致性可以按照三种不同的“计划”计算:我们可以(a)对齐序列,然后联合折叠它们,或者(B)同时对齐和折叠,或者(C)先单独折叠序列,然后对齐它们的结构。

方案B理论上是最优的,因为它联合解决了在任意评分函数下对齐和折叠的两个优化问题[2]. 然而,其计算成本O(运行)(n个)时间和O(运行)(n个2)空间,其中n个是序列长度和是序列数,都比较高。例如,实现折叠对齐,Dynalign公司,PMComp公司[7]进行务实限制,提高效率。

方案C适用于发散太多而无法根据序列守恒进行有意义的对齐的序列。首先,序列是单独折叠的。这件事必须小心。人们不能简单地计算MFE结构,然后用结构对齐程序将其对齐。在对10个RNA家族的69个序列的评估中,MFE预测只有32个案例具有与共识结构相同的抽象形状(即螺旋排列)(见[8]). 预测的MFE结构中缺乏一致性使得它们的结构对齐毫无意义,但这并不排除存在隐藏在近最优折叠空间中的良好一致性结构。因此,必须为每个序列获得近最优结构的代表子集,例如通过抽象形状分析[9]. 然后,将具有一致抽象形状的结构对齐,例如通过树比较(RNAforester公司[10,11],马尔纳[12]).RNA广播[8]是第一个C计划方法;最近的一个是R-咖啡[13].

方案A可能是使用最广泛的方法,也是我们将在这里进一步加强的方法。它适用于使用非现成的多序列对齐工具(例如。ClustalW公司[14],T-Coffee咖啡[15],MAFFT公司[16]). 然后,对齐的序列被联合折叠(例如。PFOLD支架[17],RN验证[18,19],信息生命周期管理[20],连接结构[21]).

上面列出的计划A、B和C方法还远远不够完整,因为问题的难度由大量方法反映出来。许多启发式算法被建议保留方案B方法的能力,但减少了其高计算成本并克服了其对序列对的限制,例如。莫莱特MXSCARNA[22,23]. 务实的读者是指用于校准结构RNA的WAR网络服务器[24],目前展示了14种此类方法。其中四种方法可以归类为A计划方法,这是我们在此关注的问题。我们在这里提出的贡献不应被视为另一种方法,而是一个值得与计划a方法结合的微调步骤。

计划A失去了它的存在的理由当序列保守性在90%以上时。虽然序列比对肯定是可靠的,但与单独折叠序列相比,它携带的额外信息很少。该方法在75%左右的序列相似性时效果最好。55%以下,测量值[25]表现出性能下降。这种影响在[26](图四)。在这里,我们展示了如何在一定程度上缓解这种情况。结果方法命名为平面A星,因为它是计划A和计划C的步骤的迭代组合。

动机

要详细评估方案A的性能,请考虑图1方案A的得分在30-55%的序列一致性范围内与参考比对差异最大。在这个“暮色地带”RN验证下降,以较低的结构保护指数(SCI)表示[27]. 较低的指数表明产生的共识结构质量下降,但不排除存在更好的共识,这一点尚未发现。事实上,情况往往如此。

图1
图1

方案A执行情况对具有不同序列一致性水平的RNA家族执行a计划方法。“曙光区”从大约55%的序列标识延伸到左侧。参考线形取自BRAliBase。随后使用Savitzky-Glay过滤器进行过滤,以平滑图形。

让我们详细看看情况。众所周知,随着发散度的增加,序列比对将无法对齐代表补偿性突变的碱基,并携带协方差信号,以便在后续阶段利用。事实上,在存在间隙的情况下,序列比对将系统地模糊协方差信号。由于(据我们所知)文献中没有报道过这一观察结果,让我们在这里解释一下这一现象。

我们使用熟悉的点-拍表示法,其中成对的碱基用匹配的括号表示,未成对的碱用点表示。对于结构。。((....)).. 还有。。(....).., 预期的结构对齐

可能表现出良好的序列保守性、两个间隙和补偿的碱基对变化。在任何序列中AAGGAAAAACCAA公司AACAAAAGA公司,对齐两个底座GG公司带有单个底座C,算法必须在C,或向右。由于最终得分不受此选择的影响,因此可以任意选择差距位置。假设对齐算法首先产生不匹配,然后在不匹配的基础右侧插入一个间隙。到目前为止,一切都很好。完全相同的情况出现在立方厘米G公司。该算法再次在的右侧插入间隙G公司,并按以下方式对齐序列:

现在,对齐序列的联合折叠将产生:

这可以防止形成上部序列中的第二个碱基对:将第二个G与第二个C配对将创建非嵌套的碱基对,这在折叠算法中是不允许的。

平面ACstar轮廓

在30-55%的序列一致性范围内,我们推测得到的一致性结构在整体形状上通常是正确的,而结构细节由于协方差信号的模糊而丢失。因此,我们根据初步一致意见,分解排列并分别重新折叠序列。这种单独的折叠将产生与共识兼容的额外碱基对。然后,将结果结构与结构校准程序[10]. 这使碱基对对齐,而不考虑具体的碱基,从而找到补偿碱基变化并恢复协方差信号。这样获得的任何结构对齐都需要序列对齐,我们将其提取出来。现在,这种序列比对可能会形成比以前更好的共识。

这种方法有一个明显的局限性:我们可以恢复在第一次对齐折叠中丢失的碱基对,但我们永远不会撤消在初始步骤中实际形成的一致碱基对。这些碱基对将始终保持在改进的结构中,尽管它们可能以不同的方式对齐。这就是为什么我们认为我们的方法是计划a的一个微调附件,而不是(又一个)新方法。这很像是在没有参考完美音高设备的情况下调整吉他。你假设六根弦中的一根,比如说A,处于音高,然后将其他弦调到A弦。虽然你的吉他现在听起来很和谐,但从绝对值来看,它可能比以前更不协调。我们的假设是,在暮色区,初始对准将足够好,以指向绝对值最接近音高的弦A。

这个想法已经用工具实现了ClustalW公司,RN验证、和RNAforester公司共识的质量由RN验证根据Gruber等人[28]是结构保护的最佳措施。折叠对齐ARN验证产生一致的最小自由能E类 A类 作为输出。E类 A类 包括观测到的协变的伪能量贡献。折叠序列B类1,..B类 n个 我们可以分别计算它们的平均MFE来自单独的MFE。SCI是美国/.

因此,我们从以下方面衡量改进RN验证自己的质量标准,达到SCI。

SCI改进的充分性

请注意,SCI不是一种绩效衡量指标,因为优化SCI分数的校准最接近“真实”校准。无论保守结构是否为“真”,它都可以作为发散序列中结构守恒的指标。从机械上讲,SCI解释了将序列从MFE结构重新折叠到预测一致性所需的能量X。这并不排除存在另一个低能耗共识结构X’,这可能在结构上有很大不同,实际上可能与RNA的功能有关。将所有序列从其MFE结构重新折叠到X’而不是X可能只需要比一致意见多一点点的能量X但这并不意味着XX’结构相似。X’可能是“真正的”结构,但计划A根本不会注意到这一点。诚然,考虑的序列数量越多,分歧越大,这种情况发生的可能性就越大。原则上,A计划的方法可以得到加强,以防止出现这种情况,但前提是要以执行次优共识折叠为代价。

我们的新方法基于这样一个前提,即增加SCI分数是值得的。然而,我们也根据策划的结构评估了由此产生的共识结构,并在结论和附加文件中对此进行了报告1.

结果和讨论

算法

平面ACstar是方案A和方案C的元素的迭代组合。它使用单独的结构预测,如方案C所做的那样,但包括来自多序列比对和比对折叠的信息,如方案A所示。我们使用ClustalW公司初始对准步骤,以及RN验证因为它们是在实践中用于这些任务的最广泛的工具。A类是初始序列比对,C是初步共识X是其SCI内核。C 是初步共识的碱基对的投影C到序列B类 从输入大小集n个,其中1≤n个.S公司 是序列的单个折叠B类 从输入集到初步共识结构C.Y(Y)是折叠结构的多结构对准。多结构比对意味着序列比对,即改进的序列比对A类*带SCI-芯X*.

在伪代码中,过程如下:

给定一组RNA序列B类1,...,B类 n个 ,

  1. 1

    A类ClustalW公司(B类 1,...,B类 n个 )-初始序列对齐

  2. 2

    CRN验证(A类);X科学分数(C)-初步共识

  3. 三。

    C 碱基对在中的投影CB类 -(见下文)

  4. 4

    S公司 RNA折叠-C类C (B类 )的= 1,..n个-每个单独折叠B类 相对于共识

  5. 5

    Y(Y)RNAforester公司(S公司 1,...,S公司 n个 )-多结构对齐

  6. 6

    A类*←序列对齐隐含于Y(Y)-提取改进的序列比对

  7. 7

    C* ←RN验证(A类*);X*←科学分数(C*)-折叠改进对齐

  8. 8

    如果X* >X,套A类A类*并从步骤3开始迭代,否则退出并返回结果A类,CX

“投影”(第3步)从一致性中提取碱基对,消除与序列相关的间隙B类 ,并生成非饱和结构C 对于B类 .呼叫RNA折叠带选项-C C公司 (步骤4)可能会产生除以下碱基对之外的其他碱基对C 。一般来说,每种情况都会有所不同B类 .

测试数据

在评估中,我们使用了最新版本的RNAalifold[29]和ClustalW 2.0.11。SCI是根据中给出的公式计算的[28]. 在计算平均序列相似性时,我们没有使用原始的BRAliBase计算,而是使用了Torrinsson等人建议的改进计算[30].平面ACstar根据BRAliBaseII基准数据库的数据集1进行评估[31]. BRAliBaseII是由Gardner、Wilm和Washietl于2005年在应用于结构RNA的多序列比对程序基准中创建的[25].

BRAliBaseII的数据集1包含II组内含子、5S rRNA、tRNA和U5剪接体RNA的各种RNA序列。这些序列来自Rfam数据库[32]. 使用中描述的程序将每个RNA家族切割成100个亚序列[26]. 这些子排列包含5个序列,每个序列包含广泛的序列标识。

目前,不支持完整的IUPAC代码RNAforester公司因此,我们的方法仅限于将具体的RNA序列作为输入序列。此限制将测试数据集的大小减少到388个子对齐中的340个。

为了进行比较,我们包括了参考比对的得分。必须记住,它是从完整的家庭一致性中得分的。因此,参考路线不一定代表最佳次路线。

SCI改进

在图中2,我们看到可变序列相似性的SCI平均得分。计划A的结果,平面ACstar然后对参考对准进行评分,并使用Savitzky-Glay滤波器进行滤波。滤波器使用局部多项式回归来计算每个点的平滑值。

图2
图2

planACstar的性能.性能平面ACstar用于具有不同序列一致性水平的RNA家族。有关更多信息,请参阅图1。

结果表明,该边界具有55%的序列相似性。在55%以上,SCI得分一致,在55%以下,这两种方法的性能优于参考比对。这证实了Gardner、Wilm和Washietl的观察结果:

结果表明,60%的序列一致性是一个粗略的阈值,由此预测序列比对的结构内容与参考结构比对不同[25].

(边界5%的偏移是由于使用了改进的计算相似性的公式。)我们的工作假设是,预测的整体形状在这个微光区可能仍然正确。事实上,平面ACstar与方案A相比,该区域的相似度提高了30%至55%。虽然潜在的RNA序列没有很好地保存,但我们从其结构中提取的额外信息改善了总体排列中的结构保存。与方案A相比,平面ACstar将暮色区的面积减少到原来的三分之二左右。

连接由平面ACstar和平面图A。彩色突出显示的是有趣的序列身份范围,即暮色区。请注意,几乎所有重大改进都在该区域内。

图3
图3

以黄昏区为焦点的点图.SCI—改进平面ACstar对于“曙光带”中的RNA家族,30-55%的序列一致性(颜色代码:绿色=高相似性,红色=低相似性)。灰色圆点表示较低或较高的序列标识,即超出此范围的排列。

查看完整的数据集,90%的点位于或非常靠近对角线。正如预期的那样,在55%的边界以上,我们没有必要进行微调。在黄昏区,我们注意到近50%的SCI分数有所提高。

我们还测试了改进是否与对齐中的间隙含量有关,但没有观察到相关性。该测试记录在图中4.

图4
图4

缺口内容与SCI评分的相关性.

详细观察

下面是通过平面ACstar如图所示。作为一个例子,我们选择了一个位于序列身份的曙光区的序列,即第二组内含子的序列83。该比对具有31%的序列同一性,并且平面ACstarSCI得分从0.8807提高到1.005。

第一步是初始序列比对A类,执行人ClustalW公司结果如下:

使用RN验证,其初步共识C已计算。5(左)显示了共识的结构,由RN验证得分为-27.92,SCI得分为0.8807。的字符串表示C如下所示:

图5
图5

改进共识结构.共识结构CC*. 结构C是MFE折叠限制的初步共识。结构C*是经过微调后的改进共识平面ACstar已应用。

我们管道中的下一步是单个序列相对于一致性的单独折叠RNA折叠-C。图中显示了该程序与最佳MFE折叠的直接比较,没有任何共识6.RNAforester公司计算多重结构路线Y(Y),从中改进了序列比对A类*可以很容易地提取。两者均显示如下:

图6
图6

MFE结构和折页仅限于初步共识MFE结构与仅限于初步共识的折叠。

请注意,我们的路线末端有一个新的缺口。对改进共识结构的影响C类*如图所示5(右):碱基对的数量增加了。这个RN有效MFE A类 提高到-31.88,即SCI得分为1.005。SCI得分高于1.0表示二级结构非常保守。

评估总结

在30-55%序列同一性的黄昏区,RNA比对的结构保守性通常可以得到改善。我们通过结合上述流水线中已有的和广泛使用的RNA工具来实现这一点。虽然平均改善率为10%,但无法说明改善的百分比范围,因为有时原始SCI值非常接近0。在图中最左侧的数据点,一个结构有两个部分,原始对齐只允许识别其中一个。RNAfold在每个序列中找到第二部分,并且结构比对与这些部分相匹配。因此,SCI值从(几乎)0提高到显著正值。

比较图12我们注意到,在黄昏区,平面ACstar将预测值和参考值之间的差异减少到原始面积的三分之二左右。这与SCI分数的直接比较密切相关平面ACstar和平面图A如图所示几乎所有的改善都发生在暮色区。

这些改进的计算成本很高。使用我们的数据集和特定的工具集,我们发现平面ACstar比方案A慢30倍(序列长度80)到50倍(序列长150)。具体来说,单个子对齐上的运行时(n个=5,序列长度150)在2 GHz Intel Core 2 Duo处理器上从0.297秒增加到14.896秒。这种额外的努力源于RNA折叠对于n个序列和折叠后结构的多重对齐,前者的努力随着O(运行)(n个)后者随着O(运行)(n个2). 由于管道的每个组件都可以替换为等效的功能,因此另一个实现中的资源需求可能不同。特别是,我们正在研究一种更快版本的纯结构对齐算法,用于预先知道对齐结构以共享通用整体形状的特殊情况。

另一方面,我们的研究也证实了最近对RN验证程序[29]. 我们的数据最初是用以前版本的RN验证平均SCI改善率接近20%。改进了间隙处理RN验证,我们的微调使SCI评分的改善幅度较小。但请注意,新的RN验证不会改变路线,只会更聪明地得分。

结论

我们的评估表明,通过相当简单的可用工具组合,可以改善曙光区RNA比对中的结构保守性。可实现的改进程度差异很大。在大规模筛选保守二级结构的背景下,如全基因组RNA基因预测RNAz(无线电导航)[27],选择方案A是因为其速度快,并且使用平面ACstar代替A计划必须被视为过于昂贵。此外,许多折叠路线位于曙光区之外,无论如何,微调都不会带来任何改善。然而,一旦确定某些定线有希望并用于模型构建,我们建议使用平面ACstar应该应用。我们的实现可在Bielefeld生物信息服务器上获得,网址为http://bibiserv.techfak.uni-bielefeld.de/planACstar/.

虽然我们已经对这三种工具进行了评估ClustalW公司,RN验证RNAforester公司,请注意,这些成分中的每一个都可以被功能等效物替换,以创建另一个平面ACstar恢复被序列比对遮挡的协方差信号仍然是基本的总体思路。

虽然经常这样解释,但SCI高并不一定意味着相关结构接近事实。目前尚不清楚这种解释在多大程度上有效,尤其是在曙光区。我们从精心策划的结构中汇编了第二个测试数据集,将他们的共识作为真理的标准。我们从Szymanski 5S核糖体RNA数据库中随机选择了80组数据,每组5个序列[33],注意相应的亚照明落在微光区内。在55例(共80例)中,平面ACstar要么证实了最初的预测(23例),要么改善了SCI,也使比对与参考文献(22例)更相似。在28例患者中,SCI得到改善,但排列与参考值的相似性降低。。在26例中,这是由于碱基对的适度局部重排,而整体结构保持不变。在一个案例中,我们发现平面ACstar被微调到错误的字符串,在其他情况下,一个(正确的)螺旋因另一个(错误的)螺旋而加强,整体上产生负面影响。本研究的详细信息见附加文件1,以及附加文件中的完整数据集2在这里,我们还详细研究了最坏情况,并展示了应用于“真实”对齐时管道的性能。作为最后的观察结果,我们注意到,有7例校准情况有所改善,而SCI没有改善(因此,我们的管道报告了原始SCI和校准)。这表明,在一些额外的情况下,微调可以改善预测的共识结构。然而,由于在实践中我们没有可用的参考结构,我们没有利用这一事实的标准。

工具书类

  1. Gardner P,Giegerich R:比较RNA结构预测方法的综合比较。BMC生物信息学2004., 5(140):

    谷歌学者 

  2. Sankoff D:同时解决RNA折叠、排列和原序列问题。SIAM应用数学杂志1985, 45: 810–825. 10.1137/0145048

    第条 谷歌学者 

  3. Havgaard JH、Lyngso RB、Stormo GD、Gorodkin J:序列相似性小于40%的RNA序列的成对局部结构比对。生物信息学2005年,21(9):1815-1824。10.1093/生物信息学/bti279

    第条 中国科学院 公共医学 谷歌学者 

  4. Torrinsson E,Havgaard JH,Gorodkin J:RNA序列的多重结构比对和聚类。生物信息学2007, 23: 926–932. 10.1093/生物信息学/btm049

    第条 中国科学院 公共医学 谷歌学者 

  5. Mathews DH,Turner DH:Dynalign:一种发现两个RNA序列共同二级结构的算法。分子生物学杂志2002, 317(2):191–203. 2006年10月10日/jmbi.2001.5351

    第条 中国科学院 公共医学 谷歌学者 

  6. Harmanci AO,Sharma G,Mathews DH:使用Dynalign中的概率对齐约束进行有效的成对RNA结构预测。BMC生物信息学2007., 8(130):

  7. Hofacker IL,Bernhart SH,Stadler PF:RNA碱基配对概率矩阵的校准。生物信息学2004, 20(14):2222–2227. 10.1093/生物信息学/bth229

    第条 中国科学院 公共医学 谷歌学者 

  8. Reeder J,Giegerich R:共识形状:RNA共识结构预测Sankoff算法的替代方法。生物信息学2005年,21(17):3516–3523。10.1093/生物信息学/bti577

    第条 中国科学院 公共医学 谷歌学者 

  9. Giegerich R,Voss B,Rehmsmeier M:RNA的抽象形状。核酸研究2004, 32(16):4843–4851. 10.1093/nar/gkh779

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  10. Höchsmann M,Toeller T,Giegerich R,Kurtz S:RNA二级结构的局部相似性。2003年IEEE生物信息学会议记录2003, 159–168.

    第章 谷歌学者 

  11. Höchsmann M,Voss B,Giegerich R:纯多RNA二级结构比对:渐进剖面法。IEEE/ACM计算生物学和生物信息学汇刊2004, 1(1):53–62. 10.1109/TCBB.2004.11

    第条 公共医学 谷歌学者 

  12. Siebert S,Backofen R:MARNA:基于序列结构比较的RNA多重比对和共识结构预测。生物信息学2005, 21(16):3352–3359. 10.1093/生物信息学/bti550

    第条 中国科学院 公共医学 谷歌学者 

  13. Wilm A,Higgins DGG,Notredame C:R-Coffee:非编码RNA多重比对方法。核酸研究2008年,36(9):10.1093/nar/gkn174

    谷歌学者 

  14. Chenna R、Sugawara H、Koike T、Lopez R、Gibson TJ、Higgins DG、Thompson JD:与Clustal系列程序的多序列比对。核酸研究2003, 31(13):3497–3500. 10.1093/nar/gkg500

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  15. Poirot O、O’Toole E、Notredame C:Tcoffee@igs公司:用于计算、评估和组合多序列比对的web服务器。核酸研究2003, 31(13):3503–3506. 10.1093/nar/gkg522

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  16. Katoh K,Toh H:MAFFT多序列比对程序的最新进展。生物信息简介2008, 9(4):286–298. 10.1093/bib/bbn013

    第条 中国科学院 公共医学 谷歌学者 

  17. Knudsen B,Hein J:Pfold:使用随机无上下文文法预测RNA二级结构。核酸研究2003, 31(13):3423–3428. 10.1093/nar/gkg614

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  18. Hofacker IL,Fekete M,Stadler PF:对齐RNA序列的二级结构预测。分子生物学杂志2002, 319(5):1059–1066. [http://dx.doi.org/10.1016/S0022–2836(02)00308-X]10.1016/S0022-2836(02)00308-X

    第条 中国科学院 公共医学 谷歌学者 

  19. Hofacker IL:用RNA折叠预测RNA共有结构。分子生物学方法2007, 395: 527–544.

    第条 中国科学院 公共医学 谷歌学者 

  20. Ruan J,Stormo GD,Zhang W:ILM:一种用于预测具有假结的RNA二级结构的网络服务器。核酸研究2004年,(32 Web服务器):146–149。10.1093/nar/gkh444

    谷歌学者 

  21. Wilm A,Linnenbrink K,Steger G:ConStruct:RNA共有结构的改进构建。BMC生物信息学2008., 9(219):

  22. Kiryu H,Tabei Y,Kin T,Asai K:Murlet:一种实用的结构RNA序列多重比对工具。生物信息学2007, 23(13):1588–1598. 10.1093/生物信息学/btm146

    第条 中国科学院 公共医学 谷歌学者 

  23. Tabei Y,Kiryu H,Kin T,Asai K:长RNA序列的快速结构比对方法。BMC生物信息学2008., 9(33):

  24. Torrinsson E,Lindgren S:WAR:用于校准结构RNA的Web服务器。NAR公司2008,(36 Web服务器):W79-W84。10.1093/nar/gkn275

  25. Gardner PP,Wilm A,Washietl S:结构RNA上多序列比对程序的基准。核酸研究2005, 33(8):2433–2439. 10.1093/nar/gki541

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  26. Washietl S,Hofacker I:对齐序列的一致折叠是通过比较基因组学检测功能RNA的新方法。分子生物学杂志2004年,342:10.1016/j.jmb.2004.07.018

    谷歌学者 

  27. Washietl S、Hofacker IL、Stadler PF:非编码RNA的快速可靠预测。国家科学院程序2005, 102(7):2454–2459. 10.1073/pnas.0409169102

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  28. Gruber AR、Bernhart SH、Hofacker IL、Washietl S:RNA二级结构进化保护测量策略。BMC生物信息学2008, 9: 122. 10.1186/1471-2105-9-122

    第条 公共医学 公共医学中心 谷歌学者 

  29. Bernhart SH、Hofacker IL、Will S、Gruber AR、Stadler PF:RNAlifold:RNA比对的改进共识结构预测。BMC生物信息学2008, 9: 474. 10.1186/1471-2105-9-474

    第条 公共医学 公共医学中心 谷歌学者 

  30. Torrinsson E,Yao Z,Wiklund ED,Bramsen JB,Hansen C,Kjems J,Tommerup N,Ruzzo WL,Gorodkin J:基于序列比对的比较基因组学:ENCODE区域中的RNA结构。基因组研究2008, 18(2):242–251. 10.1101/gr.6887408

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

  31. BRAli底座[http://projects.binf.ku.dk/pgardner/bralibase网站/]

  32. Griffiths-Jones S、Moxon S、Marshall M、Khanna A、Eddy SR、Bateman A:Rfam:在完整基因组中注释非编码RNA。核酸研究2005年,(33数据库):D121-D124。[http://view.ncbi.nlm.nih.gov/pubmed/15608160]

  33. Szymanski M,Barciszewska MZ,Erdmann VA,Barciszewski J:5S核糖体RNA数据库。核酸研究2002, 30: 176–178. [http://view.ncbi.nlm.nih.gov/pubmed/11752286]10.1093/nar/30.1.176

    第条 中国科学院 公共医学 公共医学中心 谷歌学者 

下载参考资料

致谢

我们感谢匿名评审员的评论,这些评论有助于改进演示并大大深化本研究的范围。我们还要感谢Stefan Janssen的多次讨论。

作者信息

作者和附属机构

作者

通讯作者

与的通信罗伯特·吉格里奇.

其他信息

作者的贡献

RG和SS设计了该研究。AB实施了平面ACstar并执行了第一次评估。SS根据参考结构对SCI改进进行评估。AB和SS对这项工作的贡献相等,应被视为联合第一作者。三人在手稿上密切合作。所有作者阅读并批准了最终手稿。

安德烈亚斯·布雷姆盖斯(Andreas Bremges)、斯蒂芬妮·斯基默(Stefanie Schirmer)对这项工作做出了同样的贡献。

电子辅助材料

12859_2009_3679_MOESM1_ESM。PDF格式

附加文件1:SCI改进的充分性本附录报告了一项评估,该评估使用精心策划的参考结构来评估SCI的改进是否与使预测的共识结构更接近参考有关。(PDF 117 KB)

12859_2009_3679_MOESM2_ESM。邮政编码

附加文件2:古菌次排列。此文件提供了在附加文件中描述的研究中创建和使用的古菌序列的子对齐1。这是Fasta格式的文件压缩存档。(邮政编码145 KB)

作者提交的图像原始文件

权利和权限

开放式访问本文经BioMed Central Ltd.许可发布。这是一篇开放存取文章,根据知识共享署名许可条款分发(https://creativecommons.org/licenses/by/2.0)它允许在任何介质中不受限制地使用、分发和复制原始作品,前提是正确引用了原始作品。

转载和许可

关于本文

引用这篇文章

Bremges,A.、Schirmer,S.和Giegerich,R.在曙光区微调结构RNA比对。BMC生物信息学 11, 222 (2010). https://doi.org/10.1186/1471-2105-11-222

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/1471-2105-11-222

关键词