摘要

RNA Bricks数据库(http://iimcb.genesilico.pl/rnabricks网站)存储有关反复出现的RNA 3D模体及其相互作用的信息,这些信息在实验确定的RNA结构和RNA-蛋白质复合物中发现。与其他类似工具(RNA 3D Motif Atlas、RNA Frabase、Rloom)不同,RNA模体,即“RNA砖”,是在分子环境中出现的,在分子环境下进行测定,包括RNA、蛋白质、金属离子、水分子和配体。RNA块中的所有核苷酸残基都用结构质量分数进行注释,这些结构质量分数描述了与电子密度数据(如果可用)、骨架几何形状和可能的空间位阻的真实空间相关系数,可用于识别建模较差的残基。该数据库还配备了3D图案搜索和比较算法。该算法比较用户提供的查询结构和存储的RNA模体的主干原子的空间位置,而不依赖序列或二级结构信息。这使得鉴定进化相关和不相关RNA分子之间的局部结构相似性成为可能。此外,搜索实用程序可以根据序列相似性搜索“RNA块”,并可以在特定位置识别带有修饰核糖核苷酸残基的基序。

简介

折叠的RNA分子表现出层次结构。它们由模块单元组成,特别是由Watson–Crick(WC)意义上配对的核糖核苷酸残基形成的规则形状的双链螺旋,以及由参与各种非WC相互作用的残基构成的不规则形状的基序。结构图案的例子包括扭结(1),sarcin–蓖麻毒素基序(2),π-圈()和t循环(4,5). 这些基序通常具有复杂的内部结构,它们参与具有高度生物学意义的相互作用。它们通常引入RNA主干的精确扭结和旋转,使相邻螺旋相互定位,并介导特定的分子内接触,诱导大中型RNA的紧密折叠(6). 它们还经常在RNA分子表面形成结合位点,负责与蛋白质、小分子配体和其他RNA的相互作用(综述:(7–9)). 因此,对RNA结构-功能关系的理解关键取决于基序的识别和分类,无论是从其内部结构还是与之相互作用的分子方面。

越来越多和类型的RNA的实验结构测定表明,结构基序通常在同源(进化相关)分子中保持不变,但在非同源分子中也可能出现在不同的结构和功能环境中。因此,结构基序不一定伴随着保守的RNA序列或二级结构,因此它们的发现和比较并不容易().

目前,已有几个对RNA结构模体进行分类的数据库。其中一些还提供了RNA分子中三级相互作用的信息。SCOR公司(10)是一个手动管理的RNA 3D模体数据库,提供结构和功能分类。然而,它不再更新。RNA Frabase 2.0(11)存储RNA二级结构元素(茎、环)及其空间坐标。它的搜索算法可以进行主次结构查询,包括亲吻循环交互;它们还支持进行主干几何查询。R房间(12)和RNA CoSSMos(13)数据库是RNA 3D模体的大型集合,两者都为符号模体搜索工具MC-search提供了接口(14). RNAJunction对由多达九个螺旋和吻环形成的内环和连接进行分类(15). 另一个有价值的工具是DARTS数据库(16)基于ARTS程序进行两两RNA结构比较(17). 它侧重于对已知RNA结构之间的结构相似性进行分类,并允许进行用户定义的查询。最后,最近发布的RNA 3D Motif Atlas提供了有关RNA 3D模体序列变异性和二级结构的详细和部分精选信息(18). 该数据库还提供了对图案结构环境的一些见解。用户可以显示和下载选定RNA基序中16℃范围内的蛋白质和RNA残基。这些残基来源于蛋白质数据库(PDB)中定义的生物组装体,但由于晶体接触而不是相邻的组装体。此外,RNA 3D Motif Atlas为一组具有代表性的核糖体RNA提供了二级结构图,并与已知模体进行了交互映射。它有一个附带的工具WebFR3D(19)可以在数据库中存储的结构中搜索RNA结构模体。还有一些数据库专门提供有关RNA分子内接触的数据。核酸中金属离子数据库(MIAS)汇编了核酸可用结构中所有金属离子的详细信息(20). MINAS可以根据离子配位环境进行详细搜索。另一方面,核酸-蛋白质相互作用数据库(NPIDB)(21)存储有关DNA-蛋白质和RNA-蛋白质复合物所有可用结构的信息。

尽管在RNA结构基序识别和分类方面付出了巨大努力,但仍有几个问题尚未解决。第一个问题是PDB中可用的RNA结构模型的分子环境很少被考虑。特别是,晶体中对称配偶之间的接触信息往往被忽视,尽管它会影响RNA结构的局部特征,在某些情况下甚至影响RNA的全局折叠。此外,对于含有RNA分子的大型结构(例如核糖体),模型被拆分为几个不一定独立的PDB文件。例如,70S核糖体晶体结构之一的不对称单元由四个PDB文件组成(id代码:4KFH、4KFK、4KFL、4KFI)(22),但其中只有两个包含整个结构中所有离子的坐标(参见补充示例S2在里面补充数据1详细信息)。另一个问题是使用衍射数据的最大分辨率来衡量结构质量的常见做法。然而,众所周知,晶体结构模型质量是一个局部属性,必须经过局部验证(23).

我们开发了一个名为RNA Bricks的数据库来解决上述问题。我们的数据库提供了收集到的基序的局部环境信息,包括与其他RNA基序、蛋白质、金属离子、水分子或小分子配体的接触。此外,RNA Bricks存储晶体中对称配对之间的接触数据,以及来自分离PDB条目的分子之间的接触(即,由于PDB文件格式的限制,在分成多个文件的巨大结构中)。RNA Bricks的一个独特特征是具有单核苷酸分辨率的三个结构质量分数。这些可用于选择存储的RNA结构和基序的最可靠子集。我们还实现了一种用于PDB范围内基于结构的搜索的算法。该算法具有与上述WebFR3D类似的功能,但还可以进行PDB范围的查询。

材料和方法

RNA砖的定义

术语“RNA(3D)基序”有多种含义(7,24). 在这项工作中,我们引入了“RNA砖”的具体定义,即来自同一链的一组相互作用的核苷酸残基,两侧是WC或摆动碱基对。我们特别区分了三种类型的图案。茎是WC/摆动基对串联的阵列。环是由单链碎片和WC/摆动对构成的图案。终端碎片是单链碎片,只有一端涉及WC/摆动对(图1B) ●●●●。

RNA干环结构(A)以标准二级结构表示(B)和RNA砖中使用的简化图表示(C)表示。简化图的节点对应于RNA 3D基序:灰白(B.1)、黑色茎(B.2)、开放圆圈末端片段(B.3)。灰色边缘表示共享的核苷酸残基或对,红色和蓝色边缘分别对应于分子内和晶体接触。绿色圆圈表示与蛋白质接触的基序。tRNA结构(PDB:1EHZ)简化图表示(D)。
图1。

RNA干环结构(A类)以标准二级结构表示法表示(B类)和RNA砖中使用的简化图形表示(C类). 简化图的节点对应于RNA 3D基序:灰白(B.1)、黑色茎(B.2)、开放圆圈末端片段(B.3)。灰色边缘表示共享的核苷酸残基或对,红色和蓝色边缘分别对应于分子内和晶体接触。绿色圆圈表示与蛋白质接触的基序。简化图表示中的tRNA结构(PDB:1EHZ)(D类).

实施

实用程序在Python 2.7中实现,广泛使用了计算晶体学工具箱(CCTBX)中的例程(25). 数据库web界面是在Django框架中开发的(http://djangoproject.com). 精简RNA图的可视化基于JavaScript InfoVis工具包(http://thejit.org). RNA模体的二级结构表示使用内部修改版本的Varna进行呈现(26),这使得堆叠相互作用和多个链结构能够可视化。RNA基序的交互式3D表示以Jmol显示(http://www.jmol.org/).

数据准备

包含RNA分子(含或不含蛋白质)的大分子结构模型(不包括DNA/RNA杂交)从PDB下载(27). 在全原子表示(有或没有氢原子)中,具有至少两个共价结合的未修饰核糖核苷酸残基的结构被用于填充RNA Bricks数据库。晶体结构的实验衍射数据在可用时下载,并使用CCP4套件中的cif2mtz程序转换为二进制MTZ文件格式(28).

RNA模体提取和聚类

对于PDB模型中发现的每个RNA链,用MC-Annotate注释二级结构(14). 用K2N去除假结后(29),碱基配对信息被转换为二级结构图,节点表示核糖核苷酸残基,边缘表示磷酸二酯键(RNA主干)或WC/摆动碱基对。接下来,我们应用了最小循环基算法(30,31)为了检测图形中的基序,即螺旋茎和未成对片段(在缺乏经典二级结构的意义上),可以是内部的,也可以是末端的。该算法找到一个最小的循环集合(即没有节点出现两次的闭合路径),可用于构建图中的任何循环。在RNA二级结构图(没有伪结)的情况下,碱基对串联的循环对应于螺旋茎,其余的循环代表各种类型的循环。需要强调的是,在这种方法中,任何一对相邻的基序都至少共享一个共同的核糖核苷酸残基。最后,我们提取了模体的原子坐标,按照类型(茎、环或末端片段)和组成(即连续RNA链片段的数量、长度和顺序)对其进行分组。对于每个组,使用层次聚类过程来识别几何相似的基序,在最佳叠加后计算出骨架原子的RMSD小于1.0º。因此,我们获得了由具有相同数量核糖核苷酸残基的RNA基序组成的簇。

基于三级结构的搜索算法

基于三级结构的搜索算法的输入是一个查询RNA结构q个和一组RNA 3D基序M(M)= {1,2,, …n个}. 任务是找到一组叠加的刚性变换M(M)成员到q个骨架原子的RMSD最低。另一个限制是核苷酸在查询结构中必须有对应项q个。问题的对称版本,我们希望在其中找到的所有匹配项q个在内部M(M)成员,以类似的方式处理。

该算法从过滤来自M(M)无法匹配的q个首先,我们从M(M)和结构q个在该步骤中,默认使用碳C3′原子。然而,用户可以请求使用任何其他主干原子类型。来自的所有图案M(M)没有观察到的距离q个被拒绝。接下来,对于结构q个以及来自M(M)我们分析了所选主链原子的所有可能的三重态。再次,我们拒绝所有不包含至少一个三元组且边缘距离与三元组相似的基序q个最后,对于剩下的每一个基序,我们从选定的主链原子中选择一个三元组,并尝试将其叠加到结构中所有类似的三元组上q个将获得的变换应用于整个基序,并使用来自q个叠加后。如果RMSD低于用户提供的阈值,则使用所有骨干原子进一步细化叠加。

核苷酸接触检测

假设氢键是使用我们自己用CCTBX库开发的实用程序脚本检测的。我们使用了HB-PLUS程序中我们自己的算法实现(32). 使用Reduce将缺失的氢原子添加到结构中(33).

检测RNA与RNA和蛋白质以外的分子(即与水、离子和小分子)的假定相互作用是基于一个简单的基于距离的标准。如果两个相邻的非氢原子之间的最小距离小于3.9°,则将其归类为接触。

基本对注释

使用MC-Annotate对碱基对进行注释(14)、RNAView(34),FR3D(35)以及基于检测到的氢键和来自(36). 使用ModeRNA改编的代码对假定的堆叠交互进行了额外注释(37,14). 由于上述三种二级结构注释方法使用不同的命名方案,我们使用了基于共识方法的统一命名法,如我们自己的方法ClaRNA(T.W.,G.Ch,J.M.B.,提交的手稿,http://iimcb.genesilico.pl/clarna/).

质量得分

RNA砖中的所有核苷酸残基都用结构质量分数进行注释,这些分数描述了电子密度数据(如果适用于晶体结构)、骨架几何形状和可能的空间位阻冲突的实际空间相关系数(RSCC)。这些分数可用于识别建模不佳的残基,并帮助选择建模良好的基序。空间位阻的测量,即每1000个原子的非氢键重叠数(0.4º或更大),是使用Probe程序确定的(38)来自Molprobity套件(39). 基于RNA本体联盟定义的54个有利RNA骨架构象,使用来自Molprobity套件的Suitename程序,检测出可疑的骨架扭转角(39). 一部分电子密度低的核苷酸残基是从沉积在PDB中的实验结构因子中获得的(如果可用)。电子密度差应解释为弱信号(平均低于1σ)或RSCC值低于0.7。RSCC是一种标准的真实空间拟合质量测量方法,用于结晶学[例如在MAPMAN中(40)]。根据我们分析RNA结构的经验,任意选择了本研究中用于定义低质量拟合的参数。计算给定PDB条目的完整RNA含量(全局分数)和单独RNA基序(局部分数)的所有三个分数。

结果

数据库web界面

RNA Bricks网络界面提供了对RNA 3D模体数据的直观访问,即“RNA Bricks”(图2). 用户可以浏览结构目录或使用PDB查询数据库(27)、印度复兴信贷银行(41)或Uniprot(42)标识符(图2B) ●●●●。RNA块列在显示序列和二级结构数据、本地质量分数和联系信息的交互式表格中(图2A) ●●●●。成对图案之间的注释交互被明确列出,并链接到二级结构可视化。此外,还突出显示了对称配对和来自分离PDB条目的分子之间的接触。此外,可以下载PDB格式的选定RNA块坐标以及包含交互列表的文本文件。

RNA Bricks网络界面显示了海星门氏菌大核糖体亚单位(PDB:1S72)的详细信息。VARNA图(A)上的绿色光环表示与蛋白质接触的核糖核苷酸残基。
图2。

RNA Bricks web界面显示海星大核糖体亚基(PDB:1S72)。VARNA图上的绿色光晕(A类)描述与蛋白质接触的核糖核苷酸残基。

RNA 3D模体的可视化

可以使用Jmol applet可视化RNA块的3D结构及其完整的局部环境(包括对称配对和来自分离PDB条目的相邻分子)。用户可以切换选定类型的相邻分子(RNA、蛋白质、配体和水/离子)的可见性。与蛋白质和RNA分子的接触表现为单氢键水平(详见材料和方法部分)。

基于序列的搜索

该数据库支持基于序列和二级结构相似性搜索RNA模体。查询必须采用FASTA格式,并定义形成基序的连续RNA链片段序列。搜索引擎支持正则表达式查询,并按段的顺序解释循环排列。默认情况下,基于序列的搜索是区分大小写的。但是,用户可以选择区分大小写搜索由相关残基的小写符号表示的修饰残基的选项(在本工作中,我们遵循RNAView中使用的方案,例如“u”代表m5U、m2U和任何其他尿苷修饰)。此外,可以聚合1.0°主干RMSD距离内的查询结果。如果结果数量很大,则此选项可能很有用。

基于三维结构的搜索

可以使用PDB格式的RNA结构查询RNA Bricks数据库,该结构包含多达40 nt个残基。有两种搜索模式可用;查询式图案在RNA模体中搜索查询结构的实例,而查询中的图案试图用数据库中的主题覆盖查询结构。由于结构匹配算法的复杂性,涉及所有可用基元的穷举搜索在计算上是禁止的。因此,单个查询仅限于RNA 3D模体簇的代表(有关详细信息,请参阅材料和方法部分)。这些可以是简单的类药物(默认),源自一组非冗余RNA结构的基序(43)或形成选定类型接触的基序(例如与蛋白质、RNA或配体)。用户还可以搜索从所选PDB条目派生的一组片段。

RNA基序的提取和聚类

数据库记录每周随PDB的每个新版本更新,最新统计数据显示在RNA Bricks网页上。截至2013年8月15日,RNA Bricks存储了2573个包含RNA分子的结构(PDB中97%的结构具有RNA链)和220460个RNA 3D基序。其中大多数是回路(51.8%)。尤其是末端环占所有RNA 3D基序的15.9%,内部环占28.2%,三向连接(3wj)占4.2%,由3股以上的链组成的环占3.5%。典型螺旋(双链)和单链末端片段分别占所有RNA 3D基序的40.6%和7.6%。应用聚类程序(详见材料和方法部分)后,我们获得了16089个基序,这些基序代表主干原子RMSD≤1.0º的RNA 3D基序簇。代表性茎基序的比例为13.4%,明显小于数据库中茎的整体比例。所有类型的回路占代表的63.2%。其中大多数是内部回路(占所有代表的32.4%)。内部回路、3wj和由三股以上绞线组成的回路分别占所有代表的20.5%、5.7%和4.6%。相对较大比例(23.4%)的代表是单股末端碎片。

质量得分

为了评估RNA砖中使用的质量分数的相互依赖性,我们计算了所有成对分数值的Spearman等级相关系数。在计算中,我们只使用了来自晶体结构的RNA模体,这些晶体结构的实验数据存储在PDB中。

针对完整RNA结构计算的所有三对得分的相关系数分别为0.42(针对较差的电子密度和clash分数)、0.38(针对较差电子密度和suite分数)和0.44(针对clash分数和suite得分)。这些相关性相对较低,但具有统计学意义。RNA模体的相似相关系数分别为0.35、0.28和0.31,这同样对应于微弱但具有统计学意义的相关性。这些结果表明,这三个质量分数应该一起使用,因为它们提供了补充信息,但它们不应被视为完全独立的。

示例:涉及T-loop基序的三级交互作用

RNA砖是为了研究RNA三级相互作用而开发的。为了证明其功能,我们分析了由保守的T环基序形成的接触。T型回路(图3)是一种反复出现的RNA基序,已知参与许多RNA家族中的多种三级相互作用(4,5). 在该基序中的第五和第六核苷酸残基之间形成的大空腔能够接受插入碱基,该插入碱基还可以与第三核苷酸残基的暴露糖边相互作用。这种复杂的相互作用网络能够形成稳定的接触,从而连接RNA分子的顺序遥远的部分或形成稳定的分子间相互作用。

tRNASec(A)和tRNA(B)Rfam家族中涉及T环的两种相互作用模式。黄色字母表示查询核苷酸,R表示嘌呤,N表示任何核苷酸。右侧图(C)显示了以3.0º或更高分辨率求解的非冗余含RNA晶体结构集合中所有高质量片段的叠加。仅描述了T形回路的一个代表(黑线)。蓝线和红线分别代表在tRNASec和tRNA家族中观察到的保守核苷酸。
图3。

tRNASec中涉及T环的两种交互模式(A类)和tRNA(B类)Rfam家族。黄色字母表示查询核苷酸,R(右)表示嘌呤N个任何核苷酸。右侧图形(C类)呈现来自以3.0Å或更高分辨率求解的包含RNA的晶体结构的非冗余集合的所有高质量片段的叠加。仅描述了T形回路的一个代表(黑线)。蓝线和红线分别代表在tRNASec和tRNA家族中观察到的保守核苷酸。

高分辨率X射线结构(PDB:1EHZ,残基a/53,54,55,56,57,58,61,黄色字母图3A) 用于使用默认参数搜索RNA Bricks数据库,查询式图案模式和RNA模体来源于一组非冗余的X射线结构,分辨率为3.0º或更高。使用RNA Bricks web界面手动整理结果,以删除与低RMSD查询匹配但不是T环的点击(例如,第五和第六个核苷酸相互堆叠)。Rfam数据库当前版本未涵盖的结构系列使用Infinal进行分配(44)和Rfam(41)协方差模型。

总的来说,我们在10个RNA 3D模体簇中发现了匹配,对应于9个Rfam家族中的76个独特RNA模体。这些是tRNA(47),tRNA-秒(7),SSU_rRNA_eukarya(5)、火力发电厂(5),SSU_rRNA_细菌(4)、FMN(2),5_8S_rRNA(),采用可变(2)和II-D1D4-3组(1). 有关完整的结果列表,请访问http://iimcb.genesilico.pl/rnabricks/algorithms/browse_result/tloop_search_curated/由于本文篇幅有限,我们将仅详细讨论第一场比赛中涉及最高质量主题(即所有质量分数均低于25.0)的联系人。在20个基序中,16个基序来自注释为tRNA的RNA结构,3个基序为tRNASec,1个基序是II-D1D4-3组(PDB:4FAW)。在tRNA和tRNASec家族中,基序的第三尿苷残基和顶端胞嘧啶残基与保守的鸟嘌呤残基相互作用(图3A和B)。然而,这两个家族具有不同的结合模式,涉及位置7和8的翻转核苷酸残基。在tRNA家族基序中,第七位的残基与保守的鸟嘌呤堆积在一起。相反,在tRNASec基序中,第七个残基还与尿苷配对。一个例外是来自tRNA(Asp)(PDB:1IL2)的T环基序,它形成类似于tRNASec家族的相互作用。我们还在一个II-D1D4-3族(PDB:4FAW)的代表中发现了一个类似T环的基序。尽管tRNA中的T环结构相似,但该基序缺乏一个涉及顶端核苷酸的非常特征的WC对(45). 这一观察结果与tRNA识别的拟议结构基础一致(46).

讨论

在这项工作中,我们描述了RNA Bricks,一个重复的RNA 3D模体及其相互作用的数据库。与其他类似工具不同,RNA Bricks提供了有关RNA基序局部环境的详细信息,包括与其他RNA基序、蛋白质、金属离子、水分子和配体的接触。此外,RNA Bricks中唯一可用的数据是晶体中对称配对物与来自分离PDB条目的分子之间的接触(即,由于PDB格式的限制,分为多个文件)。RNA Bricks还提供了三个具有单核苷酸分辨率的结构质量分数。这些可以用于选择存储的RNA结构和基序的最可靠的子集。我们还实现了一种生成PDB范围内基于结构的查询的算法。与其他类似工具相比,RNABricks接受PDB格式的用户提供的查询。此外,搜索实用程序可以根据序列相似性搜索“RNA块”,并可以在特定位置识别带有修饰核糖核苷酸残基的基序。

为了解决大RNA分子(例如核糖体)二级结构可视化的问题,我们开发了简化图表示法。这些图表可以显示复杂的相互作用网络(例如核糖体亚基和tRNA之间的相互作用),并提供二级结构元素和RNA 3D基序之间的有效映射(图1).

如何使用RNA Bricks数据库

RNA Bricks数据库提供了一种简单的聚类方法,将具有相同二级结构和核糖核苷酸残基数量的RNA模体分组。因此,在某些情况下,由于二级结构注释的差异,具有类似三级结构的两个基序被分类为单独的簇。此外,具有可变环的非常相似的3D图案(例如,上述T环)不属于相同的簇。意识到这些局限性,我们实施了一种结构搜索算法,该算法允许根据单个原子的相互位置比较RNA结构片段,而不考虑二级结构和分子大小。用户应使用此工具查询数据库中所有RNA 3D基序,这些基序与感兴趣的基序具有共同的子结构。

基于三级结构的搜索算法

我们将RNA Bricks中实现的基于结构的搜索工具与其他公开可用的web服务器进行了比较,这些服务器使用用户定义的小RNA片段坐标实现PDB范围的搜索。据我们所知,在目前可用的方法中,只有R3D-Blast(47),WebRF3D(19)和FASTR3D(48)满足这些标准。WebFR3D和FASTR3D只接受PDB结构的片段作为查询,这些片段存储在这些工具附带的数据库中。R3D-Blast允许搜索用户上传的结构。我们有意将主干搜索方法(如RNA Frabase 2.0)排除在比较之外,因为这些方法需要提供糖皱褶幅度和扭转角度范围作为输入,因为自定义片段相对难以定义。

我们对3D模体搜索问题的解决方案与ARTS中实现的算法类似(17)用于比较大RNA分子。然而,主要的区别在于,我们不使用任何二级结构信息来计算初始叠加。因此,输入结构可能不完整,或者以粗粒度的方式表示。因此,RNA砖可以用于识别由不使用全原子表示的RNA 3D结构建模方法(如NAST)生成的结构中的三级模体(49)、DMD(50)或SimRNA(51). 该算法的这一明显优势是在计算复杂度增加的情况下进行权衡,并使我们的方法在比较大型RNA结构时计算成本高昂。然而,储存在RNA砖中的RNA片段相对较小(片段的平均大小为11 nt),因此性能合理。实际计算时间取决于查询大小和服务器负载。在我们的测试中,搜索由20 nt残基组成的相对较大的RNA片段平均需要15分钟。

在这项工作中,我们发现RNA Bricks模体搜索工具重现了先前报道的FR3D结果(35)(请参见补充示例S1在里面补充数据1详细信息)。所有出现的讽刺素-蓖麻毒素基序环,包括非局部的,都在死海盐盒菌50S核糖体亚基(PDB:1S72)。此外,我们能够对所有已知的RNA结构进行搜索,这在使用FR3D的网络版本时是不可能的(35),WebFR3D(19). 我们还尝试使用FASTR3D进行类似的搜索(48)和R3D爆破(47)web界面。然而,这两种方法都没有找到匹配项。

涉及T-loop图案的触点

我们使用RNA Bricks基于结构的搜索工具和web界面来阐明涉及保守T环基序的交互模式。首先,我们列出了在至少有一个代表性的已知高分辨率3D结构的RNA家族中出现的所有该模体。随后,我们详细描述了tRNA家族中涉及T环基序的三级相互作用。大多数这些相互作用已经在报道单个结构的文章中描述过;然而,通过使用RNA Bricks数据库界面进行搜索,可以进行全面的比较分析。

质量得分

RNA Bricks以单核苷酸分辨率存储三个结构质量分数,可用于选择最可靠的RNA结构和基序子集。这些分数是:主干几何可靠性(suitescore),存在严重的空间位阻(clashscore)和实验衍射数据的低RSCC(如果可用,仅适用于晶体结构)。在这项工作中,我们表明,虽然这三个分数不是独立的,但它们之间的相关性相对较弱。值得注意的是,与高分辨率电子密度图相对应的RNA基序不一定具有良好的RNA骨架构象(数据未显示)。因此,我们建议用户应始终考虑所有可用的质量分数。RNA Bricks为所有结构提供了测定的RSCC,并在PDB中保存了实验数据,包括作者报告的精炼参数无法重现的那些结构。这意味着在某些情况下,整体低相关系数可能反映了作者所保存的衍射数据中的粗略误差,而不是结构的实际质量。在临界情况下,用户应参考电子密度服务器等专用工具(52)或PDB_REDO(53).

基金

波兰科学部[Iuventus Plus 0066/IP1/2011/71 to G.Ch.];欧洲研究委员会(ERC)【StG向J.M.B.授予RNA+P=123D】;T.W.开发的子结构搜索工具得到了国家科学中心(NCN)的支持[2011/01/D/NZ1/00212 to G.Ch.]。开放获取费用资助:波兰科学部[Iuventus Plus 0066/IP1/2011/71]。

利益冲突声明。未声明。

致谢

作者感谢斯坦尼斯·阿夫·杜宁·霍卡维奇、米夏·比奥尼基、彼得·本特科夫斯基、多罗塔·马特尔斯卡、马格达·马奇尼卡和马蒂亚斯·博希特勒对手稿的批判性阅读和宝贵的评论。我们还感谢Katarzyna Mikołajczak在准备RNA接触注释脚本时提供的帮助,以及GrzegorzŁach建议在本工作中使用RNA二级结构的简化图形表示。

参考文献

1
克莱因
流行音乐播音员
施迈英
TM(TM)
摩尔
PB(聚丁二烯)
斯泰兹
扭结转向:一种新的RNA二级结构基序
EMBO J。
2001
,卷。 
20
(第
4214
-
4221
)
2
狮子座炎
斯托姆堡
J型
威斯特霍夫
E类
核糖体RNA中的基序预测同源RNA分子中自动基序预测的教训和展望
生物化学
2002
,体积。 
84
(第
961
-
973
)
沃德利
LM公司
派尔
调幅
使用COMPADRES识别新的RNA结构基序:一种结构发现的自动化方法
核酸研究。
2004
,卷。 
32
(第
6650
-
6659
)
4
克拉西尔尼科夫
AS公司
大RNA分子中T环RNA折叠基序的发生
核糖核酸
2003
,卷。 
9
(第
640
-
643
)
5
纳加斯瓦米
U型
福克斯
通用电气公司
核糖体RNA中T-loop RNA折叠基序的频繁出现
核糖核酸
2002
,卷。 
8
(第
1112
-
1119
)
6
屠夫
S公司
派尔
A类
稳定RNA三级结构的分子相互作用:RNA模体、模式和网络
账户化学。物件。
2011
,卷。 
44
(第
1302
-
1311
)
7
列昂蒂斯
NNB公司
莱斯库特
A类
韦斯特霍夫
E类
RNA结构的构建块和基序
货币。操作。结构。生物。
2006
,卷。 
16
(第
279
-
287
)
8
Y(Y)
科特斯
M(M)
斯皮塔莱
R(右)
通过RNA结构了解转录组
Genet国家牧师。
2011
,卷。 
12
(第
641
-
655
)
9
古特尔
R(右)
罗素
R(右)
RNA高阶结构的比较分析
RNA折叠的生物物理学
2013
纽约州施普林格
(第
11
-
22
)
10
塔穆拉
M(M)
亨德里克斯
丹麦
克洛斯特曼
PS(聚苯乙烯)
希梅尔曼
NRB公司
布伦纳
东南方
霍尔布鲁克
SR公司
SCOR:RNA的结构分类,2.0版
核酸研究。
2004
,卷。 
32
(第
D182号
-
第184页
)
11
波本达
M(M)
扎奇尼乌克
M(M)
布拉泽维奇
M(M)
瓦希克
S公司
伯克
EK公司
布拉泽维奇
J型
阿达米亚克
RW公司
RNA FRABASE 2.0:一个先进的网络访问数据库,能够搜索RNA结构中的三维片段
BMC生物信息。
2010
,卷。 
11
第页。 
231
 
12
舒多马
C类
五月
P(P)
尼基福罗娃
V(V)
沃尔特
D类
RNA环中的序列结构关系:建立环同源性建模的基础
核酸研究。
2010
,卷。 
38
(第
970
-
980
)
13
凡内加斯
损益
哈德逊
通用航空公司
戴维斯
应收账
凯莉
联合国安全理事会
柯克帕特里克
科科斯群岛
Znosko公司
BM公司
RNA CoSSMos:二级结构基序的特征描述——RNA三维结构中二级结构模序的可搜索数据库
核酸研究。
2012
,卷。 
40
(第
D439号
-
第444页
)
14
Gendron公司
P(P)
勒米厄
S公司
专业
F类
核酸三维结构的定量分析
分子生物学杂志。
2001
,卷。 
308
(第
919
-
936
)
15
宾德瓦尔德
E类
海耶斯
R(右)
英灵
YG公司
卡斯普扎克
W公司
夏皮罗
文学士
RNAJunction:用于三维结构分析和纳米设计的RNA连接和吻环数据库
核酸研究。
2008
,卷。 
36
(第
D392号
-
D397号
)
16
亚伯拉罕
M(M)
德罗尔
O(运行)
努西诺夫
R(右)
沃尔夫森
HJ公司
RNA三级结构的分析与分类
核糖核酸
2008
,卷。 
14
(第
2274
-
2289
)
17
德罗尔
O(运行)
努西诺夫
R(右)
沃尔夫森
HJ公司
ARTS:RNA三级结构的比对
生物信息学
2005
,卷。 
21
(第
47
-
53
)
18
佩特罗夫
人工智能
Zirbel公司
列昂蒂斯
RNA 3D基序和RNA 3D基模图谱的自动分类
核糖核酸
2013
,卷。 
19
(第
1327
-
1340
)
19
佩特罗夫
人工智能
Zirbel公司
列昂蒂斯
WebFR3D–用于查找、校准和分析重复RNA 3D基序的服务器
核酸研究。
2011
,卷。 
39
(第
50周
-
W55型
)
20
施纳布尔
J型
苏特
P(P)
西格尔
RKO公司
MINAS–核酸中金属离子的数据库
核酸研究
2012
,卷。 
40
(第
D434号
-
D438号
)
21
基尔萨诺夫
尽职调查
扎内基纳
打开
阿克西亚诺夫
每个
斯皮林
沙特阿拉伯
卡亚吉纳
AS公司
阿列克谢夫斯基
成人影片
NPIDB:核酸-蛋白质相互作用数据库
核酸研究。
2013
,卷。 
41
(第
D517型
-
D523型
)
22
桑托斯
N个
J型
多诺霍
日本
洛斯特勒夫
AA公司
诺勒
高频
与释放因子RF2的Q253P突变形式结合的70S核糖体的晶体结构
结构
2013
,卷。 
21
(第
1258
-
1263
)
23
卢比
B类
高分子晶体学课程中的科学探究、推理和批判性推理
J.应用。结晶器。
2010
,卷。 
43
(第
1242
-
1249
)
24
纳萨利安
L(左)
斯托姆堡
J型
Zirbel公司
列昂蒂斯
沃尔特
天然气
伍德森
沙特阿拉伯
贝蒂
RT公司
RNA 3D结构模体:定义、识别、注释和数据库搜索
非蛋白编码RNA
2009
柏林-海德堡施普林格
(第
1
-
26
)
25
格罗斯·昆斯特里夫
RW公司
索特
NK公司
莫里亚蒂
西北
亚当斯
PD公司
计算晶体学工具箱:可重用软件框架中的晶体学算法
J.应用。结晶器。
2002
,卷。 
35
(第
126
-
136
)
26
达尔蒂
K(K)
丹尼斯
A类
蓬季
Y(Y)
VARNA:RNA二级结构的交互式绘制和编辑
生物信息学
2009
,卷。 
25
(第
1974
-
1975
)
27
伯恩斯坦
常设费用
Koetzle公司
变压器
威廉姆斯
GJ公司
迈耶
EFJr公司
布里斯
医学博士
罗杰斯
年少者
肯纳德
O(运行)
岛内
T型
田住
M(M)
蛋白质数据库:基于计算机的大分子结构档案文件
分子生物学杂志。
1977
,卷。 
112
(第
535
-
542
)
28
优胜者
医学博士
巴拉德
科科斯群岛
考坦
杜兰特
多德森
EJ公司
埃姆斯利
P(P)
埃文斯
公共关系
基冈
马来西亚令吉
克里斯内尔
电子束
莱斯利
AGW公司
麦考伊
A类
CCP4套件概述和当前发展
晶体生物学学报。结晶器。
2011
,卷。 
67
(第
235
-
242
)
29
史密特
S公司
罗瑟
K(K)
赫林加
J型
骑士
R(右)
从打结到嵌套RNA结构:去除假结的各种计算方法
核糖核酸
2008
,卷。 
14
(第
410
-
416
)
30
巴顿
K(K)
求图的基本圈集的算法
Commun公司。ACM公司
1969
,卷。 
12
(第
514
-
518
)
31
勒米厄
S公司
专业
F类
RNA三级结构环状模体的自动提取和分类
核酸研究。
2006
,卷。 
34
(第
2340
-
2346
)
32
麦当劳
桑顿
J型
满足蛋白质中的氢键潜力
分子生物学杂志。
1994
,卷。 
238
(第
777
-
793
)
33
单词
吉咪
洛弗尔
联合国安全理事会
理查森
JS公司
理查森
直流
天门冬氨酸和谷氨酰胺:利用氢原子接触选择侧链酰胺取向
分子生物学杂志。
1999
,卷。 
285
(第
1735
-
1747
)
34
H(H)
RNA碱基对的自动识别和分类工具
核酸研究。
2003
,卷。 
31
(第
3450
-
3460
)
35
萨维尔
M(M)
Zirbel公司
斯托姆堡
J型
莫克达德
A类
列昂蒂斯
FR3D:在RNA 3D结构中发现局部和复合循环结构基序
数学杂志。生物。
2008
,卷。 
56
(第
215
-
252
)
36
列昂蒂斯
斯托姆堡
J型
韦斯特霍夫
E类
非Watson-Crick碱基对及其相关的等构矩阵
核酸研究。
2002
,卷。 
30
(第
3497
-
3531
)
37
罗瑟
M(M)
罗瑟
K(K)
皮东
T型
布尼基
吉咪
ModeRNA:RNA 3D结构比较建模工具
核酸研究。
2011
,卷。 
39
(第
4007
-
4022
)
38
单词
吉咪
洛弗尔
联合国安全理事会
拉宾
真实航向
泰勒
HC公司
扎利斯
普雷斯利
黑色
理查森
JS公司
理查森
直流
荧光片分子质量的可视化和量化:带有显式氢原子的小直径接触点
分子生物学杂志。
1999
,卷。 
285
(第
1711
-
1733
)
39
VB(虚拟语言)
阿伦达尔
工作分解结构
标题
JJ公司
基迪
陆军部
Immormino公司
马来西亚令吉
卡普拉尔
GJ公司
默里
LW公司
理查森
JS公司
理查德森
直流
分子概率:大分子晶体学的全原子结构验证
水晶女演员。D生物结晶仪。
2010
,卷。 
66
(第
12
-
21
)
40
克莱维特
GJ公司
琼斯
xdlMAPMAN和xdlDATAMAN–生物大分子电子密度图和反射数据集的重新格式化、分析和操作程序
《水晶学报》。D生物结晶仪。
1996
,卷。 
52
(第
826
-
828
)
41
伯格
软件
涂抹
J型
埃伯哈特
R(右)
泰特美术馆
J型
巴尔基特
L(左)
纳鲁洛基
欧洲药典
埃迪
SR公司
加德纳
聚丙烯
贝特曼
A类
Rfam11.0:RNA家族10年
核酸研究
2013
,卷。 
41
(第
D226型
-
D232型
)
42
UniProt财团
2013年Universal Protein Resource(UniProt)活动更新
核酸研究。
2013
,卷。 
41
(第
D43号机组
-
D47号
)
43
列昂蒂斯
Zirbel公司
列昂蒂斯
韦斯特霍夫
E类
用于RNA知识提取和基准测试的非冗余3D结构数据集
RNA三维结构分析与预测
2012
柏林
施普林格
(第
281
-
298
)
44
纳鲁洛基
欧洲药典
科尔贝
DL公司
涡流
SR公司
无间道1.0:RNA比对推断
生物信息学
2009
,卷。 
25
(第
1335
-
1337
)
45
马西娅
M(M)
派尔
调幅
通过剪接阶段可视化II组内含子催化
单元格
2012
,卷。 
151
(第
497
-
507
)
46
格里格
JC公司
Y(Y)
格伦迪
福建
汉金
TM(TM)
波拉克
L(左)
Ke(克)
A类
T盒RNA解码tRNA的信息内容和几何结构以影响基因表达
程序。美国国家科学院。科学。美国
2013
,卷。 
110
(第
7240
-
7245
)
47
线路接口单元
Y-C公司
C-H公司
K-T公司
J-R公司
M-L公司
J-C公司
高压变压器
R3D-BLAST:一种搜索类似RNA 3D亚结构的工具
核酸研究。
2011
,卷。 
39
(第
第45周
-
第49周
)
48
C-E公司
月-年
线路接口单元
Y-C公司
C-W公司
K-吨
FASTR3D:一种快速准确的相似RNA 3D结构搜索工具
核酸研究。
2009
,卷。 
37
(第
W287号机组
-
W295型
)
49
乔尼卡斯
妈妈
拉德默
RJ公司
莱德拉赫
A类
达斯
R(右)
皮尔曼
S公司
赫施拉格
D类
奥尔特曼
皇家银行
基于知识潜能和结构过滤器的大RNA分子粗粒度建模
核糖核酸
2009
,卷。 
15
(第
189
-
199
)
50
F类
沙尔马
S公司
查拉桑尼
P(P)
德米多夫
VV公司
布罗德
多霍良
内华达州
基于离散分子动力学的从头算RNA折叠:从结构预测到折叠机制
核糖核酸
2008
,卷。 
14
(第
1164
-
1173
)
51
罗瑟
K(K)
罗瑟
M(M)
博尼奇基
M(M)
皮东
T型
托马拉
K(K)
卢卡什
P(P)
布尼基
吉咪
列昂蒂斯
韦斯特霍夫
E类
基于模板和无模板的RNA 3D结构建模:来自蛋白质结构建模的启示
RNA三维结构分析与预测
2012
柏林
施普林格
(第
67
-
90
)
52
克莱威格特
GJ公司
哈里斯
先生
JY公司
泰勒
总费用
维尔比
A类
琼斯
乌普萨拉电子密度服务器
水晶女演员。D生物结晶仪。
2004
,卷。 
60
(第
2240
-
2249
)
53
尤斯登
RP公司
沃马克
T型
弗里德
G公司
布里科涅
G公司
从存放的X射线数据重新定义可以为大多数PDB条目提供改进的模型
《水晶学报》。D生物结晶仪。
2009
,卷。 
65
(第
176
-
185
)
这是一篇根据知识共享署名许可条款发布的开放存取文章(http://creativecommons.org/licenses/by/3.0/)它允许在任何介质中不受限制地重用、分发和复制原始作品,前提是正确引用了原始作品。

补充数据

评论

0条评论
提交评论
您输入了无效代码
感谢您对本文发表评论。您的评论将由杂志自行审查并发表。请通过电子邮件查看更多通知。