摘要

总结:UTR调控活动地图集(AURA)是一个人工管理的人类mRNA非翻译区域(UTR)和UTR调控注释的综合目录。通过其直观的web界面,它提供了对UTR丰富信息的全面访问,这些信息集成了系统发育保护、RNA序列和结构数据、单核苷酸变异、基因表达和来自文献和专业数据库的基因功能描述。

可利用性: http://aura.science.unitn.it

联系人: aura@science.unitn.it;dassi@science.unitn公司

补充信息: 补充数据可在生物信息学在线。

1简介

第5个和3未翻译区域(UTR)是位于编码序列两侧的mRNA部分。UTR包含mRNA转录后调控的信息,包括转运、稳定性、定位和翻译途径,因此它们在很大程度上决定了成熟mRNA在细胞中的命运(基恩,2007年). 此类事件由数百名反式-作用因子:主要是RNA结合蛋白(RBP),与所有细胞mRNA结合形成核糖核蛋白复合物(RNP),也包括非编码RNA,其中microRNA(miRNA)类具有明确的功能作用。

实验确定的UTR序列和结构结合约束在RBP和非编码RNA之间和内部差异很大,调节相互作用的全球特征是极端复杂,因为调节器可以在多个位点与多个UTR结合,反之亦然。此外,mRNA反式顺式相互作用网络具有显著的可塑性,因为mRNA的命运取决于其与几个调节因子的时间和空间依赖性关联(安德森等。,2009年). 解开这个复杂过程背后的分子密码是关键:(i)了解细胞程序在多大程度上受mRNA丰度、定位和翻译的调节;(ii)解读反式-靶点的作用因子或突变是一些严重改变细胞表型的根源;(iii)鉴定旨在在转运和翻译之间的窗口中调节mRNA动力学的新疗法。为此,越来越多的研究,无论是机械研究还是基于系统的研究,都提供了与UTR相关的因素的信息。然而,这些数据和UTR注释在基因组浏览器中的集成不足。

这个UTR监管活动地图集(AURA)通过收集和组合来自多个来源的人类UTR注释和绑定数据,以前所未有的丰富性和覆盖面填补了这一空白。

2说明和用法

最近发布的几个专门数据库表明,转录后调控在基因表达研究中的中心地位越来越高。RBPDB专注于反式-通过收集有关RBP及其已证实或预测的结合基序的半人工策划的文献数据来作用蛋白质(库克等。, 2011);Transterm是一个监管序列数据库,它聚合了顺式-与转录后调控相关的行为基序(雅各布斯等。,2009年);starBase和CLIPZ存储的主要数据反式顺式下一代高通量技术获得的交互作用(科尔希德等。, 2011). 此外,更专业的资源允许用户更详细地搜索和分析有限数量的特别知名的监管元素(例如AREsite、Gruber等。2010年,UTRdb和UTRsite,格里洛等。, 2010).

与这些目录不同,AURA被设计成一个全面而集中的人类UTR映射注释仓库,无论是在调节大分子还是其结合位点方面。AURA记录了RNA结合蛋白和微RNA与人类UTR的非冗余、直接和实验评估的相互作用。它包含来自UCSC基因组浏览器(GRCh37/hg19汇编)的一组更新的注释人类UTR(<5个碱基的除外)、实验文献数据(1041份出版物)和来自多个专业数据库的综合信息,包括miRTarBase(等。, 2011),mi记录(等。,2009年)以及上述AREsite和RBPDB资源。目前,它涵盖127523个人类UTR,对应于由19 364个蛋白质编码基因编码的63 138个转录物。AURA和相关资源之间的广泛比较可以在中的文件S2中找到补充材料.

AURA是根据RBP是一种显示经审查的RNA结合域的蛋白质这一惯例开发的,并且根据这一规则,只要mRNA调节结合位点的位置数据可用,根据当前基因组注释评估每个结合位点的坐标,以验证该位点位于转录本的拼接UTR内或重叠。

当前的AURA版本提供了100个RBP和33 836个UTR之间299 393个相互作用的检查证据,303个miRNAs和5885个UTR间28 351个相互作用,以及56 910个相互作用顺式-超过11 559 UTR的站点。其他主要属性可用于描述和/或评估UTR与反式-作用因素包括共有信息和相互作用伙伴的基因表达谱的联合可视化。此外,通过交叉参考人类蛋白质图谱数据库,对RBP和UTR之间的相互作用进行了评估(伯格伦德等。, 2008). 数据库的高级架构可以在中找到补充图S1.

2.1搜索

为了解释转录本可以与多个RBP相互作用以及RBP可以与多份转录本相互作用的观察结果,AURA展示了一个直观的界面,用户可以通过该界面分别查询“目标位点”或“反式因子”。前一个查询返回其HGNC基因符号或同义词包含搜索词的基因列表;列表中的每个基因都用其功能描述、同义词和UTR进行了注释。此外,提供了UTRs的外显子-内含子图谱,以便在基因的不同转录物之间进行适当的区分。另一方面,后一个查询会产生一个消歧列表,其中所有反式-显示其名称或同义词包含搜索词的因子。要选择反式-感兴趣的因素,用户可能会从基因的简短描述和功能摘要中受益。选择后,AURA返回其目标UTR的列表。这些UTR可以按基因本体(GO)细长类别进行分组(http://www.geneontology.org/GO.slims.shtml网站)或者通过染色体作图。此外,用户可以通过选择支持实验证据的组合来过滤结果。

2.2 UTR视图

选定的UTR显示在“UTR视图”中,由两个标准元素组成:此外,AURA为用户提供了从基因表达图谱检索的基因表达结果分组的多种方法(网址:http://www.ebi.ac.uk/gxa/)与所选UTR的基因位点相关。结果以表格的形式报告,其中一行对应一个条件,而列则按顺序显示观察到的基因相对于其平均表达值上调或下调的次数以及测量值的显著性(log10P(P)-值)。万一反式-因子搜索,一个包含两个基因编码的基因表达实验的联合表反式-因子和携带结合UTR的基因显示。此外,还强调了监管机构和目标机构之间的显著共同点,以强调它们之间可能存在的相关性或反相关性。关于UTR的注释可以通过UTRCard功能以文本格式提取;此外,整个MySQL数据库可以从一个专用页面下载。挖掘AURA中包含的数据的最后一种方法是通过AURA Mart,该网站提供了著名的BioMart平台提供的所有查询功能(http://www.biorart.org网站).

  • 文本标题包含:拼接UTR的染色体位置和长度、UTR所属基因的HGNC名称和UniProt描述,以及到HPA数据库的链接。还显示了总体保守性,即UTR的PhastCons单核苷酸保守性平均得分(葛田等。, 2011),以及根据转录物范围稳定性测量得出的相应转录物半衰期(弗里德尔等。,2009年).

  • 基于JBrowse体系结构的AURA序列浏览器(斯金纳等。,2009年),包含与特定UTR相关的所有注释,即通过进化保护、单核苷酸变异和顺式-监管结合位点。“保护”轨迹显示UCSC 46物种比对中每个核苷酸的计算分数(葛田等。, 2011). 在“SNP”跟踪中,AURA整合了dbSNP数据库中记录的单核苷酸多态性(SNP)(雪莉等。2001年),允许用户与其他注释轨迹结合,以查找转录后调控中潜在影响的变化。“RBP”轨迹包含RBP结合位点,而“miR”轨迹包含microRNA结合位点。还提供了另外两个曲目来显示反式-只有部分信息可用的因素。“未知mRNA位置”轨迹表示反式-已知可以在没有任何进一步映射信息的情况下绑定转录本的因子。相反,“未知UTR位置”轨迹指示反式-其UTR结合位点未知的因子。轨迹中的所有注释都可以单击:每当用户单击注释时,都会显示包含绑定站点和交叉引用的描述页面。从这个角度来看,最小能量预测了二级结构(葛田等。, 2011)以及彩色编码核苷酸系统发育保护、SNP位置和反式-所选UTR的因子结合位点可以通过VARNA任意绘制(达尔蒂等。,2009年).

3未来发展

AURA通过对科学文献和专业数据库中的知识进行聚合、整合和总结来收集数据。未来的发展包括(i)根据RNA-Seq数据整合UTR映射目录;(ii)反式-具有长非编码RNA的因子目录;(iii)扩展UTR监管注释,以包括内部核糖体进入位点和上游开放阅读框(ORF);(iv)包含来自全基因组RNAi基因沉默表型筛选的注释;以及(v)改进搜索引擎以及可视化和检索系统。

基金:这项工作得到了特伦托自治省大学和科学研究服务局的支持。

利益冲突:未声明。

作者希望知道,在他们看来,前三位作者应被视为联合第一作者。

参考文献

安德森
第页。
RNA颗粒:基因表达的转录后和表观遗传学调节剂
自然修订版分子细胞生物学。
2009
,卷。 
10
(第
430
-
436
)
伯格伦德
L。
基于抗体的表达谱基因中心人类蛋白质图谱
分子细胞蛋白质组学
2008
,卷。 
10
(第
2019
-
2027
)
库克
K.B.公司。
RBPDB:RNA结合特异性数据库
核酸研究。
2011
,卷。 
39
 
补充1
(第
D301号
-
D308天
)
达尔蒂
英国。
VARNA:RNA二级结构的交互式绘制和编辑
生物信息学
2009
,卷。 
25
(第
1974
-
1975
)
弗里德尔
C.C.公司。
RNA半衰期揭示哺乳动物转录调控的保守原理
核酸研究。
2009
,卷。 
37
第页。 
e115(电子115)
 
葛田
私人助理。
UCSC基因组浏览器数据库:2011年更新
核酸研究。
2011
,卷。 
39
 
补充1
(第
D876号
-
D882型
)
格里洛
G.公司。
UTRdb和UTRsite(RELEASE 2010):真核信使核糖核酸非翻译区的序列和调控基序的集合
核酸研究。
2010
,卷。 
38
(第
D75型
-
D80型
)
格鲁伯
阿拉伯联合酋长国。
AREsite:富AU元素综合调查数据库
核酸研究。
2011
,卷。 
39
(第
D66型
-
D69号
)
S.D.公司。
miRTarBase:一个数据库管理实验验证的microRNA-靶相互作用
核酸研究。
2011
,卷。 
39
(第
第163页
-
D169号
)
雅各布斯
G.H.公司。
Transterm:帮助分析mRNA调控序列的数据库
核酸研究。
2009
,卷。 
37
(第
D72型
-
D76号
)
基恩
J.D.(医学博士)。
RNA调节子:转录后事件的协调
Nat.Rev.基因。
2007
,卷。 
8
(第
533
-
543
)
科尔希德
M。
CLIPZ:实验确定的RNA-结合蛋白结合位点的数据库和分析环境
核酸研究。
2011
,卷。 
39
 
补充1
(第
D245型
-
第252页
)
雪莉
S.T.公司。
dbSNP:NCBI遗传变异数据库
核酸研究。
2001
,卷。 
29
(第
308
-
311
)
斯金纳
M.E公司。
JBrowse:下一代基因组浏览器
基因组研究。
2009
,卷。 
19
(第
1630
-
1638
)
F、。
miRecords:一种用于microRNA-靶相互作用的集成资源
核酸研究。
2009
,卷。 
37
 
补充1
(第
D105型
-
第110天
)

作者注释

副主编:Mario Albrecht

补充数据