跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2017年8月;27(8):1371-1383.
doi:10.1101/gr.208652.116。 Epub 2017年5月9日。

脊椎动物RNA保守结构的鉴定与功能注释

附属公司

脊椎动物RNA保守结构的鉴定与功能注释

斯特凡·西曼等。 基因组研究. 2017年8月.

摘要

RNA分子的结构元素在RNA稳定、定位和蛋白质相互作用等方面至关重要,它们在物种间的保存表明了共同的功能作用。我们利用基于结构而非基于序列的比对,对脊椎动物基因组进行保守RNA结构(CRS)的计算筛选。在对序列一致性和GC含量进行仔细校正后,我们预测了约516000个包含CRS的人类基因组区域。我们发现,相当一部分人-鼠CRS区域(1)与相同RNA结合蛋白(RBP)的结合位点一致共定位,或(2)在相应组织中转录。此外,CaptureSeq实验揭示了我们的许多CRS区域在人类胎儿大脑中的表达,包括662个新的区域。对于选定的人类和小鼠候选配对,qRT-PCR和体外RNA结构探测支持共享表达和共享结构,尽管丰度低且序列一致性低。大约30000个CRS区域位于编码或长非编码RNA基因附近或增强子内。结构化(CRS重叠)增强子RNAs和延伸3'末端的表达水平显著高于其非结构化对等物。我们对含有CRS的转录非特征调控区的发现支持了其RNA介导的功能。

PubMed免责声明

数字

图1。
图1。
CRS预测的性能评估、基因组分布和保存。(A类)不同CMfinder评分(pscore)截止值和GC含量区间的CRS平均FDR。FDR计算基于SISSIz(Gesell and Washietl 2008)模拟线形。在pscore截止值40和50之间观察到的FDR大幅下降促使我们基于pscore≥50的所有进一步分析。涵盖所有GC含量范围的平均FDR为15.8。(B类)CRS区域线形的GC含量。(C类)脊椎动物生物型和先前计算RNA结构筛选的CRS区域折叠富集(蓝色)。(D类)生物型的绝对CRS区域覆盖率。(E类)CRS区域相对于非编码生物型的相对位置表现为箱子中CRS区域的折叠富集,每个特征(UTR或基因)长度的5%(仅考虑外显子)。5′UTR和lncRNAs的结构数量从5′减少到3′的趋势很常见。(F类)100种树中保存的CRS数量。(G公司)系统发育树中17个代表基因组CRS区域比对的平均成对序列一致性(SI)。(H(H))重新定线(根据Torarinsson等人2008年的计算)将17种MULTIZ定线块(hg18)与CRS区域相应的基于结构的定线进行了比较(从我们的100种/hg38结果中提取的17向子定线,如方法中所述)。()CRS区域线形的物种数量。B类,G公司、和中,GC含量最高的CRS、SI和物种数分别用作CRS区域的代表H(H)最低重新定线的CRS用作代表。中的生物型G公司,H(H)、和按中位数SI排序。
图2。
图2。
人和小鼠对CRS区域的保护反映在RBP的结合位点和表达上。(A类)10个RBP中有7个显示CRS在保守结合位点中富集(P(P)< 10−7,场效应晶体管)。显著富集物为深蓝色;淡蓝色不显著。(B类)人类和小鼠(红条)在四种组织(心脏、肝脏、间脑/前脑和小脑/后脑)中表达了相对大量的CRS(146670),总RNA-seq数据具有可比性(方法)。总的来说,人类和小鼠中共有157136个CRS在总RNA-seq或poly(A)RNA-seg中表达(补充图S7). 具有经验的CRSP(P)-值<0.01的患者被指定为“表达”状态。我们只考虑了543390个人类-小鼠保守型CRS中的433327个,这两个物种具有相同的生物型。注意,“5′延伸”和“3′延伸”是指UTR和lncRNAs上游和下游的2-kb区域;UTR本身包含在“mRNA”中(C类)用Pearson相关系数测定不同生物型人和小鼠之间的表达相关性第页poly(A)RNA-seq(六种组织:睾丸、肝脏、肾脏、心脏、小脑和大脑)的表达水平。“背景”是在输入MA块上采样的,人-鼠保护不与其他生物类型重叠。上的数字左边小提琴图的数量是至少在两个组织中表达的测量CRS总数,以及正确的side是带有的CRS数第页> 0.8.
图3。
图3。
CaptureSeq和qRT-PCR显示CRS的保守表达。(A类)基于不同CPM/RLE截止值(曲线上的数字)定义的公共poly(A)RNA-seq的脑CRS区域检测的ROC曲线,以胎脑CaptureSeq的CRS区域探测为金标准。(B类)用qRT-PCR(按CRS区域归一化)测量了人和小鼠7个组织中23个CRS区域的表达谱。CRS区域具有弱保守的一级序列,并在CaptureSeq中表达(P(P)< 0.1). CRS区域通过降低人类和小鼠之间表达谱的皮尔逊相关系数进行排序。(C类)CRS区域C3381920位于lncRNA的3′端AC07304.25型尽管在公开的总RNA和poly(A)RNA-seq数据中大脑中没有表达,但它在CaptureSeq和qRT-PCR中都出现在人脑中。胃肠道(小肠和结肠;参见B类). C3381920区域包含CRS M0653745,其结构在人和小鼠之间高度保守。人类和小鼠结构中的色码是由维也纳RNA软件包计算的基本概率(Lorenz等人,2011年)。
图4。
图4。
人和小鼠的体外RNA结构探测显示CRS M1695693的保守结构。FDR为11.0%,9个物种的SI(从17个物种的树中过滤)结构比对为48%(人与鼠之间为45%)。CRS位于主页2(负股)和WHAMM公司(加绞线;第15:8284671–82846804章)。它与DNase超敏位点(DHS)(ENCODE)重叠,并具有增强子的典型染色质特征,即H3K4me1富集和H3K4me3减少富集,这些都是转录调控区的指标。然而,来自FANTOM5的CAGE数据并不支持这一假设;相反,poly(A)位点簇(Gruber et al.2016)建议延长3′UTR主页2. (A类)基因组轨迹。(B类)结构探测可用于人类和小鼠,其中红色标记碱基配对核苷酸(ds),绿色和蓝色标记单链核苷酸(ss)。(C类)CMfinder的结构比对,预测了一致性RNA的二级结构,并预测了人类和小鼠的个体结构作为点框符号。探测结果通过颜色代码与计算机预测结果重叠。
图5。
图5。
基因调控区中CRS区域的覆盖和表达。图中的三行描述了(1)增强器周围的区域(A类D类)(2)mRNAs/lncRNAs的最远端TSS(E类H(H))和(3)mRNAs/lncRNAs最远端3′端(K(K))分别是。(A类,E类,)这些特征附近CRS区域的绘图密度:50-bp窗口中的计数由特征数量归一化。“预测”曲线(橙色)反映所有CRS区域;“转录”曲线(蓝色)反映了未标记转录边界支持的子集。下部子面板显示了这些预测的估计FDR(平均值,SD)。所有其他面板均基于“转录”子集;有关详细信息,请参阅方法部分“基因调控区的定义”和补充图S11总之,表达式基于以下内容:(B类,C类)CAGE TSS靠近增强器(F类,G公司)CAGE TSS上游反义w.r.t.mRNA/lncRNA,以及(J,K(K))活性poly(A)位点下游感测w.r.t mRNA/lncRNA。“结构化”/“CRS”表示重叠CRS的区域;“非结构化”/“无CRS”则不行。(B),C类,F类,G)胎儿人类小脑中的总RNA-seq(实验ENCSR000AEW的技术复制品2;ENCODE 3期)。(J,K)人脑多聚(A)RNA-seq(HBM)。(B类,F类,J)表达水平以交叉实验相对对数表达规范化(CPM/RLE)后的百万计数为单位。(C类,G公司,K(K))表达结构化(CRS)与非结构化区域(无CRS)的GC含量和相位坐标(来自100种MULTIZ比对)。表达区域由经验定义P(P)-值<0.01且CPM/RLE≥1。(D类,H(H))如Andersson等人(2014b)所述,ENCODE HeLa DHS的转录稳定性,以及结构化(CRS)和非结构化区域(无CRS)的GC含量。奇数比量化了稳定性与CRS重叠的关联程度。
图6。
图6。
基因调控区域中的示例CRS由未标记的转录边界支持。(A类)两个基因3′端之间的低SI高结构区域中的两个基因间增强子(CRS M1293227仅在灵长类中保守)。(B类)MIR320A型位于的上游POLR3D系列TSS公司。(C类)lncRNA启动子的反义转录LINC01132公司具有增强子样染色质特征。(D类)通过控制和外显体缺失HeLa细胞测量的负链单向稳定转录的基因间增强子(Andersson等人,2014b)。共识结构中的颜色代码是基于结构的对齐中的基面保护级别。

类似文章

引用人

工具书类

    1. 1000基因组项目联盟。2015年,人类遗传变异全球参考。自然526:68–74。-项目管理咨询公司-公共医学
    1. Almada AE、Wu X、Kriz AJ、Burge CB、Sharp PA,2013年。启动子的方向性由U1-snRNP和聚腺苷酸化信号控制。自然499:360-363。-项目管理咨询公司-公共医学
    1. Andersson R、Gebhard C、Miguel-Escalada I、Hoof I、Bornholdt J、Boyd M、Chen Y、Zhao X、Schmidl C、Suzuki T等,2014a。人类细胞类型和组织的活性增强剂图谱。《自然》507:455-461。-项目管理咨询公司-公共医学
    1. Andersson R、Refsing AP、Valen E、Core LJ、Bornholdt J、Boyd M、Heick JT、Sandelin A.2014b。核稳定性和转录方向性分离出功能不同的RNA物种。国家通讯社5:5336。-公共医学
    1. Arner E、Daub CO、Vitting-Seerup K、Andersson R、Lilje B、Drablos F、Lennartsson A、Ronnerblad M、Hrydziuszko O、Vitezic M等,2015年。基因调控:转录增强子在哺乳动物细胞中引导协调转录波。科学347:1010-1014。-项目管理咨询公司-公共医学

出版物类型