摘要

RNA执行的许多生物学功能都是由RNA-结合蛋白(RBP)介导的,了解这些相互作用的分子基础是生物学的基础。在这里,我们提出了结合免疫沉淀(MPRNA-IP)的大规模平行RNA检测体内高通量切割RNA-蛋白质相互作用,并描述用于识别RNA结构域和分析RNA结构贡献的统计模型。通过使用包含系统设计的截断和突变的数以万计RNA序列的定制库,MPRNA-IP能够识别RNA域、序列、,以及在单个实验中蛋白质结合所必需和足够的二级结构。我们表明,这种方法对于多种感兴趣的RNA是成功的,包括长非编码RNA NORAD、噬菌体MS2 RNA和人类端粒酶RNA,并且我们使用它来查询迄今为止未知的DNA环因子CTCF的序列或结构RNA结合偏好。通过将系统突变分析与交联免疫沉淀相结合,MPRNA-IP提供了一种新的高通量方法来阐明RNA与蛋白质相互作用背后的基于RNA的机制体内.

介绍

几十年来,RNA在重要生物过程中的非编码作用一直为人所知。许多非编码RNA(ncRNAs)通过与蛋白质相互作用发挥生物作用。例如,端粒酶和核糖体都是核糖核蛋白复合物(RNP(1,2). 这甚至可以在信使RNA(mRNAs)中观察到,其中许多信使RNA含有影响编码蛋白表达的调节元件。mRNA通常通过特异性和非特异性元素结合多种蛋白质,每种元素都可以对RNA的功能和/或代谢产生不同的影响(,4).

RNA的生化多功能性介导了多种模式的RNA-蛋白质相互作用。RNA不仅使用一级核苷酸序列,还使用二级或三级结构进行生化活性(如程序化-1核糖体移码信号(5,6)),通常包含多个功能域(如长非编码RNA(lncRNA)Xist(7)). 但是,这种多功能性使对潜在机制的剖析变得复杂。人们必须考虑多种工作模式或区域,才能理解哪怕是单个RNA的功能机制,这使得RNA的研究在技术上很困难。历史上,这些问题都是通过使用截断分析来解决的,截断分析将感兴趣的分子分解为片段,以确定功能所必需和足够的区域。然后可以将其与更精细的方法相结合,如扫描突变或补偿突变分析,以了解生物活性所需的特定序列和结构。然而,用经典的低吞吐量方法综合进行截断和突变分析既费时又费力,最终减缓了RNA非编码或调节功能机制的研究步伐。

此前,我们和其他人开发了大规模平行RNA分析(MPRNA),该分析结合了现代高通量寡核苷酸合成和下一代测序技术,以大规模进行RNA的解剖分析(8–16). 我们和其他人使用该分析来了解lncRNA在细胞核中的主要定位(8–10). 通过将核lncRNA序列拼接成小块,并测试每个拼接序列是否可以驱动其他细胞质结构的核定位,这些研究能够识别lncRNA中驱动核定位的RNA元素以及这些域中丰富的序列基序。但是,MPRNA很少用于研究RNA与蛋白质的相互作用,部分原因是有多种技术可用于基于交联免疫沉淀(CLIP)绘制RNA区域与RBP的结合(17–20). 然而,基于CLIP的方法在揭示控制RNA与蛋白质相互作用的RNA元素方面受到了限制,因为它们的结果只允许基于RNA靶标中的结合区域计算RNA特征,而不直接测试RNA元素对相互作用是否必要或足够。此外,在CLIP中检测低水平表达的ncRNAs并不是最优的。尽管随后的一项工作使用MPRNA来查询RNA核定位序列中的蛋白结合序列模体(21),需要更复杂的突变策略来定义蛋白质结合所必需和足够的RNA特征,包括RNA二级结构。

在这里,我们描述了MPRNA-IP,它是MPRNA用于检测体内RNA–蛋白质相互作用。MPRNA-IP将MPRNA与免疫沉淀(IP)结合,并采用复杂的平铺和突变方法来探索RNA与蛋白质相互作用的基于RNA的特征的关键问题:(i)RNA是否可以划分为负责与RBP结合的自主域,以及(ii)什么样的RNA序列和/或RNA二级结构对于RNA-蛋白质相互作用是必要的和足够的。我们还进行了几项技术改进,以提高MPRNA的稳健性,包括使用每个RNA测试序列的多个分子条形码,以及引入一种新的计算方法来分析MPRNA-IP的系统突变。通过PUM2结合RNA、MS2-MCP相互作用和人类端粒酶RNA-TERT相互作用的例子,我们表明MPRNA-IP可以识别RNA中的蛋白质结合域,以及驱动RNA与蛋白质相互作用的潜在RNA序列基序和RNA二级结构。为了确定MPRNA-IP是否能解决新的RNA结合序列和结构偏好,我们选择研究CTCF,一种对RNA结合活性了解甚少的DNA环因子(22–24). 使用MPRNA-IP,我们能够揭示CTCF具有很少的序列偏好,但与RNA茎结构相关。由于RNA与蛋白质的相互作用对RNA的许多非编码作用至关重要,MPRNA-IP将成为一种强大的以RNA为导向的高通量工具,通常适用于调节性RNA的研究,并将促进我们对RNA与蛋白质相互作用的理解。

材料和方法

寡核苷酸池设计和克隆

除了通用的5′和3′PCR引物结合位点外,每个寡核苷酸还包括实验序列的157个核苷酸(nts)(实验序列是根据有或无突变的靶RNA的拼接设计的)和一个独特的10-mer分子条形码(8). 当将RNA拼接成重叠片段时,相邻片段的5′端之间的距离均匀为78 nts。Twist Bioscience(加利福尼亚州旧金山)合成了设计的寡核苷酸库。根据先前的MPRNA协议克隆寡核苷酸库(8). 简言之,使用Chimerx Micellua乳剂和纯化试剂盒(Fisher Scientific NC1117239)通过乳液PCR(ePCR)扩增寡核苷酸池,以避免扩增过程中基于序列的偏差。使用Chimerx试剂盒纯化ePCR产物,然后用限制性内切酶AgeI和NotI(NEB)消化,并连接到用相同的两种酶消化的质粒表达载体中。在我们所有MPRNA-IP实验中使用的质粒主干中,寡核苷酸被克隆到最小CMV启动子下游,然后是SV40 poly(a)转录终止子。结扎产物转化为大肠杆菌使用一次性TOP10化学活性电池(Invitrogen)。许多转化是并行进行的,以产生至少与克隆池中寡核苷酸数量相同的菌落。将菌落从转化板刮到液体LB培养基中并旋转下来后,使用Qiagen plasmid Plus Maxi Kit(Qiagen12963)直接从这些细胞中分离质粒DNA。ePCR扩增和Illumina测序质粒分离后,验证了池的代表性。

细胞培养、转染和交联

在DMEM中培养的HEK293T细胞加上10%的FBS、1%的青霉素-链霉素和1%的谷氨酸MAX补充剂(Gibco),传到15厘米的培养皿中。根据制造商的说明,使用X-tremGENE HP DNA转染试剂(Roche)将寡核苷酸池转染到HEK293T细胞中。转染后48 h通过刮取收集细胞,在4°C下500×g离心5分钟,然后用冷PBS洗涤一次。细胞在室温下用0.1%甲醛在营养器上的冷PBS再悬浮(约500万个细胞/ml)中交联10分钟。为了停止反应,将甘氨酸添加到最终浓度为125 mM的细胞中,然后在室温下在营养器上培养5分钟。将交联细胞在500×g的温度下在4°C下离心5分钟。用PBS(包括cOmplete蛋白酶抑制剂鸡尾酒(Roche))洗涤两次交联细胞颗粒,并将其速冻,并在−80°C下保存,直至使用。

细胞裂解和预清除

将细胞颗粒重新悬浮在1 ml新制的RIPA缓冲液中(50 mM Tris pH 8.0,150 mM KCl,0.1%SDS,1%Triton X-100,5 mM EDTA,0.5%脱氧胆酸钠,0.5 mM DTT,1X cOmplete蛋白酶抑制剂鸡尾酒(罗氏),100 U/ml RNaseOUT(Invitrogen))并在4°C下在管旋转器上培养10分钟,然后与Bioruptor Pico(Diagenode)进行超声波检测。细胞裂解物在4°C下以13000×RPM离心15分钟。收集上清液并用等量的新制甲醛-RNA-IP(fRIP)缓冲液(25 mM Tris pH 7.5,150 mM KCl,5 mM EDTA,0.5%NP-40,0.5 mM DTT,1X cOmplete蛋白酶抑制剂鸡尾酒(罗氏),100 U/ml RNaseOUT(Invitrogen))稀释,然后通过0.45微米过滤器过滤。将裂解液分为两个Eppendorf管(每管1 ml再悬浮中约500万细胞裂解液),每管作为一个独立的IP条件。对于每个IP条件,将25μl Dynabeads蛋白G(Invitrogen)添加到裂解液中,并在4°C下培养30分钟,以预先清除裂解液以进行后续IP实验。从每个IP条件中提取50μl预先清除的裂解液作为输入样品。将预先清除的裂解物快速冷冻并储存在−80°C下,直至使用。

免疫沉淀

对于每个IP条件,将约500万个裂解物细胞与6μl靶蛋白特异性抗体(抗FLAG,Millipore Sigma F1804;抗HA,Thermo Fisher MA5-27915;抗PUM2,Abcam ab92390)混合,在4°C的试管旋转器上培养2小时,然后添加40μl Dynabeads蛋白G(Invitrogen)在4°C的试管旋转器上培养1小时。用1ml fRIP缓冲液清洗珠子四次,每次在4°C的试管旋转器上培养10分钟,然后去除上清液。从每个IP条件中提取10%的IP珠,作为western blot IP样品。珠子被快速冷冻并储存在−80°C下,直到使用。

RNA分离和反转录

为了准备RNA分离,将50μl输入样品与6μl无RNase水混合,并用56μl无RNA水重新悬浮IP样品中的珠子。对于反向交联反应,将样品与33μl反向交联缓冲液(3×PBS,6%)混合N个-月桂酰沙星、30 mM EDTA、15 mM DTT)、10μl蛋白酶K(Ambion)和1μl RNaseOUT(Invitrogen),在42°C下培养1 h,然后在55°C下孵育1 h。使用三唑(Invit罗gen)和氯仿,然后使用RNeasy Plus Mini Kit(Qiagen)分离RNA。用DNase I(沃辛顿)处理RNAs(200 ng),在37°C下孵育30分钟,然后在75°C下热灭活10分钟,以去除gDNA。使用随机引物(Promega)和上标IV逆转录酶(Invitrogen)将RNA逆转录到cDNA。

排序和计数读取

使用定制的引物生成测序文库,这些引物退火到寡核苷酸序列上的通用启动位点,并连接Illumina兼容测序适配器(8). 使用PfuUltra II融合DNA聚合酶(Agilent)进行PCR扩增。对于ePCR样品,使用1 ng样品DNA,并用12个PCR周期进行扩增。对于克隆样品,使用50ng的样品DNA,并用18个循环的PCR扩增。对于IP样品,使用10μl样品cDNA,并用24个PCR周期进行扩增。使用AMPure XP珠(Beckman,Coulter)以0.5×、1.6×和1.0×的比率对PCR-扩增文库进行三次清理。对Illumina NextSeq进行扩增子测序。通过映射条形码序列,将输入和IP样本的排序读取分配给设计的瓷砖。我们还检查了测序读取和原始设计序列之间多达167个nts的序列一致性(取决于读取长度),如果测序读取有两个以上的不匹配,则过滤测序读取。

IP中相对于输入的富集瓷砖的识别

通过使用R包limma和voom流水线应用线性回归模型,比较Input和IP之间分配给tile的测序读取数(实验序列,寡核苷酸中的条形码除外)(25),在每个磁贴合并条形码后。简单地说,以下模型是为瓷砖构建的:|$\log y={{\beta}_0}+{{\beta}_1}\Replicate+{{\ beta}_2}\Pulldown+\varepsilon$|,其中是归一化计数,分类变量复制描述了生物复制和分类变量下拉具有输入和IP两个级别。在模型中,系数|${{\beta}_2}$|以IP相对于输入的倍数变化(对数尺度)表示瓷砖的富集,并控制生物复制物对富集的特定影响。如果所有样本中的RPM(百万分读取数)值小于1,则在汇集之前过滤寡核苷酸。使用R包边缘中的TMM方法对读取计数进行标准化(26). 通过R包界限计算富集和假发现率(FDR)的统计显著性(25).

突变的统计模型

对于突变(缺失或多碱基替换突变),使用以下线性回归模型比较野生型(WT)和突变寡核苷酸:|${\log y}={{\beta}_0}+{{\beta}_1}\下拉+{{\ beta}_2}\突变+{{β}_3}\突变*下拉+\varepsilon$|,其中是标准化计数,以及分类变量下拉(输入和IP)和突变(WT和突变体)分别有两个水平。为了计算茎的茎得分,使用线性回归模型比较WT、5′突变、3′突变和补偿突变,评估序列特异性(分别为5′和3′)和碱基特异性效应:|${\log y}={{\beta}_0}+{{\beta}_1}\下拉+{{\ beta}_2}\5^{\prime}序列+\{{\贝塔}_3}\3^{\prime}顺序+{{贝塔}_4}\Basepair+{\beta}_5}\5${\prime}序列*下拉+\{\be塔}_6}\3#{\primer}序列*Pulldown+{\beta}_7}\Baseparair*下拉+\varepsilon(瓦雷普西隆)$|,其中是标准化计数,分类变量下拉有两级输入和IP,二进制变量5′顺序, 3′顺序、和基极对指出它们是否有助于与蛋白质结合。我们假设(1)WT既有序列效应又有碱基效应,(2)5'和3'突变分别只有3'和5'序列效应,(3)补偿突变相对于5'或3'突变只有碱基效应。在R包edgeR中使用TMM方法对寡核苷酸的读取计数进行标准化(26)并且如果它们的RPM值在Input或IP中小于1则进行过滤。将线性回归模型应用于具有不同条形码的每个生物复制,并将回归系数的调节t-统计(⁠|${{\β}_3}$|对于WT与突变体,|${{\beta}_7}$|对于茎得分),使用带有趋势选项的R包limma计算每个突变体或茎(25). 然后我们分配了一个-使用WGCNA R包中的函数“rankPvalue”评估t统计量在生物复制中的一致性(27),假设有效的RNA-蛋白质相互作用在生物复制中始终排名第一。

PUM2 MPRNA-IP分析

PUM2的eCLIP峰区列表来自ENCODE(访问ID:ENCFF880MWQ)。PUM2的eCLIP覆盖范围使用以下ENCODE登录ID获得:ENCFF769SCB、ENCFF452BKL、ENCF880UXZ和ENCFF034QCL。PRE(Pumilio Responsive Element)与瓷砖的关联基于UGUAHAUA的精确匹配(28)在瓦片序列中,其中H表示除G以外的任何碱基。MEME进行了Motif分析(29).

RNA下拉分析

从IDT中获得20-nts长度的生物素标记RNA和5′端的生物素dT修饰(WT:CUUUUGAGAGCAAAACU,5′突变:CAAAACAGCUCUAAACU,补偿性突变:CAAA CUCAAGGAGUUUCU)。根据 等。(30)经过修改。每个样品使用30 ul链霉亲和素琼脂糖(Invitrogen SA10004)。用500 ul链霉亲和素琼脂糖洗涤缓冲液(20 mM Tris–HCl,pH 7.5,100 mM KCl,2 mM EDTA,0.5 mM DTT和0.5 mM PMSF)洗涤珠子两次,再悬浮在500 ul的链霉亲和力琼脂糖冲洗缓冲液中,并与200 pmol生物素标记RNA混合,然后在4°C下在旋转器上培养1 h。孵育后,用500 ul RNA–链霉亲和素相互作用缓冲液(20 mM Tris–HCl,pH 7.5,300 mM KCl,0.2 mM EDTA,0.5 mM DTT和0.5 mM PMSF)洗涤珠子两次,再悬浮在500 ul RNA-链霉亲和物相互作用缓冲中,然后与100 ul HEK293T裂解物(约800万–1000万细胞)混合然后在旋转器上在4°C下培养4小时。孵育后,用1 ml RNA–链霉亲和素相互作用缓冲液清洗珠子3次。为了洗脱结合蛋白,将12 ul的2×SDS-PAGE样品缓冲液添加到小球中,短暂混合,并在95°C下加热5 min,然后在11000 RPM下离心10 min。收集上清液进行western blot分析。

结果

MPRNA-IP概述及实验参数优化

MPRNA涉及设计一个定制的DNA寡核苷酸池,这些寡核苷酸在特定的分析中表达并测试全体虽然我们的每个MPRNA-IP实验都使用了不同的自定义池(表1)寡核苷酸的一般结构和一般实验方案保持不变。每个寡核苷酸包括157 nts的实验序列,通常将RNA拼接成有或无突变的小块(以下称为片状),一个独特的10-mer分子条形码,以及通用的5′和3′PCR引物结合位点(补充图S1a). 这里,我们使用“oligo”表示瓷砖序列和条形码序列的独特组合。MPRNA-IP的步骤如图所示1安培-简单地说,将寡核苷酸池克隆到表达载体中并转染到HEK293T细胞中。抗体确认后,用甲醛交联RNA免疫沉淀法(fRIP)检测表达的寡核苷酸与目标蛋白的相互作用(补充图S1b). 我们特别选择fRIP而不是原生RIP作为MPRNA-IP的标准化IP协议,因为它适用于所有RBP,甚至那些绑定在高度稳定的细胞结构中的RBP。例如,在过去十年中,在染色质相关因子中发现了许多新的RNA-结合活性(在Long中综述等。(31)),并且如果没有(a)超声处理以破坏染色质和(b)甲醛交联以防止这些复合物在超声处理过程中解离,这些RNA-蛋白质复合物就无法从细胞中有效提取。此外,虽然紫外线交联通常是RNA IP实验的首选,因为它只形成RNA–蛋白质交联(即不形成蛋白质–蛋白质交联),但它在交联某些类型的RNA–蛋白质相互作用(例如具有双链RNA的相互作用)方面的效率明显较低(32,33),使甲醛交联成为更普遍适用于各种RBP的方法。然后,通过逆转录、PCR扩增回收的寡核苷酸,并生成这些扩增物的测序文库,对得到的RNA样本进行高通量测序。最后,将线性回归模型应用于每一块瓷砖,以确定相对于总裂解物(Input)富含IP的寡聚物,其中比较了Input和IP之间的测序读取数(参见材料和方法)。对于有突变的瓷砖,比较WT和突变瓷砖,以评估突变对相对于输入的IP富集的影响(见材料和方法)。

表1。

寡头池汇总

寡核苷酸池瓷砖数量每个磁贴的条形码数量寡聚物总数
PUM2结合RNA1,5992235,178
MS2-MCP公司105505,250
hTR-TERT公司6142515,350
CTCF结合RNA9852423640个
WRAP53-CTCF公司55351,925
寡核苷酸池瓷砖数量每个磁贴的条形码数寡聚物总数
PUM2结合RNA1,5992235,178
MS2-MCP公司105505,250
hTR-TERT公司6142515,350
CTCF结合RNA9852423,640
WRAP53-CTCF公司55351,925
表1。

寡头池汇总

寡核苷酸池瓷砖数量每个磁贴的条形码数量寡聚物总数
PUM2结合RNA1,5992235,178
MS2-MCP公司105505,250
hTR-TERT公司6142515,350
CTCF结合RNA9852423,640
WRAP53-CTCF公司55351,925
寡核苷酸池瓷砖数量每个磁贴的条形码数量寡聚物总数
PUM2结合RNA1,5992235,178
MS2-MCP公司105505,250
hTR-TERT公司6142515,350
CTCF结合RNA9852423,640
WRAP53-CTCF公司55351,925
图1。

MPRNA-IP是一种大规模平行RNA分析,专门用于探索RNA与蛋白质的相互作用。(A类)MPRNA-IP示意图。将寡核苷酸池克隆到表达载体中并转染到HEK293T细胞中。通过甲醛交联RNA免疫沉淀法对RNA片断的蛋白质相互作用进行分析,并应用统计分析确定优先与目标蛋白质相互作用的RNA特征。(B)为了改进以前版本的MPRNA,每个实验序列块都由多个唯一的条形码表示。该策略提高了分析的可靠性和统计能力。(C类)MPRNA-IP实验参数的优化。我们通过从测试实验中随机选择测序读数,模拟了给定条形码编号的MPRNA-IP的两个生物复制品,并确定了瓷砖富集的高再现性所需的最佳条形码数量。15个唯一的条形码足以在两个生物复制之间实现>80%的相关性,15个以上的改进逐渐减少。分布由标准方框图描述:方框表示百分比分布的第一和第三个四分位数,水平线表示中值,胡须表示第十和第九十个百分位数。

为了改进以前的MPRNA实现,我们为每个实验块分配了多个独特的分子条形码,并在实验设计中添加了内部技术副本(图1B年). 这种冗余设计的目的是(i)最大限度地提高寡聚体的代表性,(ii)降低由单个条形码驱动的假阳性结果的可能性,以及(iii)提高富集分析的统计能力。为了确定每个实验序列的最佳条形码数量,我们随机从MPRNA-IP实验(表中的hTR-TERT)中进行下采样测序读取1)并为每个磁贴的广泛条形码编号生成模拟复制对。然后我们计算了重复数据之间瓷砖平均富集度(IP/Input)的皮尔逊相关系数。分子条形码的数量越多,两个模拟重复之间的相关性越高(图1摄氏度),并且15个分子条形码足以实现0.8的相关性。因此,在推进新的寡头池设计时,我们为每个瓷砖至少包含15个独特的条形码。

接下来,我们优化测序深度,以指导MPRNA-IP样本的成本效益测序。这里,我们再次对MPRNA-IP实验(表中的hTR-TERT)进行随机下采样测序读取1)并观察不同模拟测序深度下缺失寡核苷酸(在输入样本中未检测到的寡核苷酸)的数量。由于高通量测序中测序读取的数量取决于GC百分比,因此我们评估了100个GC含量约为50%的随机序列,允许无偏见地计算退出率。每个随机序列有25个分子条形码,总共有2500个寡核苷酸。正如预期的那样,随着每个寡核苷酸平均测序深度的增加,缺失寡核苷酸的比例降低(补充图S1c). 我们确定,建议每个寡核苷酸至少有500个测序读数,以尽量减少缺失寡核苷酸的数量。

MPRNA-IP可以恢复蛋白结合RNA结构域和序列基序。

我们首先测试了MPRNA-IP的拼接方法是否可以应用于RNA-蛋白质相互作用。在这里,我们探索了Pumilio(PUM)结合RNA,因为Pumilio-RNA相互作用已被详细研究(28). 为了在这个寡聚物池中设计实验芯片,我们通过增强交联和免疫沉淀(eCLIP)技术从先前的研究中识别出的分子中选择了23个PUM2结合RNA,这是一种识别内源性RNA中蛋白质结合位置的技术(19)覆盖了每个分子的eCLIP峰的数量和密度的广泛范围(补充图S2a). 我们用157个nts的重叠片段拼接这些RNAs的全长,得到总共1599个实验序列。每个瓦片由22个分子条形码表示,最终生成35178个寡核苷酸。MPRNA-IP的执行如图所示1a个使用针对IP的PUM2抗体(补充图S1b).

我们首先通过评估在我们的输入样本中检测到的池中寡聚物的百分比,确认寡聚体在我们的分析条件中具有良好的代表性。在三个生物复制品中,输入样本中检测到约90%的寡核苷酸(补充图S2b)并且寡核苷酸的每百万读数(RPM)值的分布是可比较的(补充图S2c). 重要的是,瓦片的富集在生物复制中高度相关(补充图S3).

接下来,我们使用一个线性回归模型来确定抗PUM2 IP样本中统计丰富的瓷砖,该模型比较了每个瓷砖的输入和IP之间的序列读取相对数量,同时控制了生物复制的影响(参见方法)。在1123个测试的实验瓷砖中,有158个瓷砖的IP相对于输入显著富集(错误发现率(FDR)<0.01,IP/Input>1,补充图S4),我们发现这些富集瓷砖和eCLIP峰之间有高度重叠,如典型的PUM2结合lncRNA NORAD所示(图2安培补充图S5). 此外,富集瓷砖的数量与跨多个RNA靶点的eCLIP峰值的数量相关(图2B型,N个=23,皮尔逊相关系数=0.64,双面t吨-测试-值=0.00112),表明RNA–PUM2相互作用由局部RNA元素介导,可通过MPRNA-IP的拼接方法识别。这些数据表明,MPRNA-IP可以独立于全长RNA,识别这些RNA中足以与PUM2结合的独特、自主和生物相关的区域。

图2。

MPRNA-IP可以识别驱动Pumilio蛋白特异性的区域和一级序列基序。(A类)MPRNA-IP图块在众所周知的Pumilio结合RNA(NORAD)上进行了描述。IP样品中的红色图块在统计上富集,并与PUM2 eCLIP峰和已知的PUM2-结合共识基序Pumilio响应元素(PRE)高度对应。(B)靶RNA内eCLIP峰值的数量与MPRNA-IP富集的瓷砖比例之间的相关性。(C类)MPRNA-IP富集瓷砖的主题分析证实了众所周知的PRE(#158)。MPRNA富集的瓷砖与之前生成的eCLIP峰不重叠,再次产生PRE(#43)。eCLIP峰值内的磁贴也未在MPRNA-IP(#86)中富集,但未检索到一致模体。()瓷砖的富集与瓷砖中包含的PRE数量相关,表明PRE在瓷砖富集中的因果作用。通过双侧Mann–Whitney U检验评估统计显著性:***表明-值<0.001。

此外,我们还探索了MPRNA-IP能否准确地确定与特定蛋白质结合的RNA模体。先前的研究已经确定Pumilio响应元件(PRE)是驱动Pumilio蛋白质相互作用的RNA序列基序(17,34). 使用图案发现工具(MEME)对丰富瓷砖进行无偏图案分析(29))成功恢复PRE(图2厘米). 在158个富集瓷砖中,142个瓷砖在一个失配中至少含有一个PRE。此外,未经富集的瓷砖未发现任何特定的序列基序,表明假阴性率较低。最后,我们将我们的MPRNA-IP富集瓷砖与eCLIP识别的峰值进行了比较,eCLIP通常用于识别RNA元素。通过两次分析检测到的PUM2结合区域之间存在显著重叠(如果至少有3个nts,超几何检验重叠-值<10−15). 在158个富集瓷砖中,43个没有与eCLIP峰重叠,但基序分析表明,这些瓷砖仍然含有PRE。这些磁贴具有更高的eCLIP折叠变化,这表明它们可能被称为具有不同峰值调用参数的eCLIP峰值(补充图S6). 相反,当我们对没有被MPRNA-IP富集的瓦片,即使是那些与eCLIP峰重叠的瓦片进行基序分析时,也没有发现PRE。这意味着eCLIP在这些区域的富集可能是非特异性的,或者在HEK293T细胞的MPRNA-IP实验中,这些区域对PUM2是隐藏的,但在K562细胞的eCLIP实验中可以访问PUM2。MPRNA-IP结果进一步表明,瓷砖的富集强度与PRE的数量相关,揭示了PRE在这种相互作用中的因果关系(图二维). 这些结果表明,MPRNA-IP能够识别RNA–蛋白质相互作用的初级序列基序,至少与基于全长RNA的方法(如eCLIP)类似。

通过蛋白质结合绘制功能RNA结构

在验证MPRNA与RNA-蛋白质相互作用的拼接方法的适用性后,我们试图扩展我们的寡核苷酸池设计策略,以纳入经典的补偿性突变分析(图3A级). 在这里,我们旨在确定RNA二级结构对RNA-蛋白质相互作用的贡献,因为几十年的研究表明,RNA二级构造驱动许多RNA-蛋白相互作用(35–37). 为了生成一个补偿性突变库,我们首先根据RNA初级序列(a:U,G:C,G:U)的碱基配对规则预测了所有潜在的茎。接下来,将预测的碱基配对结构的5′和3′侧分别突变为互补序列以破坏预测的茎,然后在单个补偿突变体中一起突变以恢复推定的碱基配对(例如,CU–AG茎将突变为GA–AG和CU–UC以破坏,并突变为AG–CU以恢复)。在这些实验中,当5′和3′突变体都损害生化功能并被代偿突变体部分或完全挽救时,这有力地证明了预测的结构形成,并且对测试的功能(在本例中,蛋白质结合)很重要。在进行MPRNA-IP实验后,我们应用了一个基于回归的计算模型,该模型比较了WT、5′和3′突变体和补偿性突变体序列的富集情况,以量化茎内碱基配对对RNA-蛋白质相互作用的影响,与改变主RNA序列的影响无关。具体而言,该回归模型假设WT和5′或3′突变体之间的富集差异是序列效应和碱基对映效应的总和,而补偿性突变体和5′和3′突变变体之间的浓缩差异仅由碱基对射效应引起(图中的底部面板3a年和参见方法)。我们将估计的碱基配对效应大小称为“词干得分”。

图3。

通过MPRNA-IP鉴定MS2 RNA的结构特征。(A类)MPRNA-IP用于探索RNA结构的补偿性突变分析示意图。从一级序列预测二级结构后,将点突变或全干突变引入预测结构的5′或3′端,以及5′和3′突变,以拯救假定的结构元件。基于补偿性突变分析,应用回归模型分析结构和序列对结合的贡献。(B)根据MS2发夹的主要序列,所有可能的茎都包含两个或多个相邻碱基对。WT MS2发夹内的两个已知茎用红色标记。插图表示MS2发卡的已知结构。(C类)(B)中所有预测基线的杆得分,由(A)中描述的统计模型估计。颜色表示统计显著性:红色(FDR<0.1)和黑色(else)。请注意,茎1和8是WT发夹中已知的两个茎。插图:寡聚物褶皱变化的分布(log2标尺)用于阀杆8。茎8的5′和3′突变破坏了与MCP的相互作用,这是通过恢复茎的补偿性突变来挽救的。数据点表示MPRNA-IP的三个生物复制品的条形码(WT:142,5′mut:76,3′mut:107,Comp.146)。分布由标准方框图描述:方框表示百分比分布的第一和第三个四分位数,水平线表示中值,胡须表示第十和第九十个百分位数。统计显著性由双边Mann–Whitney评估U型test:***表示-值<0.001,不另说明,平均值-值>0.01。

我们选择了经过充分研究的噬菌体MS2 RNA发夹作为模型(图第3页,插图),对于结合MS2外壳蛋白(MCP)至关重要。根据MS2一级层序预测至少两个不间断基线的所有16个潜在分支(图第3页)我们合成了5250个寡核苷酸,涵盖了所有预测茎的5′,3′和补偿性突变。为了提高此实验中的IP效率,每个磁贴都设计为具有四个串联的MS2发夹序列副本,该序列在其间使用单链链接器区域进行测试(补充图S7a). 然后我们用HA-FLAG标记的MCP串联二聚体共同转染我们的寡聚体池,并使用抗HA抗体进行IP(补充图S1bS7b系列). 我们的MPRNA-IP结果表明,在所有可能的茎中,对应于MS2发夹的两个已知茎的“茎:1”和“茎:8”在MCP结合方面的茎得分最高(图3C公司). 以茎8(对应发夹顶端环正下方的GG–CC茎)为例,含有5′或3′突变的瓦片相对于WT显著减少,而补偿性突变恢复了与WT水平相当的富集(图3C公司,插图)。这些结果表明,MPRNA-IP可以通过蛋白结合成功地绘制功能性RNA二级结构,从而扩展了MPRNA-IP的用途,使其不仅仅局限于探测初级序列。

除了突变预测的茎外,我们还包括在每个核苷酸位置包含点突变的瓦片,以更好地评估初级序列对结合的贡献。我们的结果表明,大多数点突变都不同程度地降低了富集度,但一些突变加强了结合(补充图S7c). 相对于MS2 RNA翻译起始点(U11C),在-5位置观察到最强烈的富集增加,这与之前的发现一致,即WT序列U到C的突变增强了MS2-MCP的相互作用(38,39).

MPRNA-IP在人端粒酶RNA中的应用

在确认MPRNA-IP的拼接和突变方法可以识别RNA结构域、序列基序和介导蛋白质相互作用的结构后,我们试图使用MPRNA-IP来研究一种重要的RNA-蛋白质相互作用,其结构远比MS2-MCP或PUM2-PRE相互作用复杂。端粒酶RNA(TR)是端粒酶的一个重要的ncRNA成分,既是RNP的支架,又是端粒延长所需的逆转录模板(40,41). 尽管从酵母到人类,TR在一级序列和长度上存在差异,但所有脊椎动物TR都包含三个保守的RNA结构域:模板/假结、CR4/5和H/ACA小核仁RNA-like结构域(图4A级)(42). CR4/5和模板/假结结构域都被证明与端粒酶催化亚单位端粒酶逆转录酶(TERT)蛋白相互作用,但作为两个独立的模块(43,44). 特别是,人类端粒酶复合体已经成为一些结构研究的主题,这些研究揭示了RNP的结构,包括TERT和人类TR(hTR)之间联系的细节(45–47). 因此,我们接下来探讨了hTR-TERT相互作用作为一个生物学示例,以测试如何利用MPRNA-IP的多个方面来研究涉及生物学上重要的RNA-蛋白质相互作用的复杂RNA特征。由于hTR为451 nts,我们的寡核苷酸长度为157 nts,因此我们将其分为三个片段(平铺),涵盖三个已知域(图4A级). 除了WT序列外,我们还包括已知hTR二级结构中所有茎的缺失或破坏和补偿性突变。这些实验瓦片伴随着100个随机序列瓦片,作为统计计算中的阴性对照。每个实验和控制块由25个条形码表示(补充图S8a).

图4。

MPRNA-IP与人类端粒酶RNA(hTR)-TERT相互作用的综合应用。(A类)hTR的已知结构示意图。对于MPRNA-IP池设计,hTR分为三块,分别覆盖假结(图1,橙色)、CR4/CR5结构域(图2,红色)和H/ACA小核仁RNA-like结构域(第3,黑色)。(B)根据比较图描述了FLAG-TERT-IP中寡聚物相对于输入的富集情况,通过RPM的折叠变化测量。在汇集3个生物复制品(N:32,tile 1,39,tile 3,60,5679,pooled random)后,使用条形码复制品计算富集的平均值和标准误差。(C类)描述了与WT序列相关的删除(用圆表示)和替换(用三角形表示)中的富集变化。显著变化(FDR<0.1)用红色表示()图2中所有已知茎干得分的统计显著性覆盖在图2的二级结构上。最重要的-如果有多个平铺覆盖该位置,则值用于给定位置。P6a中的虚线框表示杆得分最大的杆。(E类)根据突变描述(D)中虚线框对应的瓷砖寡核苷酸的富集。三种生物复制用不同的颜色表示。分布由标准方框图描述:方框表示百分比分布的第一和第三个四分位数,水平线表示中值,胡须表示第十和第九十个百分位数。在(B)和(E)中,双面Mann–WhitneyU型测试-值表示为:***(-值<0.001)和不适用(-值>0.01)。

使用这个hTR序列库和带有抗FLAG抗体的FLAG-TERT IP,我们首先测试MPRNA-IP是否可以选择性地富集已知与TERT结合的hTR结构域。相对于100个随机序列(Mann–WhitneyU型测试,-值<0.01),而H/ACA域块则不是(图4B类补充图S8b)与之前的报道一致,伪结和CR4/5结构域独立地与TERT结合(43,48). 此外,覆盖CR4/5域的瓷砖比覆盖模板/假结域的瓷砖更丰富(IP到Input的平均倍数变化为2.25比1.65)。这可能意味着CR4/5域是主要的TERT-相互作用模块,正如之前所建议的那样(43,48)尽管还需要更直接的实验证据来证实这一发现。

接下来,我们试图确定与TERT结合所需的模板/假结和CR4/5区域内的二级结构。我们首先比较了WT瓷砖和具有单个茎缺失的瓷砖之间的寡聚物富集(参见方法)。总的来说,CR4/5中茎的缺失导致了富集的损失,而假结中茎的删除则表现出微弱的影响(图4摄氏度). 此外,将删除的P6a和P6b茎替换为其补偿性突变序列以改造原始结构,恢复了TERT的富集,表明二级结构是TERT结合所必需的。

为了更严格地分析RNA对hTR-TERT相互作用的结构贡献,我们扩展了突变策略,将所有已知茎的1-碱基对(bp)和4-bps滑动窗口中的补偿性突变分析包括在内,并计算茎得分,以量化碱基对结合的影响。我们确定了9个显示显著干细胞得分的干细胞(补充图S9a10年),所有这些都位于CR4/5域内的茎P6a、P6b和P6.1中(图4D(四维)对于4-bp突变和补充图S10b对于1-bp突变)。特别是,茎P6a、P6b和P6.1的5′和3′突变体表现出富集度降低,这是通过补偿性突变挽救的(图第四版补充图S9b)而其他茎没有显示出这种模式(例如,茎P5,见补充图S9c). 与CR4/5结构域相比,尽管TERT和假结之间存在已知的相互作用,但我们在模板/假结结构域中没有发现任何显著的干效应(补充图S9a:茎P1b、P2a.1、P2a、P2b和P3)。这表明这些区域中的配对不足以与TERT结合,并且这些茎中的特定序列也可能是相互作用所必需的。总之,这些结果表明,MPRNA-IP可用于严格探索蛋白质结合所需的RNA元素,所有这些都在一个实验中完成。

MPRNA-IP显示CTCF与碱基配对RNA结构相关,但缺乏强烈的序列偏好性

最后,我们旨在利用MPRNA-IP研究相对无特征的RNA-蛋白质相互作用。在这里,我们重点关注CTCF和RNA之间的相互作用(C类科科斯群岛总费用-绑定(f)已证明actor)通过一组紧密相关的CG-丰富序列基序结合DNA(49–51),以前的研究也表明CTCF可以与RNA相互作用(22–24,52,53). 然而,CTCF与RNA相互作用所需的RNA特征尚未确定。我们对23640个寡核苷酸进行了MPRNA-IP测试,测试了985个独特的RNA序列,拼接了9个RNA(补充表S1). 这些RNA包括已知的CTCF相关RNA,如WRAP53(22)和JPX(52,53). 我们将表达该寡核苷酸库的质粒库与过度表达FLAG和GFP标记的CTCF的质粒一起转染到HEK293T细胞(54). 然后,我们对GFP阳性细胞进行分类,并在三个生物复制品中使用CTCF的抗FLAG抗体进行fRIP。与我们之前的实验一样,我们观察到这些复制品在IP中相对于Input的瓷砖富集方面具有很高的再现性(补充图S11). 此外,我们确认了tile的富集与之前的PAR-CLIP数据相关(22)这样,与没有峰的瓷砖相比,具有PAR-CLIP峰的瓷砖具有更高的富集值(图5A级,单侧Kolmogorov–Smirnov检验-值=0.003588)。然后,我们确定了141个在富集方面具有统计意义的瓷砖(图5亿). 使用我们在PUM2实验中使用的模体填充方法,我们没有发现富集瓷砖共享的有意义的序列模体(补充图S12). 这种观察到的缺乏强序列基序的现象与之前在CTCF上使用CLIP-seq的研究一致,该研究也未能检测到任何基于序列的特征(23). 在缺乏明确序列偏好的情况下,我们假设CTCF与依赖于二级结构的特定靶RNA相关。为了支持这个假设,RNAfold(55)预测富磁瓦的折叠能量比贫磁瓦低得多(即更负)(图5摄氏度). 此外,我们发现,在富集的瓦片中,预测的碱基对数量和预测的茎环结构数量明显更大(补充图S13ab条这表明CTCF优先与双绞线结构相关联。

图5。

MPRNA-IP鉴定RNA干与CTCF相关。(A类)瓷砖与PAR-CLIP峰值重叠(N个=76)根据之前的研究,与没有重叠的研究相比,通过MPRNA-IP的对数尺度折叠变化测量,相对于输入,IP的富集程度更高(N个= 908). (B)985块瓷砖中有141块的IP相对于Input显著丰富。红色:富集(FDR<0.01和IP/Input>1),蓝色:耗尽(FDR<0.01和IP/Infut<1),灰色:不显著(FDR>0.01)。来自WRAP53、WRAP53-1的磁贴被标记为示例。(C类)三组瓷砖的预测RNA二级结构能量:富集(N个=141),耗尽(N个=111)且不重要(N个= 666). ()茎得分覆盖在预测的二级结构上。最重要的-如果有多个瓦片覆盖给定位置,则该值用于该位置。显著得分(FDR<0.1)用红色表示。杆得分最大的杆用虚线框表示。(E类)(D)中虚线框的茎显示了不同突变中寡核苷酸的折叠变化。三种生物复制用不同的颜色表示。使用标准方框图:方框表示百分比分布的第一和第三个四分位数,水平线显示中值,胡须表示第十和第九十个百分位数。双面曼·惠特尼U型测试-值表示为:***(-值<0.001),不另作说明(-值>0.01)。

为了测试RNA与CTCF的相互作用是否需要二级结构,我们设计了一个新的补偿突变寡聚池来询问平铺池中单个瓦片的RNA二级结构。我们从lncRNA WRAP53中选择了一个名为“WRAP53_1”的图块,因为它在我们的数据中显示了高浓缩分数(图5亿)与WRAP53外显子(大小:164 nts,重叠:146 nts)显著重叠,该外显子以前曾用于研究CTCF的RNA结合活性(22). 利用RNAfold预测该瓷砖的二级结构(55)最小自由能和系综质心两种不同的预测算法之间是一致的。我们为这种预测结构的每个茎设计了寡聚池中的破坏性和补偿性突变。MPRNA-IP利用这个突变库发现,多个茎包含一个特殊的长茎环(图中指向右侧的茎环第五天)具有较高的杆得分(补充图S14a). 尤其是长柄末端的柄,用图中的虚线框表示第五天,具有显著的茎得分(FDR<0.1),反映了5′和3′突变中折叠变化减少的典型模式,但代偿突变中的挽救(图第五版). 我们还检查了序列突变的影响,发现两个突变显著增加了IP相对于Input的富集(补充图S14b). 但是,它们不会干扰我们通过补偿性突变发现的茎结构,这表明还有其他序列或结构影响CTCF和测试RNA之间的相互作用。最后,为了确认MPRNA-IP识别的区域有助于WRAP53-CTCF相互作用,我们删除了一个小区域(48 nts)由WRAP53全长RNA中得分最高的3个茎组成(56)(1826 nts),并通过fRIP-qPCR比较缺失突变体与WT的FLAG-CTCF-binding。与WT相比,我们观察到突变体中CTCF-WRAP53相互作用显著减少(补充图S15). 我们还证实,CTCF与双链RNA相关,并且与在体外RNA下拉分析(补充图S16). 总之,我们的结果揭示了CTCF与RNA干结构的相关性,为CTCF和RNA之间的相互作用提供了见解。

讨论

RNA与蛋白质的相互作用在许多生物过程中发挥着中心作用,许多实验室已经使用现代高通量分析来扩大我们对这些相互作用的理解。改进前几代分析,如SELEX(57,58)它只产生一个优化的适配体,用于与感兴趣的分子结合,这种新的技术家族可以对更大的序列空间进行采样,以提供蛋白质结合所需的RNA特征的更多细节。特别是,以前已经开发了许多方法,如MPRNA-IP,使用大量的RNA序列来测试蛋白质结合的要求,包括RNA竞争(59),RNA-RAP(60),RNA-MaP(61),RNA结合-n-Seq(RBNS)(62)、HiTS-KIN(63),和MPRNA-RIP(21). 虽然我们的方法的能力与其他方法有部分重叠,但MPRNA-IP提供了一些关键的改进。首先,虽然这些其他方法使用高通量突变和截断分析来确定蛋白质结合所需的序列,但没有一种方法合理地设计了具有突变策略的寡核苷酸池,能够识别蛋白质结合所需要的二级结构。我们的工作是首次使用高通量补偿性突变策略来识别功能性二级结构,这代表着在该系列方法之前可能取得的重大进展。其次,虽然执行了上述大多数方法在体外(带MPRNA-RIP(21)唯一例外),执行MPRNA-IP体内允许在尽可能与生理相关的条件下进行这些生化分析。虽然我们的系统不能将这些RNA片段的表达精确地调整到生理水平,但它允许对RNA结合偏好进行生化分析,即使是对生化纯化有抵抗力的蛋白质在体外方法将是不可战胜的。尽管之前的一项研究(MPRNA-RIP)证明了使用高通量方法进行研究的原理体内RNA–蛋白质相互作用涉及RNA定位,我们开发了MPRNA-IP作为一种更通用和专用的方法,为该方法的未来使用进行了彻底的基准测试。最后,MPRNA-IP中使用的测试序列明显大于以前大多数高通量切割方法中使用的序列(例如,RBNS中40-nt长的RNA)。这一进步在一定程度上是因为我们使用了设计合理的瓷砖或变异水池。虽然诸如RBNS之类的其他方法成功地使用随机序列库来识别相对较短的RNA片段中的蛋白质结合序列和结构,但由于序列空间急剧增加,使用随机序列库对于较长的RNA片段将不有利。正如我们对人类端粒酶RNA的实验所证明的那样,我们的合理池设计的目标方法允许分离诸如CR4/5等对于其他类似方法来说太大的RNA结构域,以及深入表征碱基配对区域。

在我们对这种方法的第一次测试中,我们采用平铺策略扫描已知的23个RNA,以结合特征良好的RNA结合蛋白PUM2(64). 我们观察到含有已知PUM2结合共识基序的瓷砖的强烈富集,富集瓷砖显示出与先前发布的PUM2 eCLIP数据中的峰值高度重叠(19). 我们还观察到一些包含PUM2结合共识但没有与PUM2 eCLIP峰值重叠的瓷砖的富集。进一步分析表明,这些序列在eCLIP数据中得到了丰富,但不足以在下游分析中被称为峰值。虽然eCLIP数据是用来自MPRNA-IP的不同细胞系(K562与HEK293T)生成的,但这一比较表明MPRNA-IR可以准确、忠实地捕获体内RNA-蛋白质结合的要求。此外,通过从全长分子的天然环境中分离出RNA的一个小区域,我们能够测试哪些元素足以独立于RNA的其余部分结合蛋白质。这种充分性的概念无法用eCLIP等方法进行测试,eCLIP调查全长内源性转录组,但它是理解任何生物活性(包括蛋白质结合)的关键。

在MPRNA-IP方法的第二次测试中,我们使用了一种更复杂的切割策略——补偿突变分析,以分离噬菌体MS2发夹RNA的二级结构元素,这些元素是结合其伙伴蛋白MCP所必需的。重要的是,为了准确模拟目标RNA结构未知的情况,我们对MS2发夹序列中2 bp或更长的所有可能茎进行了补偿性突变分析(即不仅仅是已知结构)。通过计算将碱基连接对蛋白质结合的影响与序列变化的影响分离开来,我们能够清楚地将MS2发夹的两个真正茎与预测的其他茎区分开来。这是补偿性突变分析应用的一个重大进展,补偿性变异分析传统上仅用于逐个测试潜在茎。此外,这种在生物功能的直接背景下解剖二级结构的方法可能对lncRNA的研究特别有利。lncRNAs显示一级序列保守性低,推测结构保守性实际上驱动了保守性功能(65,66). 传统化学探测方法(67)已成功用于确定lncRNA结构,但通常需要进行广泛验证,以确定生成的结构模型是否与功能相关。这种MPRNA-IP方法通过直接分析潜在的二级结构破坏和恢复对蛋白质结合的影响来避免这个问题,通过其生物功能有效地识别结构。

成功建立了平铺和补偿性突变策略来识别蛋白结合RNA元件,我们接下来将MPRNA-IP应用于蛋白质TERT和人类端粒酶RNA(hTR)之间的相互作用,这是一种结合序列和结构要求的复杂RNA-蛋白质相互作用。使用平铺方法将RNA分割成不同的结构域,并对已知的RNA茎进行补偿性突变分析,我们能够确定CR4/5结构域中需要碱基连接才能与TERT结合的区域。我们的体内鉴定P6a、P6b和P6.1为TERT结合茎的结果与之前的结果一致在体外鉴定一个足以进行端粒酶活性的最小CR4/5结构域的结果,以及TERT-CR4/5界面的细节,这在最近发表的人类端粒酶高分辨率结构中很明显(68,69). 但值得注意的是,CR4/5结构的折叠已被证明受到端粒酶亚单位TCAB1的调节,而TCAB1又反过来影响TERT结合(47). 由于TCAB1与位于瓦片3中的hTR的H/ACA结构域结合,因此在我们的实验中没有考虑其对TERT结合的贡献。

与CR4/5结构域不同,我们在hTR的template-pseudoknot结构域中没有发现TERT结合的显著茎,但尽管该区域已知与TERT相互作用,这些结果与之前发布的数据一致。首先,之前的一项研究没有发现假结域突变对TERT相互作用的实质性抑制,因此也可能需要更大的突变或缺失来完全破坏TERT与假结的结合(48). 其次,最近发表的人类端粒酶的高分辨率冷冻电镜结构表明,TERT和假结之间的接触并不是均匀分布在假结的长度上(69). 在假结的P2茎中,与TERT的接触非常少,因此我们可以预计,该区域的大多数突变对TERT结合几乎没有影响。假结的另一半(P3茎)包含与TERT的广泛接触,但该区域也包含与假结环的几个碱基-三元相互作用。由于碱基三联体是高度序列特异性结构,我们可以预计,该区域补偿性突变体改变的P3干序列不会形成正确的碱基三连体结构,因此不会采用正确的TERT结合构象,这与我们在该地区观察到的缺乏强烈茎效应一致。此外,强大的干效应相对罕见,这可能并不奇怪,不仅在hTR中,而且在所有RNA中。已知许多大RNA在其功能蛋白结合位点之间含有长连接区(例如NORAD(70,71),酵母端粒酶RNA(41,72)、西斯特(73)),许多RNA-结合蛋白具有特定于序列的偏好,而不是二级结构(74). 因此,可以推断,蛋白质结合需要单独进行碱基布线的区域将相对罕见。蛋白质结合要求的这种复杂性进一步强调了在这些MPRNA-IP实验中使用定制序列库的优势。虽然补偿性突变分析是本研究中使用的最复杂的突变策略,但未来可以使用更复杂的策略来剖析需要序列和结构的相互作用,或包括内部缺失来评估长程相互作用。

最后,我们将MPRNA-IP应用于CTCF–RNA相互作用中,对于驱动它的RNA特征知之甚少。CTCF是一种高度保守的锌指蛋白,在染色质结构中发挥着重要作用。CTCF通过锌指结合基因组,识别核心11 bp基序上的几个变异(49,50),一些研究报道CTCF也能结合RNA(22–24,75–78). 例如,一个长的非编码RNA Jpx与CTCF相互作用,并将CTCF招募到小鼠胚胎干细胞的特定基因组位点(52,53). 然而,尽管CTCF CLIP数据显示CTCF与特定RNA结合(即与转录组的一大群子集不存在混杂关联),但尚未发现驱动CTCF结合RNA的序列基序。为了解决CTCF如何与RNA相互作用的问题,我们采用了拼接和突变MPRNA方法。与上次报告一致(23)我们的结果表明,CTCF以依赖RNA二级结构的方式与RNA结合,特别是与介导这种相互作用的RNA干结构结合。然而,我们承认,茎对相互作用的影响程度相对较弱。很可能CTCF-RNA相互作用不仅仅是由茎结构驱动的。因此,虽然这一新发现是理解CTCF和RNA之间关系的重要一步,但还需要更多的实验,特别是那些测试CTCF与RNA相互作用中序列和结构特征组合的实验。此外,郭和同事最近的工作(79)尽管许多其他人已经证明CTCF与RNA的直接相互作用(22–24,52,53,75–78). 鉴于我们的MPRNA-IP方法无法明确区分直接和间接RNA-蛋白质相互作用,这只能进一步强调需要更多的实验来研究CTCF和RNA之间的关系,超出我们在本研究中详细介绍的方法的可能范围。

尽管MPRNA-IP与类似分析相比具有优势,但在新系统中实施和解释MPRNA-ID时仍有重要考虑因素。首先,RNA表达可能与内源性环境不同,例如,在MPRNA-IP中,在RNA水平或RNA定位方面。因此,应该考虑过度表达的背景来解释MPRNA-IP获得的结果。此外,以前的研究在报告基因分析中观察到了细胞类型特异性活动,强调了选择合适的体内模型系统(80,81). 其次,当设计补偿突变来评估RNA碱基修饰对RNA–蛋白质相互作用的影响时,可以利用先前关于碱基修饰的实验信息来减少茎结构的测试次数。这些信息可以从基于SHAPE(通过引物延伸和突变分析的选择性2′-羟基酰化)的实验中获得,如SHAPE-MaP(82). 我们证实,通过将SHAPE反应性数据纳入保守的CR4/5 hTR区的干细胞预测管道,待测试的潜在干细胞结构的数量显著减少(83)(补充图S17). 第三,应该注意的是,我们目前用于评估二级结构的实现仅限于树干结构。虽然茎结构是RNA二级结构的重要组成部分,但已知其他结构如RNA G-四链体也参与RNA与蛋白质的相互作用(84). 在这种情况下,需要设计突变策略或处理破坏RNA结构的化学物质。第四,我们在这里介绍的MPRNA与甲醛-RIP的偶联最适合于研究已经被证实是直接的RNA与蛋白质的相互作用。虽然甲醛交联对多种类型的RNA-蛋白质相互作用有效(即抗假阴性),但它可以交联RNA-蛋白和蛋白质-蛋白质相互作用(即易出现假阳性)。因此,当预期存在间接相互作用时,应谨慎解释甲醛交联。但我们注意到,MPRNA-IP中的交联步骤可以根据感兴趣的蛋白质或研究目标进行调整。对于涉及间接相互作用的应用,最好将我们的MPRNA方法与涉及UV交联的IP协议配对。这种替代方法虽然对某些类型的RNA-蛋白质相互作用(如与dsRNA的相互作用)效率较低(32,33)(即使其易受假阴性),对RNA–蛋白质相互作用具有选择性(即抗假阳性)。此外,尽管交联细胞有助于避免天然RIP中细胞裂解后纯化过程中的离解和/或重新离解(85)天然RIP可用于研究相对较强的RNA-蛋白质相互作用。最后,Input和IP之间的富集程度差异取决于RNA-蛋白质的相互作用,需要在寡聚物池中进行足够的生物复制或控制瓦片。随着这些参数的调整,MPRNA-IP将成为一个强大的系统探测工具体内RNA–蛋白质以高通量和定量的方式相互作用。

数据可用性

当前研究期间生成的原始数据和处理数据可在NCBI GEO中获得,其登录ID为GSE221537。分析中使用的计算代码可根据要求(T.H.)或通过DOI:10.5281/zenodo.10633325获得(https://zenodo.org/doi/10.5281/zenodo.10633324).

补充数据

补充数据可从NAR Online获取。

致谢

我们感谢科罗拉多大学博尔德分校的Tom Cech和威尔康奈尔医学院的Yicheng Long对结果的讨论。我们感谢李伯大脑发育研究所的Joo Heon Shin提供测序资源。我们感谢科罗拉多大学博尔德分校的BioFrontiers Computing Core提供由BioFrontiers IT支持的高性能计算资源。我们也感谢约翰霍普金斯大学彭博公共卫生学院流式细胞术细胞分选核心设施的Hao Zhang和Joseph Margolick进行FACS分选。该设施由CFAR:5P30AI094189-04(Chaisson)、1S10OD016315-01和1S10RR13777001提供支持。

作者的贡献:T.H.和J.L.R.构思并指导了该研究。T.H.、E.P.H.、Y.H.L.和W.C.设计并执行了实验。Y.K.L.、E.L.和J.S.S.协助实验。T.H.开发了计算方法并进行了统计分析。T.H.、J.L.R、Y.H.L.和E.P.H.根据所有作者的意见撰写了手稿。

基金

美国国立卫生研究院/尼日利亚国立卫生研究院[R00 GM137072至T.H.]。开放存取费用资金:NIGMS[R00 GM137072]。

利益冲突声明。未声明。

参考文献

1

布莱克本
 
E.H.公司。
,
柯林斯
 
英国。
 
端粒酶:一种RNP酶合成DNA
.
冷泉港。透视。生物。
 
2011
;
:
a003558号
.

2

切赫
 
T.R.公司。
 
核糖体是一种核酶
.
科学类
.
2000
;
289
:
878
——
879
.

3

芥末
 
上午。
,
釜山
 
美国。
,
大米
 
总经理。
,
哈丁
 
首席执行官。
,
彼得森
 
英国。
,
鲁达
 
V.M.公司。
,
库比卡
 
N。
,
努蒂乌
 
R。
,
巴里扎
 
法学博士。
,
 
K.M.公司。
 
高分辨率SHAPE探针揭示mRNA结构的普遍调节功能
.
单元格
.
2018
;
173
:
181
——
195
.

4

德雷福斯
 
G.公司。
,
基姆
 
V.N.公司。
,
片冈
 
N。
 
信使RNA结合蛋白及其携带的信息
.
自然修订版分子细胞生物学。
 
2002
;
:
195
——
205
.

5

千斤顶
 
T。
,
马德哈尼
 
H.D.公司。
,
马西亚兹
 
F.R.公司。
,
Varmus公司
 
尊敬的。
 
肉瘤病毒gag-pol区核糖体移码信号
.
单元格
.
1988
;
55
:
447
——
458
.

6

布里埃利
 
一、。
,
迪加德
 
第页。
,
英格利斯
 
南卡罗来纳州。
 
高效冠状病毒核糖体移码信号的表征:RNA假结的必要性
.
单元格
.
1989
;
57
:
537
——
547
.

7

洛达
 
答:。
,
听到
 
E.公司。
 
Xist RNA的作用:过去、现在和未来
.
公共科学图书馆-遗传学。
 
2019
;
15
:
e1008333号
.

8

舒克拉
 
C.J.公司。
,
麦考金代尔
 
A.L.公司。
,
格哈丁格尔
 
C、。
,
科特豪尔
 
K.D.公司。
,
卡维利
 
制造商编号。
,
谢赫纳
 
D.M.公司。
,
爱尔兰语
 
注册会计师。
,
马斯
 
P.G.公司。
,
林恩
 
法学博士。
 
RNA核富集序列的高通量鉴定
.
EMBO J。
 
2018
;
37
:
e98452(电子98452)
.

9

卢贝尔斯基
 
年。
,
尤里斯基
 
一、。
 
富含Alu重复序列的序列驱动长RNA在人类细胞中的核定位
.
性质
.
2018
;
555
:
107
——
111
.

10

罗恩
 
M。
,
尤里斯基
 
一、。
 
序列元素对线性和圆形RNA亚细胞定位的上下文特异性影响
.
国家公社。
 
2022
;
13
:
2481
.

11

门多萨
 
美国。
,
冯·库格根
 
N。
,
柔道(Dantsuji)
 
美国。
,
罗恩
 
M。
,
布赖曼
 
L。
,
巴拉诺夫斯基
 
答:。
,
勒迪格
 
一、。
,
基什内尔
 
M。
,
费希尔
 
M。
,
策尔纳
 
N。
等。 
初级皮层神经元mRNA定位元件的大规模平行鉴定
.
自然神经科学。
 
2023
;
26
:
394
——
405
.

12

阿罗拉
 
答:。
,
卡斯特罗·古铁雷斯
 
R。
,
莫法特
 
C、。
,
埃莱托
 
D。
,
贝克尔
 
R。
,
棕色
 
M。
,
摩尔
 
阿联酋。
,
俄罗斯
 
高级管理人员。
,
塔利亚费罗
 
J.M.公司。
 
神经元细胞中RNA定位元件的高通量鉴定
.
核酸研究。
 
2022
;
50
:
10626
——
10642
.

13

米克尔
 
M。
,
埃莱托
 
D。
,
尼吉姆
 
M。
,
 
M。
,
拉夫齐
 
答:。
,
姆哈梅迪
 
F。
,
大卫
 
O。
,
赛因
 
S.B.公司。
,
处理程序
 
英国。
,
摩尔
 
阿联酋。
 
一项大规模平行报告分析揭示了神经元中集中且广泛编码的RNA定位信号
.
核酸研究。
 
2022
;
50
:
10643
——
10664
.

14

扎克曼
 
B。
,
罗恩
 
M。
,
米克尔
 
M。
,
西格尔
 
E.公司。
,
尤里斯基
 
一、。
 
基因结构和序列组成支持NXF1和TREX复合物上长RNA核输出的选择性依赖性
.
分子电池
.
2020
;
79
:
251
——
267
.

15

米克尔
 
M。
,
皮尔佩尔
 
年。
,
西格尔
 
E.公司。
 
人类细胞中程序化核糖体移码的高通量询问
.
国家公社。
 
2020
;
11
:
3061
.

16

Weingarten-Gabbay公司
 
美国。
,
埃利亚斯·基尔马
 
美国。
,
尼日尔
 
R。
,
格里岑科
 
答:。
,
斯特恩·吉诺萨尔
 
N。
,
亚基尼
 
Z.公司。
,
温伯格
 
答:。
,
西格尔
 
E.公司。
 
人类和病毒基因组中cap依赖性翻译序列的系统发现
.
科学类
.
2016
;
351
:
公元4939年
.

17

哈夫纳
 
M。
,
兰德塔勒
 
M。
,
汉堡
 
L。
,
科尔希德
 
M。
,
豪塞(Hausser)
 
J。
,
贝尔宁格
 
第页。
,
罗斯巴勒
 
答:。
,
阿斯卡诺
 
M。
,
Jungkamp公司
 
交流-交流。
,
穆绍尔
 
M。
等。 
用PAR-CLIP对RNA结合蛋白和microRNA靶位点的转录组全鉴定
.
单元格
.
2010
;
141
:
129
——
141
.

18

科尼格
 
J。
,
扎尔纳克
 
英国。
,
腐烂
 
G.公司。
,
科克
 
T。
,
凯伊奇
 
M。
,
祖潘
 
B。
,
特纳
 
D.J.公司。
,
卢斯科姆
 
N.M.(最小值)。
,
乌莱
 
J。
 
iCLIP揭示了hnRNP颗粒在单个核苷酸分辨率下的剪接功能
.
自然结构。分子生物学。
 
2010
;
17
:
909
——
915
.

19

范·诺斯特兰德
 
E.L.公司。
,
普拉特
 
总会计师。
,
希什金
 
答:。
,
Gelboin-Burkhart公司
 
C、。
,
 
M.Y.先生。
,
Sundararaman公司
 
B。
,
蓝色
 
S.M.公司。
,
阮(Nguyen)
 
T.B.公司。
,
苏尔卡
 
C、。
,
埃尔金斯
 
英国。
等。 
利用增强CLIP(eCLIP)在转录组范围内稳健发现RNA-结合蛋白结合位点
.
自然方法
.
2016
;
13
:
508
——
514
.

20

利卡塔洛西
 
D.D.公司。
,
梅勒
 
答:。
,
Fak公司
 
J.J.公司。
,
乌莱
 
J。
,
凯伊奇
 
M。
,
芝加哥
 
S.W.公司。
,
克拉克
 
T.A.公司。
,
施韦策
 
交流。
,
布鲁姆
 
J.E.公司。
,
 
十、。
等。 
HITS-CLIP为大脑选择性RNA处理提供全基因组见解
.
性质
.
2008
;
456
:
464
——
469
.

21

卢贝尔斯基
 
年。
,
扎克曼
 
B。
,
尤里斯基
 
一、。
 
RNA核富集序列中功能和蛋白质结合的高分辨率定位
.
EMBO J。
 
2021
;
40
:
电子106357
.

22

萨尔达纳·梅耶
 
R。
,
冈萨雷斯-布恩迪亚
 
E.公司。
,
格雷罗
 
G.公司。
,
纳伦德拉
 
五、。
,
博纳西奥
 
R。
,
雷西利亚斯·塔尔加
 
F。
,
莱因伯格
 
D。
 
CTCF通过与天然反义转录物Wrap53直接相互作用调节人类p53基因
.
基因发育。
 
2014
;
28
:
723
——
734
.

23

 
J.T.公司。
,
凯斯纳
 
B。
,
 
J.Y.(纽约)。
,
 
J.Y.(纽约)。
,
Cifuentes-Rojas公司
 
C、。
,
科洛尼奥里
 
D。
,
Jeon(吉恩)
 
年。
,
桑托
 
答:。
,
德尔罗萨里奥
 
公元前
,
品特牌手表
 
S.F.公司。
等。 
CTCF RNA相互作用组揭示X染色体的位点特异性靶向
.
分子电池
.
2015
;
57
:
361
——
375
.

24

萨尔达尼亚-迈耶
 
R。
,
罗德里格斯-赫内兹
 
J。
,
埃斯科瓦尔
 
T。
,
Nishana公司
 
M。
,
雅科梅·洛佩斯
 
英国。
,
诺拉
 
E.P.公司。
,
文莱
 
英国政府。
,
齐里戈斯
 
答:。
,
Furlan-Magaril公司
 
M。
,
斯科克
 
J。
等。 
RNA相互作用对CTCF介导的基因组组织至关重要
.
分子电池
.
2019
;
76
:
412
——
422
.

25

法学
 
C.W.公司。
,
 
年。
,
 
W。
,
斯迈思
 
G.K.(通用)。
 
voom:精确权重解锁用于RNA-seq读取计数的线性模型分析工具
.
基因组生物学。
 
2014
;
15
:
29兰特
.

26

罗宾逊
 
医学博士。
,
奥什拉克
 
答:。
 
RNA-seq数据差异表达分析的尺度归一化方法
.
基因组生物学。
 
2010
;
11
:
25兰特
.

27

朗费尔德
 
第页。
,
霍瓦思
 
美国。
 
WGCNA:加权相关网络分析的R包
.
BMC生物信息。
 
2008
;
9
:
559
.

28

橄榄岩
 
一、。
,
丹尼
 
S.K.公司。
,
瓦迪亚纳桑
 
P.P.公司。
,
贝克尔
 
W.R.公司。
,
安迪森
 
《法学杂志》。
,
莱顿
 
C.J.公司。
,
卡佩尔
 
英国。
,
Shivashankar公司
 
五、。
,
斯瑞尼瓦桑
 
R。
,
达斯
 
R。
等。 
人Pumilio蛋白与RNA结合的定量预测模型
.
分子电池
.
2019
;
74
:
966
——
981
.

29

贝利
 
T.L.公司。
,
约翰逊
 
J。
,
授予
 
首席执行官。
,
贵族
 
水蒸汽发生器。
 
MEME套件
.
核酸研究。
 
2015
;
43
:
第39周
——
第49周
.

30

 
十、。
,
 
美国。
,
月亮
 
H。
,
 
总工程师。
,
 
H.N.公司。
,
 
H。
 
R.-J.公司。
 
使用末端标记的生物素化RNA寡核苷酸和免疫印迹技术检测RNA-蛋白质相互作用
.
RNA-蛋白复合物和相互作用,分子生物学方法
.
2016
;
1421
:
纽约州
施普林格
35
——
44
.

31

 
年。
,
 
十、。
,
尤曼斯
 
D.T.公司。
,
切赫
 
T.R.公司。
 
lncRNAs如何调节转录?
.
科学。副词。
 
2017
;
:
eaao2110标准
.

32

基姆
 
B。
,
Jeong(郑)
 
英国。
,
基姆
 
V.N.公司。
 
主要microRNA和非经典底物上DROSHA裂解位点的全基因组定位
.
分子电池
.
2017
;
66
:
258
——
269
.

33

里奇
 
E.P.公司。
,
库库库尔
 
答:。
,
塞尼克
 
C、。
,
Mercier公司
 
公元前
,
辛格
 
G.公司。
,
海耶
 
例如。
,
阿沙尔·佩特尔
 
答:。
,
 
L。
,
摩尔
 
医学博士。
 
Staufen1感知整个转录物的二级结构以调节翻译
.
自然结构。分子生物学。
 
2014
;
21
:
26
——
35
.

34

加尔加诺
 
答:。
,
福雷尔
 
M。
,
贾斯基维奇
 
L。
,
卡尼茨
 
答:。
,
扎沃兰
 
M。
,
格伯
 
A.P.公司。
 
人类PUF家族蛋白mRNA靶点的比较分析表明与miRNA调节系统存在广泛的相互作用
.
公共科学图书馆一号
.
2008
;
:
电子3164
.

35

桑切斯·德·格罗
 
N。
,
阿玛奥斯
 
答:。
,
格拉纳·蒙特斯
 
R。
,
阿尔里奎特
 
M。
,
卡洛尼
 
G.公司。
,
Vabulas公司
 
相对湿度。
,
塔尔塔利亚
 
G.G.公司。
 
RNA结构驱动与蛋白质的相互作用
.
国家公社。
 
2019
;
10
:
3246
.

36

 
年。
,
 
英国。
,
 
质量控制。
,
弗林
 
注册会计师。
,
庄园
 
O。
,
欧阳
 
Z.公司。
,
 
J。
,
斯皮塔莱
 
钢筋混凝土。
,
斯奈德
 
M.P.(医学博士)。
,
西格尔
 
E.公司。
等。 
人类转录组RNA二级结构的景观和变异
.
性质
.
2014
;
505
:
706
——
709
.

37

泽曼
 
瑞典。
,
米尔扎
 
A.H.公司。
,
汉森
 
C、。
,
班贝特尔森
 
C.H.公司。
,
加德
 
C、。
,
克里斯滕森·戴尔加德
 
M。
,
托拉林森
 
E.公司。
,
姚明
 
Z.公司。
,
工人
 
C.T.公司。
,
波西奥特
 
F。
等。 
脊椎动物RNA保守结构的鉴定与功能注释
.
基因组研究。
 
2017
;
27
:
1371
——
1383
.

38

罗曼纽克
 
P.J.公司。
,
微量法
 
第页。
,
 
H.N.公司。
,
斯托莫
 
G.公司。
,
乌伦贝克
 
O.C.公司。
 
R17外壳蛋白的RNA结合位点
.
生物化学
.
1987
;
26
:
1563
——
1568
.

39

贝特朗
 
E.公司。
,
查特朗
 
第页。
,
谢弗
 
M。
,
谢诺伊
 
S.M.公司。
,
歌手
 
相对湿度。
,
 
相对湿度。
 
活酵母中ASH1 mRNA颗粒的定位
.
分子电池
.
1998
;
2
:
437
——
445
.

40

发货人伦茨
 
D。
,
布莱克本
 
E.H.公司。
 
端粒酶中RNA模板的功能证据
.
科学类
.
1990
;
247
:
546
——
552
.

41

扎普拉
 
哥伦比亚特区。
,
切赫
 
T.R.公司。
 
酵母端粒酶RNA:蛋白质亚基的柔性支架
.
程序。国家。阿卡德。科学。美国。
 
2004
;
101
:
10024
——
10029
.

42

 
法学博士。
,
布拉斯科
 
文学硕士。
,
格雷德
 
C.W.公司。
 
脊椎动物端粒酶RNA的二级结构
.
单元格
.
2000
;
100
:
503
——
514
.

43

米切尔
 
J.R.公司。
,
柯林斯
 
英国。
 
人类端粒酶激活需要端粒酶RNA和端粒酶逆转录酶之间的两个独立相互作用
.
分子电池
.
2000
;
6
:
361
——
371
.

44

梅福德
 
文学硕士。
,
扎普拉
 
哥伦比亚特区。
 
人类端粒酶RNA环状排列的物理连接性映射揭示了对活性和加工性至关重要的新区域
.
分子细胞。生物。
 
2016
;
36
:
251
——
261
.

45

 
J。
,
棕色
 
空军。
,
 
J。
,
 
J。
,
布莱
 
C.J.公司。
,
兰德
 
D.P.公司。
,
 
L。
,
 
R。
,
 
J.J.-L.公司。
,
 
M。
 
端粒酶中蛋白质RNA识别的结构基础
.
自然结构。分子生物学。
 
2014
;
21
:
507
——
512
.

46

阮(Nguyen)
 
T.H.D.公司。
,
Tam公司
 
J。
,
 
注册会计师。
,
格雷贝尔
 
B.J.公司。
,
托索
 
D。
,
诺盖尔斯
 
E.公司。
,
柯林斯
 
英国。
 
底物结合人端粒酶全酶的冷冻电镜结构
.
性质
.
2018
;
557
:
190
——
195
.

47

 
L。
,
罗克
 
客户经理。
,
弗伦德
 
答:。
,
巴蒂斯塔
 
P.J.公司。
,
 
美国。
,
 
Y.A.公司。
,
加杰拉
 
首席风险官。
,
 
美国。
,
 
B。
,
佩奇
 
M.F.(货币基金组织)。
等。 
基于RNA构象并由TCAB1形成的人类端粒酶活性开关
.
单元格
.
2018
;
174
:
218
——
230
.

48

罗巴特
 
阿拉伯联合酋长国。
,
柯林斯
 
英国。
 
利用疾病相关亚基变体研究人类端粒酶全酶的组装、活性和加工性
.
生物学杂志。化学。
 
2010
;
285
:
4375
——
4386
.

49

菲利普斯
 
J.E.公司。
,
科尔塞斯
 
副总经理。
 
CTCF:基因组编织大师
.
单元格
.
2009
;
137
:
1194
——
1211
.

50

基姆
 
T.H.公司。
,
阿卜杜拉耶夫
 
Z.K.公司。
,
史密斯
 
公元前。
,
Ching(清)
 
K.A.公司。
,
卢基诺夫
 
D.I.公司。
,
绿色
 
钢筋混凝土。
,
 
M.Q.公司。
,
洛巴连科夫
 
V.V.公司。
,
 
B。
 
人类基因组中脊椎动物绝缘体蛋白CTCF结合位点的分析
.
单元格
.
2007
;
128
:
1231
——
1245
.

51

伦达
 
M。
,
巴利沃
 
一、。
,
伯吉斯-贝斯
 
B。
,
埃斯波西托
 
美国。
,
法托鲁索
 
R。
,
费森菲尔德
 
G.公司。
,
佩多内
 
P.V.公司。
 
绝缘体蛋白CTCF的关键DNA结合相互作用:少量锌指介导强结合,单指DNA相互作用控制印迹位点的结合
.
生物学杂志。化学。
 
2007
;
282
:
33336
——
33345
.

52

太阳
 
美国。
,
德尔罗萨里奥
 
公元前
,
桑托
 
答:。
,
小川
 
年。
,
Jeon(吉恩)
 
年。
,
 
J.T.公司。
 
Jpx RNA通过抑制CTCF激活Xist
.
单元格
.
2013
;
153
:
1537
——
1551
.

53

 
H.J.公司。
,
阿吉拉尔
 
R。
,
凯斯纳
 
B。
,
 
高-高。
,
克里兹
 
A.J.公司。
,
 
高压-高压。
,
 
J.T.公司。
 
Jpx RNA调节CTCF锚定位点的选择和染色体环的形成
.
单元格
.
2021
;
184
:
6157
——
6173
.

54

诺拉
 
E.P.公司。
,
卡恰尼尼
 
L。
,
弗得伯格
 
G.公司。
,
所以
 
英国。
,
Kameswaran公司
 
五、。
,
纳格尔
 
答:。
,
尤伯森
 
答:。
,
朝觐
 
B。
,
 
A.L.公司。
,
库隆
 
答:。
等。 
基因组折叠中CTCF结合极性的分子基础
.
国家公社。
 
2020
;
11
:
5612
.

55

洛伦茨
 
R。
,
伯恩哈特
 
S.H.公司。
,
霍纳·祖·西德德斯坦
 
C、。
,
塔弗
 
H。
,
弗拉姆
 
C、。
,
斯塔德勒
 
功率因数。
,
霍法克
 
身份识别码。
 
维也纳RNA软件包2.0
.
算法分子生物学。
 
2011
;
6
:
26
.

56

马哈茂迪
 
美国。
,
亨芮科桑
 
美国。
,
科克兰
 
M。
,
梅恩德斯·维达尔
 
C、。
,
维曼
 
K.G.公司。
,
法尔内博
 
M。
 
Wrap53,DNA损伤时诱导p53所需的天然p53反义转录物
.
分子电池
.
2009
;
33
:
462
——
471
.

57

图尔克
 
C、。
,
黄金
 
L。
 
指数富集配体的系统进化:噬菌体T4 DNA聚合酶的RNA配体
.
科学类
.
1990
;
249
:
505
——
510
.

58

艾灵顿
 
公元前。
,
绍斯塔克
 
J.W.公司。
 
结合特定配体的RNA分子的体外筛选
.
性质
.
1990
;
346
:
818
——
822
.

59

 
D。
,
喀山
 
H。
,
 
E.T.公司。
,
卡斯蒂略
 
L.P.有限责任公司。
,
乔杜里
 
美国。
,
塔卢克
 
美国。
,
布伦科
 
B.J.公司。
,
莫里斯
 
问:。
,
休斯
 
T.R.公司。
 
RNA-结合蛋白RNA识别特异性的快速系统分析
.
自然生物技术。
 
2009
;
27
:
667
——
670
.

60

汤姆
 
J.M.公司。
,
奥泽
 
答:。
,
帕加诺
 
J.M.公司。
,
盖巴
 
D。
,
施洛斯
 
G.P.公司。
,
Lis公司
 
J.T.公司。
 
通过高通量序列分析RNA与蛋白质的相互作用
.
自然方法
.
2014
;
11
:
683
——
688
.

61

布恩罗斯特罗
 
J.D.(医学博士)。
,
奇尔库斯
 
L.M.有限公司。
,
阿拉亚
 
C.L.公司。
,
莱顿
 
C.J.公司。
,
 
香港。
,
斯奈德
 
M.P.(医学博士)。
,
格林利夫
 
W.J.公司。
 
大规模平行阵列上RNA-蛋白质相互作用的定量分析,用于绘制生物物理和进化景观
.
自然生物技术。
 
2014
;
32
:
562
——
568
.

62

兰伯特
 
N。
,
罗伯逊
 
答:。
,
詹吉
 
M。
,
麦盖里
 
美国。
,
夏普
 
私人助理。
,
伯格
 
中央银行。
 
RNA结合-n-Seq:定量评估RNA结合蛋白的序列和结构结合特异性
.
分子电池
.
2014
;
54
:
887
——
900
.

63

Guenther公司
 
U.-P.公司。
,
Yandek公司
 
有限责任公司。
,
尼兰德
 
C.N.公司。
,
坎贝尔
 
F.E.公司。
,
安德森
 
D。
,
安德森
 
V.E.公司。
,
哈里斯
 
机械工程师。
,
扬科夫斯基
 
E.公司。
 
一种明显非特异性RNA结合蛋白的潜在特异性
.
性质
.
2013
;
502
:
385
——
388
.

64

戈德斯特罗姆
 
交流。
,
霍尔
 
T.M.T.公司。
,
麦肯尼
 
K.M.公司。
 
哺乳动物Pumilio蛋白的转录后调节功能
.
趋势Genet。
 
2018
;
34
:
972
——
990
.

65

史密斯
 
文学硕士。
,
格塞尔
 
T。
,
斯塔德勒
 
功率因数。
,
马蒂克
 
J.S.公司。
 
哺乳动物RNA结构的广泛纯化选择
.
核酸研究。
 
2013
;
41
:
8220
——
8236
.

66

尤里斯基
 
一、。
,
舒马塔瓦
 
答:。
,
 
C.H.公司。
,
Sive公司
 
H。
,
巴特尔
 
D.P.公司。
 
尽管序列进化迅速,lincRNAs在脊椎动物胚胎发育中的保守功能
.
单元格
.
2011
;
147
:
1537
——
1550
.

67

久保田
 
M。
,
Tran公司
 
C、。
,
斯皮塔莱
 
钢筋混凝土。
 
活细胞内RNA结构化学探测的进展与挑战
.
自然化学。生物。
 
2015
;
11
:
933
——
941
.

68

基姆
 
不适用-适用。
,
Theimer公司
 
首席执行官。
,
米切尔
 
J.R.公司。
,
柯林斯
 
英国。
,
费贡
 
J。
 
假尿苷化对人端粒酶RNA中催化必需P6.1发夹结构和活性的影响
.
核酸研究。
 
2010
;
38
:
6746
——
6756
.

69

线路接口单元
 
B。
,
 
年。
,
 
年。
,
歌曲
 
H。
,
 
Z.H.公司。
,
费贡
 
J。
 
端粒保护蛋白TPP1与活性端粒酶的结构
.
性质
.
2022
;
604
:
578
——
583
.

70

埃尔金迪
 
医学硕士。
,
科普
 
F。
,
古达尔齐
 
M。
,
雷菲尔德
 
F。
,
托马斯
 
答:。
,
 
T.-C.公司。
,
孟德尔
 
J.T.公司。
 
非编码RNA NORAD调控基因组稳定性需要PUMILIO而非RBMX结合
.
电子生活
.
2019
;
8
:
e48625电话
.

71

 
美国。
,
科普
 
F。
,
 
T.-C.公司。
,
萨塔鲁里
 
答:。
,
 
B。
,
西瓦库马
 
美国。
,
 
H。
,
 
年。
,
孟德尔
 
J.T.公司。
 
非编码RNA NORAD通过隔离PUMILIO蛋白调节基因组稳定性
.
单元格
.
2016
;
164
:
69
——
80
.

72

扎普拉
 
哥伦比亚特区。
,
古德里奇
 
英国。
,
切赫
 
T.R.公司。
 
一种小型酵母端粒酶RNA在体内的功能和体外的活性重建
.
自然结构。分子生物学。
 
2005
;
12
:
1072
——
1077
.

73

 
C、。
,
 
质量控制。
,
达罗查
 
S.T.公司。
,
弗林
 
注册会计师。
,
巴拉德瓦杰
 
M。
,
卡拉布雷斯
 
J.M.公司。
,
马格努森
 
T。
,
听到
 
E.公司。
,
 
香港。
 
Xist RNA结合蛋白的系统发现
.
单元格
.
2015
;
161
:
404
——
416
.

74

科利
 
M。
,
烧伤
 
M.C.公司。
,
Yeo(Yeo)
 
G.W.公司。
 
RNA结合蛋白如何与RNA相互作用:分子和机制
.
分子电池
.
2020
;
78
:
9
——
29
.

75

姚明
 
H。
,
 
英国。
,
埃夫拉德
 
年。
,
 
T。
,
卡梅里尼·奥特罗
 
钢筋混凝土。
,
费森菲尔德
 
G.公司。
 
DEAD-box RNA结合蛋白p68和类固醇受体RNA激活剂SRA介导CTCF转录隔离
.
基因发育。
 
2010
;
24
:
2543
——
2555
.

76

Oksuz公司
 
O。
,
亨宁格
 
J.E.公司。
,
华纳福德-汤姆森
 
R。
,
 
医学硕士。
,
Erb公司
 
H。
,
万库拉
 
答:。
,
过压
 
K.J.公司。
,
霍肯
 
S.W.公司。
,
巴纳尼
 
S.F.公司。
,
劳曼
 
R。
等。 
转录因子与RNA相互作用调节基因
.
分子电池
.
2023
;
83
:
2449
——
2463
.

77

汉森
 
美国。
,
 
T.-H.S.公司。
,
卡托利奥
 
C、。
,
普斯托瓦
 
一、。
,
萨尔达纳·梅耶
 
R。
,
莱因伯格
 
D。
,
达尔扎克
 
十、。
,
特建
 
R。
 
CTCF中一个RNA-结合区的缺失揭示了不同类别的染色质环
.
分子电池
.
2019
;
76
:
395
——
411
.

78

 
C、。
,
西多利
 
美国。
,
华纳福德-汤姆森
 
R。
,
塔托梅尔
 
哥伦比亚特区。
,
威卢斯
 
J.E.公司。
,
加西亚
 
文学学士。
,
博纳西奥
 
R。
 
胚胎干细胞核蛋白组RNA结合区的高分辨率定位
.
分子电池
.
2016
;
64
:
416
——
430
.

79

 
J.K.(英国)。
,
布兰科
 
M.R.公司。
,
沃尔库普
 
W.G.公司。
,
骨鳗
 
G.公司。
,
乌尔维纳提
 
首席风险官。
,
班纳吉
 
英国。
,
食物
 
答:。
,
埃特林
 
O。
,
施特雷勒
 
M。
,
佩达
 
第页。
等。 
变性纯化表明PRC2和其他广泛报道的染色质蛋白似乎不直接与RNA结合体内
.
分子电池
.
2024
;
84
:
1271
——
1289
.

80

穆苏努鲁
 
英国。
,
强大
 
答:。
,
弗兰克·卡梅内茨基
 
M。
,
 
东北部。
,
阿费尔特
 
T。
,
萨克斯
 
K.V.公司。
,
 
十、。
,
 
H。
,
库珀瓦瑟
 
N。
,
鲁达
 
V.M.公司。
等。 
通过1p13胆固醇位点的SORT1从非编码变异到表型
.
性质
.
2010
;
466
:
714
——
719
.

81

桑卡兰
 
副总经理。
,
路德维希
 
L.S.公司。
,
西钦斯卡
 
E.公司。
,
 
J。
,
鲍尔
 
D.E.公司。
,
工程
 
J.C.公司。
,
帕特森
 
高压断路器。
,
梅特卡夫
 
注册会计师。
,
纳特库南
 
年。
,
奥尔金
 
S.H.公司。
等。 
细胞周期蛋白D3在分化过程中协调细胞周期以调节红细胞大小和数量
.
基因发育。
 
2012
;
26
:
2075
——
2087
.

82

齐格弗里德
 
不适用。
,
釜山
 
美国。
,
大米
 
总经理。
,
纳尔逊
 
《亚洲期刊》。
,
 
K.M.公司。
 
通过SHAPE和突变分析发现RNA模体(SHAPE-MaP)
.
自然方法
.
2014
;
11
:
959
——
965
.

83

帕尔卡
 
C、。
,
福里诺
 
N.M.(最小值)。
,
亨切尔
 
J。
,
达斯
 
R。
,
石头
 
医学博士。
 
人类端粒酶RNA三向连接的折叠异质性
.
核糖核酸
.
2020
;
26
:
1787
——
1800
.

84

大仲马
 
L。
,
赫维奥
 
第页。
,
达西
 
E.公司。
,
卡马
 
答:。
,
Millevoi公司
 
美国。
 
RNA生物学中的G-四倍体:最新进展和未来方向
.
生物化学趋势。科学。
 
2021
;
46
:
270
——
283
.

85

米利
 
美国。
,
斯泰兹
 
J.A.公司。
 
细胞裂解后RNA结合蛋白重新结合的证据:对免疫沉淀分析的解释意义
.
核糖核酸
.
2004
;
10
:
1692
——
1694
.

作者注释

前两位作者应被视为联合第一作者。

这些作者共同指导了这项工作:John L.Rinn和Taeyong Hwang。

这是一篇根据知识共享署名-非商业许可条款发布的开放存取文章(https://creativecommons.org/licenses/by-nc/4.0/)它允许在任何媒体上进行非商业性重复使用、分发和复制,前提是正确引用了原始作品。如需商业再使用,请联系journals.permissions@oup.com

补充数据

评论

0条评论
提交评论
您输入的代码无效
感谢您对本文发表评论。您的评论将由杂志自行审查并发表。请通过电子邮件查看更多通知。