跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2022年10月14日;50(18):10643-10664.
doi:10.1093/nar/gkac806。

一项大规模平行报告分析揭示了神经元中集中且广泛编码的RNA定位信号

附属公司

一项大规模平行报告分析揭示了神经元中集中且广泛编码的RNA定位信号

马丁·米克尔等。 核酸研究. .

摘要

非对称亚细胞mRNA定位允许基因表达的空间调控和功能分区。在神经元中,特定mRNA定位到神经突对细胞功能至关重要。然而,转录物排序是如何以序列特定的方式工作的,这在很大程度上是未知的。在这里,我们结合了亚细胞转录组学和大规模平行报告分析,并测试了约50000个序列定位到神经突的能力。绘制>的本地化潜力;300个基因揭示了实现轴突靶向的两种途径:集中定位基序和广泛编码的定位潜能。我们描述了RNA稳定性和定位之间的相互作用,并确定了能够将定位偏向神经突或胞体的基序,以及它们的作用所需的反作用因子。基于我们的数据,我们设计了能够预测新报告序列定位行为的机器学习模型。在天然mRNA测序数据上测试该预测因子表明,预测的定位潜力与观察到的定位潜力非常一致,这表明我们的MPRA揭示的规则也适用于天然全长转录物的定位。

PubMed免责声明

数字

图1。
图1。
神经元中RNA定位的大规模平行报告基因测定。(A类)实验大纲。在CMV启动子下游克隆了一个寡核苷酸文库(包含用于扩增的通用引物(2×18nt)、一个5′条形码(12nt)和一个150nt可变的3′UTR区域,并在CMV的启动子下游构建了一个DNA文库绿色荧光粉多聚腺苷化位点的编码序列和上游。对于RNA定位测量(左),将最终的报告文库转染到生长在微孔膜上的分化神经元细胞系中,收集并测序来自胞体和轴突室的报告RNA,从而测量轴突室和胞体室中每个文库变体的富集程度。为了进行RNA稳定性测量,将报告文库转染到分化的神经元细胞系中,然后使用放线菌素D进行转录抑制,并在BC 0、4或24小时后收集并测序报告RNA:条形码;pA位点:聚腺苷化位点。(B)CAD(红色)和Neuro-2a细胞(黄色)中测量的对数FC(突起/胞体)密度图;n个=47 347。(C类)将在CAD细胞中测量的logFC(轴突/胞体)与在Neuro-2a细胞中针对相同序列测量的logFC、针对所有测试序列(浅蓝色,n个=47 347)或仅具有统计学显著富集(神经突或胞体,P(P)=0.05),n个 = 3412). (D类)CAD细胞中测量的logFC(4 h/0 h放线菌素D)(黄色)或logFC(24 h/0小时放线菌素D)(红色)的密度图;n个=13753,两者均适用。(E类)logFC(4 h/0 h放线菌素D)与logFC(24 h/0小时放线菌素D)在CAD细胞中测量的相同序列、所有测试序列(浅蓝色、,n个=13 753)或仅对RNA水平有统计学显著影响(4小时和24小时,P(P) = 0.05; 红色,n个 = 2542). (F类)logFC(4小时/0小时放线菌素D)测量值与CAD细胞中测定的logFC(神经突/胞体)进行对比;logFC(neurite/soma)<0的库变体以浅蓝色显示,相应的趋势线以橙色显示,logFC(neurite/somea)>0的库变体则以深蓝色显示,对应的趋势线则以红色显示(n个 = 13 753).
图2。
图2。
突起富集转录物的子集在其3′UTR中包含聚焦定位区域。(A类)内源性基因3′UTR的拼接;在终止密码子之后立即开始,对150nt的片段进行隔离测试,两个相邻块之间的距离为50nt,从而在相邻块之间创建100nt的序列重叠。(B,C类)测量(上面板:logFC(神经突/躯体),下面板:–log10(P(P)-用CAD(红色)和Neuro-2a(黄色)细胞测量沿Shank1(B)和Camk2a(C)的3′UTR的瓷砖的效果,乘以logFC的符号;灰色水平带表示面积P(P) > 0.05; 面板F和G中显示了smFISH验证的位置,如下所示。(D类)维恩图显示了在测试的3′UTR中识别的神经突起定位信号的唯一和重叠峰的数量。(E类)平均值z(z)-根据平均值绘制轴突定位峰值处logFC(4小时/0小时放线菌素D)的得分z(z)-CAD细胞中logFC(神经突起/胞体)评分;n个 = 77). (F类,G公司)对于选定的轴突定位(Camk2a,Shank1)或胞体限制(St6gal1,Ogt)文库序列的smFISH图像(F)和定量(G),成像和定量的个体3′UTR报告子对应于图B和C中所示的瓦片。
图3。
图3。
3′UTR片段重述了内源性转录物的定位行为。(A类)测量(上面板:logFC(神经突/躯体),下面板:–log10(P(P)-用CAD(红色)和Neuro-2a(黄色)细胞测量沿Shank3的3′UTR的瓷砖,乘以logFC的符号。(B,C类)CAD(红色)和Neuro-2a(黄色)细胞中测得的logFC(神经突起/胞体)与–log相对应10(P(P)-值),对于具有增加的轴突定位潜能的定义区域(Shank1,B,top)的基因,具有广泛编码的定位潜能的基因(Shank3,B,bottom)或内源性RNA-seq数据中没有轴突定位证据的基因(C)。(D类)P(P)-显示了所示基因的所有分片的富集分数值(符号表示logFC的方向);上面给出的统计数据(偏斜和相关的p值)在面板E中用于基因分类。(E类)倒置图显示属于指定类别的基因数量和它们之间重叠的大小(用于测量CAD细胞中的logFC(神经突/体))。(F类)每个数据点表示与取自同一天然3′UTR的片段相对应的所有瓷砖的平均logFC(神经突/胞体),并显示出任何隔室(神经突或胞体)的统计显著富集,P(P) = 0.05); 根据logFC(神经突/体细胞)将这些基因按20组进行排序,根据Taliaferro的测量,从神经突中的最高值(“1/6”)到最低值(“6/6”)等。(44)CAD(左)、Neuro-2a细胞(中)或皮层神经元(右)。(G公司)每个数据点代表与取自同一天然3′UTR的片段相对应的所有瓷砖的分数,该片段在CAD细胞的体细胞室中显示出统计上显著的富集;根据logFC(神经突/体细胞)将这些基因按20组进行排序,根据Taliaferro的测量,从神经突中的最高值(“1/6”)到最低值(“6/6”)等。(44)用于CAD单元。(H(H))在CAD(左)和Neuro-2a细胞(右)中,针对特定基因(x轴)测量的所有瓷砖中,神经突显著富集的瓷砖比例与针对相同基因(y轴)测得的所有瓷砖中体细胞显著富集的砖比例相比较;红色表示属于神经突中存在最多的组的基因(图F和G中的‘1/6’),蓝色表示属于神经突中存在最少的组的遗传基因(图G和F中的‘6/6’)等。(44)CAD(左)或Neuro-2a细胞(右)。I.对于CAD(左)和Neuro-2a细胞(右),根据面板E中的类别(未富含轴突、广泛编码的轴突定位电位或聚焦定位信号(>0峰值)),分别绘制特定基因测量的所有瓷砖中体细胞显著富集的瓷砖分数。
图4。
图4。
单个RBP基序只能阻止但不能加强轴突定位。(A类)根据在Neuro-2a细胞中测量的相同累计RBP得分和logFC(神经突/体)之间的Pearson相关系数,绘制了从CAD细胞中测量到的本地3′UTR和logFC的所有库序列中RBP累积结合得分之间的Pear相关系数。(B)RBP与logFC(4 h/0 h放线菌素D)的累积结合分数之间的Pearson相关系数的分布分别显示了RBP的累积基序分数与CAD细胞中logFC(突起/胞体)的负相关或正相关。(C类)可用RNA-seq数据集的生物信息学分析示意图,以识别富含体细胞或神经突起转录组的RBP基序;然后,这些基序要么在本地3′UTR中突变,要么插入本地3′UTR上下文中。(D类)每个数据点显示了多达973个本地序列中特定基序缺失对CAD细胞logFC(神经突/胞体)的平均影响,这些基序与相关的p值(Wilcoxon符号秩检验)相对应,而这些基序在神经突(红色)或胞体(蓝色)RNA-seq数据集中富集(Middleton等。、扎普洛等。). (E类)每个数据点显示了CAD细胞中多达187个本地序列中插入特定基序对logFC(神经突/体)的平均影响,并与相关的P(P)-值(Wilcoxon符号秩检验),用于在神经突(红色)或胞体(蓝色)RNA-seq数据集中富集的基序(Middleton等人,Zappulo等。). (F类)当插入序列0-4次时,AGGUAA基序对logFC(轴突/体)的平均影响;n个=133、20、153、16和17。(G公司,H(H))两个未插入(绿色)或插入四个AGGUAA基序的单个3′UTR报告子的smFISH图像(G)和细胞核/细胞质荧光强度(H)量化(红色,见面板F中相应的MPRA数据)。()对照组和不同RNAi条件下插入天然3′UTR的所有基序的平均效应大小分布;红色垂直线表示AGGUAA图案在不同条件下的平均效果。
图5。
图5。
合成序列可以驱动RNA定位到神经突。(A类)可用RNA-seq数据集的生物信息学分析示意图,以确定富含体细胞或轴突转录组的一致序列;然后将这些基序插入到本地3′UTR上下文中。(B)每个数据点显示了在CAD(红色)和Neuro-2a(黄色)细胞中,根据相关的p值(Wilcoxon符号秩检验)绘制的多达69个本地序列中插入合成序列对logFC(轴突/体)的平均影响。(C类)在CAD细胞中插入合成序列对logFC(轴突/体)的平均影响与Neuro-2a细胞中相同基序的影响相对应。(D类)未插入(蓝色)或插入(橙色)指定合成序列的天然3′UTR序列的logFC(神经突/体细胞)分布;该行表示没有或带有motif插入的对应序列对。(E类)在MPRA中显示胞体富集、无富集或突起富集的SU1基序的平均出现次数和95%置信区间。(F类)根据Taliaferro的测量,SU1基序的平均出现次数和对体细胞(logFC(neurite/soma)<0)或轴突定位(logFC)>0)有偏见的基因的95%置信区间等。(44)CAD(蓝色)、Neuro-2a细胞(橙色)或皮层神经元(绿色)。(G公司)灰色线显示了CAD和Neuro-2a细胞中所测得的相邻细胞的logFC(轴突/体)的运行平均值,适用于所示基因3′UTR的所有位置;蓝色圆点表示与SU1共识序列的匹配,x轴表示匹配的开始位置,右侧(蓝色)y轴表示匹配分数。
图6。
图6。
质谱分析揭示了与SU1合成转录物结合并调节其轴突定位潜能的蛋白质。(A类)SU1示意图体外质谱分析的转录和下拉实验。(B)CAD细胞中跨样本spearman相关性的热图。(C类)CAD细胞中的差异蛋白下拉分析。(D类)维恩图显示了CAD和N2A细胞中显著下拉的蛋白质与SU1探针的交叉点,以及典型小鼠RBP的注释列表(63)。(E类)显著下调蛋白(两种细胞系)的曼哈顿基因集富集分析图(g:Profiler,(68));图例中突出显示了特别感兴趣的基因集。点大小是指基因集的成员数。x轴表示按数据源分组和彩色编码的功能术语。y轴以负log10刻度显示调整后的富集p值。(F类)对照组和不同RNAi条件下插入天然3′UTR的所有模体的平均效应大小分布(在引入或不引入特定模体的成对序列中logFC(轴突/体)的平均变化);正值表示一个基序对平均偏倚定位于神经突起,负值表明一个基模对平均偏爱定位于躯体,值在0左右表示该基序没有作用;红色垂直线代表SU1基序在不同条件下的平均效果;SU1基序插入在相应条件下的效果的p值(Wilcoxon符号秩检验)如上所示。
图7。
图7。
MPRA训练的模型预测内源性3′UTR的亚细胞定位。(A类)预测策略概述。(B)接收机工作特性(ROC)曲线,显示了在90%的库序列上训练的分类器的性能,这些序列通过了过滤(至少500个UMI读取),并在剩余的10%上进行了测试(n个 = 3674; 持有的测试数据),使用累积RBP基序得分或四聚体计数作为特征;auROC:ROC曲线下的面积。(C类)接收器操作特征(ROC)曲线显示了分类器的性能,该分类器训练的所有文库序列中有90%通过了4924个基因的过滤和测试,这些基因的CAD细胞中轴突/体的分布已事先确定(44);根据预测神经突起富集(左)、体细胞富集(中)或两者的联合输出(右)的模型,该预测构成了对150个天然3′UTR个体的联合预测。
图8。
图8。
本地化潜力是一个小贡献的总和。(A类)促进轴突定位的序列元件(红色小箭头)沿3′UTR长度编码,促进转录物向轴突的富集(红色大箭头)。(B)促进轴突(红色小箭头)和胞体(蓝色小箭头)的序列元件的贡献相互中和,导致转录物限制在胞体上(蓝色大箭头)。(C类)促进轴突定位的序列元件突变(“X”)(红色小箭头)可以消除轴突中转录物的富集。(D类)引入促进体细胞限制的序列元件(蓝色小箭头)可以防止定位到神经突。

类似文章

引用人

  • 具有进化特征的非编码区的罕见变异导致自闭症谱系障碍风险。
    Shin T、Song JHT、Kosicki M、Kenny C、Beck SG、Kelley L、Antony I、Qian X、Bonacina J、Papandile F、Gonzalez D、Scotellaro J、Bushinsky EM、Andersen RE、Maury E、Pennacchio LA、Doan RN、Walsh CA。 Shin T等人。 细胞基因组。2024年8月14日;4(8):100609. doi:10.1016/j.xgen.2024.100609。Epub 2024年7月16日。 细胞基因组。2024 PMID:39019033 免费PMC文章。
  • 对广泛RNA定位基础的机械见解。
    Chekulaeva M。 Chekulaeva M。 自然细胞生物学。2024年7月;26(7):1037-1046. doi:10.1038/s41556-024-01444-5。Epub 2024年7月2日。 自然细胞生物学。2024 PMID:38956277 审查。
  • RNA定位机制超越了细胞形态。
    Goering R、Arora A、Pockalny MC、Taliaferro JM。 Goering R等人。 埃利夫。2023年3月3日;12:e80040。doi:10.7554/eLife.80040。 埃利夫。2023 PMID:36867563 免费PMC文章。
  • 初级皮层神经元中mRNA定位元件的大规模平行鉴定。
    Mendonsa S、von Kügelgen N、Dantsuji S、Ron M、Breimann L、Baranovskii A、Lödige I、Kirchner M、Fischer M、Zerna N、Bujanic L、Mertins P、Ulitsky I、Chekulaeva M。 Mendonsa S等人。 自然神经科学。2023年3月;26(3):394-405. doi:10.1038/s41593-022-01243-x.Epub 2023年1月16日。 自然神经科学。2023 PMID:36646877 免费PMC文章。
  • 神经元细胞中RNA定位元件的高通量鉴定。
    Arora A、Castro-Gutierrez R、Moffatt C、Eletto D、Becker R、Brown M、Moor AE、Russ HA、Taliaferro JM。 Arora A等人。 《核酸研究》2022年10月14日;50(18):10626-10642. doi:10.1093/nar/gkac763。 核酸研究2022。 PMID:36107770 免费PMC文章。

工具书类

    1. Lécuyer E.、Yoshida H.、Parthasarathy N.、Alm C.、Babak T.、Cerovina T.、Hughes T.R.、Tomancak P.、Krause H.M.。mRNA定位的全球分析揭示了mRNA在组织细胞结构和功能中的重要作用。单元格。2007; 131:174–187.-公共医学
    1. Mili S.,Moissoglu K.,Macara I.G.。全基因组筛查显示APC相关RNA在细胞突起中富集。自然。2008; 453:115–119.-项目管理咨询公司-公共医学
    1. Moor A.E.、Golan M.、Massasa E.E.、Lemze D.、Weizman T.、Shenhav R.、Baydatch S.、Mizrahi O.、Winkler R.、GolaniO.et公司所有。。整体mRNA极化调节肠上皮的翻译效率。科学。2017; 357:1299–1303.-项目管理咨询公司-公共医学
    1. Das S.、Vera M.、Gandin V.、Singer R.H.、Tutucci E.,《细胞内mRNA转运和定位翻译》。自然修订版分子细胞生物学。2021; 22:483–504.-项目管理咨询公司-公共医学
    1. Blower M.D.Jeon K.W.第一章:细胞内RNA定位的分子见解。细胞和分子生物学国际评论。2013; 302:学术出版社;1–39.-项目管理咨询公司-公共医学

出版物类型