小鼠衰老细胞图谱分析揭示了整体和细胞类型特定的衰老特征

  1. 马丁·金叶(Martin Jinye Zhang)  是通讯作者
  2. 安吉拉·奥利维拉·皮斯科  是通讯作者
  3. 斯派罗斯·达尔马尼斯
  4. 詹姆斯·邹  是通讯作者
  1. 美国斯坦福大学电气工程系
  2. 美国哈佛T.H.Chan公共卫生学院流行病学系
  3. 美国麻省理工大学和哈佛大学博大研究所医学和人口遗传学项目
  4. 美国Chan-Zuckerberg Biohub
  5. 美国斯坦福大学生物医学数据科学系

摘要

衰老与复杂的分子和细胞过程有关,但人们对此知之甚少。在这里,我们利用Tabula Muris Senis单细胞RNA-seq数据集系统地描述了小鼠不同细胞类型在衰老过程中的基因表达变化。我们在23个组织中的76种组织细胞类型中鉴定了老化依赖基因,并表征了共同老化行为和组织细胞特异性老化行为。我们发现,在大多数组织细胞类型的衰老过程中,多个组织细胞类型共享的衰老相关基因也以相同的方向一致地改变其表达,这表明在生物体水平上存在协调的全球衰老行为。基于这些共享老化基因的评分细胞使我们能够从转录组学的角度对比不同组织和细胞类型的老化状态。此外,我们确定了表现出特定于组织细胞类型的每个功能类别的年龄相关表达变化的基因。总之,我们的分析为哺乳动物系统中不同组织细胞类型衰老的分子特征提供了最全面和系统的特征之一。

介绍

衰老导致机体主要器官的功能下降,是许多疾病的主要危险因素,包括癌症、心血管疾病和神经退行性变(尼科利和帕特里奇,2012年López-Otín等人,2013年). 过去的研究强调了衰老过程的不同特征,包括基因组不稳定、端粒磨损、表观遗传改变、蛋白质平衡丧失、营养感应失控、线粒体功能障碍、细胞衰老、干细胞衰竭和细胞间通讯改变(López-Otín等人,2013年坎皮西,2013Vijg和Suh,2013年2018年,尼古利奇). 然而,衰老的主要根源尚不清楚,其潜在的分子机制尚不完全清楚。

为了更好地了解哺乳动物在生物体水平上的衰老过程,我们所属的Tabula Muris Consortium创建了单细胞转录组数据集Tabula Muris Senis(TMS)(Tabula Muris财团,2020年). TMS是最大的专家管理的单细胞RNA测序(scRNA-seq)数据集之一,包含来自雄性和雌性小鼠23个组织和器官的300000多个注释细胞(小家鼠). 这些细胞是从不同年龄段的小鼠身上采集的,这为研究不同组织和细胞类型衰老的遗传基础提供了巨大的机会。通过专家注释和聚类,将TMS数据组织成不同组织细胞类型组合(例如,脾脏中的B细胞)的scRNA-seq表达。

最初的TMS论文主要探讨了衰老的细胞中心效应,旨在描述不同组织中细胞类型组成的变化。在这里,我们对不同细胞类型衰老过程中发生的基因表达变化进行了系统的基因中心研究。以细胞为中心和以基因为中心的观点是互补的,因为在衰老过程中,同一细胞类型内的基因表达可能发生变化,即使组织中的细胞类型组成不会随时间而变化。

我们的分析重点是TMS FACS数据(通过在微量计孔板中进行细胞分类,然后准备Smart-seq2库获得Picelli等人,2014年)因为它对组织和细胞类型有更全面的覆盖(补充文件1)与TMS液滴数据相比,在量化基因表达水平方面更为敏感。如所示图1AFACS数据收集自16只C57BL/6JN小鼠(10只雄性,6只雌性),年龄从3个月(20岁人类当量)到24个月(70岁人类当量。它包含来自23个组织的120种细胞类型,总计110096个细胞。我们还使用TMS液滴数据(源自微流控液滴)对数据可用的组织进行了测试,以进一步验证我们对不同方法生成的额外数据集的发现。

分析概述。

(A类)样本描述。TMS FACS数据收集自16只C57BL/6JN小鼠(10只雄性,6只雌性),年龄从3个月(相当于20岁人类)到24个月(相当于70岁人类)。(B类)在FACS数据中,所有76种组织细胞类型中都存在显著的年龄依赖性基因。左侧面板显示了每种组织细胞类型的衰老相关基因(发现)数量,细分为上调基因数量(橙色)和下调基因数量(蓝色),左侧的数字显示了比率(上调/下调)。带有明显更多上调/下调基因(比率>1.5)的组织细胞类型以纯色突出显示。大多数组织细胞类型的衰老基因显著下调。右侧面板显示了为每种组织细胞类型排序的细胞数。

我们研究了小鼠组织和细胞类型衰老的综合表达特征。我们进行了系统差异基因表达(DGE)分析,以在23个组织中的76个组织-细胞型组合中鉴定出与aging-相关的基因(图1B,补充文件1). 此外,我们描述了共享和组织-细胞特定老化特征。我们的研究确定了全球衰老基因(GAG),即在大多数(>50%)组织细胞类型中,其表达随年龄变化显著的基因。有趣的是,这些基因的表达变化在组织细胞类型中高度一致,并表现出强烈的双峰性。也就是说,在大多数组织细胞类型中,这些基因要么在衰老过程中下调,要么全面上调。我们利用这种协调的动态,根据GAG构建了一个老化分数。我们发现,无论是在FACS数据还是在多个独立数据集中,年龄分数都与时间年龄显著正相关。此外,老化分数对比了具有不同功能和周转率的组织细胞类型的老化状态,揭示了76种组织细胞类型中的异质老化过程。该分数以其单细胞分辨率和大数据量而著称,因为之前的工作要么在个体水平上研究生物年龄(Harries等人,2011年Holly等人,2013年Peters等人,2015年Fleischer等人,2018年Horvath,2013年Jylhävä等人,2017年Petkovich等人,2017年)或专注于少数器官(Ori等人,2015年Arrojo E Drigo等人,2019年). 总的来说,我们的分析强调了scRNA-seq在研究衰老方面的作用,并提供了跨不同组织细胞类型的与衰老相关的基因特征的综合目录。

结果

衰老相关基因的鉴定

我们考虑了TMS FACS数据中的76种组织细胞类型,TMS液滴数据中的26种组织细胞,以及伴随的大量RNA-Seq小鼠衰老研究中的17种组织(Schaum等人,2020年)(称为批量数据)具有足够的样本量。我们分别对每种组织细胞类型进行DGE分析,将组织细胞类型的所有细胞作为样本处理。我们使用一个线性模型来测试每个基因的表达是否与年龄显著相关,该模型将年龄视为一个数字变量,同时控制性别。我们应用了0.01的FDR阈值(比较的数量对应于组织细胞类型中的基因数量)和0.005的年龄系数阈值(以每月对数倍数变化为单位,对应于从3米到24米的10%倍数变化)。有关详细信息,请参阅材料和方法中的DGE分析小节。

如所示图1B每个组织细胞类型的显著年龄依赖性基因的数量从数百个到数千个不等。有趣的是,大多数组织细胞类型具有更多下调的与衰老相关的基因,而不是上调的与衰老有关的基因,这表明随着年龄的增长,基因表达普遍下降。这种下调模式不太可能被测序深度等技术因素所混淆,因为18米/24米小鼠的测序深度更高(图1——补充图1C-E). 通过使用一种性别的小鼠或一组年龄组(3米/18米)的小鼠进行单独的DGE分析,我们进一步发现,这种下调模式主要由24米的小鼠驱动,并不特定于一种性别(图1-图补充2). 我们在液滴数据中也观察到类似的模式(图1——图补充3)。

此外,我们发现分析中发现的大多数衰老相关基因都有单调的衰老轨迹,这意味着它们的表达在衰老过程中要么单调增加,要么单调减少(图1-图补充4,5). 然而,FACS数据中的一部分基因(13%)在整个衰老过程中上调,从3m增加到18m,从18m略微减少到24m;这些基因富含棕色脂肪组织(BAT)B细胞、大肠上皮细胞和脂肪间充质干细胞(图1——补充图4C)。

衰老和全球衰老基因的双峰效应

我们发现,大多数基因与至少一种组织细胞类型的衰老显著相关(TMS FACS数据中为13376,TMS液滴数据中为6233),这与衰老是一个涉及许多生物过程的高度复杂特征的直觉一致。FACS数据中发现的与衰老相关的基因与其他重要基因集显著重叠,包括GenAge数据库中记录的已知人类和小鼠衰老标记(Tacutu等人,2018年),衰老基因(坎皮西,2013)转录因子、真核启动因子和核糖体蛋白基因(图2——图补充1). 在大多数组织细胞类型中,与衰老显著相关的一些顶部重叠基因包括已知的小鼠衰老标记勇得,阿波、和像素4和已知的人类衰老标志物勇得,阿波,福斯、和Cdc42公司来自GenAge数据库(Tacutu等人,2018年)和衰老基因勇得,六月,Ctnb1号机组,应用程序、和地图1此外,我们发现每种组织细胞类型都有大约5%的与衰老相关的基因,这些基因与GenAge人类衰老标记物共享。然而,我们没有发现任何组织细胞类型特别富含这些已知的人类衰老标记物,这表明小鼠衰老和人类衰老之间的保护在组织细胞类型中是相对一致的(图2——补充图2)。

我们观察了所有与衰老相关的基因(在≥1种组织细胞类型中显著)图2A,其中颜色表示基因的数量。x轴表示基因与衰老显著相关的组织细胞类型的加权比例(在76种组织细胞类型中),而y轴表示基因上调的组织细胞的加权比例。这里使用的组织-细胞类型权重与组织中的细胞类型数量成反比,以确保组织的平等表示。可视化结果表明,与上调衰老基因相比,下调衰老基因更多,这与图1B也许更引人注目的是,从衰老相关基因在大多数组织细胞类型的衰老过程中趋向一致的变化方向来看,双峰模式是显而易见的。有趣的是,最近在其他研究中也有报道称,在衰老过程中,包括大脑在内的小鼠组织和细胞类型中,许多与衰老相关的共享基因表现出一致的变化方向(Ximerakis等人,2019年)肾、肺和脾(Kimmel等人,2019年)。

组织细胞水平的全球衰老基因(GAG)。

(A类)组织细胞水平的衰老相关基因,颜色指示基因的数量。x轴表示基因与衰老显著相关的组织细胞类型的加权比例(在所有76种组织细胞类型中),而y轴表示基因上调的组织细胞类别的加权比例。(B和C)GAG年龄系数热图(面板B类)和前20个GAG(面板C类). 年龄系数以每月对数倍变化为单位,蓝色/红色表示下调/上调。(D类)GAG的顶级GO生物途径。

在许多细胞类型中表现出与年龄相关的表达变化的基因具有特别强的双峰行为。这促使我们定义全球衰老基因(GAG公司)即与50%以上加权组织细胞类型(即使用上述组织细胞类型权重按细胞类型频率归一化后的细胞类型)中的衰老显著相关的基因。我们总共确定了330个GAG,其中93个持续上调,190个持续下调(>80%的加权组织细胞类型);只有47个具有不一致的方向性(在20-80%的加权组织细胞类型中上调)。我们发现GAG与衰老相关疾病中已知的基因有显著重叠,包括与阿尔茨海默病(p=2.4e-11)、神经母细胞瘤(p=1.4e-7)、纤维肉瘤(p=3.3e-5)和骨质疏松症(p=1.5e-4)相关的基因有较强重叠,与亨廷顿病相关的基因重叠相对较弱(p=2.5e-3),皮肤癌(p=3.6e-3)、肾癌(p=1.2e-3),急性早幼粒细胞白血病(p=3.2e-3。我们的结果对选择GAG的50%阈值的具体选择不敏感;使用不同阈值产生相似的基因本体(GO)富集分析结果(图2——图补充3C)或GAG得分(图3——补充图1A–D)如下所述。

我们可视化了10个上调/下调GAG的年龄系数(在>80%的加权组织细胞类型中是一致的方向),这些GAG与大多数组织细胞类型的衰老有关,如图所示图2C这些基因中有许多与衰老高度相关。例如拉尔斯2已经证明,这会导致线粒体活性降低,并延长秀丽线虫(Lee等人,2003年). 另一方面,勇得是一种已知的保护细胞免受氧化应激的原癌基因,其敲除可能导致小鼠寿命缩短(Laurent等人,2008年). 此外,卢比13a在几乎所有的组织细胞类型中都观察到上调。作为炎症蛋白的负调节因子,卢比13a有助于炎症反应的消退阶段,确保炎症组织完全恢复正常组织。它也有助于防止炎症基因长期表达导致的受损细胞癌变生长(周等,2015Mazumder等人,2003年). 因此,观察卢比13a鉴于大多数老年小鼠都有严重的炎症症状。

如所示图2D基因本体(GO)生物途径富集分析表明,330个GAG与细胞凋亡、翻译、生物合成、代谢和细胞组织有关。这些生物过程与衰老高度相关(塔楼,2015年Anisimova等人,2018年Barzilai等人,2012年)并且在大多数细胞类型中共享,这与GAG代表跨组织细胞类型的全球老化过程的直觉一致。此外,与GAG相关的KEGG通路与GO术语一致,并且还强调了免疫相关通路和多种衰老相关疾病(图2——补充图4A). 此外,对雾滴数据中发现的59组GAG的类似分析也支持了这一发现(图2——图补充3A B). 我们还使用Ingenuity pathway analysis(IPA)软件进行了通路富集分析(Krämer等人,2014年)证实了我们对GAG相关生物过程的发现(图2——补充图4B). 值得注意的是,mTOR通路,一种已知的AGG相关通路,在GAG表达的情况下,预计会受到抑制(Weichhart,2018年Papadopoli等人,2019年Johnson等人,2013年图2——补充图4C). 有趣的是,mTOR下调已被证明能促进长寿(史泰龙等人,2019Laplante和Sabatini,2012年),进一步表明GAG与老化过程有关。

GAG评分对比组织细胞类型的异质老化状态

在对GAG进行分析之后,我们接下来利用这些标记基因来表征不同组织细胞类型的整体老化状态。我们将全球老化标记的表达聚合为每个细胞的单个分数,称为GAG分数(有关详细信息,请参阅材料和方法中的GAG分数小节)。我们使用FACS数据来识别GAG,因为它对不同的组织细胞类型有更全面的覆盖。直观地说,GAG评分标记了全球衰老过程,它反映了生物体的年代和组织细胞类型特定的衰老效应。为了正式分析这些组成部分,我们定义了一个固定效应模型,以GAG评分为响应变量,以各种其他因素为解释变量,包括年龄、性别和二进制编码的组织细胞类型。作为一项健康检查,年龄顺序对GAG得分的影响显著为正(p<1e-100)。该模型解释了TMS FACS数据中60.2%的GAG评分方差,而在年龄和每种组织细胞类型之间添加额外的相互作用项仅略微增加了模型拟合(解释的方差为62.6%),表明对当前模型的拟合是合理的(图3——补充图2C). 有趣的是,虽然大多数年轻细胞的GAG评分较小,而老年细胞的GAC评分较大,但我们还发现四种组织细胞类型的GAG得分在年龄组之间相似,八种组织细胞型的细胞亚群的GAG分数与不同年龄组的细胞更相似(图3——补充图3)强调了不同组织细胞类型衰老过程的异质性。

接下来,我们考虑了组织细胞类型对GAG评分的影响。直觉上,更大的GAG评分效应表明,与同一动物的其他细胞相比,相应的细胞类型在分子上对衰老更敏感。如所示图3A免疫细胞和干细胞具有较高的GAG评分效应,而大多数实质细胞类型具有较低的GAG得分效应;这种对比在统计上也很显著,如图3B事实上,众所周知,免疫细胞和干细胞会随着年龄增长而发生最显著的变化。具体而言,免疫系统老化通常与老年人对新感染的反应能力受损有关(Montecino-Rodriguez等人,2013年). 此外,成人干细胞对组织维持和再生至关重要,与衰老相关疾病的发病率增加与干细胞功能下降有关(Ermolaeva等人,2018年). 另一方面,胰腺细胞、神经元、心肌细胞和肝细胞等实质细胞的老化分数较低。这可能表明这些组织特异性细胞类型对衰老更具弹性,尽管动物发生了变化,但仍能保持其功能。

GAG得分。

(A类)组织细胞GAG评分效应,置信区间为95%。颜色代表组织细胞类型的功能类别。(B和C)细胞功能类别的影响(面板B类)和二进制电池寿命(面板C类)根据GAG评分,对组内所有组织细胞类型进行荟萃分析。正y值表示组(面板的功能类别组)中的单元B类面板的二进制电池寿命组C类)GAG评分值高于相同年龄和性别的其他细胞。提供了95%的置信区间和标称p值来量化类别之间的差异。在面板中C类,还为组织细胞类型的子集提供了平均寿命注释,其中这些信息可用。(D类)通过FACS数据(x轴)和液滴数据(y轴)估计的组织细胞GAG评分效应之间的比较。每个点对应一个组织细胞类型,并提供线性拟合,表明估计值是一致的。

我们还发现,组织细胞GAG评分效应通常与细胞周转率呈正相关。例如,皮肤表皮细胞、单核细胞和T细胞等短命细胞(Koster,2009年Guilliams等人,2018年Westera等人,2013年)具有较高的GAG评分效应,而长寿细胞如神经元、少突胶质细胞、胰腺β细胞、肝细胞和心房肌细胞(Arrojo E Drigo等人,2019年Teta等人,2005年Magami等人,2002年Bergmann等人,2015年)GAG得分影响很低。为了量化这一观察结果,我们将一个二进制细胞寿命标签分配给一组细胞类型,这些细胞类型的数据可以从文献中获得(Milo等人,2010年霍布森和德内坎普,1984年Stewart等人,1980年劳森等人,1992年Arrojo E Drigo等人,2019年Darwich等人,2014年Lowry和Zehring,2017年Geering等人,2013年Cheshier等人,1999年Fulcher和Basten,1997年Scollay等人,1980年)(长>180天,短<90天,补充文件1); 使用二进制标签而不是实际值允许我们合并更多的细胞类型,这些细胞类型的确切寿命信息不可用,但已知寿命长/短。我们发现,短寿命细胞的GAG评分效应显著高于长寿细胞(p=1.68e-3,图3C). 一种可能的解释是GAG评分与细胞增殖、发育和死亡相关的生物过程有关,这些生物过程在更替率较高的细胞类型中更为活跃。这种惊人的差异也符合这样的直觉,即经历了更多分裂(也具有更高的更替率)的细胞是“更老”的,可能具有分子记忆。

验证外部数据的GAG得分

我们进行了几项分析,以验证GAG评分的稳健性。首先,GAG评分对当前评分方法的扰动不敏感,包括使用不同的标准来选择GAG或不执行细胞级背景校正(图3——补充图1A–D). 我们还发现,仅使用旧细胞评估组织细胞GAG评分效果得出了几乎相同的结果(图3——图补充1H)。

接下来,我们进行了平行分析,以确定TMS液滴数据上的GAG,并发现59个这样的基因(由于较小的样本大小和检测能力)。我们发现,如上所述,液滴GAG和330个FACS GAG之间共有34个基因(p=9e-48)。与FACS GAG类似,我们还发现,液滴GAG与许多与衰老相关的疾病中已知的基因显著重叠,包括阿尔茨海默病(p=2.8e-4)、神经母细胞瘤(p=1.2e-3)和纤维肉瘤(p=1.4e-3)。此外,我们考虑了一组261个在Kimmel等人,2019这项scRNA-seq研究包含年轻和老年小鼠肾脏、肺和脾脏的细胞,261个共有的衰老基因被定义为与五种以上细胞类型的衰老显著相关的基因(Kimmel等人,2019年). 我们发现Kimmel等人共有90个基因。基因和FACS GAG(p=2e-105),Kimmel等共有42个基因和液滴GAG(p=7e-69)。此处报告的所有p值均通过Fisher精确测试计算得出。

使用从TMS FACS数据中识别的GAG,我们计算了GAG得分,并进一步估计了TMS液滴数据、批量数据(将每个小鼠样本视为一个“细胞”)、Kimmel等人的数据以及来自Kowalczyk等人,2015年最后一组数据只有三种造血干细胞亚型,因此在其他分析中被忽略。我们发现,在所有四个验证数据集中,年龄顺序对GAG得分的影响显著为正(对于批量数据,由于样本量和检测能力较小,p=7e-10,对于其他三个数据集,p<1e-100)。由于GAG是根据FACS数据选择的,因此GAG得分与四个验证数据集中的年龄标签无关,从而证实了GAG得分确实反映了老化过程。

其他四个数据集估计的组织间GAG评分效应也与FACS数据估计的结果一致(图3-图补充1,4E至F). 具体而言,在液滴数据和Kimmel等人的数据中,免疫细胞类型具有较高的GAG评分效应,而上皮细胞、内皮细胞和实质细胞类型具有较低的GAG得分效应。特别是对于液滴数据,由于注释的细胞类型数量较少,短寿命细胞类型也具有较高但不显著的GAG评分影响。在查看大量数据时,我们发现与免疫相关的组织和器官,如全血、脾脏和骨髓,具有最高的GAG评分效应。有趣的是,在Kowalczyk等人的数据中,MPP(多能祖细胞)的GAG评分效应小于ST-HSC(短期HSC),后者小于LT-HSC(长期HSC)。这与这三种细胞类型的分化潜能完全一致,与FACS数据中观察到的更多干细胞具有更高GAG评分效应的假设一致。

最后,我们发现组织细胞GAG评分效应在数据集之间高度一致(FACS数据和图3D,FACS数据和Kimmel等人数据之间的相关性为0.75,p=1e-3图3——补充图1G). 总之,我们表明GAG评分能够描述年龄顺序以及老化过程中的转录变化。此外,我们可以使用组织细胞GAG评分效应来对比具有不同生物学特性的细胞类型的老化状态,包括功能类别和周转率。这提供了一个全面的分析,展示了GAG评分如何捕捉老化的异质分子效应。此外,我们通过合并来自同一组织的所有细胞类型,在组织层面重复了DGE分析和GAG评分分析。我们观察到定性上类似的发现,支持分析的稳健性。请参阅图3-图补充5——8了解更多详细信息。

类别特异性衰老基因

接下来,我们考虑特定于组织细胞类型子集的基因,包括功能类别特异性基因、细胞类型特异性基因、组织特异性基因和组织细胞类型特异性基因。给定一组组织细胞类型,为了获得该组织细胞类型集合中细胞的总体元年龄系数,我们首先通过荟萃分析将集合中所有组织细胞类型的年龄系数进行组合;同样,我们还通过对所有外部组织细胞类型的meta分析计算了外部元年龄系数。然后,我们选择集内和集外元年龄系数显著不同的基因作为集特异性基因(有关更多详细信息,请参阅材料和方法中的分类特异性老化基因小节)。值得注意的是,GAG几乎没有共享此处确定的基因。

在原始TMS论文中(Tabula Muris财团,2020年)每种组织细胞类型都被指定为六种功能类别标签中的一种,即内皮细胞、上皮细胞、免疫细胞、干/祖细胞、基质细胞和薄壁细胞。当按功能类别检查数据时,我们发现内皮细胞、免疫细胞、干细胞和基质细胞表现出高度的类别特异性老化行为。事实上,我们发现这些类别的特定衰老基因数量更多(图4B). 此外,它们的年龄系数是特定于各自的功能类别的,正如我们可以从不同组织细胞类型的清晰块结构中看到的那样(图4A). 此外,当分别对这六组基因进行GO生物途径富集分析时,我们仅发现这四类基因的重要途径(图4C). 其中,内皮特异性基因与血管生成和细胞迁移负调控的各种过程相关;后者表明衰老过程中内皮细胞功能降低,因为内皮细胞迁移对血管生成至关重要(Lamalice等人,2007年). 此外,免疫特异性基因与各种免疫反应的激活有关,这与衰老过程和免疫系统之间的密切联系相一致(Tabula Muris财团,2020年2018年,尼古利奇). 此外,干细胞特异性基因与骨化和多种血管生成过程相关,干细胞和基质特异性基因均与细胞外基质和结构组织相关。

功能类别特异性基因。

(A类)功能类别特定基因的年龄系数,以每月对数倍变化为单位。x轴的基因和y轴的组织细胞类型都是按功能类别排序的。例如,左上方区块对应内皮特异性基因。(B类)每个类别的功能类别特定基因的数量。(C类)功能类别特异基因的GO生物途径,颜色代表负log10 FDR。

这样的分析也有助于发现与衰老相关的有趣的特异基因。例如,C2cd4b型(图4——补充图12安培)是一种薄壁组织特异性基因,在几种胰腺、乳腺、大肠细胞类型中具有较大的年龄系数,而在其他细胞类型中几乎为零。增加的表达C2cd4b型与2型糖尿病风险增加有关(Kycia等人,2018)并增加了C2cd4b型在老年小鼠中,胰腺细胞类型可能表明这些小鼠患2型糖尿病的风险增加。此外,C2cd4b型研究表明,这会导致体重和葡萄糖稳态的性别差异(穆萨维·加拉维等人,2021年)这与乳腺是一种众所周知的性二型组织这一事实相符。第二个例子是Gsn公司(图4——补充图12B型)在衰老过程中,在基质细胞和干细胞类型中下调,在其他细胞类型中上调。这可以通过其制造凝胶蛋白的功能来解释,凝胶蛋白是一种重要的细胞运动蛋白。细胞运动不仅对免疫细胞和内皮细胞重要,而且Gsn公司也被证明是与衰老相关的神经退行性变的潜在生物标志物(Manavalan等人,2013年)。

除了功能类别特异性基因外,我们还鉴定了几种细胞类型的特异性基因,包括B细胞、表皮基底细胞、内皮细胞、巨噬细胞、间充质干细胞、脂肪间充质细胞、髓样细胞和骨骼肌卫星细胞,通过它们与相关生物过程的联系得到证实(图4——补充图3). 该方法还允许我们识别每个组织特有的基因。然而,我们没有发现任何特定于单个组织细胞类型的基因。所有的基因集都可以在补充文件3

讨论

本研究通过分析TMS FACS数据中的76种组织细胞类型,对衰老相关转录组特征进行了系统和全面的分析。与首次出版的Tibula Muris Senis的分析一起(Tabula Muris财团,2020年)它是迄今为止以单细胞分辨率对哺乳动物衰老过程进行的最大分析之一。特别令人感兴趣的是研究中确定的330个全球衰老基因(GAG)。这些基因在小鼠的大多数组织细胞类型中表现出年龄依赖性表达。GAG富含许多有趣的基因,包括已知的人类和小鼠衰老标记、与衰老相关的疾病基因、衰老基因、转录因子、真核启动因子和核糖体蛋白基因。有趣的是,大多数GAG是强双峰的,因为它们的表达在几乎所有组织细胞类型的衰老过程中减少或增加,这表明这些基因对衰老具有一致的反应,这对特定的组织或细胞环境是稳健的。此外,我们发现大多数基因的表达都有系统性下降,并且活性表达基因的数量也减少,这表明转录活性随着动物年龄的增长而关闭。最近的一项研究发现,在小鼠细胞分化过程中,表达的基因数量减少(Gulati等人,2020年). 有趣的是,尽管与分化相比,老化的时间尺度要长得多,但我们对老化的类似现象进行了量化。

虽然我们专注于检测那些随年龄变化呈线性和非特异性的基因,但研究与年龄相关的非线性或性别特异性变化也很有趣。例如,如所示图1-图补充1,表达基因的数量以非线性和性别特异性的方式随着年龄的增长而变化,这表明这些基因的存在。我们已经使用TMS液滴数据、大量RNA-seq数据和外部数据集验证了我们的发现,在未来的研究中进行进一步验证非常重要。特别是,双模式表达模式在TMS液滴数据中不太明显,可能是因为其组织细胞类型覆盖范围有限,测序深度相对较浅。

GAG具有显著的双峰一致性,可以作为生物标记物来表征单个细胞的老化状态。我们基于GAG提出了一个新的老化评分,即GAG评分。组织细胞类型特异性GAG评分效应量化了每种组织细胞类型对衰老的敏感性,并与细胞分裂率呈正相关。例如,免疫细胞往往比同年龄和性别的其他细胞具有更高的GAG评分,这反映了它们经历了许多细胞分裂周期的现象,并且在动物的生命周期中也发生了重大变化。一种假设是GAG评分捕捉到了细胞真实生物年龄的某些方面,这可能与动物的出生年龄不同。未来工作的一个有趣方向是通过功能实验进一步研究该模型。与此相一致,重要的是研究我们在这里量化的一些转录组变化,例如mTOR的下调,如何指向健康衰老,或者它们如何为实验提供信息,从而揭示改善衰老影响的机制。此外,虽然GAG评分被提议用于捕捉全球老化状态,但也存在细胞类型特定的老化程序;两者的结合将更好地描述细胞的整体老化状态。细胞类型特异性衰老评分的构建需要对不同细胞类型内不同亚型和状态的细胞进行更全面的纵向分类。虽然这超出了当前工作的范围,但当这些数据可用时,这是一个令人兴奋的方向。

GAG评分也与之前工作中开发的转录组年龄预测因子有关(Harries等人,2011年Holly等人,2013年Peters等人,2015年Fleischer等人,2018年)从某种意义上说,它们都使用基因表达信息,并预测动物的年龄。以往工作中常用的方法是训练一个模型(例如线性/逻辑回归模型),以根据基因表达预测个体的年龄。通过对76种组织细胞类型的DGE结果进行元分析,并将每种组织细胞类别放在同一基础上,我们的GAG评分使用的是从广泛的组织细胞类型中以无偏见的方式选择的GAG,而不是模型填充算法。这确保了GAG评分所使用的基因能够捕捉到共同的衰老过程,并且不会偏向于某些组织细胞类型。事实上,GAG被证明与与衰老高度相关的生物过程有关(图2),提供更好的分数解释性。相比之下,以前的研究只关注一种特定组织,如血液(Harries等人,2011年Holly等人,2013年Peters等人,2015年)或皮肤成纤维细胞(Fleischer等人,2018年),因此可能选择了偏向于特定组织的基因。

总的来说,我们的研究提供了小鼠各种组织细胞类型衰老基因的综合特征。除了生物学见解外,它还为从事相关主题的研究人员提供了全面的参考。

材料和方法

数据预处理

请求详细协议

我们考虑了五个数据集,即TMS FACS数据、TMS液滴数据、Schaum等人,2020年(称为批量数据)Kimmel等人,2019年,以及中的数据Kowalczyk等人,2015年对于TMS FACS数据和TMS液滴数据,我们筛选出少于3个细胞中表达的基因,筛选出少于250个基因的细胞,并丢弃FACS数据中计数总数小于5000的细胞,以及液滴数据中唯一分子标识符(UMI)总数小于2500的细胞。对于批量数据,我们筛选出少于五个样本中表达的基因,并筛选出少于500个基因的样本。我们没有过滤其他两个数据集的单元格。对于所有五个数据集,我们将每个样本规范化为每个样本有10000次读取/UMI,然后进行日志转换(log(x+1),其中x是读取计数)。我们注意到这样的程序与原始文件中的程序相同(Tabula Muris财团,2020年). 我们没有纠正批次效应,因为原始TMS文件中没有发现实质性的批次效应(Tabula Muris财团,2020年)。

DGE分析

查看详细协议

如所示补充文件1在TMS FACS数据中,我们考虑了23个组织中的76种组织细胞类型,其中年轻(3m)和老年(18m,24m)年龄组的细胞均超过100个;TMS液滴数据中,年轻(1米,3米)和老年(18米,21米,24米,30米)年龄组的11个组织中有26种组织细胞类型,其中500多个细胞;以及用于批量数据的所有17张纸巾(Schaum等人,2020年). 与TMS FACS数据相比,我们需要更多的细胞用于TMS液滴数据,因为液滴数据的测序深度要低得多(每个细胞6000个UMI,而FACS数据的每个细胞85万次读取)。此外,由于TMS液滴的组织和细胞类型覆盖范围有限,因此我们在主要结果中没有关注TMS液珠数据。

我们分别对每种组织细胞类型的细胞进行了DGE分析。在组织细胞类型的DGE分析中,将组织细胞类型中的所有细胞作为样本进行处理,并对每个基因进行单独测试,观察到的是细胞中基因的表达。我们使用一个线性模型,将年龄作为一个连续变量,同时控制性别,确定了与年龄显著相关的基因,即:,

(1) e(电子)n个e(电子)e(电子)x个第页第页e(电子)o(o)n个e(电子)+e(电子)x个

由于测试是在每个组织细胞类型的细胞水平上进行的,细胞数量只会影响检测能力,但不会影响结果。因此,这不是一个混杂因素,也没有得到控制。我们使用了MAST包(Finak等人,2015年)(版本1.12.0)以执行DGE分析。scRNA-seq数据中的零计数由MAST包处理,我们没有观察到其他类型的缺失数据。我们没有控制细胞检测率(Finak等人,2015年)(CDR,对应于细胞中表达的基因数量),因为我们发现在我们的数据中,无论是考虑所有细胞还是按性别分层,CDR都与年龄呈正相关,与技术协变量(如测序深度和检测到的ERCC尖峰数)呈负相关(图1——图补充1). 因此,控制CDR可能会消除真正的老化影响。我们注意到CDR被定义为细胞中表达基因的数量,这是数据集的基本数量,并不特定于MAST包。因此,这种观察并不意味着存在MAST的潜在问题。尽管如此,我们发现,无论是否进行CDR校正,年龄系数都高度相关(FACS数据为0.89,液滴数据为0.93,图1-图补充6),排除了CDR修正会显著改变结果的可能性。

我们使用了Benjamini–Hochberg(FDR)程序(Benjamini和Hochberg,1995年)控制多次比较,其中比较的数量对应于组织细胞类型中的基因数量。我们采用0.01的FDR阈值和0.005的年龄系数阈值(以每月对数倍变化为单位,相当于从3米到24米的大约10%倍变化)来检测与年龄显著相关的基因。

全球老化基因

请求详细协议

如果一个基因与50%以上的加权组织细胞类型的衰老显著相关,我们选择该基因作为GAG。这里,组织细胞类型的重量与组织中细胞类型的数量成反比,以确保组织的平等代表性。

对于GAG与已知的衰老相关疾病基因之间的重叠,我们考虑了前25种衰老相关疾病,并从人类疾病数据库(MalaCards)中获得了它们的相关基因(Rappaport等人,2013年Rappaport等人,2014年Rappaport等人,2017年). 然后,我们使用g:Profiler将人类基因转换为相应的小鼠同源基因(Raudvere等人,2019年)(版本1.2.2)。使用Fisher精确检验计算量化重叠重要性的p值。

路径富集分析

请求详细协议

我们使用了g:Profiler(Raudvere等人,2019年)进行GO生物途径富集分析。我们考虑了FDR小于0.01的生物途径。我们使用了基因集富集分析(GSEA MGSig数据库)(Subramanian等人,2005年Liberzon等人,2011年)进行KEGG通路分析。我们筛选了小鼠基因,并考虑了FDR小于0.05的生物途径。我们还使用了IPA软件(Krämer等人,2014年)执行典型路径分析(图2——图补充4). 对于图2——补充图4A,我们使用了1e-5的FDR阈值和0.5的z评分阈值。

GAG得分

请求详细协议

给定一组GAG(例如,FACS GAG),单元格的整个GAG得分计算如下:

  1. 计算原始GAG得分作为上调GAG的平均表达(在>50%的加权组织细胞类型中与衰老显著相关,在>80%的加权组织-细胞类型中上调)减去下调GAG的平均表达(在50%以上的加权组织细胞类型中与衰老显著相关,在80%以上的加权组细胞类型中下调),即:,

    R(右)w个G公司A类G公司c(c)o(o)第页e(电子)=e(电子)n个(单位第页第页e(电子)单位t吨e(电子)d日G公司A类G公司)e(电子)n个(d日o(o)w个n个第页e(电子)单位t吨e(电子)d日G公司A类G公司)
  2. 遵循配方DeTomaso等人,2019,使用具有相同数量的上调/下调基因的随机基因集的预期平均值和方差对原始GAG评分进行z归一化:

    (3) G公司A类G公司c(c)o(o)第页e(电子)=R(右)w个G公司A类G公司c(c)o(o)第页e(电子)/[t吨d日1/n个单位第页+1/n个d日o(o)w个n个],
  • 哪里t吨d日是细胞基因表达的标准偏差,n个向上的是上调GAG的数量,以及n个向下是下调GAG的数量。

出于稳健性考虑,我们检查了用于计算GAG得分的基因的表达水平,发现没有极值。因此,GAG评分不太可能由少数高表达基因控制。我们还考虑了GAG评分的另一个版本,其中每个基因根据其表达范围进行加权。我们发现这两个版本产生了高度相关的结果。请参阅图3——补充图2A B了解更多详细信息。

为了估计GAG评分效应,我们对细胞的GAG评分进行建模与细胞的年龄、性别和组织细胞类型线性相关,即,

(4) G公司A类G公司c(c)o(o)第页e(电子)e(电子)+e(电子)x个+j个组织细胞型j个

在这里,e(电子)是该细胞的动物年龄(以月为单位)来自,e(电子)x个如果单元格为1来自男性,否则为零,并且组织细胞型j个如果单元格为1属于组织细胞类型j个否则为零。我们不包括截距项,因为所有二进制编码的组织细胞类型总和为一。最后,我们进一步将响应变量和解释变量集中,并进行普通最小二乘回归,以估计年龄、性别和每个组织细胞类型的GAG评分影响。

中的元分析图3B和C图3——补充图1E F假设随机效应模型(莱利等人,2011年). 用于比较数据集之间的组织-细胞GAG评分效应,即图3D图3——补充图1G,我们使用了所有组织细胞类型,而不限于76种TMS FACS组织细胞类型和26种TMS液滴组织细胞类型。这增加了数据集之间重叠的组织细胞类型的数量。

类别特异性衰老基因

请求详细协议

我们考虑鉴定功能类别特异性基因、细胞类型特异性基因,组织特异性基因和组织细胞类型特异基因。对于一组组织细胞类型,例如所有免疫组织细胞类型的集合,特定于该集合的基因(或特定于集合的基因)选择如下。对于每个基因,我们首先通过假设随机效应模型对集合中所有组织细胞类型的年龄系数进行元分析来估计其集合内的元年龄系数(莱利等人,2011年). 具体地说,这是通过假设存在组织类型集合的元年龄系数来完成的,并且该集合中每个组织细胞类型的年龄系数是平均值等于该集合的元年龄系数的随机变量。类似地,我们通过元分析集合外的所有组织细胞类型来估计集合外的元年龄系数。然后,我们将集特异性基因定义为以下基因:

  1. 组内元年龄系数与组外元年龄系数差异显著(FDR<0.01);

  2. 内置元年龄系数足够大(绝对值>0.005);

  3. 外集元年龄系数与0无显著差异(FDR>0.01)。

假设正态分布,根据平均值和标准误差计算p值,并计算所有基因的FDR。

代码可用性

请求详细协议

复制所有结果的代码位于https://github.com/czbiohub/tabla-muris-senis/tree/master/2_aging_signature(Zhang和Pisco,2021; 副本存档于swh:1:版本:0fd2ee501f4f3bd0e691b6071ee2c9286f1cf92)。

数据可用性

所有数据都可以在下载https://figuhare.com/articles/dataset/tms_gene_data_rv1/12827615

使用了以下先前发布的数据集

工具书类

    1. 彼得斯·乔丹
    2. 乔哈内斯·R
    3. 起球连卡佛
    4. 舒曼C
    5. 康尼利KN
    6. 鲍威尔J
    7. 雷马E
    8. Sutphin GL公司
    9. 哲尔纳科娃A
    10. 施拉姆K
    11. 威尔逊YA
    12. 科比斯S
    13. Tukiainen T公司
    14. 拉莫斯YF
    15. 戈林HH
    16. 饲料M
    17. 刘毅
    18. 加里布股份有限公司
    19. 陌生人BE
    20. De Jager公司
    21. Aviv A公司
    22. 征税D
    23. Murabito吉咪
    24. 蒙森PJ
    25. Huan T公司
    26. 霍夫曼A
    27. Uitterlinden股份公司
    28. Rivadeneira F公司
    29. 范·罗伊J
    30. 斯托克L
    31. 布罗尔L
    32. 最详细的MM
    33. Jhamai M公司
    34. Arp P公司
    35. Metspalu A公司
    36. Tserle L公司
    37. Milani L公司
    38. 新泽西州萨马尼
    39. 彼得森·P
    40. 卡塞拉S
    41. 代码V
    42. 彼得斯A
    43. 病房-空腔CK
    44. 牧民C
    45. 瓦尔登伯格M
    46. 罗登M
    47. 辛格曼P
    48. 泽林格S
    49. 伊利格·T
    50. Homuth G公司
    51. Grabe HJ公司
    52. 沃尔兹克·H
    53. 不锈钢L
    54. 科彻T
    55. 默里A
    56. 梅尔泽D
    57. Yaghootkar H公司
    58. 班迪内利S
    59. 摩西·EK
    60. 肯特JW
    61. Curran JE公司
    62. 约翰逊议员
    63. Williams Blangero S公司
    64. 韦斯特拉HJ
    65. 麦克雷空军
    66. 史密斯JA
    67. 卡迪亚SL
    68. 霍瓦塔一世
    69. 佩罗拉·M
    70. 里帕蒂S
    71. 萨洛马五世
    72. Henders AK公司
    73. 马丁·NG
    74. 阿拉斯加州史密斯
    75. 梅塔D
    76. 粘合剂EB
    77. 尼洛克KM
    78. 肯尼迪EM
    79. 克伦格尔T
    80. 丁J
    81. Suchy-Dicey上午
    82. Enquobahrie DA公司
    83. 布罗迪J
    84. Rotter JI公司
    85. 陈永德
    86. 后窗-分流器J
    87. 克洛彭堡M
    88. 拦渣栅PE
    89. Helmer Q号
    90. 邓·霍兰德W
    91. 豆子S
    92. 拉杰·T
    93. 巴赫什N
    94. 王振鹏
    95. 牡蛎LJ
    96. Psaty BM公司
    97. 特蕾西·RP
    98. 蒙哥马利GW
    99. 特纳ST
    100. 布兰杰罗J
    101. MeulenbeltⅠ型
    102. 莱斯勒KJ
    103. 杨杰(Yang J)
    104. 弗兰克·L
    105. Kettunen J公司
    106. Visscher项目经理
    107. Neely GG公司
    108. 科尔斯坦杰R
    109. 汉森RL
    110. Prokisch H公司
    111. 费鲁奇L
    112. 埃斯科T
    113. 特默尔A
    114. 范·梅尔斯JB
    115. 约翰逊AD
    (2015) 人类外周血年龄的转录图谱
    自然通讯 6:8570.
    https://doi.org/10.1038/ncomms9570

文章和作者信息

作者详细信息

  1. Martin Jinye Zhang(张金业)

    1. 美国帕洛阿尔托斯坦福大学电气工程系
    2. 美国波士顿哈佛大学陈T.H.公共卫生学院流行病学系
    3. 美国剑桥大学麻省理工学院和哈佛大学医学与人口遗传学项目
    贡献
    概念化、形式分析、调查、可视化、方法论、写作-初稿、写作-审查和编辑
    用于通信
    jinyezhang@hsph.harvard.edu
    竞争性利益
    没有宣布竞争利益
    ORCID图标 “此ORCID iD标识了本文的作者:”0000-0003-0006-2466
  2. 安吉拉·奥利维拉·皮斯科

    美国旧金山Chan-Zuckerberg Biohub
    贡献
    概念化、数据管理、监督、调查、写作-初稿、写作-审查和编辑
    用于通信
    angela.pisco@czbiohub.org
    竞争性利益
    没有宣布竞争利益
    ORCID图标 “此ORCID iD标识了本文的作者:”0000-0003-0142-2355
  3. Spyros Darmanis公司

    美国旧金山Chan-Zuckerberg Biohub
    贡献
    数据管理、写作——审查和编辑
    竞争性利益
    没有宣布竞争利益
  4. 詹姆斯·邹

    1. 美国帕洛阿尔托斯坦福大学电气工程系
    2. 美国旧金山Chan-Zuckerberg Biohub
    3. 美国帕洛阿尔托斯坦福大学生物医学数据科学系
    贡献
    监督、资金获取、调查、方法、写作-初稿、写作-审查和编辑
    用于通信
    jamesyzou@gmail.com
    竞争性利益
    未申报竞争利益
    ORCID图标 “此ORCID iD标识了本文的作者:”0000-0001-8880-4764

基金

Chan-Zuckberg生物城

  • 詹姆斯·邹

国家科学基金(CCF 1763191)

  • 詹姆斯·邹

国立卫生研究院(R21 MD012867-01)

  • 詹姆斯·邹

美国国立卫生研究院(P30AG059307)

  • 詹姆斯·邹

硅谷社区基金会

  • 詹姆斯·邹

美国国立卫生研究院(R01 MH115676)

  • Martin Jinye Zhang(张金业)

资助者不参与研究设计、数据收集和解释,也不参与将研究成果提交出版的决定。

鸣谢

我们要感谢S Quake、R Sinha、R Sit、J Cool、B van de Geijn、H Shi和X Xu的反馈。MJZ和JZ得到了NSF CCF 1763191、NIH R21 MD012867-01、NIH P30AG059307以及硅谷基金会和Chan-Zuckerberg倡议的资助。MJZ还得到NIH R01 MH115676的支持。

版本历史记录

  1. 收到日期:2020年8月20日
  2. 接受日期:2021年3月29日
  3. 已出版的接受手稿:2021年4月13日(第1版)
  4. 发布的记录版本:2021年4月14日(第2版)

版权

©2021,Zhang等人。

本文根据知识共享署名许可协议,它允许不受限制的使用和重新分配,前提是原始作者和来源都是可信的。

韵律学

  • 14,969
    意见
  • 1,651
    下载
  • 69
    引用

eLife发布的这篇论文的所有版本都聚合了浏览量、下载量和引用量。

下载链接

一个由两部分组成的链接列表,用于以各种格式下载文章或文章的部分。

下载(链接以PDF格式下载文章)

公开引用(在各种在线参考咨询管理服务中打开本文引文的链接)

引用这篇文章(以与各种reference manager工具兼容的格式下载本文引文的链接)

  1. 马丁·金叶(Martin Jinye Zhang)
  2. 安吉拉·奥利维拉·皮斯科
  3. Spyros Darmanis公司
  4. 詹姆斯·邹
(2021)
小鼠衰老细胞图谱分析揭示了整体和细胞类型特定的衰老特征
电子生活 10:e62293。
https://doi.org/10.7554/eLife.62293(网址:https://doi.org/10.7554/eLife.62293)

分享这篇文章

https://doi.org/10.7554/eLife.62293

进一步阅读

    1. 计算与系统生物学
    2. 神经科学
    Pau Vilimelis Aceituno、Dominic Dall'Osto、Ioannis Pisokas
    研究文章

    为了在环境中导航,昆虫需要跟踪它们的方位。先前的研究表明,昆虫将头部方向编码为围绕八列结构神经元环的正弦活动模式。然而,尚不清楚这种头部方向的正弦编码是进化上的巧合,还是提供了特殊的功能优势。为了解决这个问题,我们建立了方向编码的基本数学要求,并表明它可以由许多具有不同活动模式的电路执行。在这些活动模式中,我们证明了正弦模式是最具抗噪声能力的,但只有当编码神经元之间的连接模式与正弦模式相结合时。我们将这一预测的最佳连接模式与蝗虫和果蝇头部方向回路的解剖学数据进行了比较,发现我们的理论与实验证据一致。此外,我们证明,我们的预测电路可以使用希伯来可塑性出现,这意味着神经连接不需要在昆虫的遗传程序中明确编码,而是可以在发育过程中出现。最后,我们说明了在我们的理论中,多种昆虫头部方向回路的八列结构的持续存在并不是偶然的产物,而是可以用基本进化原理来解释的。

    1. 计算与系统生物学
    Natalie R Davidson、Casey S Greene
    研究文章

    科学新闻是公众了解科学发现并从中受益的重要途径。这样的新闻报道塑造了公众对科学现状的看法,并使专家合法化。记者只能引用他们在研究中可能发现的有限的消息来源,包括其他科学家的建议。任何一个过程中的偏见都可能影响谁被识别并最终被包括在来源中。为了检验科学新闻中的潜在偏见,我们分析了《自然》杂志发表的22001篇非研究性文章,并就预测的性别和姓名来源与《自然》期刊发表的研究性文章进行了比较。我们提取了被引用作者的姓名和被引用演讲者的姓名。虽然一篇文章中的引用和引文并不能反映整个信息收集过程,但它们可以提供对可见来源人口统计的洞察力。然后我们预测了被引用作者和演讲者的性别和姓名来源。我们将文章与由《自然》主要研究文章中的第一作者和最后作者组成的比较集以及同期Springer Nature文章的子集进行了比较。在我们的分析中,我们发现自然科学新闻中有一种倾向于引用男性的言论。然而,在学术出版中,引用趋于平等,其速度快于作者数量。《自然》引文中的性别差异取决于文章类型。我们发现,在摘录的引文和期刊引文中,预测的凯尔特人/英国血统的名字的过度表达和预测的东亚血统的名字的过度表达都很显著,但在引文中有所减弱。