跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
美国国家科学院程序。2008年9月16日;105(37): 14076–14081.
2008年9月9日在线发布。 数字对象标识:10.1073/pnas.0805206105
预防性维修识别码:项目经理2532972
PMID:18780791

人类乳腺细胞类型特异性DNA甲基化模式

关联数据

补充资料

摘要

细胞的身份和分化是由表观遗传程序决定的。这些程序在正常人类乳腺上皮中的特征及其与干细胞中的相似性尚不清楚。为了开始研究这些问题,我们使用MSDK(甲基化特异性数字核型分析)和SAGE(基因表达系列分析)分析了乳腺上皮细胞不同亚群的DNA甲基化和基因表达谱。我们确定了乳腺癌子集中保持的离散细胞型和分化状态特异性DNA甲基化和基因表达模式,并与临床相关的肿瘤亚型相关。CD44+细胞是最低甲基化和高表达的几种转录因子,具有已知的干细胞功能,包括HOXA10和TCF3。与MSDK分析的未分化人类胚胎干细胞(ES)相比,BMP4处理的BMP4中许多基因也发生了低甲基化。进一步强调胚胎和乳腺上皮细胞的表观遗传程序的相似性,相对于分化程度更高的CD24+细胞,CD44+中高表达的基因在ES细胞中显著富集为Suz12靶点。FOXC1是一种在CD44+细胞中高度表达的低甲基化转录因子,其表达在分化的乳腺上皮细胞中诱导了祖细胞样表型。这些数据表明,表观遗传控制的转录因子在调节乳腺上皮细胞表型方面发挥着关键作用,并暗示了定义祖细胞特征的表观遗传程序之间的相似性。

关键词:癌症、分化、祖细胞、干细胞

干细胞被定义为具有自我更新能力和产生多种不同分化细胞类型的能力的细胞。最近的研究表明,在正常人乳腺上皮中存在具有这些特性的细胞(1). 然而,这些细胞的身份、分子特征和位置尚不明确。通过使用体外克隆原性分析,已经鉴定出几个候选的人类乳腺上皮祖细胞,并且提出了许多细胞表面标记物来富集它们,包括MUC1、CD10、CD44和ITGA6(1). 这些细胞被认为局限于末端导管的基底层,已知的干细胞途径在用于富集假定的乳腺干细胞的乳房培养物中被激活(4).

通过使用小鼠乳腺脂肪垫注射分析/CD24型−/低/CD44细胞+(“CD44+”)乳腺肿瘤细胞比分化程度更高的CD44细胞更易致癌/CD24型+(“CD24+”)细胞,将CD44+细胞识别为人类乳腺“癌症干细胞”(5). 我们之前从原发性乳腺肿瘤和正常乳腺组织的类似细胞中分离出这些细胞,并确定其综合基因表达谱与CD24+和CD44+细胞分别代表分化的管腔上皮细胞和祖细胞样细胞的假设一致(6).

表观遗传程序,包括DNA甲基化和染色质模式,在ES细胞功能和分化中起着关键作用(7,8). 几个对多能性和自我更新重要的基因在干细胞中被低甲基化并表达,在分化细胞中被甲基化沉默(9)这表明控制干细胞特性的其他基因,如转录因子,可能受到表观遗传调控。乳腺上皮祖细胞特异性表观遗传程序的身份、它们与ES细胞和乳腺癌中的表观遗传项目的关系以及它们调控的基因尚不明确。为了开始研究这些问题,我们分析了正常人类乳腺组织中四种不同细胞群(包括CD44+和CD24+细胞)的全面DNA甲基化特征,并证明表观遗传控制的转录因子似乎有助于确定祖细胞和分化细胞表型。此外,我们发现编码具有已知干细胞功能的转录因子的基因在来自正常乳腺上皮和一些乳腺癌的CD44+细胞以及BMP4处理的ES细胞中类似地甲基化。这些发现意味着表观遗传程序的保护,定义了祖先的特征。

结果和讨论

不同乳腺上皮细胞群的特征。

为了表征正常人乳腺上皮的细胞组成,我们使用以前与管腔上皮(MUC1和CD24)、肌上皮(CD10)和祖细胞(CD44)表型相关的细胞表面标记进行了FACS分析[支持信息(SI)图S1一个]. 然后,我们设计了一种免疫磁珠纯化程序,以最小化细胞组分之间的重叠(图S1B类). 通过使用该程序,我们从健康女性的正常乳腺组织中分离出CD44+、CD24+、MUC1+和CD10+细胞。每个细胞组分都是从多个独立的病例中分离出来并进行表征的[参见表S1和S2]. 通过半定量RT-PCR分析已知分化和祖细胞标记的表达,初步评估富集细胞组分的表型(图S1C类和数据未显示)。CD24+细胞表达管腔细胞标记,但缺乏肌上皮和祖细胞标记,而CD44+细胞缺乏谱系特异性基因,并表达多个祖细胞标记。MUC1+细胞对管腔和一些祖细胞标记呈阳性,这意味着它们可能代表管腔谱系承诺的祖细胞或分化和祖细胞的混合。同样,CD10+细胞表达肌上皮和一些祖细胞标记物。

为了更详细地确定四种细胞类型之间的差异,我们使用SAGE分析了它们的基因表达谱(10). 通过使用四种细胞类型之间差异表达的标签对SAGE文库进行分级聚类,有效地将样本分为两个主要的基底/肌上皮(CD44+和CD10+细胞)和管腔(CD24+和MUC1+细胞)分支,根据细胞类型进一步细分为四个分支(图1一个). 值得注意的是,已知的祖细胞和分化细胞标记在预期的细胞群体中更为丰富(表S3). “基础/祖细胞”簇中的一个子集基因在CD44+细胞中高度表达,它包括几个具有已知发育和干细胞功能的基因(例如MSC、BRD2和ELF1),而一组基因在CD10+和CD44+之间是常见的。这些结果证实了我们之前对CD24+和CD44+细胞的研究(6)并确定MUC1+和CD10+细胞分别是管腔上皮和肌上皮细胞的不同亚群。

保存图片、插图等的外部文件。对象名为zpq9990847740001.jpg

各种乳腺上皮细胞的富集和表型。(一个)树状图描述了由来自多个独立病例的CD44+、CD10+、MUC1+和CD24+细胞制备的SAGE文库的相关性。聚类热图的选定部分表示富含管腔细胞(CD24+和MUC1+)和基底/祖细胞样细胞(CD44+和CD10+)的基因。每行代表一个标签,并标有与该标签最匹配的基因的符号。红色和绿色分别表示高表达水平和低表达水平。(B类)CD44+细胞和其他三种细胞类型之间差异表达基因的基因本体富集分析。使用Fisher Exact检验,将CD44+中相对于CD24+(蓝色)、CD10+(绿色)和MUC1+(黄色)细胞高度表达的基因的本体术语与CD44+细胞中表达的其他基因的本体词汇进行比较。显著丰富的本体术语用相对丰富倍数表示为P值的负对数。其他代表性菌落中细胞类型特异性标记的免疫荧光分析(C类)和CD44+(D类)细胞在二维培养条件下。

为了确定四种细胞类型之间的功能差异,我们使用基因本体(GO)术语对CD44+和其他三种细胞类型之一之间差异表达的基因进行分类。这些分析表明,与所有三种分化程度更高的细胞类型相比,CD44+细胞富含编码具有细胞外功能和在发育和分化中作用的蛋白质的基因(图1B类表S4). CD44+细胞特异性分泌的蛋白质包括几种趋化因子(CCL2、CXCL2和CXCL14)、蛋白酶(MMP2、MMP3和MMP9)、蛋白酶抑制剂(TIMP1-3)以及干细胞信号通路中涉及的细胞因子,如TGFb(INHBA、BMP2、DCN和LTBP4)、WNT(SFRP和SFRP4)和Hedgehog(BGN)。与分化程度更高的CD24+、MUC1+和CD10+细胞相比,这些基因在祖细胞样CD44+细胞中的富集与推测的一致体内这四种细胞群的功能。

为了将四种细胞类型的分子特征与其分化能力联系起来,我们在不同的培养条件下进行了菌落生长分析(表S5). 来自CD10+细胞的集落在基底/肌上皮标记物细胞角蛋白14(CK14)、平滑肌肌动蛋白(SMA)和波形蛋白(VIM)中均呈阳性,而MUC1+和CD24+细胞在腔标记物细胞角蛋白18(CK18)中呈阳性,在基底/肌上皮标记物(CK14、VIM和SMA)中呈阴性(图1C类). 相反,CD44+细胞根据所用培养基产生不同类型的菌落。在培养基1中,大多数菌落为间充质样、CK14+、VIM+、CK18-和SMA-,而在培养基3中,大部分菌落为上皮样和CK18+(图1D类). 培养基1和3含有不同的添加剂(例如,生长因子、激素和抗氧化剂),培养基3与WIT培养基相似(11). 在两种培养基中,一部分菌落由CK18+和CK14+细胞组成(图1D类)表明CD44+细胞可以同时产生管腔细胞和肌上皮细胞。因此,菌落生长分析的结果与体内四种细胞类型的表达模式和推测的祖细胞和分化细胞特征。

细胞类型特异性DNA甲基化模式。

接下来,我们使用MSDK分析了上述每种细胞类型的全面DNA甲基化谱,MSDK是我们实验室先前开发的一种全面的DNA甲基化图谱技术(12). 通过使用甲基化敏感的组合(例如。,阿斯克一) 和非敏感(例如。,Nla公司三) 限制性内切酶,我们从基因组中获得短序列标签。这些标签的数量反映了甲基化敏感酶每个识别位点的甲基化状态。因为我们使用了AscI,所以我们的分析仅限于其识别位点。尽管如此,我们分析了每个样本中对应于4000个以上基因的5000多个独特标签,约占与CpG岛相关的所有人类编码基因的25%(表S6图S2 一个B类).

确定具有统计显著性的AscI位点(P(P)<0.05)四种不同细胞类型之间的甲基化差异,我们对MSDK库进行了配对和组合比较(图S3表S7). 这些比较表明,与其他三种细胞类型相比,CD44+细胞都是低甲基化的。

为了确定ES和乳腺上皮细胞DNA甲基化谱之间的相似性,我们对未分化(ES-UD)和BMP4处理(ES-D)的人类胚胎干细胞进行了MSDK分析(图S1D类) (13,14). 总的来说,与BMP-4处理的ES细胞相比,未分化的ES细胞是高甲基化的,有趣的是,与ES-D细胞相比,ES-UD中几个低甲基化的基因座在CD44+细胞中也相对于CD24+细胞低甲基化(表S8).

为了进一步检查DNA甲基化的总体程度是否与细胞分化状态相关,我们计算了每个样本的任意低甲基化分数,该分数由每个文库中每个AscI位点对应的MSDK标签的丰度定义。根据该评分,乳腺上皮细胞中CD44+、MUC1+和CD10+细胞与CD24+细胞相比呈低甲基化,而未分化的ES细胞与BMP-4处理的ES细胞相比甲基化程度更高(图2一个). 观察到的DNA甲基化总体程度的差异并不是因为DNMT(DNA甲基转移酶)表达的细胞类型特异性差异,因为这在样本之间是相当恒定的(数据未显示)。这些结果表明,DNA甲基化谱可能被用作细胞分化状态的标记。然而,在乳腺上皮中,更多分化的细胞可能更甲基化,而在胚胎干细胞中,分化可能与低甲基化有关。

保存图片、插图等的外部文件。对象名为zpq9990847740002.jpg

细胞类型特异性DNA甲基化模式及其功能意义。(一个)MSDK分析每种细胞类型的任意低甲基化评分。(B类)CD44+细胞和其他三种细胞类型之间差异甲基化基因的基因本体富集分析。使用Fisher Exact检验,将CD44+中相对于CD24+(蓝条)、CD10+(绿条)和MUC1+(黄条)细胞的低甲基化基因的本体术语与CD44+细胞中表达的其他基因的本体词汇进行比较。显著丰富的本体术语以相对丰富倍数表示为负对数P(P)值。灰色虚线表示统计显著性(1.3)。(C类)通过使用来自CD44+(红色条)、CD10+(绿色条)、MUC1+(黄色条)和CD24+(蓝色条)细胞的亚硫酸氢处理DNA,qMSP对选定基因的MSDK结果进行验证。每列代表不同的个体。-轴表示相对甲基化水平归一化为ACTB。P(P)数值表明了不同细胞类型之间观察到的DNA甲基化差异的统计意义。(D类)从乳腺肿瘤和正常乳腺分离的CD44+和CD24+细胞中指示基因甲基化的qMSP分析。这个-axis表示CD24+和CD44+细胞中qMSP值的ln比率。PE、胸腔积液、IDC、浸润性导管癌。颜色表示不同的样品。

为了确定哪些基因类别可能受到DNA甲基化的调控,我们使用基因本体(GO)术语对CD44+和其他三种细胞类型之间甲基化的基因进行了分类。我们发现CD44+细胞中的低甲基化基因高度丰富,具有转录相关功能,并参与细胞增殖和分化的调节(图2B类表S4). 特别是,CD44+细胞中与CD24+细胞相比低甲基化的几个基因编码同源异型盒和多梳蛋白,已知这些蛋白可以调节干细胞功能(表1). HOXA10是MLL-AF9癌基因的靶点,是造血干细胞自我更新所必需的(15). 类似地,TCF7L1(TCF3)是涉及OCT4、SOX2和Nanog的转录程序的上游调节器,这是ES细胞的多能性和自我更新所必需的(16). 这些数据与以下假设一致:CD44+细胞包括乳腺上皮祖细胞,其表型和分化(至少部分)受表观遗传调控。此外,我们的数据还表明,多能性和自我更新可能由不同干细胞中重叠的一组转录因子调节。

表1。

CD44+和CD24+正常乳腺上皮细胞之间已知发育作用的特定基因差异甲基化

标签CD24型+CD44细胞+Pval公司比率Chr公司基因距离职位搁浅功能
CACAGCAGCCCCTCCCAG公司0390.0000012217LHX1型+3696里面+同源框基因
TATTGCCAAGTTAC公司0140.0020597287HOXA10型−4360上游同源框基因
TATTGCCAAGTTAC公司0140.0020597287HOXA11型+627里面同源盒基因
TCGCCGGGCTCTCCC7669.33E-08年55PITX1接口+6168年里面同源框基因
ACAATAGCGCGATCGAG公司2140.0178476416IRX5系列−460上游+同源框基因
TTAAGAGGGCCCCGGGG070.0241671414NKX2–8号+1823里面同源框基因
AGCCTCGGGTGAG公司5240.01061811LMX1A公司−747上游同源框基因
CCCCGTTTTTGTGAGTG公司6220.0355276217HOXB9型−20615上游同源框基因
CAGCACGCTTTCTGCCC公司20560.016936229LHX3型−141上游同源框基因
中国CCAGGCCGTGTCC9370.0070473217CBX8系列−16725上游多囊蛋白
ACCCGCACATCCCGGG公司461405.96E-06年217CBX4型−4595上游多囊蛋白
CACCAACCTAGAAGGC公司10330.038320122GLI2型−56233上游+Shh途径
ACCCTGAAAAGCCTAGCC公司240.00179963421ITGB2标准−10800上游干细胞标记
TGGTTTACCTTGATA公司0130.00977376FOXF2型−6378上游+开发
GTCCTTGTTCCCATAGG公司0350.000002196FOXC1系列−5061上游+开发
中国证监会0200.000800427111SOX13型−576上游+开发
CACTCCAGTTTAGA公司070.024167144SMAD1系列−783上游+BMP信号
CCCCAGCTCGGCGG(CCCCAGTCGG)441130.0011826212TCF7L1型+854个里面+WNT途径

MSDK标签序列,指示库中的原始标签号(CD24+和CD44+),第页-观察到的库间标签数差异的统计显著性值、标准化标签数比率、染色体位置、基因符号、到预测转录起始点的距离、阿斯克指示了与基因相关的I位点、DNA链和基因功能。

为了确认所选基因的MSDK结果,我们对亚硫酸氢盐处理的基因组DNA进行了测序,并进行了定量甲基化特异性PCR(qMSP)。检测的基因包括FNDC1和FOXC1(与其他三种细胞类型相比,CD44+细胞低甲基化)、PACAP(与CD24+和MUC1+细胞相比,CD44+和CD10+细胞低甲化)、SLC9A3R1(与其他3种细胞类型比较,CD44+细胞高甲基化),DDN(与CD10+相比,CD42+细胞低甲基),DTX1和CDC42EP5(与CD44+细胞相比,CD10+细胞低甲基化)、LHX1、HOXA10和SCGB3A1(与CD24+细胞相比在CD44+电池低甲基化的)和SOX13(与MUC1+和CD24+电池相比,在CD10+电池低甲化的)。并非所有基因都通过这两种方法进行了分析。测序和qMSP结果证实了细胞类型特异性甲基化模式,表明来自不同年龄段(18-58岁)女性和生殖史的样本之间的甲基化模式是一致的,尽管观察到甲基化程度存在一些差异(图2C类图S4).

乳腺癌细胞类型特异性DNA甲基化模式的保护。

我们最近对正常乳腺组织和肿瘤乳腺组织中CD24+和CD44+细胞的基因表达谱进行的分析显示,类似细胞类型之间存在高度相似性(6). 为了确定正常CD44+细胞和CD24+细胞之间差异甲基化的基因是否也在来自肿瘤组织的类似细胞类型中差异甲基化,我们对五种不同乳腺肿瘤的CD44+和CD24~+细胞进行了qMSP分析。肿瘤CD44+和CD24+细胞中几个基因的甲基化与正常细胞中的甲基化相同,尽管肿瘤比正常样本变化更大(图2D类图S5). 有趣的是,与正常CD24+和CD44+细胞最不相似的两种肿瘤(IDC31和PE6)均为HER2+,而其他所有肿瘤均为ER+、PR+和HER2−。这表明不同肿瘤亚型中祖细胞样细胞的表观遗传学特征不同,这可能是因为肿瘤特异性转化事件。

为了进一步验证定义祖细胞样细胞的表观遗传学特征在不同乳腺癌亚型中不同的假设,我们分析了来自散发病例和生殖系BRCA1和BRCA2突变携带者的更大组(>100例)浸润性乳腺癌中PACAP、FOXC1、SLC9A3R1和HOXA10的甲基化。之所以选择这四个基因,是因为它们是正常乳腺中CD44+和CD24+细胞之间最一致的甲基化差异。PACAP、FOXC1和HOXA10的甲基化与PR、ER和HER2状态显著相关,与管腔(ER+/PR+)、HER2+和基底样(ER−/PR−/HER2−)乳腺肿瘤亚型相关(表S9). 因此,管腔肿瘤的甲基化模式与正常CD24+细胞相似,而HER2+和基底样肿瘤的甲基化度较低,与CD44+细胞相似。

我们以前证明CD44+乳腺癌细胞基因表达特征与更短的无远处转移生存期相关(6). 为了研究细胞类型特异性甲基化基因是否也存在这种关联,我们利用临床随访和微阵列数据分析了两组独立患者中五个此类基因的表达(图S6一个). 在这两个数据集中,CD44+细胞样肿瘤患者的无远处转移生存期明显短于CD24+细胞样瘤患者,具有统计学意义(图S6一个).

为了确定癌细胞的表观遗传学特征在肿瘤进展过程中是否得到维持,我们分析了四名独立患者的匹配原发肿瘤和位于不同器官的远处转移的甲基化特征。与原发肿瘤相比,远处转移肿瘤中HOXA10、FOXC1和LHX1(CD24+细胞中的高甲基化)的甲基化程度更高,而PACAP和SLC9A3R1的甲基化表现出更多的变异性(图S6B类和数据未显示)。这些结果表明远处转移富含高甲基化CD24+乳腺癌细胞,证实了我们先前的免疫组化分析(6). 然而,由于几乎所有被分析的患者都患有ER+/PR+/HER2−原发浸润性乳腺癌,因此我们的发现可能对该肿瘤亚型具有特异性。

DNA甲基化和基因表达模式之间的联系。

为了确定甲基化差异对基因表达模式的影响,我们对qMSP分析的相同细胞进行了定量RT-PCR(qRT-PCR)(图3一个). 启动子区或基因内CpG岛的甲基化通常导致表达降低(FNDC1、DDN、LHX1、HOXA10、FOXC1和SOX13),而某些上游(PACAP)或下游(CDC42EP5)位点的甲基化与高表达相关。由于CTCF和BORIS等沉默物的结合受到抑制,DNA甲基化增加可能导致表达增加(17). 与这一假设一致,PACAP和CDC42EP5的差异甲基化区域包含预测的CTCF/BORIS结合位点。

保存图片、插图等的外部文件。对象名为zpq9990847740003.jpg

差异甲基化基因的表达。(一个)用于甲基化研究的同一组细胞中指示基因的qRT-PCR分析。颜色表示单元格类型,如图2。规范化为RPL19的相对表达水平在-轴。“U”(非甲基化)和“M”(甲基化)表示每个细胞类型中基因的甲基化状态,以及第页-数值表明所分析的细胞类型之间的表达水平差异具有统计意义。基因名称旁边的数字表示阿斯克I位点相对于转录起始位点的位置。“CpG岛”表示阿斯克所分析的现场位于预测的CpG岛内。(B类)与CD24+细胞相比,CD44+高表达基因与Suz12靶点之间的关系。SAGE表达比率由红色和绿色阴影分别表示上调和下调基因。黄色条表示阈值比率(2倍差异)。基因是根据其折叠差异排序的。Suz12靶基因由黑色条表示,右侧面板显示其密度和对应第页-基因列表中的值。(C类)正常人乳腺组织中指示基因表达的免疫组织化学分析。(D类)对HOXA11和CD44v6表达进行双重免疫组织化学染色,以证明同一细胞中两个标记物共存(红色箭头)。插图显示放大倍数更高的图像。

为了获得更多证据来支持我们的假设,即CD44+细胞包括具有祖细胞特性的细胞,并进一步探索胚胎干细胞和假定成体干细胞的表观遗传程序的相似性,我们分析了CD44+和CD24+细胞之间差异表达的基因是否富集于Suz12靶点。Suz12是与含有H3K27的核小体相关的PRC2(多梳抑制复合物2)的成员,对小鼠胚胎发育和ES细胞分化至关重要(8,18). Suz12的靶点已根据ES细胞的全基因组ChIP研究确定,其中许多靶点编码多能性和自我更新所需的蛋白质(19,20). 当我们比较CD44+和CD24+细胞与ES细胞Suz12靶点之间差异表达的基因时,我们发现在CD44+细胞高表达的基因中Suz12目标点在统计学上显著富集(图3B类表S10). 在分析CD44+细胞和其他两种(CD10+和MUC1+)细胞类型之间差异表达的基因时,也进行了类似的观察。因此,CD44+细胞包括具有干细胞特征的细胞,这些干细胞特征似乎由相同的基因定义,而与组织类型无关。

为了进一步加强我们确定的在CD44+细胞和乳腺上皮祖细胞中表达的低甲基化基因之间的联系,我们对正常人类乳腺组织中的四个此类基因(HOXA10、SOX13、HOXA11和MSC)进行了免疫组织化学分析。位于导管和肺泡基底层的偶尔细胞表达这些基因,与乳腺上皮祖细胞的推测位置一致(图3C类). 双重免疫组织化学分析表明,这些细胞对CD44v6也呈阳性反应,CD44v4是一种上皮特异性的标记物亚型,用于其富集(图3D类). 这些结果支持了我们的假设,即编码转录因子的基因是乳腺上皮祖细胞表型表观遗传调控因子的候选基因,因为它们的甲基化和表达模式在样本和样本中始终是CD44+细胞特异性的体内表达与乳腺上皮祖细胞的假定位置相关。

细胞类型特异性基因表达和DNA甲基化模式的系统网络分析。

为了进一步分析可能在确定干细胞和分化乳腺上皮细胞表型方面发挥重要作用的信号通路和基因相互作用网络,使用Metacore对来自正常乳腺的四种不同细胞类型的MSDK和SAGE数据进行功能分析(21). 首先,我们确定四种细胞类型中差异甲基化或表达的基因映射到相同的通路和细胞过程(图S7–S9表S11表S12). 接下来,我们分析了信号通路和网络中单个细胞类型特异性差异的甲基化和表达数据(图S10和S11). CD24+细胞中高表达的基因富含胰岛素调节途径、线粒体代谢和凋亡,而CD44+细胞中的高表达基因富含ECM(细胞外基质)和细胞骨架重塑、整合素介导的细胞粘附、免疫反应过程和IL-4介导的信号转导(表S13). CD24+细胞得分最高的ANR网络包括几个DNA损伤检查点基因(例如p53、Chk1、Chk2和ATM),而MYC、AR和TGF-β/SMAD信号在CD44+细胞中占主导地位(图S10和S11). 这些结果分别与CD44+和CD24+细胞的祖细胞样和管腔上皮表型一致。

FOXC1,乳腺上皮前体细胞功能的候选调节器。

为了进一步验证我们鉴定的CD44+细胞中低甲基化和高表达的转录因子与其他三种细胞类型相比可能在祖细胞功能中发挥作用的假设,我们确定了FOXC1在分化的乳腺上皮细胞中表达的影响。FOXC1是一个顶级候选祖细胞表型调节器,因为FOXC1相互作用网络丰富了CD24+和CD44+细胞之间差异甲基化的许多其他基因(例如IRX5、ROR-α和BAI1),并包括调节祖细胞功能的几个关键途径,包括FGF、TGF-β、Notch、,和WNT信令(图S12 一个B类). 在特定细胞中具有最广泛网络的基因已被证明是细胞表型的重要调节器(22). 在所分析的所有细胞类型中,FOXC1在CD44+细胞中也是最低甲基化和高表达的。此外,FOXC1已被证明在发育中起着重要作用,其表达受Hedgehog和TGF-β的调节,两者都是干细胞功能的重要调节器(23). MCF12A细胞中FOXC1的稳定表达导致分化上皮表型转化为CD44+细胞样间充质表型,这是由形态学变化、细胞迁移和侵袭增加以及基因表达模式改变决定的(图4 A–C). 需要进一步研究来确定FOXC1在乳腺中的功能,但这一发现表明,至少一些我们确定的细胞类型特异性甲基化基因,特别是转录因子,可能在乳腺上皮祖细胞和分化细胞表型的调控中发挥作用。

保存图片、插图等的外部文件。对象名称为zpq9990847740004.jpg

FOXC1的作用。(一个)感染对照组或表达FOXC1的逆转录病毒后MCF12A乳腺上皮细胞的形态和E-cadherin的表达。(B类)FOXC1表达增加MCF12A细胞的迁移和侵袭。(C类)对表达FOXC1的MCF12A细胞和正常CD44+祖细胞样细胞中的指示基因进行qRT-PCR分析。这个-轴表示FOXC1+和CD44+细胞中指示基因与对照细胞和CD24+细胞相比的折叠诱导。

总之,通过使用多种方法的组合,我们确定了人类乳腺上皮祖细胞的候选调节因子、可用于纯化不同乳腺上皮细胞群的标记物以及四种细胞类型的培养条件。此外,我们发现乳腺癌中存在细胞类型特异性DNA甲基化程序,并与肿瘤亚型和临床结果相关。这些数据对于进一步描述乳腺上皮细胞层次结构和理解决定其表型的调控途径具有价值。

材料和方法

程序的详细说明见SI文本.

组织样本和细胞培养。

使用机构审查委员会批准的方案,在没有患者标识符的情况下收集组织标本。如参考文献所述,处理新鲜样品并分离不同的细胞群。6。测试的组织样品和培养条件的详细信息见表S1表S5分别是。

SAGE和MSDK数据的生成和分析。

SAGE和MSDK文库的生成和分析如前所述,使用最新的人类基因组序列信息(6,12).

使用Metacore进行路径图和网络分析。

分析是根据Metacore分析套件4.2版(GeneGo,Inc.St.Joseph,MI)手册进行的,之前已经进行过描述(6,21,24).

亚硫酸氢盐测序、qMSP和RT-PCR。

基因组DNA经亚硫酸氢盐处理和纯化;如前所述,进行qMSP和RT-PCR扩增和测序(12,25). 如有要求,作者可提供所有使用的引物列表。使用Kruskal-Wallis检验计算不同细胞类型之间qMSP值差异的统计显著性以及qMSP与表达水平之间的相关性。

免疫组织化学。

单个标记物的免疫组织化学分析基本上如参考文献所述。26使用兔多克隆HOXA10(Honami Naora博士馈赠,德克萨斯州休斯顿MD Anderson癌症中心)、SOX13(Sigma)、HOX11(Abnova)和MSC(Santa Cruz)抗体。

DNA构建和FOXC1表达。

将人FOXC1 cDNA克隆到pWZL-blasto逆转录病毒结构中,并使用标准程序进行逆转录病毒的生成。用表达FOXC1的逆转录病毒或对照病毒感染MCF-12A细胞,并在含有急速杀菌素的培养基中筛选细胞。

补充材料

支持信息:

致谢。

我们非常感谢Fiona Blows在获取人体组织样本方面的帮助,以及Dyane Bailey在免疫组织化学方面的帮助。我们感谢Honami Naora博士(德克萨斯州休斯顿安德森癌症中心医学博士)慷慨捐赠HOXA10抗体;加拿大温哥华不列颠哥伦比亚省癌症局基因组科学中心,以及MSDK和SAGE文库测序的癌症基因组解剖学项目。这项工作得到了美国国立卫生研究院(National Institutes of Health Grants)CA89393、CA94074和CA116235(to K.P.)、美国国防部(U.S.Department of Defense Grant)W81XWH-07-1-0294(to K.)和美国癌症学会(American Cancer Society Grant)RSG-05-154-01-MGO(to K.P.)的支持;苏珊·科曼基金会奖学金PDF042234(至M.H.)和PDF0707996(至M.S.);Fannie E.Rippel基金会奖学金(S.A.M.);哈佛大学/Dana-Farber SPORE乳腺癌发展研究(E.L.S.);以及美国能源部健康与环境研究办公室能源研究办公室,合同DE-AC03-76SF000098(致M.R.S.);和国立卫生研究院拨款CA112970(发给M.R.S.)。

脚注

利益冲突声明:K.P.接受诺华制药公司的研究支持,并担任其顾问。K.P..还接受Biogen-Idec的研究支持并担任Aveo Pharmaceuticals,Inc.和GeneGo Inc.M.H.,N.B.Q.的顾问。,根据DFCI的政策,K.P.提交了关于MSDK方法和本手稿中描述的结果的专利申请。V.U.、T.N.和Y.N.是Genego Inc.的员工。

这篇文章是PNAS直接提交的。

数据存储:本文中报告的数据已存储在SAGE Genie数据库中,http://cgap.nci.nih.gov/SAGE网站.

本文包含在线支持信息,网址为www.pnas.org/cgi/content/full/0805206105/DC补充.

工具书类

1Stingl J、Raouf A、Eirew P、Eaves CJ。解读乳腺上皮细胞层次。细胞周期。2006;5:1519–1522。[公共医学][谷歌学者]
2Ashkenazi R、Jackson TL、Dontu G、Wicha MS。乳腺癌干细胞——利用数学建模的研究机会。干细胞综述。2007;:176–182.[公共医学][谷歌学者]
三。Villadsen R等。成人乳腺干细胞分级的证据。细胞生物学杂志。2007;177:87–101. [PMC免费文章][公共医学][谷歌学者]
4Dontu G等人。人类乳腺干/祖细胞的体外繁殖和转录图谱。基因发育。2003;17:1253–1270. [PMC免费文章][公共医学][谷歌学者]
5Al-Hajj M、Wicha MS、Benito-Hernandez A、Morrison SJ、Clarke MF。致癌乳腺癌细胞的前瞻性鉴定。美国国家科学院程序。2003;100:3983–3988. [PMC免费文章][公共医学][谷歌学者]
6Shipitsin M等。乳腺肿瘤异质性的分子定义。癌细胞。2007;11:259–273.[公共医学][谷歌学者]
7Jackson M等人。严重的全球DNA低甲基化阻碍胚胎干细胞的分化并诱导组蛋白高乙酰化。分子细胞生物学。2004;24:8862–8871. [PMC免费文章][公共医学][谷歌学者]
8Pasini D、Bracken AP、Hansen JB、Capillo M、Helin K。胚胎干细胞分化需要多梳组蛋白Suz12。分子细胞生物学。2007;27:3769–3779. [PMC免费文章][公共医学][谷歌学者]
9Wernig M等。成纤维细胞体外重编程为多功能类ES-cell状态。自然。2007;448:318–324.[公共医学][谷歌学者]
10Velculescu VE,Zhang L,Vogelstein B,Kinzler KW.基因表达的系列分析。科学。1995;270:484–487.[公共医学][谷歌学者]
11Ince TA等。不同人类乳腺上皮细胞类型的转化导致不同的肿瘤表型。癌细胞。2007;12:160–170.[公共医学][谷歌学者]
12胡M,等。乳腺癌基质细胞的明显表观遗传变化。自然遗传学。2005;37:899–905.[公共医学][谷歌学者]
13Ludwig TE等人。在规定条件下人类胚胎干细胞的衍生。国家生物技术。2006;24:185–187.[公共医学][谷歌学者]
14Xu RH等。BMP4启动人类胚胎干细胞向滋养层细胞的分化。国家生物技术。2002;20:1261–1264.[公共医学][谷歌学者]
15Krivtsov AV等。MLL-AF9启动的从承诺祖细胞到白血病干细胞的转化。自然。2006;442:818–822.[公共医学][谷歌学者]
16Cole MF、Johnstone SE、Newman JJ、Kagey MH、Young RA。Tcf3是胚胎干细胞核心调控电路的组成部分。基因发育。2008;22:746–755. [PMC免费文章][公共医学][谷歌学者]
17Klenova EM、Morse HC、III、Ohlsson R、Lobanenkov VV。新的BORIS+CTCF基因家族独特地参与了正常生物学和癌症的表观遗传学。Semin癌症生物学。2002;12:399–414.[公共医学][谷歌学者]
18Pasini D、Bracken AP、Jensen MR、Lazzerini Denchi E、Helin K.Suz12对小鼠发育和EZH2组蛋白甲基转移酶活性至关重要。EMBO J。2004;23:4061–4071. [PMC免费文章][公共医学][谷歌学者]
19Lee TI等。Polycomb对人类胚胎干细胞中发育调节因子的控制。单元格。2006;125:301–313。 [PMC免费文章][公共医学][谷歌学者]
20Bracken AP、Dietrich N、Pasini D、Hansen KH、Helin K。Polycomb靶基因的全基因组定位揭示了它们在细胞命运转变中的作用。基因发育。2006;20:1123–1136. [PMC免费文章][公共医学][谷歌学者]
21Nikolsky Y,Ekins S,Nikolskaya T,Bugrim A.从复杂高通量数据中生成生物标记物特征网络的新方法。毒理学快报。2005;158:20–29.[公共医学][谷歌学者]
22何X,张杰。为什么枢纽在蛋白质网络中往往至关重要?公共科学图书馆遗传学。2006;2:e88。 [PMC免费文章][公共医学][谷歌学者]
23Myatt SS,Lam EW公司。叉头盒蛋白在癌症中的新作用。Nat Rev癌症。2007;7:847–859.[公共医学][谷歌学者]
24Wood LD等。人类乳腺癌和结直肠癌的基因组景观。科学。2007;318:1108–1113.[公共医学][谷歌学者]
25Herman JG、Graff JR、Myohanen S、Nelkin BD、Baylin SB。甲基化特异性PCR:一种新的CpG岛甲基化状态PCR检测方法。美国国家科学院程序。1996;93:9821–9826. [PMC免费文章][公共医学][谷歌学者]
26Shurin GV等。肿瘤组织中新趋化因子CXCL14的缺失与树突状细胞(DC)的低浸润有关,而肿瘤细胞中人CXCL14表达的恢复会在体内外引起DC的吸引力。免疫学杂志。2005;174:5490–5498.[公共医学][谷歌学者]

文章来自美国国家科学院院刊由以下人员提供美国国家科学院