小鼠肿瘤分析
为了表征小鼠乳腺癌模型中存在的生物表型的多样性,我们对13种不同小鼠模型的肿瘤进行了基于微阵列的基因表达分析(表1)使用安捷伦微阵列和通用参考设计[1]. 我们进行了122个微阵列,包括108个独特的乳腺肿瘤和10个正常乳腺样本(附加数据文件1)。通过对数据进行无监督的分层聚类分析(附加数据文件2),小鼠肿瘤特征显示存在内皮细胞、成纤维细胞、脂肪细胞、淋巴细胞和两种不同上皮细胞类型(基底细胞/肌上皮细胞和管腔细胞)的基因集特征。在这个无监督的集群中对小鼠肿瘤进行分组表明,一些模型产生了具有一致、模型特异性表达模式的肿瘤,而其他模型则表现出更大的多样性,不一定要组合在一起。具体来说,TgWAP-Myc公司、TgMMTV-Neu公司、TgMMTV-PyMT公司、TgWAP-国际3(槽口4)、TgWAP-标签和TgC3(1)-标签肿瘤具有较高的模型内相关性。相反,来自TgWAP的肿瘤-T型
121
、TgMMTV-重量1,布尔卡1有限公司/有限公司;TgMMTV-核心;第53页+/-DMBA诱导的模型显示出不同的表达模式。这个第53页-/-移植模型往往是同质的,4/5个肿瘤合并在一起,而布尔卡1+/-;第53页+/-电离辐射(IR)和第53页+/-IR模型显示肿瘤之间存在一定的异质性;然而,6月7日布尔卡1+/-;第53页+/-IR和5/7第53页+/-IR均出现在一个树状图分支内。
与之前的人类肿瘤研究一样[1,三],我们进行了“内在”分析,以选择始终代表小鼠样本组/类别的基因。在人类研究中,使用来自同一患者的生物复制来确定每个基因的表达变异,该算法识别的“内在基因”在生物复制中的变异相对较低,在个体之间的变异较高。相反,在这项小鼠研究中,我们使用附加数据文件2中的树状图,将该算法应用于由经验确定的相关阈值>0.65定义的小鼠样本组。这种“内在”分析产生了866个基因,然后我们将其用于层次聚类分析(图1以及完整集群图的附加数据文件3)。该分析确定了10个潜在组,每个组包含5个或更多样本,包括正常乳腺组(I组)和9个肿瘤组(指定II-X组)。
总的来说,这十个组包含在四个主要类别中(图1亿(从左至右):正常乳腺标本(第一组)和具有间叶特征的肿瘤(第二组);基底/肌上皮肿瘤(III-V组);具有管腔特征的肿瘤(第VI-VIII组);和具有混合特征的肿瘤(第IX组和第X组)。第一组包含所有正常乳腺样本,无论菌株如何,均显示出高度相似性,其特征是基底层/肌上皮的高表达(图第1页)和间充质特征,包括波形蛋白(图1克). 第二组样品来自几个模型(2/10布尔卡1有限公司/有限公司;TgMMTV-核心;第53页+/-,3/11 DMBA诱导,1/5第53页-/-移植,1/7第53页+/-红外,1/10 TgMMTV-Neu公司和1/7 TgWAP-T型
121
)并显示间充质特征的高表达(图1克)除了第二个高表达的间充质样簇外,它们还与正常样本共享蜗牛同源物1(一个与上皮-间充质转化有关的基因[11])后者在正常样本中没有表达(图第1页). 两个TgWAP-Myc公司树状图最左侧的肿瘤显示了明显的棘状组织学,也表达了这些间充质样基因特征。第II组肿瘤间充质表型的进一步证据来自角蛋白8/18(K8/18)和平滑肌肌动蛋白(SMA)免疫荧光(IF)分析,这表明大多数脊柱样肿瘤是K8/18阴性和SMA阳性(图2升).
第二大类包含III-V组,其中III组(4/11 DMBA诱导和5/11重量1),IV组(7/7 Brca1+/-;第53页+/-红外,4/10布尔卡1有限公司/有限公司;TgMMTV-核心;第53页+/-, 4/6第53页+/-IR和3/11重量1)和V组(4/5第53页-/-移植和1/6第53页+/-IR),显示基底/肌上皮细胞的特征(图第1天,第5天). 这些特征包含在两种表达模式中。包括一个集群角蛋白14,17和LY6D型(图1天);角蛋白17是已知的人类基底样肿瘤标志物[1,12],同时LY6D型是糖基磷脂酰肌醇(GPI)锚定蛋白Ly6家族的一员,在头颈部鳞状细胞癌中高度表达[13]. 该簇还包含基底膜的成分(例如,层粘连蛋白类)和半桥粒(例如,Envolakin公司和Desmoplakin公司)连接基膜和细胞质角蛋白丝。第二个基底/肌上皮簇在第三组和第四组肿瘤中高表达,以及一组鳞状形态的DMBA肿瘤的特征是高表达标识4,TRIM29阀内件,以及角蛋白5(图第1页)后者是另一种人类基底样肿瘤标志物[1,12]. 与上述基因集相比,该基因集在较小的模型子集中表达(图1天)在大多数V组肿瘤中较低或缺失。正如基因表达数据预测的那样,大多数肿瘤在角蛋白5IF的(K5)(图2克/千克).
第三类肿瘤(第VI-VIII组)包含许多“同质”模型,所有这些模型都显示出潜在的“管腔”细胞表型:第VI组包含大多数TgMMTV-Neu公司(9/10)和TgMMTV-PyMT公司(6/7)肿瘤,而第VII组和第VIII组包含大多数TgWAP-Myc公司肿瘤(11/13)和TgWAP-国际3样品(6/7)。这些肿瘤(尤其是VI组)的一个显著特征是XBP1(图1c个),这是一个人类腔肿瘤定义基因[14–17]. 这些肿瘤还表达紧密连接结构成分基因,包括闭塞素,紧密连接蛋白2和三和管腔细胞K8/18(附加数据文件2)。K8/18和K5的IF证实这些肿瘤都只表达K8/18(图2b-f型).
最后,第九组(1/10布尔卡1有限公司/有限公司;TgMMTV-核心;第53页+/-,4/7 TgWAP-T型
121
肿瘤和5/5 TgWAP-标签肿瘤)和X组(8/8 TgC3(1)-标签)肿瘤位于最右侧,呈混合特征;特别是,第九组肿瘤显示出一些管腔的表达(图1c个),基础(图1天)和间充质基因(图第1页)而X组肿瘤表达为基底(图1e、f)和间充质基因(图1f,克).
IF分析表明,与人类一样[12,18],小鼠基底样模型倾向于表达K5,而小鼠管腔模型仅表达K8/18。然而,一些小鼠基底样模型产生了肿瘤,其中包含基底(K5+)和管腔(K8/18+)细胞系的细胞巢。例如,在某些TgMMTV中-重量1[19],DMBA诱导(图2克,i)、和布尔卡1-在同一肿瘤内观察到单个阳性K5和K8/18细胞的不同区域。有趣的是,在一些布尔卡1有限公司/有限公司;TgMMTV-核心;第53页+/-样本、双阳性K5和K8/18细胞结节被鉴定出来,暗示潜在的过渡状态或前体/干细胞群(图第2节),在某些TgMMTV中-重量1(图2小时) [19]和布尔卡1-缺乏肿瘤,存在大面积上皮样细胞,几乎没有检测到K5或K8/18染色(数据未显示)。
使用“共识聚类”(CC)评估这些组的再现性[20]. 使用内在基因列表的CC与图中所示的结果显示出强烈的一致性1并支持使用层次聚类分析确定的大多数组的存在(附加数据文件4)。然而,基于生物学知识,我们对某些CC定义的组的进一步划分似乎是合理的。例如,分层聚类法将正常乳腺样本(第一组)和组织学上不同的棘状瘤(第二组)分离出来,并通过CC将其合并为一组。第六组(TgMMTV)-Neu公司和PyMT公司)和VII(TgWAP-Myc公司)同样通过层次聚类将它们分开,但CC将它们放在一个类别中。CC也使用所有表达和不同表达的基因(摘自附加数据文件2)进行,这些基因与基于内在列表的分类不太一致,并且经常将肿瘤从单个模型中分离到不同的组中(图3立方厘米,最底部面板);例如,TgMMTV-Neu公司肿瘤被分为两个或三个不同的组,而当使用内在列表进行分析时,这些是不同的和单一的组。这可能是由于“所有基因”列表中存在或不存在来自其他细胞类型(即淋巴细胞、成纤维细胞等)的基因表达模式,这导致肿瘤根据非来自肿瘤细胞的质量进行分类[1].
鼠-人联合非监督分析
小鼠基因簇让人想起以前在人类乳腺肿瘤样本中发现的基因簇。为了更直接地评估这些潜在的共同特征,我们对这里展示的小鼠数据和我们之前报告的人类乳腺肿瘤数据的扩展版本进行了综合分析。人类数据来源于代表184个原发性乳腺肿瘤的232个微阵列,9个正常乳腺样本也在安捷伦微阵列上进行了分析,并使用了一种通用的参考策略(结合人类数据集[21–23]加上58名新患者/阵列)。为了合并人类和小鼠数据集,我们首先使用小鼠基因组信息数据库来识别注释良好的小鼠和人类同源基因。然后,我们进行了距离加权判别校正,这是一种有监督的分析方法,用于识别两个数据集之间存在的系统差异,并进行全局校正以补偿这些全局偏差[24]. 最后,我们创建了一个由老鼠和人类组合数据组成的无监督层次聚类(图三以及完整集群图的附加数据文件5)。
该分析确定了许多共同特征,包括类似于上述细胞线簇的簇。具体来说,人类基底样肿瘤和小鼠布尔卡1+/-;第53页+/-;红外,布尔卡1有限公司/有限公司;TgMMTV-核心;第53页+/-,百万吨电视-重量1,并且一些DMBA诱导的肿瘤的特征是层粘连蛋白γ2,角蛋白5,6亿,13,14,15,TRIM29阀内件,干细胞生长因子和CRYAB公司(图3亿)最后一个是一种人类基底样肿瘤标记物,可能与化疗耐药有关[25]. 如上所述布尔卡1+/-;第53页+/-;IR,一些布尔卡1有限公司/有限公司;TgMMTV-核心;第53页+/、DMBA诱导的和TgMMTV-重量1IF染色K5阳性的肿瘤和人类基底样肿瘤倾向于使用K5/6抗体染色阳性[1,12,18,26]从而表明,这两个物种的基底样肿瘤具有共同的K5蛋白表达,这是一个显著特征。
小鼠和人类的“管腔肿瘤”共同特征与共同的基础特征不同,但确实包括高表达的SPDEF公司,XBP1型和GATA3协议(图3立方厘米)并且这两个物种的管腔肿瘤也染色为K8/18阳性(图2并查看[18]). 然而,对于这个管腔簇中的许多基因,两个物种之间的相对表达水平不同。例如,一些基因在两个物种的肿瘤中一直很高(例如,XBP1型,SPDEF公司和GATA3协议),而其他,包括TFF公司,SLC39A6型,以及FOXA1公司在人类管腔肿瘤中高表达,在小鼠肿瘤中低表达。值得注意的是,人类腔上皮基因簇总是包含雌激素-受体(急诊室)和许多雌激素调节基因,包括TFF1型和SLC39A6型[22]; 由于大多数小鼠乳腺肿瘤,包括此处所述的肿瘤,均为ER阴性,ER和大多数ER调节基因明显缺乏参与,这可能解释了一些人类腔上皮基因在小鼠中表达不一致的差异。
物种间还发现了其他几个显著和值得注意的特征,包括“增殖”特征,其中包括有充分记录的增殖标记Ki-67(图第三版) [1,27,28]和干扰素调节模式(图第3页) [27]. 人类基底样肿瘤和pRb功能受损的小鼠模型(即IX组和X组肿瘤)的增殖特征最高。目前,干扰素对人类乳腺肿瘤生长调节的影响尚不清楚,而具有这种表达特征的小鼠模型(TgMMTV-Neu公司、TgWAP-Tag、,第53页-/-移植和棘突肿瘤)可能为今后研究这一途径提供一个模型。成纤维细胞剖面图(图3克)在具有棘突形态的小鼠样品和TgWAP中高度表达-Myc公司在许多人类管腔和基底样肿瘤中也观察到“棘状”肿瘤;然而,平均而言,这种分布在小鼠肿瘤中的表达水平较低,这与组织学上观察到的上皮细胞与基质细胞的相对比例一致。
通过这些分析,我们还发现了一种潜在的新人类亚型(图三、顶行-下图组和其他数据文件6)。这种亚型在人类和鼠-人联合数据集中都很明显,被称为“克劳丁-罗”亚型,其特征是紧密连接和细胞间粘附相关基因的低表达,包括克劳金斯3,4,7,闭塞素,以及E-钙粘蛋白(图三维). 这些人类肿瘤(n个=13)还显示管腔基因低表达,基础基因表达不一致,淋巴细胞和内皮细胞标记物高表达。该组中除一个肿瘤外,其余肿瘤均为临床ER阴性,均被诊断为II或III级浸润性导管癌(附加数据文件7为代表性苏木精和伊红图像);因此,这些肿瘤似乎不是小叶癌,这可能是因为它们的低表达E-钙粘蛋白该组的独特性得到了与小鼠棘突样肿瘤共有的间充质表达特征的支持(图3克)在这些人类肿瘤附近聚集,并且缺乏克洛丹基因簇(图三维). 需要进一步分析以确定这些人类肿瘤的细胞起源。
跨物种扩增的共同区域
小鼠C3(1)-标签肿瘤和人类基底样肿瘤的一个子集显示出一组基因的高表达,包括克拉2,益普索8,Ppfibp1型,苏尔布,以及Cmas公司,它们都位于对应于人类染色体12p12和小鼠染色体6的同步区(图3小时).克拉2扩增与C3肿瘤进展相关(1)-标签模型[29]和单倍体功能不全克拉2延缓肿瘤进展[30]. 高共表达克拉2-连锁基因促使我们测试DNA拷贝数的变化是否也可能是克拉2在人类肿瘤的一个子集中。事实上,通过定量PCR检测的16例人类基底样肿瘤中有9例在卡拉斯2基因座;然而,在卡拉斯2在这16个基底样肿瘤中的任何一个。此外,范·比尔斯等. [31]据报道,人类12号染色体的这一区域在47%的巴西航空公司1-相关肿瘤的比较基因组杂交分析;巴西航空公司1-已知相关肿瘤具有基底样分子特征[三,32]. 在培养的人类乳腺上皮细胞中,显示出基底/肌上皮特征[1,33]转化需要高致癌性H-ras和SV40大T抗原的表达[34]. 综上所述,这些发现表明卡拉斯2可能影响细胞表型或确定基底样肿瘤的易感靶细胞类型。
鼠人共有的内在特征
为了同时对小鼠和人类肿瘤进行分类,我们确定了人类乳腺肿瘤内在列表(Hu中描述的1300个基因等. [21])以及在此开发的小鼠内在列表(866个基因)。这两个列表的重叠共有106个基因,当用于层次聚类分析时(图4)确定了四个主要组:最左边的组包含所有人类基底样、“克劳丁-罗”和5/44 HER2+/ER肿瘤,以及小鼠C3(1)-标签、TgWAP-标签和棘突肿瘤。第二组(从左到右)包含来自人类和小鼠的正常样本、人类HER2+/ER-和10/92管腔肿瘤的一小部分(6/44),以及剩余的鼠基底样模型的很大一部分。根据临床标准,这两组中几乎所有人类肿瘤在临床上都被归类为ER阴性。
第三组包含33/44人HER2+/ER肿瘤和小鼠TgMMTV-Neu公司、MMTV-PyMT和TgWAP-Myc公司样品。虽然人类HER2+/ER肿瘤主要为ER阴性,但通过免疫组织化学评估的比较基因组分析及其角蛋白表达谱表明,HER2+/ER人类肿瘤起源于“管腔”,而不是表现出基底样特征[18]. 第四组和最右侧组由ER-阳性的人类管腔肿瘤和小鼠TgWAP组成-国际3(缺口4)肿瘤为一组。这些数据表明,尽管许多小鼠和人类肿瘤位于包含大多数小鼠腔模型和人类HER2+/ER-肿瘤的大树状图分支上,但我们测试的小鼠模型均未显示出强烈的人类“腔”表型,其特征是高表达急诊室,GATA3协议,XBP1型和FOXA1公司这些分析表明,MMTV等小鼠管腔模型-Neu公司显示了他们自己独特的特征,这是一种相对较弱的人类管腔表型,缺少ER信号。显示在图的底部4这里讨论的是生物学上重要的基因吗?之前显示的基因是人类基底样肿瘤标记物(图4c类),人类管腔肿瘤标记物,包括ER(图第4天)和HER2/ERBB2/NEU(图第四版).
定义人类肿瘤和小鼠模型的基因集的比较
我们使用了第二种分析方法,称为基因集富集分析(GSEA)[35]寻找人类肿瘤亚型与小鼠模型之间的共同关系。对于该分析,我们首先对微阵列(SAM)进行了两类不成对显著性分析[36]对图中定义的十个小鼠组进行分析1,并获得了定义每组的高表达基因的列表。接下来,我们使用每个人类亚型与所有其他人类肿瘤进行了类似的分析。最后,使用GSEA将小鼠列表与每个人类亚型列表进行比较,GSEA利用了基因列表重叠和基因等级(表2). 我们发现小鼠第九组(第页=0.004)和X(第页=0.001),包括pRb-缺陷/p53缺陷模型的肿瘤,与人类基底样亚型有显著重叠,并且与人类管腔肿瘤呈反相关(第页分别为0.083和0.006)。III组小鼠肿瘤(TgMMTV-重量1大多数)明显重叠的人类正常乳房样本(第页=0.008),可能是由于两组中管腔和基底/肌上皮基因簇的表达。第四组(Brca1-缺乏和重量1)显示出显著的关联(第页=0.058),具有人类基底样剖面。小鼠VI组(TgMMTV-Neu公司和TgMMTV-PyMT公司)显示出一种近乎显著的关联(第页=0.078)与人类管腔轮廓,与人类基底样亚型不相关(第页= 0.04). 最后,小鼠II组脊髓样肿瘤与人类“克劳丁-罗”肿瘤有显著重叠(第页=0.001),这进一步表明这可能是一种独特的新型人类肿瘤亚型。
我们还使用每个小鼠模型作为路径扰动的代表,使用转基因“事件”作为定义组的手段,进行了两类非配对SAM分析。将产生重要基因列表(错误发现率(FDR)=1%)的模型与上述每个人类亚型进行比较(附加数据文件8)。基于SV40 T抗原的模型(所有C3(1)-Tag和WAP-Tag肿瘤)与人类基底样肿瘤有显著重叠(第页=0.002),并与人类管腔类别略有反相关。BRCA1缺陷模型(所有BRCA1+/-;第53页+/-IR和布尔卡1有限公司/有限公司;TgMMTV-核心;第53页+/-肿瘤)对人类基底样肿瘤的影响较小(第页= 0.088). TgMMTV-Neu公司肿瘤与人类管腔肿瘤在名义上有显著差异(在多重比较校正之前)(第页=0.006),与人类基底样肿瘤不相关(第页= 0.027).
两种最重要的人类乳腺肿瘤生物标志物是ER和HER2;因此,我们也对这两个标记的相关数据进行了分析。在这里检测的232例人类肿瘤中,137例具有通过免疫组织化学和微阵列数据评估的ER和HER2数据。如前所述[三,18,21],肿瘤固有亚型与ER和HER2临床状态有很高的相关性(第页<0.0001):例如,81%的ER+肿瘤为管腔型,63%的HER2+肿瘤被归类为HER2+/ER-,80%的ER-和HER2-肿瘤为基底样亚型。使用GSEA,我们比较了图中定义的十个鼠标类1(附加数据文件9)和基于小鼠模型的基因列表(额外数据文件10)添加到基于人类ER和HER2状态进行监督分析获得的人类数据/基因列表中(请注意,仅使用HER2状态的分析(即HER2+与HER2-),ER+和HER2+与其他类别相比不被纳入人类类别,因为HER2状态仅在HER2扩增子上产生基因,ER+和HER2+分类没有产生显著的基因列表)。我们发现小鼠的第IX组(第页=0.009)和X(第页=0.003)肿瘤与ER-HER2-人类肿瘤有显著重叠,并且与人类ER+肿瘤显著反相关(第页分别为0.024和0.043)。VI组小鼠样品(TgMMTV-Neu公司和TgMMTV-PyMT公司)同样显示出与ER+人类肿瘤相同的富集趋势,与ER-HER2-类呈反相关。尽管并不完美,但这些GSEA结果与我们从图中观察到的结果一致1和三并且再次证明,人类和小鼠之间强烈共享基底样轮廓,而管腔轮廓显示了物种之间的一些共享和独特特征。