跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
公共科学图书馆一号。2009; 4(3):e4710。
2009年3月9日在线发布。 数字对象标识:10.1371/journal.pone.0004710
PMCID公司:PMC2650420型
PMID:19270750

Meta分析和与ER状态相关的基因集富集显示“基底”乳腺癌亚群中MYC和E2F活性升高

约格·霍海塞尔,编辑器

关联数据

补充材料

摘要

背景

缺乏雌激素受体(ER)的乳腺癌可以根据预后差、分级高、组织病理学特征独特和独特的分子特征与其他乳腺癌区分。这些特征进一步区分了雌激素受体阴性(ER−)肿瘤亚型,但目前靶向治疗仅限于过表达ErbB2受体的肿瘤。

方法/主要发现

为了揭示未来治疗的发展途径,我们对五个与ER状态相关的大型微阵列数据集的基因表达进行了荟萃分析。计算每个Affymetrix HG-U133A探针组与ER状态的相关性,并通过使用基因集富集分析(GSEA)测试生物定义的基因集的富集来确定ER肿瘤的鉴别途径。正如预期的那样,雌激素受体直接转录靶点在雌激素受体肿瘤中的表达减弱,但雌激素间接调节的基因的表达增强。我们还观察到MYC和E2F驱动的独立转录程序的富集。我们使用雌激素和MYC作用的细胞模型来定义乳腺癌中雌激素与MYC转录活性之间的相互作用。我们发现ER−乳腺癌的基本亚群显示出强烈的MYC转录反应,再现了雌激素受体阳性(ER+)乳腺癌细胞中的间接雌激素反应。

结论/意义

MYC转录活性增加是基底部乳腺癌的一个特征,它在没有ER的情况下模拟了大部分雌激素反应,这表明这些癌症实现雌激素依赖性的机制,并为这一预后不良的乳腺癌亚组提供了潜在的治疗靶点。

介绍

乳腺癌通常分为雌激素受体阳性(ER+)和雌激素受体阴性(ER-)。这些肿瘤类型具有不同的分子表型[1]ER+癌症可能对三苯氧胺等抗雌激素有反应[2],尽管有很大一部分表现出对内分泌治疗的耐药性。与ER+肿瘤相比,ER−肿瘤对内分泌治疗无效,预后较差[2]ER−肿瘤在缺乏有丝分裂雌激素(E2)信号很难理解。为ER−患者开发改进的治疗方法需要阐明这些途径。目前,针对ER−肿瘤的唯一靶向治疗是针对ErbB2受体(ErbB2)的单克隆抗体Herceptin,这在ER−/孕酮受体(PGR)−/ErbB2+患者中显示。负责ER−肿瘤增殖的遗传机制也可能使ER+肿瘤表现出内在或后天内分泌阻力,从而形成功能性ER−瘤状态。

一些研究已经确定了ER+和ER-肿瘤类型之间差异表达水平的基因集[3][5]其他人定义了区分分子亚型的最小基因集,如管腔型(主要是ER+)、ERBB2+和分子基础型(主要为高级/ER−/PGR−/ERBB2−/基础细胞角蛋白+)[1]以期产生更好的预后标记。这些基因集显示出仅限于最差异表达基因的小重叠[4],阻止定义常见途径。通过荟萃分析整合多项研究的数据,提供了必要的统计能力,以确定常见的遗传途径,并为乳腺癌表型多样性的原因提供新的生物学见解。一项荟萃分析最大限度地减少了个体研究的偏见,并确定了在个体研究中可能没有超过显著性阈值的具有微小但一致的表达变化的基因。

我们对五个独立的乳腺癌队列进行了荟萃分析,目的是为Affymetrix HG-U133A芯片上的每个探针组制作ER+和ER-肿瘤差异表达的综合测量。我们首次研究了足够数量的肿瘤,以分离分级和ER状态的混杂效应。使用两种不同的方法对荟萃分析结果进行功能注释分析,即使用注释、可视化和综合发现数据库(DAVID)测试功能类别的过度代表性,以阐明ER+和ER−肿瘤中活跃的遗传途径和机制[6],以及使用基因集富集分析(GSEA)富集公共和内部基因列表[7]在三个独立的验证数据集中,我们将功能注释和GSEA结果与乳腺癌的亚型联系起来。我们发现,ER−乳腺癌基础亚群中MYC的转录活性增强与ER+乳腺癌中雌激素的转录反应相似。这一发现提供了一种机制,使内质网-肿瘤能够克服内质网的缺失,并确立MYC及其转录靶点作为开发乳腺癌基础亚群新疗法的候选药物。

材料和方法

数据收集

Affymetrix HG-U133A微阵列分析的五组原发性乳腺肿瘤数据[8][11]在本荟萃分析中使用。数据来自[11]分为两组数据集,一组来自乌普萨拉大学医院(Sotiriou.Uppsala),另一组来自约翰·拉德克利夫医院(John Radcliffe Hospital),未接受辅助系统治疗(Sotiriau.JRH.Untreated)。HG-U133B数据来自[9]被排除在外。使用鲁棒多芯片平均(RMA)算法对每个数据集进行标准化,并计算log2探测集强度[12]然后创建Elston-Ellis 3级肿瘤的子集数据集,共包含82名ER−和101名ER+患者,用于荟萃分析(参考文献文本S1患者特征)。

三个独立的RMA正常化乳腺癌数据集[13][15]用于meta分析和分子亚型分析的验证(文本S1). 理查森数据集[13]3级肿瘤和正常样本中,指定肿瘤为“基底”、“BRCA1”(阳性巴西航空公司1突变)或“非BLC”(非基底细胞样癌)。对于Wang数据集[14]我们使用了相对转录水平急诊室(探测集ID 205225_at),PGR公司(208305_吨),ERBB2号机组(216836_s_at)和韩元5(201820_at)确定基础样品。帕维坦队列没有ER状态[15]然而,这些样品被归类为Perou的分子亚型等。 [16]帕维坦等。 [15],(参考存放在基因表达总览中的GSE1456系列网址:http://www.ncbi.nlm.nih.gov/geo),我们的研究中保留了这些分类。

荟萃分析

荟萃分析[17]使用中实现的函数执行基因Meta包裹[18]在每个单独的研究中,ER+和ER-肿瘤之间基因表达水平的变化表示为效应大小,这是测量因样本大小偏差而校正的协变量效应大小的条件之间的无单位标准化平均差。将每个数据集中每个HG-U133A探针组的效应大小输入到随机效应模型中,该模型考虑了研究内和研究间的变异性,以产生Z分数,如文本S1Z分数为负表示ER−肿瘤中的探针集强度较高。通过将Z分数转换为P值,计算差异表达的统计显著性,然后使用Benjamini-Yekutieli(by)校正进行多次测试调整[19]转换后的加权平均比(tWAR)可以指示ER+和ER-肿瘤之间的折叠变化,计算方法如文本S1.

功能注释分析

使用2007年版DAVID中的工具,对一组选定的基因进行了功能注释类别的过度表示测试,包括基因本体(GO)和蛋白质域类别[6](请参阅文本S1查看类别详细信息)。多次测试的BY校正应用于EASE得分,显著性阈值设置为调整后的P≤0.05。细胞周期图来自GenMapp数据库[20]图中的基因使用tWAR和荟萃分析中调整的P值着色。

验证数据集的统计分析

使用欧几里德距离度量对缩放的数据进行完全链接层次聚类,以便所有探针共享相同的平均值和方差统计数据R中的包[21]使用双侧配对t检验评估验证数据集中基础和非基础ER−样本中的基因组之间,或基础和正常样本之间的平均探针集强度差异。对于感兴趣的单个基因,使用双侧Welch双样本t检验评估平均强度的差异。

MYC和E分析2差异表达数据集

来自Bild研究的转录谱分析数据等。 [22],卡罗尔等。 [23]以及Musgrove的内部研究等。 [24](保存在基因表达总览中的GSE11791系列)进行RMA正常化,并使用LIMMA分析差异表达[25]未使用强度或折叠式过滤器,差异表达的显著性阈值设置为BY调整的P<0.05。

基因集富集分析(GSEA)

GSEA公司[7]用于确定给定基因集的成员是否通常与“ER−”肿瘤状态相关,因此对HG-U133A芯片上的所有22283个探针集进行meta分析Z评分,从最阴性到最阳性。使用默认功能将基因列表折叠为唯一的基因符号。最大基因集大小固定为1500个基因,最小大小固定为15个基因。进行了1000个随机样本排列,显著性阈值设置为FDR<0.05。如果一个基因集的富集分数为正,则其大多数成员在ER−肿瘤中的表达高于ER+肿瘤,并且该集在ER-肿瘤中被称为“富集”。如果一组的富集分数为负,则在ER−肿瘤中称为“耗尽”。使用截至2007年3月的分子特征数据库(MolSigDB)c1.v2、c2.v2和c3.v2基因集,对ER−肿瘤中富集的基因集进行了初步筛选(数据未显示)。考虑到这些结果,其他已发表的与E的作用有关的基因集2,MYC和E2F被策划并在第二个GSEA屏幕中添加到MolSigDB列表中。

结果

ER+与ER-肿瘤的Meta分析

一种荟萃分析方法[17]用于从5个数据集中获得ER+和ER-肿瘤中基因表达的总体测量值。所有数据集包括Affymetrix HG-U133A平台上的新鲜冷冻原发性乳腺癌,以及ER状态和分级信息。荟萃分析仅限于3级肿瘤(82 ER−,101 ER+),以克服分级和ER状态之间的关联,并在三个独立数据集中进行了验证。使用的8个数据集的详细信息见文本S1。获得了所有22283 HG-U133A探针组的ER状态关联测量值,并显示在可搜索的表S1其中2141例(9.6%)在ER+和ER−肿瘤中差异表达,校正后P<0.01。这组基因被称为ER状态相关(ERA)基因。

为了探讨3级肿瘤的结果是否可以扩展到其他级别的肿瘤,我们使用ERA基因对2级肿瘤进行了主成分分析(图S1). ERA基因将ER+和ER−2级肿瘤分开,这表明许多在3级肿瘤中差异表达的基因在2级肿瘤中也有差异表达。

ERA基因用于从三个独立的验证数据集中对肿瘤进行聚类,以热图的形式显示(图1). 在每个热图中,产生两个主要基因簇。每个热图中的顶部簇对应于ER+肿瘤中更高表达(红色)的ERA基因和ER-肿瘤中较低表达(蓝色)的ERA-基因。底部簇对应于ERA基因,这些基因表现出相反的表达模式。肿瘤的ER状态显示在热图顶部,表明ERA基因集可以在独立数据集中正确描述ER+和ER-肿瘤,从而验证其预期容量。重要的是,在所有三个数据集中的ER−肿瘤中,ERA基因清楚地描绘了基底部(Richardson集,图1A),预测基础(Wang set,图1B)或分子基础(Pawitan集合,图1C)ER−/ERBB2+亚型的亚型。ERBB2的表达沿着每个热图的顶部显示,角蛋白5(KRT5)的表达在图1B这些基因在亚型中的适当富集已得到明确证明。聚类还区分了管腔亚型。因此,在我们的5个发现数据集中,区分ER状态的基因在3个独立的数据集中清楚地工作,以实现根据ER状态和分子亚型分离肿瘤。

保存图片、插图等的外部文件。对象名称为pone.004710.g001.jpg
A.癌症样本中ERA基因的层次聚类。

[13]、B。[14]和C。[15]每行代表一个基因;每列代表一个样本。样本中每个基因的表达水平,相对于该基因在所有样本中的平均表达,使用红蓝色标表示,红色表示高表达。顶部的树状图表示样本表达模式之间的相似性,而侧面树状图则表示基因表达模式的相似性。图1A数据来自Richardson数据集[13]顶部的颜色条表示以下内容:“ER_Protein”–使用IHC确定的ER状态;“PGR_蛋白”-使用IHC确定的PGR状态;“ERBB2_蛋白”-使用IHC确定的ERBB2状态;“亚型”-根据IHC结果确定的亚型(基本,巴西航空公司1突变阳性或非基底细胞样癌(“non-BLC”)(见样本键)。图1B数据来自Wang数据集[14]顶部的颜色条表示以下内容:“ER_Protein”–使用配体结合分析或IHC确定的ER状态;“PGR_Tcript”、“ERBB2_Transcript”和“KRT5_Transcript”:根据探针集强度的分位数测量的相对表达式,如中的“数据收集”所述材料和方法(参见示例键)。图1C数据来自Pawitan数据集[15]顶部的颜色条表示以下内容:“Molecular_Subtype”(分子亚型)——由与正常型、发光体A、发光体B、ERBB2+和基本分子亚型的相关性决定[16]; “ER_Transcript”–HG-U133A ESR1转录物205225_at的相对表达,以分位数测量;上述“PGR_Transcript”和“ERBB2_Transcript”;和“Tumor_Grade”–Elston-Ellis分级(见示例键)。

ER−肿瘤的增殖基因表达高于相同级别的ER+肿瘤

使用“DAVID”工具分析ERA基因,该工具测试基因本体、通路和蛋白质域的过度表达。ERA基因中所有12类显著过度表达与细胞周期和有丝分裂有关(表1). 这些与细胞周期相关的ERA基因在ER−肿瘤中主要表现出较高的表达,表明ER−瘤的增殖率高于ER+肿瘤,即使肿瘤处于相同的高级别(表S2). 这一点可以通过荟萃分析结果叠加在关键细胞周期控制基因(即“G1到S细胞周期控制”)的路径图上加以说明(图2)和“KEGG细胞周期”(图S2)GenMAPP数据库中的地图。

保存图片、插图等的外部文件。对象名称为pone.0004710.g002.jpg
“G”的GenMapp表示中基因的Meta分析结果1S期细胞周期控制”。

meta分析中,基因的颜色取决于它们在ER+或ER肿瘤中是否有较高的表达,这种过度表达的变化和意义分别由转换的加权平均比(tWAR)和by-调整的P值(adj-P)表示。

表1

来自DAVID的功能注释类别[6]ERA基因明显过度表达。
类别期限计数未调整的P调整后的P
SP_PIR_关键字细胞周期832.40E-12型8.87E-08号
GOTERM_BP_ALL公司细胞周期1421.35E-11号机组2.49E-07型
KEGG_PATHWAY(KEGG_航道)HSA04110:细胞周期414.55E-10型5.60E-06年
获取时间_BP_ALL通过细胞周期调节进展942007年1月1日0.00092
GOTERM_BP_ALL公司细胞周期的调节941.25E-070.00092
GOTERM_BP_ALL公司有丝分裂细胞周期502007年7月34日0.0045
GOTERM_BP_ALL公司细胞分裂391.02E-05号机组0.038
GOTERM_BP_ALL公司M相431.56E-05型0.047
GOTERM_BP_ALL公司有丝分裂361.66E-050.047
SP_PIR_关键字细胞分裂351.92E-05号机组0.047
UP_SEQ_特征域:Kinesin-motor132.27E-05年0.049
GOTERM_BP_ALL公司有丝分裂细胞周期M期362.37E-05号0.049
在综合ERA基因列表中,许多与细胞周期和细胞分裂相关的类别被显著高估,BY调整后的P<0.05。

在ERA基因中,细胞周期蛋白A1、A2、B2、E1和J、细胞周期蛋白依赖性激酶抑制剂2A(CDKN2A型)和CDK2相关蛋白(CDK2AP1号机组)ER−肿瘤中表达较高,而细胞周期蛋白D1、G2和H、,川东北7和细胞周期蛋白G相关激酶(GAK公司)在ER+肿瘤中有较高表达。一些直接参与DNA复制的基因在ER−肿瘤中表达更高:例如,那些编码原-再认知复合体中蛋白质的基因(ORC1L(ORC1L)orc6升),微小染色体维持蛋白MCM2型MCM7系列、和CDC45L型我们在验证数据集中对细胞周期类别中的基因进行了聚类,首先根据ER状态,然后根据ERBB2水平对样本进行强制排序(图S3). 增殖相关基因的差异表达在肿瘤的基础亚群中最为显著,即使肿瘤处于同一级别(图S3A)这表明,与其他分子亚型相比,这些肿瘤具有高增殖性。

使用GSEA对荟萃分析结果的调查

GSEA是一种允许我们搜索ERA基因集的方法,以获取指示潜在生物过程的转录谱。最初的GSEA研究测试了与染色体位置相关的MolSigDB基因集、出版物中的精选基因集和保守调控基序[26]用于ERA基因集的富集。通过单击中的index.html文件,可以查看重要关联的完整列表数据集S1启动浏览器。对结果的检查表明,与MYC和E2F活性相关的许多基因集在ER−肿瘤中非常显著地富集。尽管从这一分析中出现了其他主题,但我们仍集中精力研究这些发现。MYC公司和细胞周期蛋白D1一样,是E的靶点2并能在抗雌激素抑制的MCF-7细胞中拯救细胞增殖[27]。在添加额外的已发布和内部基因集后,我们进行了第二次GSEA筛选(参见材料和方法)与E有关2-细胞系中MYC-和E2F-活性,添加的数据集由前缀“MCA”表示(文本S2).

与ER+状态相关的基因集[4],[28]乳腺癌预后良好[28]在ER−肿瘤中被耗尽(文本S2.A)以及与ER−状态相关的基因[28]结果不佳[28]在ER−肿瘤中富集,表明荟萃分析结果与单个队列的结果一致。与细胞周期相关的几个基因集在ER−肿瘤中富集,支持使用DAVID进行功能注释的结果(文本S2.B). 对错误发现率(FDR)<0.05丰富或耗尽的基因集进行更仔细的检查,并将其分配给生物主题;许多组与染色体位置、E2-行动、MYC行动和E2F-行动。我们将在后续章节中详细报告这些类别。

ER+和ER-肿瘤表达差异的特异性细胞带

DNA拷贝数改变显示ER+和ER-肿瘤亚型之间的区域差异[29],[30]使用GSEA,我们确定了包含ER+和ER-肿瘤表达差异的基因集的细胞带位点(表2); 这些细胞带中的基因标记在ERA基因表中表S1ER−肿瘤中富含6p21、7q32–q33、10p13和21q22内的基因,这些基因通过比较基因组杂交(CGH)在基底部肿瘤中显示增益[31]和1p34,其显示ER+肿瘤中杂合性的丧失[30]我们注意到21q22的增加与不良预后有关[31]并且这个细胞带含有与细胞周期相关的ERA基因第1B章S100B型在ER−肿瘤中表达升高。ER−肿瘤中缺失的是细胞带4p16、5q11-13、5q22、5q31、14q22-23,这些细胞带在基底部肿瘤中表现出更频繁的丢失,而16p11-p13在管腔肿瘤中表现为更频繁的增加[30]ER−肿瘤中的细胞带14q11–12、16p12–13、17q21和17q24也缺失,低分辨率CGH图谱表明14q、16p和17q在基底样肿瘤中的丢失增加[29]17q21内的基因在ER−肿瘤中通常缺失,但17q12–21的扩增在ERBB2+肿瘤中常见,ERBB2+通常为ER−,并且该区域的扩增预示着更糟糕的预后[31]我们的研究揭示了在细胞带2p13、2p16、2p21、2p25、3q25、3q29、6q16、6q21、9q21、11q21–22、12p13和22q13富含ER−肿瘤的新位点,在3p21、11q13和12q13缺乏ER−瘤。这些区域可能代表以前未检测到的DNA拷贝数改变或表观遗传沉默/再激活事件。ERA基因具有与富集/缺失细胞带一致的差异表达,并参与细胞周期和/或细胞增殖,标记于表2这些基因的失调可能导致ER+和ER−癌症之间的增殖率差异。

表2

在FDR<0.05的ER−肿瘤中,染色体位置基因集富集或缺失。
基因集名称财务总监与细胞周期和/或细胞增殖相关的ERA基因* ER−肿瘤富集或缺失
瑞士法郎第34页0.0017 国家标准普尔,CDC20型,KIF2C公司,CDCA8型 丰富
瑞士法郎第13页0.010 TGFA公司 丰富
第2页第16页0.0081丰富
瑞士法郎2P210.0035 MSH2型 丰富
瑞士法郎2P230.044 PPP1CB(PPP1CB) 丰富
瑞士法郎第25页0.033丰富
瑞士法郎3P21<0.0001 应用程序,CYB561D2型,RBM5型,TUSC2号机组,TUSC4公司 耗尽
35瑞士法郎0.022丰富
29瑞士法郎0.024丰富
瑞士法郎4P160.048 GAK公司 耗尽
2011年第11季度瑞士法郎0.0047耗尽
2012年第12季度瑞士法郎0.048 川东北7 耗尽
13年第5季度瑞士法郎0.00035 CCNH公司,第二层,RAD17型,RASA1公司 耗尽
瑞士法郎Q220.0094耗尽的
R5Q31瑞士法郎0.0050 聚氨酯橡胶,SKP1A公司 耗尽
瑞士法郎6P210.036 参考号8,个人信息管理1,TUBB公司,GMNN公司 丰富
2016年第6季度瑞士法郎0.018丰富
第6季度210.0028 巴格达2 丰富
瑞士法郎7Q320.0081丰富
瑞士法郎7Q330.041丰富
瑞士法郎9Q210.0044 ANXA1公司 丰富
10P13瑞士法郎0.0040丰富
2013年第11季度瑞士法郎0.0020 CCND1号机组,VEGFB公司 耗尽
11Q21瑞士法郎0.0058丰富
11Q22瑞士法郎0.020丰富
12P13氯0.010 1号机组,CDCA3型 丰富
2013年第12季度瑞士法郎0.00076 KRT18型,MCRS1号机组 耗尽
2014年第11季度瑞士法郎0.00054耗尽
2014年第12季度瑞士法郎0.050耗尽
14Q22瑞士法郎0.0097 CGRRF1,热休克蛋白A2 耗尽的
第14季度第23季度0.021 MNAT1型 耗尽
16P11瑞士法郎0.022耗尽
16P12瑞士法郎0.0079耗尽
16P13瑞士法郎<0.0001 E4F1系列,电磁脉冲2,GFER公司,UBE2I公司 耗尽
17Q21瑞士法郎0.0082 十六进制1 耗尽
17Q24瑞士法郎0.0039耗尽
2011年第22季度瑞士法郎0.013 第1B章,S100B型 丰富
2013年第12季度瑞士法郎0.024 MCM5型,GTSE1公司 丰富
*基因属于细胞周期类别表S2和/或GO0008283细胞增殖本体。

ER−肿瘤中ER的直接转录靶点显著缺失,但间接E2-诱导靶基因在ER−肿瘤中富集

我们预计ER+和ER−肿瘤之间的许多基因表达差异可能是由于ER+肿瘤对E2.区分E的直接和间接影响2我们添加了基于染色质免疫沉淀的研究得出的直接内质网靶点数据集,以及包含直接和间接靶点的数据集,这些靶点以对E的早期反应为特征2(文本S2.C,这些数据集中的基因标记为表S1). ER−肿瘤中直接ER靶点显著减少(8组FDR<0.0001至0.023,1组=0.052),两种E2-诱导和E2-被压制的直接目标[23](FDR 0.0013至0.021)。令人惊讶的是,间接包含E的集合2-诱导基因在ER−肿瘤中显著富集(文本S2.C)包括来自的集合[24](FDR=0.015)和[32](FDR=0.0047),而数组基因在E2ER−肿瘤仍显著减少(文本S2.C). 对这些观察结果的解释可能是,E2该通路可能独立于ER−肿瘤中的ER被激活,从而驱动E的间接靶点的转录2.

基础亚群中MYC诱导基因的高表达和MYC抑制基因的低表达

如中所示表3文本S2.D来自各种实验和肿瘤系统的MYC的多组直接靶点、包含MYC结合基序的基因和MYC诱导的基因在ER−肿瘤中富集。其中最突出的是MYC在人类原代乳腺上皮细胞培养物(HMEC)中诱导的一组基因[22]和MCF-7乳腺癌细胞[24](FDR均<0.0001)。值得注意的是,MYC诱导的MCF-7细胞中的基因子集也由E诱导2 [24]在ER−肿瘤中高度富集(FDR<0.0001),该基因集的富集图如所示文本S2.D.iMYC诱导的基因在MCF-7细胞中的富集程度(FDR<0.0001)大于E2-来自同一研究的诱导基因(FDR=0.015)。在ER−肿瘤中,MCF-7细胞中MYC抑制基因作为一个整体被耗尽(FDR<0.0001)(表4).

表3

在FDR<0.0001的ER−肿瘤中富集的MYC-和E2F-相关集合的详细信息。
基因集名称参考实验系统描述
MCA公司。巴利丘纳特_p130.G1_B [37] MEF(G1相位),ChIP第130页B
MCA公司。马斯格罗夫_E2_U和Myc_U [24] 抗雌激素逮捕了MCF-7。E2_U和MYC_U
E后6小时2-诱导,或
MYC-诱导后6小时。
MCA公司。巴利丘纳特_E2F4.G0_B [37] MEF(G0相位),ChIPE2F4_B型
MCA公司。马斯格罗夫(Musgrove_Myc_U) [24] 抗雌激素逮捕了MCF-7。MYC_单位
MYC诱导后6小时。
MCA公司。巴利丘纳特_p107.G1_B [37] MEF(G1相位),ChIP第107页B
MCA公司。BLACK.2005.TOP.100.E2F1诱导基因。可供应2 [36] MEF公司E2F1_U型
弗内尔_PRB_CLSTR1 [35] U2OS系列E2F_U(E2Fs 1、2或3上调,pRB和p16下调)
MCA公司。巴利丘纳特_p130.G0_B [37] MEF(G0相位),ChIP第130页
MCA公司。巴厘岛_E2F4.G1_B [37] MEF(G1相位),ChIPE2F4_B型
YU_CMYC_以上 [54] B细胞淋巴瘤非转基因小鼠模型。MYC_单位
MCA公司。图片_杂志。限制(U) [22] 赫梅克MYC_单位
SGCGSSAAA_V$E2F1DP2_01 [26] 不适用E2F1_M和TFDP2_M
REN_E2F1_目标 [38] WI-38原代人成纤维细胞E2F1_B和E2F4_B
MCA公司。Zeller_Myc_U和Myc_B [33] 人类B淋巴细胞瘤,ChIP结合双端双标记测序分析(ChIP-PET)MYC_U和MYC-B
MCA公司。BLACK.2005.TOP.100.E2F3-诱导基因。可供应3 [36] MEF公司E2F3_U型
V$E2F1_Q6 [26] 不适用E2F1(_M)
V$E2F4DP2_01 [26] 不适用E2F4_M+TFDP2_M
V$E2F1_Q6_01 [26] 不适用E2F1(_M)
表格通过增加FDR进行排序。后缀“U”、“D”、“B”和“M”表示集合中的基因是否U型p-调节或D类由相关分子自身调节,B类结合通过染色质免疫沉淀(ChIP)识别的分子的伙伴(或直接靶点),或包含结合M(M)在其启动子区域中的分子的otifs。

表4

FDR<0.0001的ER−肿瘤中MYC相关集合缺失的详细信息。
基因集名称参考实验系统描述
MCA公司。马斯格罗夫_迈科_D [24] 抗雌激素逮捕了MCF-7。马来西亚元_D
MYC诱导后6小时。
MCA公司。马斯格罗夫_E2_D和Myc_D [24] 抗雌激素阻断MCF-7。E2_D和MYC_D
E后6小时2-感应,或
MYC诱导后6小时。
表格通过增加FDR进行排序。后缀“D”表示集合中的基因是否D类由相关分子自身调节。

在ERA基因中,在MCF-7细胞中MYC诱导的基因中,84%在ER−肿瘤中显著较高表达,而MYC抑制的基因中87%在ER‐肿瘤中较低表达(表S1). 因此,我们在三个验证数据集中检查了MCF7细胞中受MYC调节的ERA基因的表达(图3). 首先根据ER状态和ERBB2水平对样品进行排序,我们检测了ERA基因Musgrove_Myc_U+D亚群相对于分子亚型的表达差异模式,以及该基因集区分直接和间接调节的E2和MYC目标。在热图的左侧色条中,我们标记了MCF7细胞(Musgrove_MYC_U+D)中MYC调节的方向[24]以及B细胞淋巴瘤中定义的MYC的直接靶点(Zeller_MYC_B)[33]与荟萃分析和GSEA的结果一致,在所有三个队列中,MYC诱导的基因在ER−肿瘤中普遍较高,而MYC抑制的基因在ER-肿瘤中较低。MYC直接靶点遵循与MYC调节基因整体相同的趋势。

保存图片、插图等的外部文件。对象名称为pone.0004710.g003.jpg
500个MYC-反应性ERA基因的层次聚类[24]在来自A的验证数据集中。[13]、B。[14]和C。[15].

图3A的第一个顶部颜色条。代表样本是乳腺癌还是正常乳腺组织。图3A中剩余的顶部颜色条与图1A侧色条中的颜色表示以下内容:黄色=E2-诱导基因,紫色=一个E2-抑制基因,橙色=MYC诱导基因,蓝色=MYC-抑制基因,红色表示ER(“ER_B”后缀)的直接靶基因,或MYC(“MYC_B”)的直接目标基因。从右向左移动,对于每个基因,第一个侧色条代表MCF-7细胞中对MYC的转录反应[24](Musgrove_Myc_U+D)。下一个颜色条表示该基因是否被归类为B细胞淋巴瘤中MYC的直接靶点[33](Zeller_Myc_B)。接下来的两个颜色条表示该基因是如何被E调节的2在MCF-7细胞中[24](Musgrove_E2_U+D),以及它是否包含启动子区50 kbp的ER-结合位点[23](回旋_ER_50 kbp_B)。图3B的顶部颜色条与图3B中的颜色条等效,而侧面颜色条与表3A中的颜色栏对应。图3C的顶部颜色条。相当于图3C,侧色条与图3A中的对应。

由于MYC是E的直接目标2,我们确定了这些基因中哪些是ER的直接靶点(Carroll_ER_B)[23]以及E如何对其进行监管2在MCF7细胞中(Musgrove_E2_U+D)[24]如左侧色条所示,与GSEA结果一致,ER的直接靶点在三个验证数据集中的ER+肿瘤中有较高的表达。正如预期的那样,许多MYC调节基因与E重叠2-来自同一实验的调节基因。重叠ERA E2-诱导基因和MYC诱导基因在ER−肿瘤中有较高的表达,重叠的ERA E2-抑制基因和MYC抑制基因在ER−肿瘤中的表达较低。

重要的是,与ERBB2高表达的ER−肿瘤相比,MYC诱导的ERA基因在基础亚组中的高表达更为显著(所有三个数据集均P<0.0001)(图3). 同样,MYC抑制的ERA基因在基础亚组中的低表达通常比ER−/ERBB2+样本中更为显著(所有三个数据集均P<0.0001)(图3). 当ER-HMEC中ERA基因受MYC调节时[22]用于对验证数据集进行聚类(图S4),我们观察到与基础亚型非常相似的结果,证明MYC途径在基础亚型中更为活跃,并且它模拟雌激素作用。

具有E2F结合基序和E2F家族直接靶点的基因在ER−肿瘤中富集

E2F家族和调节E2F活性的蛋白质对细胞周期进展很重要(参见[34])在荟萃分析中E2F3型E2F8型ER−肿瘤的强度明显较高(校正后分别为P<0.0001和0.034)(文本S3). 所有探头组E2F1系列E2F5型和一个探头组,用于E2F4型ER−肿瘤的强度较高(未调整的P<0.05),但未超过调整的P显著性阈值。探针组TFDP1型TFDP2型,DP转录因子家族成员,其产物与E2Fs 1至6形成异二聚体,产生与DNA结合的转录因子复合物[34],在ER−肿瘤中显著升高(TFDP1型,调整后P=0.0073;TFDP2型,调整后的P=0.0023)。一个探头组,用于第130页一种主要与E2Fs 4和E2Fs 5结合并将其转化为阻遏物复合物的口袋蛋白在ER−肿瘤中的强度显著降低(调整后的P=0.0053),而其他探针组显示出相同的趋势。对于上述每个基因,tWAR(表示折叠变化)很小,但以下两个探针组可能除外第2页第3页(tWAR=1.48倍和1.88倍)。

在GSEA筛查中,ER−肿瘤中显著富集的几个基因集与E2F活性相关(表3文本S2.E). 19组包含E2F家族成员的保守DNA结合基序基因,尤其是E2F1和E2F4[26]E2F家族的不同成员可以根据细胞周期的阶段等条件与相同的基因结合,这些基序集有许多共同的基因。支持对具有保守E2F基序的基因的观察,U2OS细胞中E2Fs 1、2或3上调和pRB和p16INK4A下调基因的MolSigDB列表[35]ER−肿瘤富集(FDR<0.0001)(表3). E2Fs 1、2或3下调而pRB和p16INK4A上调的互补基因集[35]耗尽(FDR=0.038)。

为了更好地了解E2F在ER−肿瘤增殖调控中可能发挥的作用,我们纳入了E2F 1、4和6的其他已发表直接靶点集,以及E2F1或E2F3调控的基因集(文本S2.E). 小鼠胚胎成纤维细胞(MEFs)中E2F1调节的基因列表中,FDR<0.0001(表3)同一研究中E2F3调控的一组基因[36]E2F1和E2F4的多组直接靶点在ER−肿瘤中显著富集(表3文本S2.E). FDR<0.0001富集的集合包括两个G期间MEF中E2F4的直接靶点0 [37]或早期G1细胞周期阶段[37]WI-38原代人成纤维细胞中E2F4和E2F1结合的基因[38]以及与E2F4结合而非E2F1结合的基因[38]口袋蛋白p130和p107与E2F4结合,将其转化为阻遏物复合物,与此关联一致,在G期MEF中p130的直接靶点0或G1 [37]FDR<0.0001富集,p107在G1 [37].

为了检查E2F活性的富集是否在ER−肿瘤亚型之间存在差异,我们使用与E2F活性相关的ERA基因对验证肿瘤数据集进行聚类(图S5). 我们证实,MEF中E2F4的直接靶点富集集在ER水平低的样本中有较高的表达。与所有三个数据集中的ER−/ERBB2+亚组相比,这些基因在基础亚组中的表达尤其高(均P<0.0001)(图S5). U2OS细胞中ERA基因与E2Fs 1、2或3激活的基因集重叠[35],通过MEF中的E2F1或E2F3[36]E2Fs 1、4或6直接靶点的所有富集基因集在基底部肿瘤中也显示出差异表达(数据未显示)。与正常组织相比,E2F4的直接靶向ERA基因和基底ER−肿瘤中过度表达的ERA基因也过度表达(P<0.0001)(图S5A).

为了确定MYC和E2F集合的富集是否完全是因为这些集合中存在增殖相关基因,我们从富含FDR<0.0001的相关集合中删除了GO“细胞周期”(GO∶0007049)和“细胞增殖”(GO:0008283)类别中的基因。GSEA表明,这些“增殖耗竭”的集合与完整的对应物一样高度富集,“增殖耗损”的MYC和E2F集合的前沿共享很少的共同基因(数据未显示)。这些结果表明,除了共享的增殖相关基因外,MYC-action和E2F-action是独立影响ER−和ER+肿瘤之间转录差异的独立力量。

我们还发现,ER+和ER-肿瘤之间差异表达的细胞带不包含MYC或已知影响MYC活性的基因(例如结合伙伴MAD或MAX)。同样,富集或缺失的细胞带不包含荟萃分析中差异表达的E2F家族的任何成员,也不包含任何已知影响E2F活性的基因(例如DP转录因子或口袋蛋白家族的成员)。因此,这些区域的基因改变不太可能是ER−肿瘤中MYC和E2F活性增加的原因。

讨论

本研究使用一种新的荟萃分析方法来确定与乳腺癌ER状态相关的基因和遗传途径。重要的是,我们将分析局限于3级肿瘤,因为ER−肿瘤几乎都是高级别的,而ER+肿瘤表现出更大的多样性。因此,先前公布的ER状态相关基因列表[3][5]除了ER状态外,可能还包含与等级相关的基因。使用DAVID和GSEA对2141个ERA基因的功能注释分析表明,与ER+肿瘤相比,与细胞周期相关的类别在ER-肿瘤中表达上调的基因中富集,这表明即使在相同级别上,ER-肿瘤也显示出更大的增殖信号。验证数据集的层次聚类显示,细胞周期相关基因在基础亚群中的表达高于其他ER−肿瘤。虽然其他转录谱分析研究报告称,细胞周期和细胞增殖类别在分子基础肿瘤中过度表达[39]由于研究中样本数量有限,他们无法像我们一样将等级和ER状态的影响分离开来。我们的结果与最近一项局限于3级浸润性导管癌的组织病理学研究结果一致,该研究发现,基础表型与高总有丝分裂计数高度相关,这是增殖增加的标志[40].

在GSEA屏幕中,E的直接目标的独立列表2/正如人们预期的那样,ER−肿瘤中的ER复合物被耗尽。E诱导的基因2在两项研究中,MCF-7细胞中的ER−肿瘤和E2-四项研究中的抑制基因在ER−肿瘤中缺失。与我们的结果一致,之前的研究旨在确定E2-ER+肿瘤中诱导基因过度表达的基因数量少于预期[4],[41]和E的小子集2-在ER−肿瘤中观察到诱导基因过度表达[41],[42]这些明显的差异归因于肿瘤和细胞系之间的差异[4],[41]我们的结果提供了另一种解释:E的异常激活2-目标MYC导致对E特征基因子集的稳健诱导2响应。与这一假设一致,MYC能够挽救在G1雌激素拮抗剂预处理分期[27]以及E调节的大部分ERA基因2MCF-7细胞也受MYC调节(图3,图S4和相关参考)。与E的直接目标不同2B细胞淋巴瘤中MYC的直接靶点和含有MYC结合基序的基因在ER−肿瘤中富集。我们的结果支持并扩展了克雷顿的结果等。 [32]世卫组织报告称,一份单一的基因列表显示了E的早期和持续诱导2在ER+细胞系中(在我们的GSEA屏幕中标记为“MCA.Creighton.Cluster B Genes_E2_Early.Supained_U”),在1至3级肿瘤队列中,ER−肿瘤富集。

范围广泛的MYC公司RT-PCR检测到ER+和ER-乳腺癌的转录水平[43]在我们的荟萃分析中MYC公司ER−肿瘤显著增高(校正P=0.024),证实了单队列研究的结果[44].MYC公司拷贝数扩增与一个队列中ER和PGR的丢失相关[45]在另一队列中与ER阳性状态无关[46].放大MYC公司在一些队列中,MYC蛋白的基因和/或过度表达与高等级相关[44],[47].罗兹等。 [48]报道了HMEC中存在一组被MYC激活的基因[22]在3级乳腺癌的特征中。

我们观察到较高水平的MYC公司在我们的两个验证队列中,与ER−/ERBB2+样本相比,基础亚型的转录物。MYC公司在肿瘤中显著放大巴西航空公司1与基底部肿瘤相似的突变[49]但放大了MYC公司与基础表型无关[46]表明高转录水平的MYC公司我们观察到ER−肿瘤可能是由以下因素引起的MYC公司放大。通过将验证队列中的样本分类为预测的乳腺癌亚型,我们发现MYC诱导基因(包括MYC直接靶点)的高表达和MYC抑制基因的低表达区分了ER肿瘤的基本亚型。此外,在该实验室的一项同时进行的研究中,我们还观察到,在IHC上具有主要细胞质染色模式的c-Myc的表达与由ER−/PGR−/ERBB2−/KRT5/6+染色模式确定的基础表型显著相关(McNeil CM、Musgrove EA和Sutherland RL,手稿正在编写中)。这个MYC公司在我们的两个验证队列中,与ER−/ERBB2+样本相比,基础亚型中的转录物过度表达,Richardson P=0.036,Pawitan P=0.00013,但Wang P=0.964中没有。MYC公司其他数据集中基底癌的过度表达可以根据频率进行区分[50],但我们对五个荟萃分析数据集的分析表明,这不是一个显著特征,排名低于前1000个差异表达mRNA。因此,我们检测到的MYC的强烈转录效应表明,MYC表达的改变对其在基底部乳腺癌中的活性起着重要作用。

我们的研究还强调了E2F家族在ER−肿瘤中的作用,并表明其失调可能在基底部肿瘤的增殖中起作用。已知E2F可以控制对细胞周期进展重要的基因以及参与凋亡和分化的基因的表达[34]E2F结合基序基因集得到了丰富,E2F1、4和/或6的一些直接靶点也得到了丰富。由于E2F家族成员在其结合特异性方面有相当大的重叠,我们得出结论,E2F家族一个或多个成员的直接结合在ER−肿瘤中增加,但无法确定是哪一个家族成员。E2F家族成员的行动与MYC的行动密切相关。MYC蛋白可以调节E2F[51]反之亦然[52]在细胞周期的早期事件中,许多由各种E2F调节的基因也受MYC调节[33],[52]. TheMYC公司在G期,该基因与E2F4结合,但不与p130或p107结合0(但不是G1)在MEF中[37].MYC是E2F1在人成纤维细胞中的直接靶点[38].E2F3型,E2F5型TFDP1型在ER−肿瘤中有较高表达的,均由MCF-7细胞中的MYC诱导[24].泽勒等。 [33]发现E2F1结合基序在MYC结合基因簇中富集16倍,在含有E-box的基因子集中富集37倍。在我们的研究中,与MYC和E2F作用相关的基因集之间共享的基因主要是增殖相关基因。在这种情况下,我们认为MYC调节过程的失调或组成性激活以及E2F活性的增加可能会导致不受控制的细胞周期进展和增殖,如我们在ER−肿瘤中看到的,尤其是ER−瘤中的基本亚型。克雷克等。 [53]表明基础亚型可以根据基因表达谱进一步分为五个亚型。一组增殖相关基因参与了聚类。Kreike队列中分割基底部肿瘤的基因中MYC和E2F调节基因的富集等。 [53]可能是一条有价值的调查途径。我们的发现也可能具有重要的治疗意义。最近的一项生物信息学研究表明,HMEC中MYC激活的一组基因之间存在显著关联[22]PI3K信号通路抑制剂沃特曼或LY-294002治疗MCF-7或HL-60细胞时抑制的基因[48]MYC激活基因在用沃特曼或LY-294002处理的细胞中表达较低,表明PI3K抑制剂抑制MYC活化[48]我们的研究为MYC在基底部肿瘤中的作用提供了强有力的证据,这表明PI3K抑制剂和MYC作用的其他潜在阻遏物应作为这些目前没有靶向治疗的肿瘤的候选治疗药物进行研究。我们预计,这项研究产生的生物学见解将在制定新的治疗策略以治疗预后不良的ER−肿瘤,尤其是基础亚型肿瘤方面具有价值。我们的结论是,MYC的过度表达或组成性激活,可能与E2F活性升高有关,可能有助于ER−乳腺肿瘤的增殖增加,尤其是在基底亚群中。

支持信息

数据集S1

GSEA结果来自第一个屏幕。该文件包含第二个GSEA屏幕的HTML结果的压缩存档。可以从my_analysis中的“index.html”链接访问丰富或贫化数据集的报告。GseaPreranked.1219975950625.rpt.zip zip存档。50个最丰富和最贫乏的基因集都有丰富图。

(13.32 MB邮政编码)

图S1

在3级和2级ER+和ER−样本上使用ERA基因进行主成分分析(PCA)。通过对五个数据集(Farmer、Sotiriou.JRH.Untreated、Miller、Minn和Sotiriu.Uppsala)中3级样本的荟萃分析,确定ERA基因。为了证明这些ERA基因也能分离2级ER+和ER−肿瘤,使用ERA基因对来自这五个相同数据集的2级样本进行PCA。Sotiriou Farmer三级样本的主成分分析。JRH公司。未经处理,米勒、明恩和索蒂里奥。乌普萨拉数据集位于图S1A.i–v;Sotiriou Farmer 2级样品的PCA。JRH。未经处理,米勒、明恩和索蒂里奥。乌普萨拉数据集位于图S1B.i–版本。

(0.54 MB畅通节能法)

图S2

KEGG细胞周期GenMapp代表基因的Meta分析结果。meta分析中,基因的颜色取决于它们在ER+或ER肿瘤中是否有较高的表达,这种过度表达的变化和意义分别由转换的加权平均比(tWAR)和by-调整的P值(adj-P)表示。

(0.08 MB畅通节能法)

图S3

A.Richardson等人(2006)、B.Wang等人(2005)和C.Pawitan等人(2005年)数据集中细胞周期相关基因的表达数据的层次聚类。ERA基因和先前样本的双向聚类(图1)表明ERA基因在ER+、基础型和ER−/ERBB2+肿瘤亚型之间有差异表达。为了阐明不同亚型中细胞周期相关基因的行为,我们首先根据ER状态对验证数据集中的样本进行排序,其次根据ERBB2状态对样本进行排序。图S3A数据来源于理查森数据集(理查森等人,2006),顶部的颜色条指示以下内容:“样本类型”-样本是乳腺癌还是正常乳腺组织;“ER_Protein”-使用IHC确定的ER状态;“PGR_蛋白”-使用IHC确定的PGR状态;“ERBB2_Protein”-使用IHC确定的ERBB2状态;“亚型”-根据IHC结果确定的亚型(基底细胞癌、BRCA1突变阳性、非基底细胞样癌(“non-BLC”)或正常组织)(见样本索引)。图S3B数据来自Wang数据集(Wang等人,2005年),顶部的颜色条表示以下内容:“ER_Protein”-使用配体结合分析或IHC确定的ER状态;“ER_Transcript”、“PGR_Transcripts”、“ERBB2_Transcript”和“KRT5_Trancript”:根据探针集强度的分位数测量的相对表达式,如中的“数据收集”所述材料和方法(参见示例键)。图S3C数据来源于帕维坦数据集(Pawitan et al.2005),顶部的颜色条表示以下内容:“分子_亚型”-通过与正常、发光A、发光B、ERBB2+和基本分子亚型的相关性确定(Sorlie et al.2001);如上所述的“ER_Transcript”、“PGR_Trancript”和“ERBB2_Transcript”;和“Tumor_Grade”-Elston-Ellis分级(见示例键)。在所有三个热区中观察到两个主要的细胞周期相关基因簇;在每个数据集中,如标记的那样,在基础样本中观察到细胞周期基因的最高表达。

(0.36 MB畅通节能法)

图S4

A.Richardson等人(2006)、B.Wang等人(2005)和C.Pawitan等人(2005年)数据集中130个MYC-responsive ERA基因表达数据的层次聚类(Bild等人,2006年)。ERA Bild_MYC_U+D基因是ERA基因,在HMEC中也受MYC调节(Bild等人,2006年)。我们将这些基因聚集在三个验证数据集中,同时保持样本顺序。图S4A,顶部颜色条相当于图S3A。侧色条中的颜色表示以下内容:黄色=E2诱导基因,紫色=E2重表达基因,橙色=MYC诱导基因,蓝色=MYC-抑制基因,红色表示ER的直接靶基因(“ER_B”后缀),或MYC的直接靶向基因(“MYC_B”)。从右向左移动,对于每个基因,前两个侧色条表示HMEC(Bild等人,2006)(Bild_MYC_U+D)和MCF-7细胞(Musgrove等人,2008;McNeil等人,2006年)(Musgrove_MYC_U+C)中MYC的转录反应。下一个颜色条表示该基因是否被归类为B细胞淋巴瘤中MYC的直接靶点(Zeller等人,2006)(Zeller_MYC_B)。接下来的三个颜色条表示6小时(Musgrove等人,2008年;McNeil等人,2006年)(Musgrove_E2_U+D)和3小时(Carroll等人,2006)(Carroll_3 hr_E2_U+D)时MCF-7细胞中E2如何调节该基因,以及它是否包含启动子区50 kbp的ER-binding位点(Carrolle等人,2006年间)(Caroll_ER_50 kbp_B)。的顶部彩条图S4B相当于图S3B,侧色条与图S4A。的顶部颜色条图S4C相当于图S3C,侧色条与图S4A可见,ERA MYC诱导的大多数基因在基底部肿瘤中表达较高,而ERA MYC抑制的大多数基因则在基底部瘤中表达较低。

(0.48 MB畅通节能法)

图S5

MCA的层次聚类。来自A.Richardson等人(2006年)、B.Wang等人(2005年)和C.Pawitan等人(2005年)的数据集中的巴林酸_E2F4.G0_B ERA基因(巴林酸盐等人,2005年)。MCA。Baliciunate_E2F4.G0_B基因是小鼠胚胎成纤维细胞中E2F4的直接靶点(Baliciunate等人,2005年)。图S5,顶部颜色条相当于图S5A、S5B和S5C等同于图S3A、S3B和S3C分别是。

(0.35 MB畅通节能法)

表S1

HG-U133A探针组及其生物学关联。一个压缩的EXCEL电子表格,包含所有22283 HG-U133A探针集,以及探针集ID、代表性公共数据库ID(RefSeq转录本、Entrez和Unigene)、基因名称、基因符号、Z评分、BY-调整的P值、ERA基因状态、转换的加权平均比,以及它们是否与E2-作用、,MYC-action、E2F-action、细胞周期或染色体位置在几个不同的数据集中显著增加或减少。“总体Z评分”为负值表示ER−肿瘤中的探针组强度较高。

(3.78 MB邮政编码)

表S2

ER−或ER+肿瘤中细胞周期基因过度表达。meta分析中的细胞周期相关基因及其在ER−肿瘤或ER+肿瘤中的过度表达。

(0.02 MB PDF格式)

文本S1

补充方法

(0.10 MB文件)

文本S2

GSEA中ER−肿瘤中主要生物类别富集或缺失的行为。表格通过增加FDR进行排序。与雌激素(E2)、MYC或E2F活性相关的基因集已被标记为后缀“U”、“D”、“B”、“Dir”和“M”,表示该组基因是由相关分子上调还是下调,通过ChIP识别的分子的结合伙伴(或直接靶点),通过使用环己酰亚胺确定的分子的其他直接靶点,或它们是否在其启动子区域包含分子的保守结合基序。

(47百万文档)

文本S3

meta分析中MYC、E2F和相关基因探针组的行为。

(0.09 MB文件)

鸣谢

我们感谢Marcelo Sergio(加文医学研究所)对MCF-7数据集的帮助,以及Warren Kaplan(加文医疗研究所)的技术援助。我们还感谢罗杰·戴利(Roger Daly)、卡特里奥娜·麦克尼尔(Catriona McNeil)和蒂尔曼·布鲁默(Tilman Brummer)(加文医学研究所所有成员)以及杰森·卡罗尔(Jason Carroll)(英国剑桥癌症研究所)的有益讨论。我们感谢所有公开微阵列数据的研究小组。

手稿注释:可按要求提供带有基因符号的分层聚类图像的可搜索PDF、添加到基因集富集分析(GSEA)中的基因列表以及第二个屏幕的完整GSEA结果。

脚注

竞争利益:提交人声明,不存在相互竞争的利益。

基金:这些实验室的工作得到了新南威尔士州癌症研究所、澳大利亚国家卫生和医学研究委员会(NH&MRC)、皮特基金会和RT霍尔信托基金会的资助。MCA获得了澳大利亚研究生奖。MGG得到了新南威尔士州癌症研究所基础设施拨款的支持。DJN在这项工作期间得到了澳大利亚研究委员会的资助。YW由Veridex,Johnson&Johnson内部资助。JAF由荷兰基因组计划/荷兰科学研究组织资助。RLS是NH&MRC的高级首席研究员。EAM是新南威尔士州癌症研究所研究员。CJO是NH&MRC的高级研究员。资助者在研究设计、数据收集和分析、决定出版或编写手稿方面没有任何作用。

工具书类

1Sims AH、Howell A、Howel SJ、Clarke RB。乳腺癌亚型的起源和治疗意义。Nat Clin Pract肿瘤。2007;4:516–525.[公共医学][谷歌学者]
2早期乳腺癌试验专家合作小组。早期乳腺癌化疗和激素治疗对复发和15年生存率的影响:随机试验综述。柳叶刀。2005;365:1687–1717.[公共医学][谷歌学者]
三。Gruvberger SK、Ringner M、Chen Y、Panavally S、Saal LH等。乳腺癌雌激素受体状态与显著不同的基因表达模式相关。癌症研究。2001;61:5979–5984.[公共医学][谷歌学者]
4.Abba MC,Hu Y,Sun H,Drake JA,Gaddis S,等。乳腺癌雌激素受体α状态的基因表达特征。BMC基因组学。2005;6:37. [PMC免费文章][公共医学][谷歌学者]
5Schneider J,Ruschhaupt M,Buness A,Asslaber M,Regitnig P,et al.浸润性导管癌雌激素受体状态诊断中小基因表达特征的鉴定和meta分析。国际癌症杂志。2006;119:2974–2979.[公共医学][谷歌学者]
6Dennis G,Jr、Sherman BT、Hosack DA、Yang J、Gao W等。DAVID:注释、可视化和集成发现数据库。基因组生物学。2003;4:R60。[公共医学][谷歌学者]
7Subramanian A、Tamayo P、Mootha VK、Mukherjee S、Ebert BL等。基因集富集分析:解释全基因组表达谱的基于知识的方法。美国国家科学院。2005;102:15545–15550. [PMC免费文章][公共医学][谷歌学者]
8Farmer P、Bonnefoi H、Becette V、Tubiana-Hulin M、Fumoleau P等。通过微阵列分析鉴定乳腺大汗腺分子肿瘤。癌基因。2005;24:4660–4671.[公共医学][谷歌学者]
9Miller LD、Smeds J、George J、Vega VB、Vergara L等。人类乳腺癌中p53状态的表达特征可预测突变状态、转录效应和患者生存率。美国国家科学院院刊。2005;102:13550–13555. [PMC免费文章][公共医学][谷歌学者]
10Minn AJ、Gupta GP、Siegel PM、Bos PD、Shu W等。介导乳腺癌肺转移的基因。自然。2005;436:518–524. [PMC免费文章][公共医学][谷歌学者]
11Sotiriou C、Wirapati P、Loi S、Harris A、Fox S等。乳腺癌基因表达谱分析:了解组织学分级的分子基础以改善预后。美国国家癌症研究所杂志。2006;98:262–272.[公共医学][谷歌学者]
12Bolstad BM、Irizarry RA、Astrand M、Speed TP。基于方差和偏差的高密度寡核苷酸阵列数据归一化方法的比较。生物信息学。2003;19:185–193.[公共医学][谷歌学者]
13Richardson AL,Wang ZC,De Nicolo A,Lu X,Brown M,等。基底样人类乳腺癌的X染色体异常。癌细胞。2006;9:121–132.[公共医学][谷歌学者]
14Wang Y,Klijn JG,Zhang Y,Sieuwerts AM,Look MP,等。预测淋巴结阴性原发性乳腺癌远处转移的基因表达谱。柳叶刀。2005;365:671–679.[公共医学][谷歌学者]
15.Pawitan Y、Bjohle J、Amler L、Borg AL、Egyhazi S等。基因表达谱分析使早期乳腺癌患者免于辅助治疗:在两个基于人群的队列中进行推导和验证。乳腺癌研究。2005;7:R953–R964。 [PMC免费文章][公共医学][谷歌学者]
16Sorlie T、Perou CM、Tibshirani R、Aas T、Geisler S等。乳腺癌的基因表达模式区分具有临床意义的肿瘤亚类。美国国家科学院。2001;98:10869–10874. [PMC免费文章][公共医学][谷歌学者]
17.Choi JK、Yu U、Kim S、Yoo OJ。结合多项微阵列研究和研究间变异建模。生物信息学。2003;19:i84–i90。[公共医学][谷歌学者]
18Lusa L、Gentleman R、Ruschhaupt M.GeneMeta:高通量实验的Meta分析。R软件包版本。2006;140 [谷歌学者]
19.Benjamini Y,Yekutieli D.在依赖性下对多次测试中错误发现率的控制。安·统计师。2001;29:1165–1188. [谷歌学者]
20Dahlquist KD、Salomonis N、Vranizan K、Lawlor SC、Conklin BR.GenMAPP,一种查看和分析生物途径微阵列数据的新工具。自然遗传学。2002;31:19–20.[公共医学][谷歌学者]
22Bild AH,Yao G,Chang JT,Wang Q,Potti A,等。人类癌症中的致癌途径特征作为靶向治疗的指南。自然。2006;439:353–357.[公共医学][谷歌学者]
23Carroll JS、Meyer CA、Song J、Li W、Geistlinger TR等。雌激素受体结合位点的全基因组分析。自然遗传学。2006;38:1289–1297.[公共医学][谷歌学者]
24Musgrove EA、Sergio CM、Loi S、Inman CK、Anderson LR等。雌激素和c-Myc应答基因功能网络的鉴定及其与乳腺癌他莫昔芬治疗反应的关系。《公共科学图书馆·综合》。2008;:e2987。 [PMC免费文章][公共医学][谷歌学者]
25Smyth GK公司。Limma:微阵列数据的线性模型。作者:Gentleman R、Carey V、Dudoit S、Irizarry R、Huber W,编辑。“使用R和生物导体的生物信息学和计算生物学解决方案”。纽约:施普林格;2005年,第23章。[谷歌学者]
26Xie X,Lu J,Kulbokas EJ,Golub TR,Mootha V,et al.通过对几种哺乳动物的比较,系统地发现人类启动子和3[主要]UTR中的调控基序。自然。2005;434:338–345. [PMC免费文章][公共医学][谷歌学者]
27.Prall OW、Rogan EM、Musgrove EA、Watts CK、Sutherland RL.c-Myc或cyclin D1模拟雌激素对cyclin E-Cdk2激活和细胞周期重入的影响。分子和细胞生物学。1998;18:4499–4508. [PMC免费文章][公共医学][谷歌学者]
28van t Veer LJ,Dai H,van de Vijver MJ,He YD,Hart AA等。基因表达谱预测乳腺癌的临床结局。自然。2002;415:530–536.[公共医学][谷歌学者]
29Jones C、Ford E、Gillett C、Ryder K、Merrett S等。具有不同临床结果的III级侵袭性导管乳腺癌亚群的分子细胞遗传学鉴定。临床癌症研究。2004;10:5988–5997.[公共医学][谷歌学者]
30王振聪,林M,魏丽杰,李C,米隆A,等。侵袭性乳腺癌亚类杂合性缺失及其与表达谱的相关性。癌症研究。2004;64:64–71.[公共医学][谷歌学者]
31Bergamaschi A、Kim YH、Wang P、Sörlie T、Hernandez-Boussard T等。DNA拷贝数改变的不同模式与乳腺癌的不同临床病理特征和基因表达亚型相关。基因、染色体和癌症。2006;45:1033–1040.[公共医学][谷歌学者]
32Creighton CJ、Cordero KE、Larios JM、Miller RS、Johnson MD等。体外乳腺肿瘤细胞中雌激素调节的基因在体内肿瘤异种移植物和人类乳腺肿瘤中也受到类似的调节。基因组生物学。2006;7:R28。 [PMC免费文章][公共医学][谷歌学者]
33Zeller KI,Zhao X,Lee CWH,Chiu KP,Yao F,等。人类B细胞中c-Myc结合位点和靶基因网络的全球定位。美国国家科学院。2006;103:17834–17839. [PMC免费文章][公共医学][谷歌学者]
34Rowland BD,Bernards R.重新评估E2F的细胞周期调控。单元格。2006;127:871–874.[公共医学][谷歌学者]
35Vernell R,Helin K,Muller H.p16INK4A-pRB-E2F通路靶基因的鉴定。生物化学杂志。2003;278:46124–46137.[公共医学][谷歌学者]
36.Black EP、Hallstrom T、Dressman HK、West M、Nevins JR。基因表达特征揭示E2F功能特异性的差异。美国国家科学院院刊。2005;102:15948–15953. [PMC免费文章][公共医学][谷歌学者]
37Balciunaite E、Spektor A、Lents NH、Cam H、te Riele H等。口袋蛋白复合物被募集到静止和增殖细胞中的不同靶点。分子细胞生物学。2005;25:8166–8178. [PMC免费文章][公共医学][谷歌学者]
38Ren B、Cam H、Takahashi Y、Volkert T、Terragni J等。E2F将细胞周期进展与DNA修复、复制和G2/M检查点整合在一起。基因发育。2002;16:245–256. [PMC免费文章][公共医学][谷歌学者]
39Sorlie T,Wang Y,Xiao C,Johnsen H,Naume B等。乳腺癌临床相关亚型的不同分子机制:三种不同平台的基因表达分析。BMC基因组学。2006;7:127. [PMC免费文章][公共医学][谷歌学者]
40Fulford LG、Easton DF、Reis-Filho JS、Sofronis A、Gillett CE等。预测3级乳腺浸润性导管癌基础表型的特定形态学特征。组织病理学。2006;49:22–34.[公共医学][谷歌学者]
41Lin CY,Strom A,Vinsensius BV,Kong SL,Yeo AL,等。乳腺癌细胞中雌激素受体α靶基因和反应元件的发现。基因组生物学。2004;5:R66.61–R66.17。 [PMC免费文章][公共医学][谷歌学者]
42Cunliffe HE、Ringner M、Bilke S、Walker RL、Cheung JM等。乳腺癌对生长调节剂的基因表达反应:模式和与肿瘤表达谱的相关性。癌症研究。2003;63:7158–7166.[公共医学][谷歌学者]
43McNeil CM、Sergio CM、Anderson LR、Inman CK、Eggleton SA等。乳腺癌中c-Myc过度表达和内分泌抵抗。类固醇生物化学和分子生物学杂志。2006;102:147–155.[公共医学][谷歌学者]
44Naidu R,Wahab NA,Yadav M,Kutty MK。使用免疫组织化学和差异聚合酶链反应对原发性乳腺癌中c-myc基因的蛋白表达和分子分析。国际分子医学杂志。2002;9:189–196.[公共医学][谷歌学者]
45Cuny M、Kramar A、Courjal F、Johannsdottir V、Iacopetta B等。乳腺癌相关基因型和表型:八个不同基因或位点扩增和p53突变的预后意义分析。癌症研究。2000;60:1077–1083.[公共医学][谷歌学者]
46Rodriguez-Pinilla SM、Jones RL、Lambros MB、Arriola E、Savage K等。乳腺癌中的MYC扩增:一项染色体原位杂交研究。临床病理学杂志。2006;60:1017–1023. [PMC免费文章][公共医学][谷歌学者]
47布兰卡托J、辛格B、刘A、廖DJ、迪克森RB。高级乳腺癌中c-myc癌基因扩增和过度表达的相关性:FISH、原位杂交和免疫组织化学分析。英国癌症杂志。2004;90:1612–1619. [PMC免费文章][公共医学][谷歌学者]
48Rhodes DR、Kalyana-Sundaram S、Tomlins SA、Mahavisno V、Kasper N等。分子概念分析将肿瘤、通路、机制和药物联系起来。肿瘤。2007;9:443–454. [PMC免费文章][公共医学][谷歌学者]
49Adem C、Soderberg CL、Hafner K、Reynolds CA、Slezak JM等。ERBB2号机组,待定2,RPS6KB1型、和MYC公司乳腺组织的改变巴西航空公司1巴西航空公司2突变携带者。基因、染色体和癌症。2004;41:1–11.[公共医学][谷歌学者]
50Efstratiadis A、Szabolcs M、Klinakis A.Notch、Myc和乳腺癌。细胞周期。2007;6:421–432.[公共医学][谷歌学者]
51Leone G、Sears R、Huang E、Rempel R、Nuckolls F等。Myc需要不同的E2F活性来诱导S期和凋亡。分子细胞。2001;8:105–113.[公共医学][谷歌学者]
52.Ogawa H,Ishiguro K-I,Gaubatz S,Livingston DM,Nakatani Y.一种具有染色质修饰物的复合物,在G0细胞中存在E2F-和Myc应答基因。科学。2002;296:1132–1136.[公共医学][谷歌学者]
53Kreike B、van Kouwenhove M、Horlings H、Weigelt B、Peterse H等。三阴性/基底样乳腺癌的基因表达谱和组织病理学特征。乳腺癌研究。2007;9:R65。 [PMC免费文章][公共医学][谷歌学者]
54Yu D,Cozma D,Park A,Thomas-Tikhonenko A。淋巴腺病相关基因的功能验证:使用Myc诱导的B细胞肿瘤进行的体内选择试验。Ann N Y科学院。2005;1059:145–159. [PMC免费文章][公共医学][谷歌学者]

文章来自普洛斯一号由提供多环芳烃