跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
摩尔癌症治疗。作者手稿;PMC 2009年8月27日发布。
以最终编辑形式发布为:
预防性维修识别码:项目经理2733874
尼姆斯:美国国家卫生研究院123191
PMID:16648555

整合NCI-60细胞株中DNA拷贝数、基因表达水平和药物敏感性的数据

摘要

染色体重排是癌症的一个标志,对致癌和肿瘤表型有着深远的影响。我们使用60个人类癌症细胞系(NCI-60)作为模型系统,以确定DNA拷贝数、mRNA表达水平和药物敏感性之间的关系。对于64个癌症相关基因中的每一个,我们计算了所有4096个可能的皮尔逊相关系数,这些系数与DNA拷贝数(使用细菌人工染色体微阵列通过比较基因组杂交评估)和mRNA表达水平(使用cDNA和Affymetrix寡核苷酸微阵列确定)有关。该分析确定了ERBB2过表达与3p拷贝数的相关性,这一发现得到了来自人类肿瘤和ERBB2诱导的致癌小鼠模型的数据的支持。当我们检查细菌人工染色体微阵列上所有353个独特基因座的DNA拷贝数与118种已知作用机制药物的药物敏感性之间的相关性时,我们发现显著的负相关(-0.983;95%自举置信区间,-0.999~-0.899)酶药物L-天冬酰胺酶的活性与卵巢癌细胞中天冬酰胺合成酶附近基因的DNA拷贝数之间的关系。先前对药物敏感性和mRNA表达的分析表明,NCI-60中天冬酰胺合成酶mRNA水平与L-天冬酰胺酶敏感性呈负相关。DNA和mRNA水平的药物基因组研究结果的一致性强烈建议进一步研究L-天冬酰胺酶,以可能治疗临床卵巢癌的低合成酶亚群。这里展示的DNA拷贝数数据库将使其他研究人员能够在自己的研究重点领域探索DNA转录-药物关系。

介绍

癌症的表型是DNA、mRNA和蛋白质水平变化的动态相互作用,导致对细胞外刺激的反应改变和不受调控的生长。癌症治疗的进一步改进在很大程度上取决于对这些不同因素如何相互作用的了解。DNA-RNA蛋白关系的复杂性为导致表型的几个水平的调节提供了充足的机会。没有理由预期这种关系会是线性的,跨基因的一致性,甚至在不同细胞条件下特定基因的一致。例如,有几种情况下,基因拷贝数与表达相关,另一些情况下基因拷贝数似乎与表达无关,还有两种情况都存在于同一基因中(1-5). 然而,DNA拷贝数与基因表达或药物反应之间的强烈相关性增加了基因受到选择性压力的可能性。

同一组样本的基因拷贝数和表达数据的获取提供了一个机会,可以询问基因拷贝数如何影响同一基因或不同基因的mRNA水平。然而,我们想在药物基因组问题上迈出另一步(6). 我们需要一个实验系统,在该系统中,我们可以评估DNA拷贝数和mRNA水平与细胞对各种药物和潜在药物的敏感性之间的关系。自然选择的是国家癌症研究所发展治疗计划使用的60个人类癌症细胞系(NCI-60),用于筛选和二次测试潜在抗癌药物。NCI-60面板具有多样性。它包括白血病、黑色素瘤、乳腺癌、卵巢癌、肾癌、结肠癌、前列腺癌、肺癌和中枢神经系统癌。自1990年NCI-60试验全面运行以来,在48小时的生长抑制试验中测试了超过100000种化合物(加上大量天然产物提取物)(7,8). 除了NCI-60的药理学特征外,与现有的任何其他细胞组相比,这些细胞在分子水平上的特征更为完整。我们和我们的合作者使用cDNA微阵列分析了它们的mRNA表达(9,10)和寡核苷酸芯片(11),用于使用二维蛋白质凝胶电泳的蛋白质表达(12,13)和“反相”裂解物阵列(14,15)和染色体畸变(16).

在这里,我们介绍了NCI-60的第一个阵列比较基因组杂交(CGH)特征,并将结果与mRNA表达和药物敏感性联系起来。研究中使用的基因阵列包括与致癌、增殖、凋亡、细胞周期调控、信号转导和耐药性有关的癌症相关基因。一个特别的目的是跟进我们之前在NCI-60中观察到的对酶药物L-天冬酰胺酶敏感性与天冬酰胺合成酶mRNA表达之间的关系(9). 自20世纪70年代初以来,L-天冬酰胺酶被用于治疗急性淋巴细胞白血病;因此,我们有兴趣发现NCI-60白血病的L-天冬酰胺酶活性和天冬酰胺合成酶表达之间存在很强的负相关[-0.98;双尾95%自举置信区间(95%CI),-1.00至-0.928]。我们并不惊讶于看到相反的关系,但在一组不同的细胞系中(以及在面临实验错误的情况下),这种接近完美的相关性出乎意料。更有趣的是,卵巢细胞类型也存在强烈的负相关(-0.88;95%CI,-0.231至-0.987)。如后一个CI所示,当考虑与单一假设相关时,卵巢系的相关性具有统计学意义,但在对多重比较测试进行适当校正后,相关性并不显著。因此,我们认为这是一条线索,可以阐明这样一种假设,即低天冬酰胺合成酶的卵巢癌亚群对该药物敏感。因此,在本研究中,我们在DNA拷贝数水平上寻找证据,以支持或反驳该假设,并可能阐明拷贝数在决定天冬酰胺合成酶表达水平中的作用。结果令人惊讶地确定,稍后将详细描述。

材料和方法

基因表达数据

通过与cDNA微阵列杂交获得NCI-60细胞系的基因表达数据(9,10)和Affymetrix(加州圣克拉拉)寡核苷酸芯片(11)如前所述。在cDNA阵列研究中,来自测试细胞的Cy5标记cDNA与来自索引标准池的Cy3标记cDNA共杂交(9)由12个具有代表性的细胞系组成。使用高斯窗移动平均拟合对测量的Cy5/Cy3比率进行标准化(无背景减法;参考。17)校正红色通道与绿色通道散射图中的曲率。对于寡核苷酸数据(11),根据测量值可靠地反映信号而非噪声的最小水平的经验测定,平均差值为30(即,所有小于30的值都设置为30)(18).10

利用Oncobacterial人工染色体DNA微阵列阵列CGH

使用QIAmp DNA Blood Maxi试剂盒(Qiagen,Inc.,Valencia,CA)纯化从60个细胞系收获的DNA,并进行荧光定量。来自普罗米加(威斯康星州麦迪逊)的正常女性基因组DNA用作参考。通过消化1μg DNA和Dpn公司II(NEB,马萨诸塞州波士顿),然后用QIAquick PCR纯化试剂盒(Qiagen)处理。如其他地方所述,细胞系和参考DNA样品分别用Cy3-UTP和Cy5-dUTP标记(Amersham Pharmacia Biotech,Piscataway,NJ)(19). 使用MicroSpin G-50柱(Amersham Pharmacia Biotech)纯化标记探针。用50μg人cot-1 DNA(Invitrogen,Carlsbad,CA)乙醇沉淀约250 ng的每个标记探针,并重新悬浮在20μL杂交缓冲液中(50%甲酰胺,10%硫酸葡聚糖,2×SSC,4%SDS和1%酵母tRNA)。探针在73°C下变性5分钟,在37°C下再退火60至90分钟,然后将其应用于载玻片。

用于CGH的OncoBAC DNA微阵列包括450个细菌人工染色体、P1衍生人工染色体和四份打印的P1克隆。所选克隆集包括与致癌、细胞周期调控、细胞增殖或凋亡相关的已知和/或先前报道的基因和位点,以及位于已知扩增子中的位点。这些克隆及其基因组位置列于(20).11

阵列的制备如前所述(20). 简言之,用含有5′胺基的简并寡核苷酸引物通过PCR扩增DNA。使用一个定制的阵列打印机器人,将PCR产物一式四份打印到3D-Link激活的载玻片上(伊利诺伊州诺斯布鲁克市摩托罗拉生命科学公司)(19). 将载玻片在装有饱和NaCl蒸汽的盒子中孵育过夜,用于印刷后偶联,然后储存在干燥器中。

阵列杂交如其他地方所述(19-22). 简言之,将阵列载玻片在50°C的封闭溶液[50 mmol/L乙醇胺、0.1 mol/L Tris(pH 9)、0.1%十二烷基硫酸钠]中预处理15分钟,然后浸入沸水中使DNA变性。在阵列周围放置橡胶水泥坝,并使用在73°C下变性的探针混合物(如上所述)。然后将载玻片无盖玻璃放置在37°C摇杆上的加湿室(50%甲酰胺,2×SSC)中48至72小时。对正常雄性和雌性参考DNA进行对照杂交,以检查分析质量。杂交后,将载玻片在50℃的50%甲酰胺/2×SSC(pH 7)中洗涤15分钟,在50℃在2×SSC/0.1%十二烷基硫酸钠中洗涤30分钟,最后在室温下在PN缓冲液中清洗15分钟[0.1 mol/L磷酸钠缓冲液,0.1%NP40(pH 8)]。然后用4′,6-二氨基-2-苯基吲哚(1μmol/L DAPI,1×PBS,90%甘油)对载玻片进行染色成像。

使用配备CY3、CY5和DAPI滤波器的定制CCD摄像机成像仪采集TIFF格式和16位灰度图像。然后按照其他地方的描述对图像进行分析(19,23). 从进一步分析中消除了DAPI强度低、CY3和CY5像素强度之间相关性低或DAPI基分段斑点像素数低的斑点。将数据归一化为原始CY3/CY5比率的中位数,并将其转换为重量增加和损失的对数2。计算四个重复点中每个点的归一化对数2比率的平均值和SD。如果四个重复值的log 2 SD超过0.332,或者如果比率测量基于单个点,则从进一步分析中排除克隆。

光谱核型分析

对60个细胞系中的59个进行了光谱核型分析(16). 第60个细胞系MDA-N不再可用于分析。NCI UNK/ADR RES没有包括在这里的断点分析中,因为我们发现它几乎可以肯定是OVCAR8的衍生物;因此,包括它会带来偏见。证据已在别处详细报道(16).

药物活性概况

为了进行分析,我们重点研究了118种化合物(24)具有已知或实验支持的作用机制。使用的数据是NCI发展治疗计划NCI-60屏幕中化合物50%的生长抑制浓度(7).12在48小时的磺基罗丹明B测定中,每种化合物对细胞系进行了多次独立的分析。如前所述,对数据进行过滤和分析(9,24).10

其中包括抗有丝分裂剂、DNA抗代谢剂、RNA抗代谢剂,拓扑异构酶1抑制剂、拓扑异构酶2抑制剂和几种亚型烷基化剂。其他地方可以找到特征和机械子分类列表(表1参考文献。12).

表1

分析中每个基因的阵列CGH和表达的皮尔逊相关性(即自我比较)

细胞遗传学
位置
符号基因名称cDNA
表达式数组
寡核苷酸
表达式数组
R(右)*P(P)R(右)P(P)
第16.13页EPHA2型Ephrin受体EphA2−0.010.991−0.070.991
第112页GADD45A公司生长停滞和DNA损伤诱导基因GADD45,α0.560.040.020.460.030.01
第13.3页CSF1型集落刺激因子1(巨噬细胞)0.180.840.660.090.981
1季度23.3DDR2(DDR2)盘状体域受体家族,成员20.150.900.890.110.981
1季度32.1ELF3级E74样因子3(ets域转录因子,上皮特异性)0.330.460.140.270.530.20
第21页MSH2型mutS同源物2,结肠癌,非息肉病1型(大肠杆菌)0.190.840.560.170.900.64
第2季度23.3ARHE公司ras同源基因家族成员E0.210.840.490.170.900.64
第2季度24.1ACVR1型激活素A受体,I型0.220.810.430.090.981
第25.3页甚高频von Hippel-Lindau综合征0.320.460.140.290.460.17
第35.2页英国皇家空军1号v-raf-1小鼠白血病病毒癌基因同源物10.610.020.020.410.070.03
第21.31页CDC25A型细胞分裂周期25A0.590.030.020.340.250.08
第21.31页ARHA公司ras同源基因家族成员A0.610.020.020.340.250.08
第11.1页TKT公司转酮醇酶(Wernicke-Korsakoff综合征)0.320.470.150.240.650.28
第3季度12.1文件1卵巢癌下调1−0.280.991−0.140.991
第3季度23PLS1(PLS1)Plastin 1(I亚型)−0.250.991−0.060.991
24年第3季度AGTR1号机组血管紧张素II受体,1型0.250.720.32−0.020.991
第3季度27.3BCL6号机组B细胞CLL/淋巴瘤6(锌指蛋白51)0.280.610.230.160.910.73
第3季度29TFRC公司转铁蛋白受体(p90,CD71)0.350.400.110.480.030.01
第16.3页FGFR3型成纤维细胞生长因子受体3(软骨发育不全,致死性侏儒症)0.330.460.140.380.120.04
2012年第4季度PDGFRA公司血小板衍生生长因子受体,α多肽0.490.100.030.350.220.07
第4季度27CCNA2号机组细胞周期蛋白A20.630.020.020.510.020.01
第5季度13.2CCNB1公司细胞周期蛋白B10.370.340.090.340.260.08
第5季度31.2CDC25C型细胞分裂周期25C0.290.570.200.310.330.11
第61.31页CDKN1A公司细胞周期素依赖性激酶抑制剂1A(p21,Cip1)−0.030.9910.10.981
第61.2页个人信息管理1原癌基因丝氨酸/苏氨酸蛋白激酶pim-1(ec 2.7.1.37)0.360.390.110.270.480.18
第6季度21FYN公司FYN酪氨酸激酶原癌基因0.110.9510.120.981
第8页,共12页FGFR1号机组成纤维细胞生长因子受体1(fms相关酪氨酸激酶2,Pfeiffer综合征)0.330.460.140.310.330.11
第8季度12.1林恩v-yes-1山口肉瘤病毒相关癌基因同源物0.260.690.280.380.110.04
第8季度12.1RAB2型RAB2,RAS癌基因家族成员0.260.690.280.230.730.34
9季度31.3GNG10系列鸟嘌呤核苷酸结合蛋白(G蛋白),γ100.20.840.510.20.860.51
10页12.2体重指数小鼠白血病病毒(bmi-1)癌基因同源物0.260.690.290.070.981
11页15.4ARHG公司ras同源基因家族成员G(ρG)0.330.460.140.340.230.08
11问题13.1MEN1(菜单1)多发性内分泌肿瘤I0.440.180.05−0.050.991
11季度13.3CCND1号机组细胞周期蛋白D1(PRAD1:甲状旁腺腺瘤病1)0.430.190.050.450.040.01
11季度13.3EMS1系统Src底物皮质素(amplaxin;致癌基因ems1)0.570.040.020.40.080.03
11季度13.5PAK1p21/Cdc42/Rac1-活化激酶1(STE20同源物,酵母)0.010.9910.040.981
11季度14.2CTSC公司组织蛋白酶C0.230.790.400.220.770.39
第11季度21MRE11A型MRE11减数分裂重组11同源物A(酿酒酵母)0.630.020.020.340.250.08
12季度14.1SAS公司肉瘤放大序列0.180.840.640.00190.991
12季度23.3TRA1公司肿瘤排斥抗原(gp96)10.280.620.230.150.910.76
2012年第12季度ALDH2型醛脱氢酶2家族(线粒体)0.080.9710.110.981
12季度23.3TDG公司胸腺嘧啶-DNA糖苷酶0.330.460.140.240.630.26
14季度11.2APEX核酸酶(多功能DNA修复酶)10.580.040.020.30.370.13
14季度11.2PSME1型蛋白酶体(prosome,macropain)激活子亚单位1(PA28α)0.060.9810.270.500.19
14季度32.33AKT1型v-akt小鼠胸腺瘤病毒癌基因同源物10.420.200.050.360.170.06
第15季度24.1PML公司急性早幼粒细胞白血病诱导剂−0.040.9910.170.900.64
第15季度24.1CSK公司c-src酪氨酸激酶0.510.080.020.280.460.17
16季度22.1CDH1型钙粘蛋白1,1型,E-钙粘蛋白(上皮性)−0.010.991−0.030.991
2012年第17季度ERBB2号机组v-erb-b2禽红细胞白血病病毒癌基因同源物20.460.130.040.50.020.01
17季度21.2TOP2A公司拓扑异构酶(DNA)IIα,170 kDa0.440.170.050.310.330.11
第18页第1.23页PTPRM公司蛋白酪氨酸磷酸酶,受体型,M0.220.810.430.110.981
19页13.26月Jun B原癌基因0.190.840.560.20.870.54
19季度13.33LIG1公司连接酶I,DNA,ATP依赖0.320.460.140.10.981
20页13FKBP1A型FK506结合蛋白1A,12kDa0.490.090.030.530.010.01
20页13川东北25B细胞分裂周期25B0.310.510.170.280.480.17
20页11.23第23B节Sec23同源物B(酿酒酵母)0.530.060.020.490.020.01
20季度13.12第二个多年电价v-myb成髓细胞病病毒癌基因同源物(禽)样20.220.810.430.190.880.59
20季度13.12PRKCBP1号机组蛋白激酶C结合蛋白10.20.840.540.240.690.31
20季度13.13CSE1L公司CSE1染色体分离1-like(酵母)0.580.040.020.440.050.02
2013年第20季度PTPN1号机组蛋白酪氨酸磷酸酶,非受体1型−0.030.9910.180.900.64
21季度22.3MX2型粘病毒(流感病毒)耐药性2(小鼠)0.380.320.090.050.981
21季度22.3SMT3H1型mif 2 3同源物3的SMT3抑制剂(酵母)0.430.190.050.410.070.03
22季度13.1自动变速箱4激活转录因子4(纳税反应增强子元件B67)0.050.9810.280.480.17
Xq23号机组§PRKCI公司蛋白激酶C,iota−0.010.991−0.110.991
*皮尔逊相关系数。
Westfall-Young公司P(P)在零相关的零假设下,为任何与观察到的相关性一样大的基因寻找相关性(27).
Benjamini-Hochberg程序表示宣布基因正相关的最小错误发现率(28).
§2003年7月重新分配至第3季度26.2。

数据集之间的基因匹配

在分析开始之前,有必要确定CGH阵列和两个表达数据集中的基因,并确定这三个数据集的交集。数据集交集(合并列表)是使用Python脚本parseUniGene生成的,13我们公开的基于网络的MatchMiner程序的早期开发版本(25).14该程序通过UniGene集群分配(构建132),将cDNA阵列的IMAGE克隆ID与寡核苷酸芯片和CGH阵列的Genbank登录号相匹配。在此匹配过程之后,对所得数据进行缺失值和下限值的筛选。对于这三个数据集中的每一个,只有那些缺失值或下限值≤45的序列或克隆被向前推进。

由于一些基因由数组中的多个序列表示,下一步是确保合并列表中的每个条目表示数组CGH和表达式之间的一对一关系。因此,我们在逐个基因的基础上推导出了由阵列上多个序列表示的那些基因的单个阵列CGH或每个细胞系的表达值。对于阵列CGH数据,在通过计算Pearson相关系数确认60个细胞系中代表相同基因座的克隆之间的相似杂交模式后,计算拷贝数比率的对数-均值。该程序从阵列CGH数据中总共产生了353个独特的基因。为了最大限度地提高表达数据的可靠性,我们在当前分析中将注意力限制在满足两个条件的64基因子集上:(a)每个基因都存在于阵列CGH、cDNA和寡核苷酸数据集中,以及(b)每个基因在cDNA和寡核苷酸数据集之间显示出合理一致的表达模式(即相关系数>0.3;参考文献。18). 对于在表达数据集中具有多种表现形式的基因,我们使用cDNA和寡核苷酸阵列表达数据之间相关性最高的序列(18). 预计该选择过程不会使与表达式相关的统计计算与阵列CGH数据产生偏差。

统计分析

除非另有规定,否则所有分析均使用SAS(SAS Software,Inc.,v8.2)进行。基因列表最终确定后,在对异常值数据进行详细检查后,计算所有64×64=4096个可能的基因对的阵列CGH-cDNA阵列Pearson相关系数(所有数据log 2均已转换)(有关说明,请参阅补充材料和补充表S3和S4)。15对所有4096阵列CGH-寡核苷酸阵列基因对也进行了同样的操作。可在补充图S1和S2中找到显示这些比较的相关系数分布的直方图。15通过bootstrap重采样估计相关性的置信限(26)采用经验百分位数法,平衡重采样10000次。通过使用引导重采样,我们避免了关于变量分布的参数假设。

通过两种方式评估了每个基因的拷贝数与其表达之间相关性的可靠性。首先是Westfall-Young(27)P(P)s for each gene表示在零相关的零假设(假设基因表达与数组CGH之间没有系统关系)下,为任何与该基因的相关性一样大的基因找到相关性的概率。在排列表达值和数组CGH之间的对应关系后,通过多次重新计算相关性来估计零分布。这样的重采样保留了不同基因之间的相关性。可靠性的第二个估计使用了假发现率的概念,即所有阳性中假阳性的预期比例。使用Benjamini-Hochberg计算预期错误发现率(28)程序。这个q个(29)对于每一个基因,是该基因被宣布为正相关的最小错误发现率。我们计算了一下q个s表示64个相关性中的每一个。这些计算是使用R统计语言完成的。16

64×64矩阵的阵列CGH-cDNA阵列Pearson的相关系数按染色体位置(即从第1染色体到第X染色体)进行行和列排序,以使用带有“无聚类”选项的CIMminer程序包创建我们这里所称的“基因组图像图”。17还为64×64阵列CGH阵列CGH和阵列CGH寡核苷酸阵列相关矩阵生成了类似的基因组图像。为了开始分析DNA拷贝数与药物敏感性之间的关系,计算了阵列CGH 353基因数据集与118种受试化合物之间的类似成对相关性。基因组图像图和聚类图像图(6)药物阵列CGH相关系数的结果矩阵通过相关距离度量和CIMminer平均链接的分层凝聚聚类进行排序。

结果

数组CGH表达式比较

我们探讨了DNA拷贝数与mRNA表达之间的关系。在阵列CGH和cDNA集合中共发现165个基因(由阵列CGH阵列上的204个序列和cDNA阵列上的206个序列表示)。在阵列CGH和寡核苷酸集合中均发现212个基因(分别由263个序列和252个序列表示)。为了确保稳健的分析,我们将注意力集中在所有三个数据集中的64个基因上,这些基因在任何一个数据集中都没有超过45个缺失或缺失值,并且在比较cDNA和寡核苷酸表达数据时,皮尔逊相关系数大于0.30(表1). 后一个标准定义了一组表达模式已被验证的基因生物信息学这一验证过程使我们有信心测量相同基因的表达水平和DNA拷贝数(18).

使用CIMminer,我们创建了基因组图像地图(图1A和B)分别包含阵列CGH-cDNA阵列和阵列CGH-寡核苷酸阵列数据的所有可能组合的皮尔逊相关系数。“自我”(即同一基因)相关性似乎位于每个图的主对角线上。阵列CGH-cDNA的阵列CGH表达自我相关性(在64个基因中)的平均±SE为0.29±0.03(范围为-0.28至0.63),而阵列CGH-寡核苷酸比较的平均±SE为0.23±0.02(范围为−0.29至0.51)。没有统计学意义上的负自我相关(表1). 这些跨不同细胞类型和跨基因组的发现支持了DNA拷贝数是影响基因表达的一个因素这一结论。

保存图片、插图等的外部文件。对象名为nihms-123191-f0001.jpg

基因组图像图显示了NCI-60细胞系中DNA拷贝数与基因表达水平的皮尔逊相关性。基因按染色体顺序排列在轴上(对应于表1).A类,DNA拷贝数与使用cDNA阵列测量的表达水平的相关性。B类,DNA拷贝数与使用Affymetrix寡核苷酸阵列测量的表达水平的相关性。C类DNA拷贝数与自身的相关性。红色和蓝色分别表示高相关性和低相关性。右上,染色体数从1到X(X).

图1A和B显示了几个有趣的非对角线模式,可能表示一个基因的DNA拷贝数与另一个基因(在同一条染色体上或不同的染色体上)的表达之间的关联。两种这样的正相关模式位于对角线附近,对应于3p21.31-p25.3的基因(即#19-12,图1,底部)和11q13.3(即#34–35)。这些区域包含几个基因(甚高频von Hippel-Lindau抑癌基因;RAF1,v-raf-1小鼠白血病病毒癌基因同源物1;CDC25A,细胞分裂周期25A;ARHA公司,3p21.31-p25.3上的ras同源基因家族成员A;CCND1号机组、细胞周期蛋白D1和EMS1系统(11q13.3上的皮质素),DNA拷贝数和基因表达之间呈正相关,这是相互的(即甚高频英国皇家空军1号反之亦然)。在阵列CGH-cDNA比较中,3p模式最引人注目(图1A). 有几个3p关系具有统计学意义(表2; 补充表S1)。15在阵列CGH-寡核苷酸比较中也发现了相同的模式(图1B;表2; 补充表S2)。15之间的关系CCND1号机组EMS1系统11q13.3在两个比较中均显著且相互作用(表2).

表2

cDNA和寡核苷酸表达阵列比较的前50个阳性和阴性阵列CGH表达相关性具有统计学显著性(双尾95%自举)

列比较基因组杂交
基因
表达式
水平基因
R(右)*(cDNA阵列)下部
95%CI绑定
(cDNA阵列)
上部
95%CI绑定
(cDNA阵列)
R(右)(寡核苷酸阵列)下部
95%CI绑定
(寡核苷酸阵列)
上部
95%CI绑定
(寡头阵列)
CCND1号机组EMS1系统0.580.320.750.450.130.67
TFRC公司PDGFRA公司0.510.210.810.520.280.75
林恩RAB2型0.570.380.710.450.230.62
PSME1型0.620.450.760.390.130.62
CTSC公司MRE11A型0.540.340.700.460.170.67
EMS1系统CCND1号机组0.480.210.670.510.290.68
RAB2型FKBP1A型0.560.360.730.410.230.58
FGFR3型CCNA2号机组0.480.290.670.460.270.64
甚高频英国皇家空军1号0.560.400.710.350.080.59
川东北25BPML公司0.610.120.850.280.050.48
自动变速箱4FKBP1A型0.490.220.710.410.130.63
PTPN1号机组CSE1L公司0.480.180.740.390.060.65
第二个多年电价CSE1L公司0.480.190.740.390.070.64
文件1DDR2(DDR2)0.430.140.650.410.180.60
AKT1型0.530.300.700.300.060.51
AGTR1号机组ACVR1型0.480.210.680.350.050.59
PRKCBP1号机组CDH1型0.420.100.620.410.020.63
MX2型FKBP1A型0.360.100.580.470.230.67
PDGFRA公司CCNA2号机组0.470.260.630.360.160.51
英国皇家空军1号甚高频0.460.220.630.350.090.56
PRKCI公司文件10.520.250.710.280.050.48
BCL6号机组TFRC公司0.310.010.570.480.350.61
ERBB2号机组TOP2A公司0.440.220.610.340.050.55
PLS1(PLS1)RAB2型0.430.210.600.340.140.54
CDC25A型CCNA2号机组0.420.200.600.350.100.57
体重指数FYN公司−0.32−0.54−0.07−0.40−0.56−0.22
体重指数DDR2(DDR2)−0.46−0.64−0.25−0.27−0.45−0.07
MRE11A型CSF1型−0.35−0.59−0.06−0.39−0.59−0.15
CDH1型FYN公司−0.31−0.55−0.05−0.42−0.63−0.17
MEN1(菜单1)RAB2型−0.41−0.60−0.12−0.33−0.54−0.19
EMS1系统PDGFRA公司−0.50−0.71−0.19−0.24−0.38−0.07
CCNA2号机组ACVR1型−0.44−0.62−0.22−0.30−0.52−0.07
第二个多年电价林恩−0.45−0.66−0.12−0.29−0.49−0.06
CSE1L公司林恩−0.41−0.62−0.12−0.33−0.52−0.08
ALDH2型ACVR1型−0.39−0.59−0.19−0.36−0.55−0.15
PTPN1号机组林恩−0.46−0.67−0.14−0.29−0.48−0.05
个人信息管理1CTSC公司−0.32−0.51−0.09−0.44−0.61−0.24
ALDH2型RAB2型−0.40−0.62−0.12−0.36−0.54−0.20
SAS公司FYN公司−0.36−0.62−0.04−0.41−0.63−0.15
CCNA2号机组DDR2(DDR2)−0.43−0.63−0.18−0.36−0.53−0.16
CDKN1A基因CTSC公司−0.34−0.50−0.15−0.46−0.60−0.28
CSF1型CDH1型−0.43−0.65−0.13−0.38−0.61−0.10
ACVR1型英国皇家空军1号−0.34−0.61−0.04−0.48−0.65−0.28
CCND1号机组PDGFRA公司−0.57−0.77−0.27−0.27−0.42−0.10
SAS公司DDR2(DDR2)−0.53−0.73−0.25−0.33−0.53−0.11
CDH1型DDR2(DDR2)−0.47−0.68−0.25−0.42−0.61−0.22
ARHA公司ERBB2号机组−0.42−0.61−0.15−0.48−0.68−0.19
FGFR3公司FKBP1A型−0.54−0.72−0.30−0.41−0.61−0.18
ARHE公司英国皇家空军1号−0.51−0.68−0.30−0.50−0.65−0.34
体重指数PDGFRA公司−0.66−0.87−0.42−0.38−0.60−0.15
*皮尔逊相关系数。

相邻基因之间相互作用的观察可以解释为将基因表达与DNA拷贝数联系在一起的潜在结构机制的证据。阵列CGH阵列CGH相关性表明同一区域内相邻基因之间存在很强的相关性(图1C). 有趣的是,光谱核型数据(16)对于相同的60个细胞系中的58个,表明这些区域以断裂明显多于偶然预期的区域为界。此外,该区域内缺乏断裂,这表明在NCI-60细胞系的基因组重排期间,该区域保持相对完整。癌症染色体畸变的Mitelman数据库分析(30)表明3p上的这种断点模式(3p21断裂增加,端粒断裂有限)也是临床肿瘤样本的一个特征。

基因表达和基因拷贝数之间的非对角关系可能反映了许多不同的现象:基因产物之间的直接相互作用,直接相互作用的相邻基因的“连锁效应”,涉及通路中其他基因的间接相互作用,或潜在染色体介导机制的选择性压力。在最后一种情况下,我们可能会发现,阵列CGH表达相关性不是一个基因拷贝数影响另一个基因表达的结果,而是反映了DNA水平上的相关性。为了解决这一问题,我们将高正和负阵列CGH表达相关性的实例与高正和负阵列CGH自相关性的实例进行了比较。这两种相关性之间几乎没有重叠,表明在染色体水平上缺乏对坐标重排的选择(图1). 阵列CGH表达相关性和阵列CGH自相关性之间存在重叠的关联包括染色体3p25-p21(即#9-12,图1)和染色体11q13(即#33–34,图1). 此外,20p11-13(包括FKBP1A型,FK506结合蛋白1A,12kDa;川东北25B,细胞分裂周期25B;第23B节,Sec23同源物B;即#54–56,图1)和MX2型,粘病毒(流感病毒)抵抗2小鼠(即#61,图1)在阵列中的21q22.3处,在阵列CGH自身比较中也存在CGH表达数据。

与不同染色体上的基因相对应的大多数统计显著的非对角关系无法根据文献进行解释。然而,根据已知生物学,有四种关系被确定为有趣的关系:

  • ()DNA拷贝数与CDC25A型和表达CCNA2号机组(cyclin A2)在阵列CGH-cDNA(0.42;95%CI,0.2–0.59)和阵列CGH-寡核苷酸(0.35;95%CI,0.10–0.57)比较中。Cdc25A是一种磷酸酶,直接与细胞周期蛋白依赖性激酶2/细胞周期蛋白a复合体相互作用,在G1-S过渡。两者都有CDC25A型CCNA2号机组在阵列CGH-cDNA阵列比较中显示出显著的自相关(表1).CCNA2号机组在CGH-寡核苷酸阵列比较中也显示出显著的自相关(表1). 这些观察结果表明,DNA拷贝数在决定这些基因的表达水平方面发挥了作用。检查两者之间的相关性CDC25A型副本编号和CCNA2号机组表达反映了DNA水平上的选择,我们检查了CDC25A型CCNA2号机组DNA拷贝号。相关性为0.34(95%bootstrap CI,0.07–0.58),这表明可能存在保持这两个基因的DNA拷贝数在某种程度上平衡的选择性压力。
  • (b条)CCNA2号机组拷贝数与细胞分裂周期25C显著正相关(CDC25C型)cDNA阵列比较中的表达(0.44;95%CI,0.25–0.61)。如上所述,CCNA2号机组显示出显著的自相关,而CDC25C型没有。然而CDC25C型CCNA2号机组通过CDE-CHR复合物介导(31). 这种共同的监管,再加上CCNA2号机组表达与其拷贝数显著相关,表明CCNA2号机组副本编号和CDC25C型反映了这两个基因的共同转录控制。
  • (c(c))胸腺嘧啶-DNA糖苷酶(TDG公司)拷贝数与mif 2 3同源物3的SMT3抑制因子呈负相关(SMT3H1型)阵列CGH-寡核苷酸比较中的表达(−0.37;95%CI,−0.54至−0.16),但阵列CGH-cDNA比较中没有表达(−0.11;95%CI、−0.32至0.11)。TDG公司编码胸腺嘧啶-DNA糖苷酶,和SMT3H1型对SUMO-3进行编码。SUMO-3 sumoylates TDG,一种被认为是TDG和AP糖基化酶在碱基切除修复途径中连接的修饰(32).
  • (d日)ERBB2号机组(c-erb B2/neu)表达与ARHA公司CDC25A型DNA拷贝号。对于cDNA阵列表达数据,值分别为−0.42(95%CI,−0.61至−0.15)和−0.30(95%CI为−0.52至−0.08)。对于寡核苷酸阵列表达数据,相应的数字分别为−0.48(95%CI,−0.68至−0.19)和−0.31(95%CI)。文献中记录了这种反向关系ERBB2号机组由CGH或杂合性缺失决定的3p的扩增和/或过度表达和丢失(33,34). 这两项研究都无法显示两者之间的统计关系ERBB2号机组扩增和3p丢失,并没有说明ERBB2号机组过度表达与3p丢失有关。同样,对阵列CGH阵列CGH相关性的分析表明,3p拷贝数与ERBB2号机组副本编号。这一观察清楚地表明,先前建立的关联是ERBB2号机组过度表达,并且这种关联不依赖于ERBB2号机组放大。

阵列CGH与药物反应

除了检查DNA拷贝数和mRNA表达水平之间的关系外,我们还分析了118种化合物的DNA拷贝数与抗NCI-60药物活性之间的相关性,这些化合物的作用机制已知。计算这些“作用机制”药物的皮尔逊相关系数(24)和群集(6)在中生成了聚类图像映射图2A药物与DNA拷贝数的相关性在-0.57到0.54之间。具有类似作用机制的药物,如紫杉醇类似物和喜树碱衍生物,聚集在一起(补充图S3)。15已知关系,例如ATP-结合盒、B亚家族(MDR/TAP)成员1之间的反向相关性(ABCB1型)存在ABCB1/MDR1底物的DNA拷贝数和活性(图2B)还有一些新的关系。一些染色体区域(如3q)紧密地聚集在一起,而另一些(如7号染色体)则广泛分散(见图S4)。15 表3和补充表S515强调一些DNA拷贝数与bootstrap估计的95%CI之间的药物关系,这些CI不包括零。

保存图片、插图等的外部文件。对象名为nihms-123191-f0002.jpg

聚类图像图显示了NCI-60细胞系中DNA拷贝数与药物敏感性之间的Pearson相关性。A类,显示353个基因与−log(GI50)118种“作用机制”药物。ABCB1(MDR1)的DNA拷贝数与P-糖蛋白底物的负相关以黄色突出,在B类。红色和蓝色分别表示高相关性和低相关性。可在补充图S3和S4中查看带标签的两个轴的簇树(可在http://mct.aacrjournals.org).

表3

118种“作用机制”化合物的阵列CGH和药物敏感性之间的前50个正相关和负相关(具有95%的双尾助推器CI)

基因座基因名称NSC编号。药物R(右)*低95%
CI绑定
上限95%
CI绑定
英国电信公司布鲁顿无丙种球蛋白血症酪氨酸激酶176323喜树碱,9-MeO0.540.270.72
ZNF70型锌指蛋白70(Cos17)658831紫杉醇类似物0.530.240.74
CTSB公司组织蛋白酶B153858马坦星0.510.130.75
AFM267xd9型658831紫杉醇类似物0.510.310.67
巴西航空公司1乳腺癌1,早发109229-天冬酰胺酶0.500.320.66
FGFR3公司成纤维细胞生长因子受体3(软骨发育不全,致死性侏儒症)143095吡唑呋喃0.500.320.66
GPRK2L型G蛋白偶联受体激酶4143095吡唑呋喃0.500.320.66
276n12版次658831紫杉醇类似物0.490.280.66
TEC公司Tec蛋白酪氨酸激酶143095吡唑呋喃0.490.260.68
EST_185259658831紫杉醇类似物0.490.230.68
ETV6发动机ets变异基因6(TEL癌基因)167780阿萨利0.480.280.73
低密度脂蛋白脂蛋白脂肪酶49842硫酸长春碱0.470.150.67
ETV6发动机ets变异基因6(TEL癌基因)172112螺莫司汀0.470.120.74
139k18转658831紫杉醇类似物0.460.230.65
TCL1A公司T细胞白血病/淋巴瘤1A249992安萨克林0.460.250.64
AFMa082zd9型658831紫杉醇类似物0.460.240.63
191e05版本658831紫杉醇类似物0.460.220.65
ETV6发动机ets变异基因6(TEL癌基因)34462乌拉尔芥末0.460.060.76
CDH1型钙粘蛋白1,1型,E-钙粘蛋白(上皮性)606985喜树碱,20-酯(S公司)0.460.260.64
上海通用_6945658831紫杉醇类似物0.460.240.64
CDH1型钙粘蛋白1,1型,E-钙粘蛋白(上皮性)249992安萨克林0.460.250.62
PRKCI公司蛋白激酶C176323喜树碱,9-MeO0.460.120.67
S1B11_PRLL系列658831紫杉醇类似物0.460.200.65
第2页第1b页蛋白磷酸酶2(原名2A)、调节亚单位A(PR65)、β亚型143095吡唑呋喃0.450.190.64
CDH1型钙粘蛋白1,1型,E-钙粘蛋白(上皮性)94600喜树碱0.450.240.63
ETV6发动机ets变异基因6(TEL癌基因)664402紫杉醇类似物−0.45−0.77−0.01
澳大利亚广播公司活性BCR相关基因118994肌苷-乙二醛−0.45−0.63−0.21
AFM289zh5型656178紫杉醇类似物−0.45−0.62−0.24
PTEN公司磷酸酶和张力蛋白同源物(在多种晚期癌症中突变1)330500格尔德那霉素−0.45−0.64−0.21
PTEN公司磷酸酶和张力蛋白同源物(在多种晚期癌症中突变1)673187紫杉醇类似物−0.45−0.66−0.21
中国北卡罗来纳州周期素C671870紫杉醇类似物−0.46−0.71−0.15
CEBPB公司CCAAT/增强子结合蛋白(C/EBP),β338947氯米松−0.46−0.67−0.15
GADD45A公司生长停滞和DNA损伤-诱导型,α118994肌苷-乙二醛−0.46−0.63−0.26
房地产税ret原癌基因(多内分泌肿瘤和甲状腺髓样癌1,先天性巨结肠病)656178紫杉醇类似物−0.46−0.65−0.21
CH1(瑞士法郎)染色体1开放阅读框9118994肌苷-乙二醛−0.46−0.63−0.26
ABCB1型ATP-装订盒,B亚家族(MDR/TAP),成员1666608紫杉醇类似物−0.46−0.70−0.03
AFM289zh5型666608紫杉醇类似物−0.47−0.64−0.24
克/立方米谷氨酸受体,代谢性3671867紫杉醇类似物−0.47−0.64−0.25
风险调整资产基础维甲酸受体,β600222紫杉醇类似物−0.47−0.66−0.20
PTEN公司磷酸酶和紧张素同源物(在多种晚期癌症中突变1)664404紫杉醇类似物−0.47−0.66−0.25
PTEN公司磷酸酶和张力蛋白同源物(在多种晚期癌症中突变1)664402紫杉醇类似物−0.47−0.68−0.22
SAS公司肉瘤放大序列656178紫杉醇类似物−0.47−0.64−0.23
房地产税ret原癌基因(多内分泌肿瘤和甲状腺髓样癌1,先天性巨结肠病)666608紫杉醇类似物−0.47−0.69−0.19
中国北卡罗来纳州周期素C666608紫杉醇类似物−0.48−0.76−0.12
ZNF70型锌指蛋白70(Cos17)107124喜树碱,10-OH−0.48−0.69−0.19
GLI公司胶质瘤相关癌基因同源物(锌指蛋白)656178紫杉醇类似物−0.49−0.65−0.24
SRC公司v-src肉瘤(Schmidt-Ruppin A-2)病毒癌基因同源物(禽类)153858马坦星−0.50−0.65−0.31
AFMa303yb1型600222紫杉醇类似物−0.51−0.69−0.26
ETV6发动机ets变异基因6(TEL癌基因)671867紫杉醇类似物−0.56−0.76−0.18
ARHI公司ras同源基因家族成员I118994肌苷-乙二醛−0.57−0.71−0.42
*皮尔逊相关系数。

阵列CGH药物基因组图像地图(未显示)产生了有趣的观察结果。基因组的某些区域显示出与各类药物的相关性,例如微管蛋白相互作用剂和通过并入DNA发挥作用的药物。例如,我们从染色体4q13-21上看到了三个基因块(PDGFRA公司血小板衍生生长因子受体,α多肽;埃法5EPH受体A5;资产负债表(白蛋白)与几乎所有被认为通过并入DNA起作用的药物呈负相关。没有一个基因与DNA代谢有任何已知的关联,这表明我们观察到了连锁效应,并且负责关联的基因位于4q的同一区域。我们使用MatchMiner(25)检索4q13-21区域基因的HUGO符号列表。然后将该列表用作GoMiner的输入(35)鉴定可能参与DNA代谢,特别是DNA修复的基因。其中一个基因锚蛋白重复域17的电子注释(澳元17)表明它结合受损DNA并参与错配修复。

两个区域(3q26-qter和12p12-13)与微管蛋白相互作用因子相关。来自3q26的基因[SLC2A公司溶质载体家族2(易化葡萄糖转运蛋白),成员2;PIK3CA公司,磷脂酰肌醇-3-激酶,催化,α多肽;TERC公司端粒酶RNA组分以及几个序列标记位点]与两种微管失稳剂maytansine和硫酸长春新碱的活性模式呈负相关,与微管稳定剂紫杉醇及其衍生物的活性模式呈正相关。这些观察结果表明,这些相关性在某种程度上与微管化学或功能有关,可能集中在β-微管蛋白上(36-38). 然而,与其他一些微管蛋白失稳剂,如秋水仙素、多司他丁-10、盐康蛋白B、三烷基半胱氨酸或硫酸长春碱,在统计学上没有显著相关性。阵列上映射到3q26或3q的基因均未与微管蛋白或β-微管蛋白发生任何已知的相互作用。

按照与上述类似的方法,我们检索了3q26-3qter上基因的基因符号,并使用GoMiner将其映射到基因本体中。已知有几个基因参与转运(包括一些ABC转运蛋白),参与细胞骨架组织和维持的基因,以及LOC389192号,一种假设蛋白质的基因,其序列与微管蛋白β-4q链相似。然而,没有一个基因是与微管蛋白相互作用因子相关的可能驱动因素。

在12号染色体上,ets变异基因6(ETV6/电话癌基因12p12-p13)与所有微管蛋白相互作用因子呈负相关。12号染色体上有几个微管蛋白或微管蛋白相关基因。然而,它们都在q臂上,12q基因与微管蛋白相互作用因子的活性模式之间没有显著的负相关。

从DNA到RNA再到药物敏感性

在之前的分析中,我们展示了一个特别有趣的关系,即天冬酰胺合成酶的表达与对L(左)-天冬酰胺酶(9). 尽管所有60个细胞系之间的相关性只有中等程度的高(-0.44),但通过对来源组织的数据进行分析,发现白血病与卵巢癌之间存在较强的负相关(-0.98;95%自举CI,-1.00至-0.93)(-0.88;95%自展CI,-0.99至-0.23)。当我们询问在DNA水平上是否会出现类似的相关性时,7q上的基因座在卵巢细胞系和白血病细胞系中均显示出负相关。特别地,遇见(met原癌基因)是天冬酰胺合成酶的18.9 Mb端粒(天冬酰胺合成酶本身在阵列上不存在),卵巢细胞系的相关系数为-0.983(95%启动CI,-0.999~-0.899),白血病细胞系的相关性系数为-0.723(95%引导CI,-0.99~0.0388)(图3A),与之前在表达式数据中发现的类似(图3B).

保存图片、插图等的外部文件。对象名称为nihms-123191-f0003.jpg

的关系L(左)-天冬酰胺酶对天冬酰胺合成酶的活性(ASNS公司)NCI-60细胞系中的表达水平和DNA拷贝数。A类,L(左)-天冬酰胺酶活性[来自谢尔夫等人(12)]与天冬酰胺合成酶表达水平的比较。这些数据产生了一个假设,即卵巢癌的一个子集可能对L(左)-天冬酰胺酶。B类,L(左)-7号染色体上靠近天冬酰胺合成酶的克隆(MET)的天冬酰胺酶活性与DNA拷贝数。蓝色、粉红色和灰色数据点分别来自白血病、卵巢和其他癌症细胞类型。蓝色和粉色线表示线性最小二乘拟合。结果中给出了相关系数估计值的CI。

讨论

在DNA和mRNA水平上进行高分辨率全基因组剖析的新技术使研究基因组重排和DNA拷贝数变化对基因表达的影响成为可能。通过对NCI-60细胞系进行此类研究,我们利用了这些细胞在药物敏感性方面的丰富特征(对>10000种化学定义的化合物),将DNA和mRNA图谱映射到分子药理学和药物发现领域(6,39). 这里使用的分析方法使我们能够将一个基因的DNA拷贝数与其自身表达以及其他基因(在同一条或不同的染色体上)的表达联系起来。

数据显示,给定基因的拷贝数与其在mRNA水平的表达之间普遍存在正相关。在乳腺细胞系和原发性乳腺肿瘤中也发现了基因拷贝数与基因表达的相关性(40,41)以及前列腺癌模型(42)和HL60中(43). Hyman等人(40)结果表明,在14个乳腺癌细胞系中,44%的高扩增基因得到了高表达,发现约10.5%的高表达基因得到了扩增。当DNA拷贝数和mRNA表达被分类为“增加”、“丢失”或“无变化”而不考虑大小时,他们还发现表达水平与拷贝数呈正趋势。44个原发性乳腺肿瘤和10个细胞系的结果相似(41). 62%的高扩增基因表现出至少中等水平的基因表达增加,42%的高放大基因表现出可比的mRNA过度表达,在所有类别的DNA拷贝数改变(缺失、无变化以及低水平、中等水平和高水平扩增)中,用DNA拷贝数跟踪平均RNA表达。12%的基因表达变异直接归因于基因拷贝数。在前列腺癌变模型中,Phillips等人(42)发现51%的基因在向恶性肿瘤转化过程中上调与DNA拷贝数增加有关,42%的下调基因位于DNA拷贝数丢失区域。当获得整个染色体臂或整个染色体时,所有相关基因的平均基因表达都会增加,尽管增加的程度因基因而异。

在我们的数据中,一个基因的DNA拷贝数和另一个基因表达之间的明显关系很少能在文献中反映出来。其中大多数可能反映了统计上的巧合,或者反映了大多数实体肿瘤的特征,并导致“连锁效应”的大型染色体重排。当驱动相关性的真正关系实际上涉及到与我们数据中确定的基因相近的基因时,我们可以预期这种“连锁效应“,但我们沿着染色体的分辨率不足以确定相关性的真正来源。除了解决问题外,应该认识到,目前的分析有以下局限性:()皮尔逊相关性基本上是线性关系;非线性关系很可能被忽略;(b条)单细胞系有时可能对确定特定基因对的相关性产生过度影响。数据见补充表S3和S4,15和计算(根据库克的D类统计)在补充信息中进行了描述。15事实上,剔除异常细胞系确实改变了某些情况下相关性的重要性。(c(c))这里提供的数据给出了DNA和RNA之间关系的不完整生物学图片。癌细胞很少是二倍体,并且几乎总是显示大规模的基因组重排。NCI-60细胞系也不例外(16). 本研究中测量的DNA拷贝数与细胞的倍性有关,不能传递有关得失基因组背景的信息,也不能传递不导致净得失的重排信息。

我们观察到三种情况,其中已知其产物直接相互作用的基因之间存在强相关性:CDC25A型CCNA2号机组,CCNA2型、和CDC25C型、和TDG公司SMT3H1型.如果CDC25A型副本编号-CCNA2号机组表达和CCNA2型拷贝数-CDC25C的表达,我们质疑所观察到的相关性是否反映了基因之间在DNA水平或转录水平上的强烈相关性,而不是一个基因的DNA拷贝数与另一个基因转录本之间的相互作用。在以下情况下CDC25A型CCNA2号机组,这种相关性反映了这两个基因之间在DNA水平上的关系。如结果中所述,我们之所以确定这一点,是因为我们发现了几种类型的相关性:CDC25A型与相关的拷贝数CCNA2型表达和两者CDC25A型CCNA2号机组表现出显著的自相关。后者表明,DNA拷贝数在决定这些基因的表达水平方面起着重要作用。因此CCNA2号机组很可能在很大程度上反映了它的DNA拷贝数。如果是真的,那么这两个基因在DNA水平上的相关性将产生所观察到的CDC25A型副本编号和CCNA2号机组表达式。事实确实如此CDC25A型拷贝数与CCNA2号机组副本编号。

探索CCNA2号机组拷贝数和CDC25C表达在DNA水平上不支持相关性,而是指向转录水平上的相关性。我们的数据显示CCNA2号机组自相关,但CDC25C型自我相关不显著。因此,不太可能CDC25C型表达式将近似于其拷贝数。事实上,两者之间没有相关性CCNA2号机组副本编号和CDC25C型副本编号。然而,因为CCNA2号机组具有显著的自相关,DNA拷贝数可能接近表达水平。因此,我们从转录水平上寻找观察到的相关性的可能解释。CCNA2号机组CDC25C型共享一个共同的阻遏物结合位点CDE-CHR。与该位点结合导致两个基因在S期的协同转录,以准备G2-M过渡(31). 的相关性CCNA2号机组副本编号CDC25C型表达可能是这种常见转录控制的反映。

目前尚不清楚如何理解TDG公司副本编号SMT3H1型表达式。TDG公司编码胸腺嘧啶-DNA糖苷酶,这是一种参与碱基切除修复的不匹配特异性尿嘧啶/胸腺嘧啶-DNA糖苷酶。SMT3H1型编码SUMO-3,一种小的泛素样蛋白。在体外碱释放分析,TDG结合不匹配的G*T或G*U,水解胸腺嘧啶/尿嘧啶,但不释放碱性位点(44,45). Hardeland等人(32)研究表明,磺酰化导致TDG的周转量增加~3倍。引入APEX核酸酶(多功能DNA修复酶)1(APE1)使周转率增加了3倍(32). 假设未修饰的TDG与不匹配的G*T或G*U具有高亲和力,催化T或U的去除,并保持结合以保护反应性碱性位点。SUMO-3在DNA-结合状态下修饰TDG,然后引起构象变化导致解离,该反应可能与修复过程中TDG下游的AP内切酶APE1协调(32). 如果SUMO-3加快了TDG的周转,那么在我们的数据中看到的反向相关性可能反映了一种补偿措施,即当TDG的数量因拷贝数丢失而减少时,保持基底切除修复的功能。

我们的数据表明,染色体3p上的基因拷贝数与ERBB2号机组。该观察结果与之前观察到的一致ERBB2号机组乳腺癌和卵巢癌中3p杂合性缺失与过度表达的关系(33,34). 在肺癌中也发现了类似的关系(46). 从文献中还不清楚是单纯的过度表达还是扩增导致的过度表达导致了这些关系。我们的数据没有表明ERBB2号机组副本编号和副本编号或表达式级别ARHA公司CDC25A型,位于3p上。这些观察结果表明ERBB2号机组是重要因素。转基因小鼠原发性乳腺癌不同位点杂合性缺失的研究ERBB2号机组在小鼠乳腺癌病毒启动子的控制下,小鼠3号和4号染色体杂合性缺失的频率显著高于背景值(47). 该研究的结果表明,染色体3和4上杂合性缺失的区域可能含有参与ERBB2诱导致癌的抑癌基因。研究中的一个标记,D3米127,位于小鼠3号染色体的一个区域,该区域与人类3p号染色体在周围区域同步CDC25A型ARHA公司在我们的研究中,拷贝数与ERBB2表达呈负相关的两个基因。3p基因的缺失可能是ERBB2号机组过度表达。

除了寻找基因拷贝数和mRNA水平之间的关系外,我们还对118种已知作用机制的药物的DNA拷贝数和药物敏感性之间的关系进行了研究(9,24). 我们首先研究了ABCB1/MDR1型基因拷贝数和药物参与多药耐药表型。与之前的文献一致,我们能够确定ABCB1型MDR1流出泵已知底物的拷贝号和活性。

为了确定可能需要随访的区域,我们使用了基因组图像地图分析和图形可视化。在某些情况下,基因组的特定基因或区域与整个类别的因子相关。我们发现微管蛋白相互作用剂与3q26基因之间存在正相关(SLC2A2系列,PIK3CA公司,TERC公司和几个序列标记的站点)和12p(ETV6发动机). 纳入DNA的试剂活性与4q基因呈负相关。在每种情况下,与相关性相关的基因与药物的作用机制没有明显的相关性。由于没有确定令人信服的候选靶点或作用修饰物,涉及这些位点的相关性可能是统计上的巧合或“连锁效应”,可以通过高分辨率研究解决。澳元17这可能解释了4q基因与DNA中的试剂之间的负相关。澳元17没有实验上已知的功能,但通过电子注释推测其在DNA结合和错配修复中起作用,这些功能与通过DNA掺入作用的试剂的负关联一致。

本研究中迄今为止发现的最有趣的药物拷贝数关系为我们之前关于NCI-60中天冬酰胺合成酶表达与细菌酶敏感性之间关系的报告提供了一个新的维度L(左)-天冬酰胺酶(9).L(左)-自20世纪70年代初以来,天冬酰胺酶被用于治疗急性淋巴细胞白血病和其他一些血液恶性肿瘤。这些细胞通常缺乏内源性天冬酰胺合成酶,因此必须从血液中清除天冬酰胺。L(左)-天冬酰胺酶耗尽循环中的天冬酰胺并选择性地使癌细胞饥饿(48,49). 早期临床试验报告了不同类型实体瘤的偶尔反应(48)但数据显然不足以证明II期试验的临床疗效。正如结果中更详细的定量描述,我们发现了一个很强的负相关(-0.98;参考文献。9)天冬酰胺合成酶的表达与药物敏感性L(左)-NCI-60中白血病细胞的天冬酰胺酶。卵巢细胞类型也有类似的相关性(-0.88)(9)但该值还不够高,无法通过统计“多重比较”测试。因此,我们认为这是一条制定无效假设的线索,即卵巢癌的一个子集可能会受到L(左)-天冬酰胺酶。在分析本研究的数据时,我们询问是否在L(左)-天冬酰胺合成酶附近7q位点的天冬酰胺酶活性和DNA拷贝数。如果是这样的话,这一发现将为最初的假设提供依据,并为酶的表达差异提供可能的机制。我们确实发现卵巢癌中的相关性非常强(-0.98;95%bootstrap CI,-0.999至-0.899)。此外,在卵巢癌中观察到7q的丢失(50-54). 这些观察加强了研究的基础L(左)-天冬酰胺酶在临床卵巢肿瘤中的活性,并提出了敏感性或耐药性的机制。的另一个潜在重要属性L(左)-天冬酰胺酶的作用机制(即消耗循环中的天冬酰胺)是,该酶无需穿透肿瘤才能发挥作用。

总之,我们在此提供了一个新的阵列CGH结果数据库,该数据库侧重于NCI-60细胞中的癌症相关基因,并分析了这些数据与这些相同细胞的mRNA表达和药物敏感性的相关性。这个L(左)-天冬酰胺酶/天冬酰胺合成酶的故事对我们来说尤为明显和有趣,如果这种关系适用于临床肿瘤,那么它将具有临床意义。然而,DNA拷贝数数据库也将作为一个公开的“时间胶囊”由具有领域专业知识的研究人员挖掘,并将研究重点放在他们自己的特定基因或药物上。然后,将DNA拷贝数数据与NCI-60上的其他丰富数据资源集成,可用于进一步探索和深入分析。

致谢

我们感谢Daniel Von Hoff在L(左)-天冬酰胺酶/天冬酰胺合成酶起作用。

拨款支持:美国能源部科学办公室生物与环境研究合同办公室DE-AC03-76SF00098;NIH国家癌症研究所资助P01 CA 64602和P50 CA 58207(J.W.Gray);以及NIH、国家癌症研究所、癌症研究中心的校内研究计划。

脚注

阵列CGH数据已存放在ArrayExpress中(登录号E-TABM-65)。

10这些研究的数据可以在网上找到(http://discover.nci.nih.gov).

11http://cc.ucsf.edu/gray/public

12http://www.dtp.nci.nih.gov

13Ajay等人,未发表。

14http://discover.nci.nih.gov/matchminer网站

15本文的补充材料可在分子癌症治疗在线上获得(http://mct.aacrjournals.org)或在基因组学和生物信息学小组网站上(http://discover.nci.nih.gov/host/2005_bussey_amplemental/bussey_et_al_Amplementary_information.jsp).

16http://www.r-project.org

17http://discover.nci.nih.gov

工具书类

1.Bieche I,Lidereau R.人类乳腺癌中13q14杂合性缺失与RB1基因表达不足相关。霉菌致癌。2000;29:151–8.[公共医学][谷歌学者]
2Bieche I、Laurendeau I、Tozlu S等。用实时逆转录-PCR分析定量散发性乳腺肿瘤中MYC基因的表达。癌症研究。1999;59:2759–65.[公共医学][谷歌学者]
三。Smith CA、Pollice AA、Gu LP等。p53、HER-2之间的相关性/neu(新)多参数流式细胞术检测人类乳腺癌中ras过表达和非整倍体:浸润性导管癌中常见表型进化模式的证据。临床癌症研究。2000;6:112–26.[公共医学][谷歌学者]
4Kristiansen G,Yu Y,Petersen S,等。非小细胞肺癌中c-erbB2蛋白的过度表达与疾病分期和c-erbB2位点的染色体增加相关。《欧洲癌症杂志》。2001;37:1089–95.[公共医学][谷歌学者]
5奔驰CC、斯科特GK、桑托斯GF、史密斯HS。c-myc、c-Haras1和c-erbB-2原癌基因在正常和恶性人类乳腺上皮细胞中的表达。美国国家癌症研究所杂志。1989;81:1704–9.[公共医学][谷歌学者]
6Weinstein JN、Myers TG、O'Connor PM等。癌症分子药理学的信息密集型方法。科学。1997;275:343–9.[公共医学][谷歌学者]
7Shoemaker RH、Monks A、Alley MC等。用于疾病导向药物筛选的人类肿瘤细胞系面板的开发。临床生物研究进展。1988;276:265–86.[公共医学][谷歌学者]
8Boyd MR、Paull KD。国家癌症研究所的一些实际考虑和应用在体外抗癌药物发现筛选。药物开发研究。1995;34:91–109. [谷歌学者]
9谢尔夫U、罗斯DT、沃尔瑟姆M等。癌症分子药理学的基因表达数据库。自然遗传学。2000;24:236–44.[公共医学][谷歌学者]
10Ross DT、Scherf U、Eisen MB等。人类癌症细胞系中基因表达模式的系统性变化。自然遗传学。2000;24:227–35.[公共医学][谷歌学者]
11Staunton JE、Slonim DK、Coller HA等。通过转录谱预测化学敏感性。美国国家科学院院刊。2001;98:10787–92. [PMC免费文章][公共医学][谷歌学者]
12Myers TG,Anderson NL,Walterham M等。癌症分子药理学的蛋白质表达数据库。电泳。1997;18:647–53.[公共医学][谷歌学者]
13Li G,Waltham M,Anderson NL,等。凝胶内蛋白水解消化后二维聚丙烯酰胺凝胶蛋白质的快速质谱鉴定。电泳。1997;18:391–402.[公共医学][谷歌学者]
14Nishizuka S,Chen ST,Gwadry FG,et al.区分结肠腺癌和卵巢腺癌的诊断标记:通过基因组、蛋白质组和组织芯片分析进行鉴定。癌症研究。2003;63:5243–50.[公共医学][谷歌学者]
15Nishizuka S、Charboneau L、Young L等。使用新的高密度反相裂解物微阵列对NCI-60癌细胞系进行蛋白质组学分析。美国国家科学院院刊。2003;100:14229–34. [PMC免费文章][公共医学][谷歌学者]
16Roschke AV、Tonon G、Gehlhaus KS等。NCI-60药物筛查小组的核型复杂性。癌症研究。2003;63:8634–47.[公共医学][谷歌学者]
17Zhou Y,Gwadry FG,Reinhold WC,等。喜树碱诱导DNA损伤对有丝分裂基因的转录调控:剂量和时间依赖性效应的微阵列分析。癌症研究。2002;62:1688–95.[公共医学][谷歌学者]
18Lee JK、Bussey KJ、Gwadry FG等。比较cDNA和寡核苷酸阵列数据:NCI-60癌细胞跨平台基因表达的一致性。基因组生物学。2003;4:R82。 [PMC免费文章][公共医学][谷歌学者]
19Pinkel D、Segraves R、Sudar D等。利用比较基因组杂交技术对微阵列进行DNA拷贝数变异的高分辨率分析。自然遗传学。1998;20:207–11.[公共医学][谷歌学者]
20Massion PP,Kuo WL,Stokoe D,等。使用阵列比较基因组杂交对非小细胞肺癌进行基因组拷贝数分析:磷脂酰肌醇3-激酶途径的意义。癌症研究。2002;62:3636–40.[公共医学][谷歌学者]
21Snijders AM,Nowak N,Segraves R等。用于DNA拷贝数全基因组测量的微阵列组装。自然遗传学。2001;29:263–4.[公共医学][谷歌学者]
22.Hackett CS、Hodgson JG、Law ME等。小鼠神经母细胞瘤的全基因组CGH分析揭示了与人类肿瘤相似的明显基因组畸变。癌症研究。2003;63:5266–73.[公共医学][谷歌学者]
23Jain AN、Tokuyasu TA、Snijders AM、Segraves R、Albertson DG、Pinkel D。微阵列图像数据的全自动量化。基因组研究。2002;12:325–32. [PMC免费文章][公共医学][谷歌学者]
24Weinstein JN,Kohn KW,Grever MR,等。癌症药物开发中的神经计算:作用机制预测。科学。1992;258:447–51.[公共医学][谷歌学者]
25Bussey KJ、Kane D、Sunshine M等。MatchMiner:一种用于在基因和基因产品标识符之间进行批量导航的工具。基因组生物学。2003;4:R27。 [PMC免费文章][公共医学][谷歌学者]
26Efron B,Gong G。悠闲地看一下引导、折刀和交叉验证。美国统计局。1983;37:36–48. [谷歌学者]
27Westfall P,Young S。P(P)-多元二项模型中多重检验的值调整。美国统计协会。1989;84:780–6. [谷歌学者]
28Benjamini Y,Hochberg Y。控制错误发现率:一种实用且强大的多重测试方法。J R Stat Soc B.公司。1995;57:289–300. [谷歌学者]
29Storey J,Tibshirani R.全基因组研究的统计意义。美国国家科学院院刊。2003;100:9440–5. [PMC免费文章][公共医学][谷歌学者]
30Mitelman F、Johansson B、Mertens F编辑。癌症染色体畸变的Mitelman数据库。2005http://cgap.nci.nih.gov/染色体/Mitelman.
31Zwicker J、Lucibello FC、Wolfraim LA等。细胞周期蛋白A、cdc25C和cdc2基因的细胞周期调控基于转录抑制的共同机制。EMBO J。1995;14:4514–22. [PMC免费文章][公共医学][谷歌学者]
32Hardeland U,Steinacher R,Jiricny J,Schar P.泛素类蛋白质对人类胸腺嘧啶-DNA糖苷酶的修饰促进了酶的转换。EMBO J。2002;21:1456–64. [PMC免费文章][公共医学][谷歌学者]
33Isola J,Chu L,DeVries S,等。ERBB2扩增乳腺癌的遗传改变。临床癌症研究。1999;5:4140–5.[公共医学][谷歌学者]
34Zheng JP,Robinson WR,Ehlen T,Yu MC,Dubeau L.根据染色体3,6,11和HER-2杂合性缺失区分低度和高级卵巢癌/neu(新)基因扩增。癌症研究。1991;51:4045–51.[公共医学][谷歌学者]
35Zeeberg BR,Feng W,Wang G,et al.GoMiner:基因组和蛋白质组数据的生物学解释资源。基因组生物学。2003;4:R28。 [PMC免费文章][公共医学][谷歌学者]
36Wilson L,Panda D,Jordan MA。药物对微管动力学的调节:细胞调节器作用的范例。细胞结构功能。1999;24:329–35.[公共医学][谷歌学者]
37Gupta S,Bhattacharyya B.抗微管药物与文卡牌手表微管蛋白结构域。分子细胞生物化学。2003;253:41–7.[公共医学][谷歌学者]
38Cassady JM、Chan KK、Floss HG、Leistner E.玉米素类抗肿瘤药物的最新进展。Chem Pharm Bull(东京)2004;52:1–26.[公共医学][谷歌学者]
39Blower PE,Yang C,Fligner MA,等。药物基因组分析:分子亚结构类与微阵列基因表达数据的相关性。药物基因组学杂志。2002;2:259–71.[公共医学][谷歌学者]
40Hyman E、Kauraniemi P、Hautaniemi S等。DNA扩增对乳腺癌基因表达模式的影响。癌症研究。2002;62:6240–5.[公共医学][谷歌学者]
41Pollack JR、Sorlie T、Perou CM等。微阵列分析揭示了DNA拷贝数改变在人类乳腺肿瘤转录程序中的主要直接作用。美国国家科学院院刊。2002;99:12963–8. [PMC免费文章][公共医学][谷歌学者]
42Phillips JL、Hayward SW、Wang Y等。染色体非整倍体对前列腺癌细胞系模型中基因表达谱的影响。癌症研究。2001;61:8143–9.[公共医学][谷歌学者]
43Ulger C、Toruner GA、Alkan M等。使用微阵列技术对DNA和RNA水平扫描进行全基因组综合比较,以识别HL-60细胞系中的候选癌症相关基因。癌症基因-细胞基因。2003;147:28–35.[公共医学][谷歌学者]
44Waters TR,Gallinari P,Jiricny J,Swann PF。人类胸腺嘧啶DNA糖基化酶与DNA中的无嘌呤位点结合,但被人类无尿酸内切酶1取代。生物化学杂志。1999;274:67–74.[公共医学][谷歌学者]
45Hardeland U,Bentele M,Jiricny J,Schar P.通过突变分析从人类胸腺嘧啶DNA糖苷酶的碱水解中分离底物识别。生物化学杂志。2000;275:33449–56.[公共医学][谷歌学者]
46Gazdar AF.人类肺癌的分子和细胞基础。抗癌研究。1994;14:261–7.[公共医学][谷歌学者]
47Ritland SR,Rowse GJ,Chang Y,Gendler SJ。MMTV-MTAg和MMTV-neu转基因小鼠原发性乳腺肿瘤和肺转移的杂合性缺失分析。癌症研究。1997;57:3520–5.[公共医学][谷歌学者]
48Capizzi RL、Bertino JR、Handschumacher RE。-天冬酰胺酶。医疗年度收入。1970;21:433–44.[公共医学][谷歌学者]
49Cooney DA,Handschumacher RE公司。-天冬酰胺酶和-天冬酰胺代谢。《年度药理学评论》。1970;10:421–40.[公共医学][谷歌学者]
50阿特金·NB,贝克·MC。染色体7q缺失:13种恶性肿瘤的观察。癌症基因-细胞基因。1993;67:123–5.[公共医学][谷歌学者]
51Kerr J、Leary JA、Hurst T等。卵巢腺癌7q染色体上的等位基因缺失:两个关键区域和PLANH1基因座的重排。致癌物。1996;13:1815–8.[公共医学][谷歌学者]
52Edelson MI、Scherer SW、Tsui LC等。侵袭性上皮性卵巢癌染色体7q31.3上1300千碱基缺失单位的鉴定。致癌物。1997;14:2979–84.[公共医学][谷歌学者]
53Watson RH、Neville PJ、Roy WJ、Jr.、Hitchcock A、Campbell IG。染色体7p、7q、9p和11q杂合性缺失是卵巢肿瘤发生的早期事件。致癌物。1998;17:207–12.[公共医学][谷歌学者]
54Hauptmann S、Denkert C、Koch I等。通过比较基因组杂交分析卵巢上皮性肿瘤的遗传改变。Hum Pathol(Hum病态)。2002;33:632–41.[公共医学][谷歌学者]