跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
基因组生物学。2008; 9(5):R86。
2008年5月23日在线发布。 数字对象标识:10.1186/gb-2008-9-5-r86
预防性维修识别码:项目经理2441472
PMID:18500990

GeneCount:根据阵列比较基因组杂交数据计算肿瘤DNA绝对拷贝数

关联数据

补充资料

摘要

目前,通过使用荧光只能在单个基因的基础上获得肿瘤DNA的绝对拷贝数就地杂交(FISH)。我们提出了GeneCount,这是一种从临床阵列比较基因组杂交数据中计算全基因组绝对拷贝数的方法。模型中肿瘤细胞分数得到了可靠的估计。获得了与FISH结果一致的数据。我们证明了在探索癌症中基因剂量和肿瘤内拷贝数异质性的现有方法上的显著改进。

背景

阵列比较基因组杂交(aCGH)广泛用于恶性细胞DNA拷贝数变化的全基因组定位[1,2]. 基因的得失影响基因表达水平,从而促进肿瘤生长和进展[-5]. 已经进行了许多临床研究,以发现肿瘤特征,并根据拷贝数变化对患者的预后进行分类[6,7]. 然而,aCGH数据的有用性是有限的,因为只获得了相对拷贝数而不是绝对拷贝数,这使得数据的解释和跨实验的比较变得困难。使用荧光只能在单个基因的基础上获得绝对DNA拷贝数就地杂交(FISH)。为此目的开发全基因组方法将能够生成个体疾病的通用基因拷贝数数据库,以便更广泛地使用,这也是一些公共存储库的目标,如癌症染色体畸变Mitelman数据库[8].

aCGH实验中获得的相对值受肿瘤细胞的总DNA含量(倍性)、样本中正常细胞的比例、实验偏差以及DNA拷贝数的影响。这些值表示为肿瘤和正常DNA之间的强度比[2]. 数据经过标准化处理,以1.0的比率作为分析的基线,并对应于近二倍体(2n个)肿瘤。使用比率平滑和断点检测的统计方法,从偏离基线的比率中识别拷贝数变化[9-12]. 然而,为统计分析确定的每个比率水平分配一个绝对拷贝数,从而对遗传变异进行评分是一项挑战。在DNA含量有明显变化的非整倍体肿瘤中,基线表示拷贝数而不是2,如三倍体或四倍体肿瘤中的3或4,或者当DNA含量与n个, 2n个, 3n个, ... n个[13]. 样品中存在正常细胞和实验偏差会降低比率动态。此外,在许多肿瘤中,存在几个具有不同遗传特征的恶性细胞亚群,导致肿瘤内DNA拷贝数的异质性[14-16]以及数据复杂性的增加。因此,当使用普通比率水平来评分具有不同倍性和正常细胞含量的肿瘤的得失时,会出现不可靠的结果。

肿瘤样本中正常细胞引起的混杂效应在aCGH分析中被认为是一个问题,并通过排除低纯度样本来处理[17,18]或根据肿瘤切片的组织学检查校正比率水平[6]. 后一种方法并不令人满意,因为只有肿瘤实质周围结缔组织的比例,而不是浸润的免疫细胞的比例,被精确量化。此外,测量不能在与aCGH实验中使用的组织完全相同的组织上进行,因此可能不具有代表性。已经提出了一个包括CGH比率、倍性和实验偏差的模型来估计肿瘤细胞系中的绝对DNA拷贝数[19]. 据我们所知,目前还没有一种方法能够同时考虑正常细胞含量,因此适合临床肿瘤样本的分析。

我们在这里提出了一个新的模型GeneCount,其中估计并校正了正常细胞的比例,并考虑了DNA拷贝数中可能存在的肿瘤内异质性。我们模型的输入是DNA指数(,其中=1/2·肿瘤倍性)、肿瘤细胞分数、实验偏差和aCGH比率。需要通过流式细胞术或基于图像的细胞术来测定预先确定的肿瘤倍性。例如,可以通过流式细胞术在aCGH实验中使用的样品的同一部分上测定肿瘤细胞分数。在正常细胞含量未知的情况下,在模型中估计肿瘤细胞分数。实验偏差是根据aCGH实验中的X染色体比率确定的,该实验比较了男性和女性DNA。可以使用任何现有统计分析工具中的平滑比率级别进行断点检测。

我们表明,该模型能够从造血和实体瘤的aCGH数据中自动和全基因组计算DNA拷贝数。通过对94例淋巴瘤的分析证明了基因计数的可行性,其中DNA指数和肿瘤细胞分数已通过流式细胞术测定,并且在先前的研究中使用FISH对DNA拷贝数进行了广泛的探索[20-25]. 基于预先确定的肿瘤细胞分数和模型确定的GeneCount结果与362个基因的FISH数据进行了比较,结果显示两种情况下的一致性为97%。特别是,我们探索了t(14;18)易位染色体区域的拷贝数,涉及BCL2级通过将93例宫颈癌中选定基因的拷贝数与基因表达和治疗结果相关联,我们进一步证明了GeneCount在分析没有预先确定肿瘤细胞组分的实体瘤方面的潜力。通过使用GeneCount,我们在检测带有拷贝数变化的子宫颈肿瘤方面获得了比直接基于比率水平的分析更高的灵敏度。最后,我们确定了淋巴瘤和宫颈癌中DNA拷贝数的瘤内异质性,并展示了如何利用这些信息得出关于肿瘤中遗传变异进化的结论。GeneCount在一个软件包中实现,用于断点检测统计方法的下游,并给出了基于GLAD和CGH-Explorer软件包的结果[9,11]. 我们通过开源的免费网络数据库BioArray Software Environment(BASE)提供我们的方法[26].

结果

GeneCount的基础

我们的模型利用了这样一个事实,即归一化aCGH比率以逐步的方式随着DNA拷贝数的增加而增加,其中步长取决于、肿瘤细胞分数和实验偏差(图(图1)。1). 近二倍体肿瘤(=1)在没有来自正常细胞的贡献或受实验偏差影响的情况下,拷贝数中增加1会使比率增加0.5,从而导致对数上的标准化比率为0.5、1、1.5、2,依此类推(-1、0、0.69、12比例尺),副本编号分别为1、2、3和4(参见材料和方法中的方程式2)。四倍体肿瘤的相应增加(=2)为0.25,而0.25到0.5之间的增加发生在肿瘤介于1和2之间。基线,在日志中2比率0对应于近二倍体中的2、3和4个DNA拷贝(图(图1a),1a个)、三倍体和四倍体(图(图1b)1亿)肿瘤。对于s介于1和1.5之间或介于1.5和2之间,基线表示拷贝数介于2和3之间(图(图1c)1c个)或介于3和4之间。肿瘤样本中正常细胞的存在减少了aCGH比率随拷贝数增加而增加(等式3),这在比较两个具有不同肿瘤细胞组分的近二倍体淋巴瘤的比率时可以看出(图1a、d). 使用通用比率水平对肿瘤的得失进行评分,如图所示1a-d(1a-d)因此,在拷贝数变化方面会导致不同的结果。

保存图片、插图等的外部文件。对象名称为gb-2008-9-5-r86-1.jpg

aCGH比率随DNA拷贝数增加而逐步增加的图示。显示了具有DNA指数的淋巴瘤的aCGH比率的频率直方图(%阵列探针)(左图)和aCGH比率与染色体位置的关系图(右图)()第页,共页(a)1.02中,(b)1.94,(c)1.21,以及(d)1.05,以及(e)比较男性和女性的正常DNA。通过流式细胞术测量的肿瘤细胞分数表示每个肿瘤。标记GeneCount估计的DNA拷贝数;那些黑色的与FISH数据一致,而那些红色的没有在显示的特定肿瘤中进行FISH测量。右侧面板中的箭头指向FISH探头的位置。接近1和2(a、b、d、e)时,比率分布在中值对数处显示出一个主峰2值约为零,表示最频繁的DNA拷贝数分别为2和4。1.21(c)对数的基线2比率0表示2到3个DNA拷贝之间的数字。注意,肿瘤细胞比例为70%(d)时,随着DNA拷贝数的增加,比率增加的幅度小于96%(a)。在(e)中,确定动态系数,q个,作为X染色体对数的绝对值2指示比率水平。

由于实验偏差,比率动力学进一步降低(方程式4)。动态因子表示的偏差,q个,可以通过控制实验确定,其中来自雄性和雌性的正常DNA是共杂交的(图(图1e)。第1页). 理论上,X染色体比率为0.5(对数为-12但实验偏差降低了比率动态,导致比率水平接近于零。日志的绝对值2-转换后的比率水平被用作衡量q个(图(图1e)。第1页). 根据8个对照实验,该值在这里使用的幻灯片系列之间差异不大,范围为0.75-0.85,平均值±标准偏差为0.80±0.04。A类q个-在已知和未知肿瘤细胞分数的情况下,GeneCount计算中分别使用值0.8和范围0.7-0.9。

为了能够自动计算与每个阵列探针关联的拷贝数,我们在一个程序中实现了GeneCount,该程序将在统计分析包之上运行,用于CGH比率平滑和断点检测(附加数据文件1)。针对未知肿瘤细胞分数的样本,开发了一种单独的算法,其中分数是基于两个比率水平和(附加数据文件1中的面板B),如材料和方法中所述。与FISH数据比较评估结果时,计算的DNA拷贝数中包含一位小数。否则,这些数字将四舍五入为最接近的整数值。

GeneCount拷贝数与FISH数据的比较

我们将94例淋巴瘤的基因计数结果与先前公布的相同肿瘤的FISH数据进行了比较[20-25]. FISH探针位于拷贝数变化频繁的染色体区域(图(图11和附加数据文件2),并测量了0-8范围内的拷贝数。这个s、 范围为0.95-2.23,肿瘤细胞组分范围为27%-98%,与GLAD和CGH-Explorer软件包中的平滑aCGH比率一起用作GeneCount的输入。CGH-Explorer应用了比GLAD更广泛的比率平滑,这偶尔会导致两个程序之间的比率水平和断点检测存在差异。

已知肿瘤细胞分数的GeneCount

在大多数情况下,无论是GLAD还是CGH-Explorer用于断点检测,我们都发现由GeneCount和FISH确定的DNA拷贝数非常一致(图(图2)。2). 数据集之间的相关性比在比较中使用比率水平时要好得多(附加数据文件3)。根据GLAD,362个GeneCount值中有350个与FISH数据一致(97%),而基于CGH-Explorer的相应数字是362个中的340个(94%)(图(图2)。2). GeneCount和FISH结果之间的少量差异主要出于两个原因。首先,GLAD和/或CGH-Explorer未能通过FISH检测到一些拷贝数发生变化的基因的比率变化(附加数据文件4中的面板a)。其次,对于仅涉及几个阵列探针的一些像差,比率水平以及拷贝数的确定不准确(附加数据文件4中的面板B)。这主要是使用少于三个探针的畸变情况,例如包含两个探针的纯合子缺失RB1型在其中一个肿瘤中(图中FISH拷贝数为0图22和其他数据文件4中的面板B)。因此,GeneCount和FISH数据之间的差异与用于断点检测的软件有关,而不是由于GeneCourt算法中的错误。

保存图片、插图等的外部文件。对象名称为gb-2008-9-5-r86-2.jpg

已知肿瘤细胞分数的GeneCount计算。用GeneCount计算的DNA拷贝数与94例淋巴瘤中9个基因的相应FISH结果进行对比。平滑aCGH比率(a)GLAD和(b)CGH浏览器,aq个-值为0.8,以及流式细胞仪测定的肿瘤细胞分数输入GeneCount。灰色和蓝色列分别表示与FISH数据一致和不一致的GeneCount结果,将GeneCourt数字舍入为最接近的整数值。显示了每个拷贝数的频率分布,其中包含1、25、246、66、15、5、4和1个值,FISH拷贝数分别为0、1、2、3、4、5、6和8。

未知肿瘤细胞分数的GeneCount

基于GLAD和CGH-Explorer,可以分别估算94例淋巴瘤中55例和43例的肿瘤细胞分数。剩余的肿瘤缺乏畸变或两种不同的比率水平,可用于评估(材料和方法)。估计的肿瘤细胞分数与流式细胞术测量的肿瘤细胞百分比显著相关(图(图3)。). 此外,估计值的变异系数(CV)小于11%(图(图3),),因此相当稳定。平均值q个-计算中确定的值在不同肿瘤之间差异不大,范围为0.73-0.84(GLAD)和0.74-0.82(CGH-Explorer)(数据未显示)。

保存图片、插图等的外部文件。对象名称为gb-2008-9-5-r86-3.jpg

肿瘤细胞分数的GeneCount估计。用GeneCount估算的淋巴瘤肿瘤细胞分数与流式细胞术测量的肿瘤细胞分数相比较。每个点代表基于以下各项获得的值的平均值±标准偏差q个在0.7-0.9范围内。平滑aCGH比率(a)GLAD和(b)CGH-explorerq个范围0.7-0.8,以及a流式细胞仪测定结果输入GeneCount。计算基于55(a)和43(b)个肿瘤,其中存在适合计算的比率水平。相关系数和-指出了皮尔逊积矩相关分析的值。

GeneCount和FISH数据之间的一致性(图(图4)4)与使用已知肿瘤细胞分数时的情况类似(图(图2)2)与比率水平和FISH数据进行比较时相比,这一结果要好得多(附加数据文件3)。根据GLAD,231个DNA拷贝中有218个与FISH数据一致(94%),而基于CGH-Explorer的相应数字为173个(97%)(图(图4)。4). GeneCount和FISH结果之间的大多数差异发生的原因与使用已知肿瘤细胞分数时的原因相同(附加数据文件4)。此外,基于GLAD的一些最高拷贝数也存在差异(图(图4),4)由于其中一个病例的肿瘤细胞分数估计值和测量值之间存在很大差异(图(图3a3a年).

保存图片、插图等的外部文件。对象名称为gb-2008-9-5-r86-4.jpg

未知肿瘤细胞部分的基因计数估计。由GeneCount使用q个-值在0.7-0.9范围内,a通过流式细胞术测定,并根据图3中GeneCount估计的肿瘤细胞分数,与中9个基因的相应FISH结果进行绘图(a)55和(b)43个淋巴瘤。分别在(a)和(b)中使用了由GLAD和CGH-explorer导出的平滑阵列CGH比率。灰色和蓝色列分别表示GeneCount值四舍五入后与FISH数据一致和不一致的GeneCourt结果。根据GLAD,显示了每个拷贝数的频率分布,其中包含1、19、134、56、11、5、4和1个值,FISH拷贝数分别为0、1、2、3、4、5、6和8。基于CGH Explorer的对应数字为1、15、98、48、7、5、4和1。

易位染色体区域的DNA拷贝数

通过使用十亿立方厘米2例如,它参与淋巴瘤中的t(14;18)易位。aCGH探头覆盖BCL2级位于断点的端粒。的aCGH数据和GeneCount结果BCL2级因此不受易位的影响。为了进行FISH分析,我们选择了一个BCL2级覆盖断点的探测。在易位的肿瘤中,探针信号分裂,导致来自der(14)t(14;18)和der(18)t(14,18)的信号,尽管BCL2级位于前一条染色体上。因此,FISH信号高于实际值BCL2级拷贝数,与GeneCount结果不同的是,所有38例易位肿瘤(图(图5a)。5a级). 按照说明重新计算FISH拷贝数后[22],数据的一致性很好,但有一个案例的校正FISH值为五份(图(图5b)。5亿). 这种差异是由于GLAD和CGH-Explorer未能检测到涉及BCL2级(附加数据文件4中的面板C)。

保存图片、插图等的外部文件。对象名称为gb-2008-9-5-r86-5.jpg

涉及t(14;18)易位区的GeneCount估计十亿立方厘米2.BCL2级由GeneCount估计的拷贝数,使用q个-值0.8和a流式细胞术测定的肿瘤细胞分数与94例淋巴瘤的相应FISH结果相比较。从GLAD和CGH-explorer得到的平滑阵列CGH比率分别用于左侧和右侧面板。灰色和蓝色列表示GeneCount计算结果,它们分别与FISH测量值一致和不一致,并舍入GeneCourt值。(a)绘制未修正的FISH数据;(b)如[22]所述,对这些数据进行了校正。显示了每个拷贝数的频率分布,其中包含1、38、33、13、5和1个值,用于红色斑点FISH拷贝数1、2、3、4、5和6。校正后的FISH数据1、2、3、4、5和6的相应测量次数为1、69、14、4、2和1。

实体瘤的基因计数分析

我们在99例宫颈癌中探索了在没有肿瘤细胞组分信息的情况下分析实体瘤的方法的可行性,其中范围为1.00-3.16。可以分别基于GLAD和CGH-Explorer对93和89个肿瘤的肿瘤细胞分数进行估计,从而满足此估计的要求(材料和方法)。肿瘤细胞分数与组织切片分析确定的值相关性较差(附加数据文件5)。在大多数情况下,组织学结果高于GeneCount估计值,可能是因为组织学检查没有正确量化浸润肿瘤实质的免疫细胞。然而,在少数病例中,组织学结果较高,这可能反映了样本的不同部分用于aCGH和组织学分析。可通过GeneCount估计肿瘤细胞分数的肿瘤包括在进一步的分析中。

宫颈癌中的遗传变异数量通常高于淋巴瘤。基因剂量增加2.5倍以上的高水平扩增(即拷贝数,N个,相对于DNA指数的两倍给出的总DNA含量(N个/(2.))约一半的肿瘤中发现,最常见于5p和11q染色体。GeneCount分析显示,这些区域的拷贝数在5-80之间,而这些区域经常被低水平的增长所包围。

GeneCount结果与现有分析方法的结果进行了比较,其中收益和损失是根据GLAD和CGH-Explorer获得的平滑比率水平和断点进行评分的。日志2转换后的比率水平为±0.2(即大约是比率标准偏差的两倍(附加数据文件6)),作为评分畸变的截止水平。我们选择了在先前对一个亚组患者的研究中显示受得失影响的基因[27]. 一些基因在aCGH比率上仅显示出微小的变化,通常在±0.2的水平内,并且只发现了少数有畸变的肿瘤(图(图6a第6页和其他数据文件7中的面板A)。基因拷贝数和相应基因剂量发生变化的患者数量较多,用GeneCount进行鉴定,使用±0.2的临界水平对基因剂量变化进行评分(图6b、c以及其他数据文件7中的面板B和C)。基因剂量与基因表达显著相关(图(图6c第6页c以及附加数据文件7中的面板C),使得由GeneCount确定的拷贝数变化是合理的。

保存图片、插图等的外部文件。对象名称为gb-2008-9-5-r86-6.jpg

宫颈癌的基因计数分析。(a)平滑aCGH比率(GLAD)的频率直方图(肿瘤数量)MRPS23型(BAC克隆ID RP11-19F16)。虚线表示截断比水平为±0.2,识别出5个具有遗传增益的肿瘤和3个具有遗传丢失的肿瘤。(b)频率直方图(肿瘤数量)MRPS23型由GeneCount计算的拷贝数。GLAD比率水平通过流式细胞术测量的肿瘤细胞分数和通过GeneCount估计的肿瘤细胞分数用于计算。基于CGH Explorer比率水平也取得了类似的结果。(c)基因表达与基因剂量的关系图;也就是说MRPS23型拷贝数除以总DNA含量(N个/(2·)). 基因剂量增加,超过总DNA含量的15%(log2在15个肿瘤(红色和蓝色符号)中发现转化基因剂量至少为0.2)。红色符号表示在(a)中增加的五个肿瘤,而蓝色符号表示剩余的十个肿瘤,其基因剂量增加,但在(a。相关系数和-指出了皮尔逊积矩相关分析的值。(d)基于GeneCount结果的Kaplan-Meier分析MRPS23型显示了(c)中基因剂量高的5名患者的生存概率图,(a)中也有增加(红线),(c)基因剂量高而(a)没有增加的10名患者(蓝线),以及(c)中低基因剂量的78名患者。(e)Kaplan-Meier分析基于MRPS23型比率水平。绘制了(a)中有增益的5名患者(红线)和(a)(黑线)中无增益的88名患者的生存概率。在(e)中仅确定了五名高危患者,而在(d)中又确定了十名患者。-对数秩检验中的值如(d,e)所示。面板(a、b、d)基于93个肿瘤,肿瘤细胞分数可以通过GeneCount估算。Panel(c)基于其中89个肿瘤,这些肿瘤的DNA拷贝数和基因表达都可用。

副本号更改MRPS23型之前已经证明与生存概率相关[27]. 基于GeneCount数据的生存分析MRPS23型根据比率水平(图第6天,第5天). 因此,根据GeneCount结果确定了15名高危患者,而根据比率水平,只有5名患者被归类为高危患者。未根据比率水平确定的十名患者中有九名(图中的蓝色曲线图6d)6天)有非整倍体肿瘤,DNA指数在1.10-1.92之间。其余二倍体肿瘤的肿瘤细胞比例相对较低,为23%。

DNA拷贝数的肿瘤内异质性

一些肿瘤的基因组区域的aCGH比率与对应于整数拷贝数的比率明显不同。这可能反映了DNA拷贝数的肿瘤内异质性,也就是说,存在拷贝数变化的亚群,这对样本中的所有肿瘤细胞来说并不常见。因此,可以认为常见的像差是均匀的。具有异质DNA区域的淋巴瘤和宫颈癌的比率水平介于整数对应的比率水平之间,并且与整数对应的比例水平显著不同(图(图7)。7). 实际比率水平反映了具有该畸变的细胞比例(方程式1)。

保存图片、插图等的外部文件。对象名称为gb-2008-9-5-r86-7.jpg

肿瘤内DNA拷贝数异质性的GeneCount鉴定。(a)异质性淋巴瘤aCGH比率的频率直方图(%阵列探针),包括整个基因组的数据。(b)aCGH比率根据染色体位置绘制,显示了染色体8、9和17上的异质区域,蓝色的DNA拷贝数为3和4。(c)拷贝数为3和4(上面板)的两个同源DNA区域和拷贝数为3&4(下面板)的异质区域的aCGH比率的频率直方图(%阵列探针)。拷贝数3、4、3和4的比率分布显著不同(第页<0.001,方差分析)。GeneCount根据流式细胞术检测肿瘤细胞组分;那些穿黑色衣服的人与FISH实验一致,而那些穿红色衣服的人没有对所显示的特定肿瘤进行FISH测量。(b)中的箭头指向FISH探头的位置。注意,异质区域的3和4拷贝数已经用FISH确认。

19例(20%)淋巴瘤和44例(50%)宫颈癌具有一个或多个拷贝号为1和2、2和3或3和4的异质DNA区域(附加数据文件8和9)。可靠检测异质性需要肿瘤细胞分数高于24%(附加数据文件10),因此93例宫颈癌中有5例被排除在本分析之外。淋巴瘤L309/89(图(图7)7)之前被FISH鉴定为异质性,显示一个种群有三个拷贝,另一个种群则有四个拷贝MYC公司和着丝粒8和17[20]. 此外,宫颈癌中的几种异质性畸变,如C005/01中4号染色体和X号染色体的缺失,11q和17号染色体的增加,C006/01中6q的缺失和11q的增加,以及C023/01中的4号染色体的丢失,与常规CGH早期检测到的类似[14]. 然而,之前的研究是基于一组不同的活检,这可能解释了一些肿瘤缺乏一致性。

在一些异质性肿瘤中,在一个和两个拷贝之间发现了两种不同的比率水平(图(图88和附加数据文件11)。因此,似乎在肿瘤细胞群的不同部分中存在相应的畸变。淋巴瘤L008/92有两个介于一个和两个拷贝之间的中间比率水平,分别对应70%和30%的肿瘤细胞(图(图8b,8b个蓝色和红色比率),导致图中所示的可能的肿瘤进化方案图8c。第8页c由于两个部分的总和不超过100%,异质性畸变可能出现在肿瘤的非重叠亚群中,其中亚群的演变与包含同质畸变(平行序列)的预测普通人群不同。一个序列,其中种群从普通种群以线性方式进化而来,也是可能的。然而,在C024/01中,异质比率水平分别对应于78%和44%的肿瘤细胞,并且只有一个序列是建议的序列(附加数据文件11中的面板C)。

保存图片、插图等的外部文件。对象名称为gb-2008-9-5-r86-8.jpg

异质性肿瘤中亚群的进化序列。(a)显示了异质性淋巴瘤中aCGH比率的频率直方图(%阵列探针),包括整个基因组的数据。(b)aCGH比率是根据染色体位置绘制的。DNA拷贝数为1和2的染色体2q、5p、7q、9p、13q、20q和Xp上以及DNA拷贝数2和3的染色体2p、4q、6p、11q和18上的异质区域以蓝色和红色显示。蓝色和红色表示肿瘤细胞不同部位的畸变;分别为70%和30%。异质性畸变列在附加数据文件8中,拷贝数为2和3的除外,因为该肿瘤中缺少3个DNA拷贝,因此无法进行统计分析以确定2和3异质性。(c)图中显示了两个可能的畸变进化序列的示意图,一个平行序列和一个串行序列。蓝色和红色圆圈表示(b)中的蓝色和红色畸变。百分比表示具有所列畸变的肿瘤细胞的分数,由GeneCount计算,表明蓝色和红色的畸变分别存在于70%和30%的肿瘤细胞中。

讨论

我们已经证明,GeneCount是一种可靠的全基因组计算临床肿瘤样本中DNA拷贝数的方法。这些数据本身具有生物学意义,但也可能改善对治疗结果的预测,并有助于识别新的抑癌基因和致癌基因。我们将该方法应用于淋巴瘤,通过其他可与GeneCount结果进行比较的技术获得了准确的肿瘤细胞分数和DNA拷贝数。我们进一步将该方法用于宫颈癌,对于宫颈癌,代表aCGH数据的肿瘤细胞组分更难以通过单独的技术实现。GeneCount模型很简单,因为它使用了在整个基因组中具有两个DNA拷贝的正常细胞作为参考样本。此外,估计的拷贝数限制为正整数,提高了该方法的鲁棒性。实现绝对量化格式的一个要求是使用预先确定的肿瘤倍体,而肿瘤细胞分数(如果未知)和实验偏差可以从aCGH数据中估计。

实验偏差主要是由来自未抑制重复序列和非特异性杂交的信号引起的[2]. 由于DNA拷贝数是由分布在整个基因组中的序列产生的,因此偏差对测试和参考样本的影响是相等的,并且与DNA拷贝数无关。因此,可以将偏差总结为阵列特定因子,q个,表示对数转换比的动态。马哈帕特拉. [19]在他们的纯肿瘤细胞模型中,将偏差作为影响绝对比(而非对数转换比)的恒定因素。我们的方法似乎是合理的,因为对数转换比率的噪声(宽度)与比率无关,因此与DNA拷贝数无关(附加数据文件6)。我们允许在q个当计算肿瘤细胞分数以解释肿瘤之间偏差的微小差异时。这个q个-针对每个肿瘤优化的值与平均值非常相似q个根据对照实验确定,表明偏差在整个实验中是稳定的。此外,GeneCount和FISH结果之间的差异与所涉及的特定遗传畸变有关,因此与断点检测算法有关,而不是与q个阵列CGH技术的最新发展,利用寡核苷酸而不是细菌人工染色体(BAC)克隆,由于重复序列较少,导致了比率动力学的改善和实验偏差的减少[28]. 我们实验室正在进行的工作表明,通过使用寡聚阵列,GeneCount可以应用于q个值接近1。

包含肿瘤细胞分数是计算临床肿瘤样本中DNA绝对拷贝数的先决条件。淋巴瘤数据基于从整个淋巴结制成的单细胞悬液。因此,可以通过流式细胞术等单独技术高精度地测定代表淋巴结的肿瘤细胞分数。在实体肿瘤(如宫颈癌)中,正常细胞由组织内高度异质分布的基质和浸润肿瘤实质的免疫细胞组成。因此,通过组织学检查获得的肿瘤细胞分数测量结果不够精确,无法计算DNA拷贝数。组织学检查基于与aCGH实验所用样品不同的部分样品,和/或无法准确量化免疫细胞的比例。然而,组织学数据可能有助于为aCGH分析预先选择富含肿瘤的样本。通过使用GeneCount获得了相当稳定的肿瘤细胞分数估计值,与流式细胞术测量值一致。这些估计导致DNA拷贝数与FISH数据一致,表明肿瘤细胞组分的准确性足以进行可靠的数据分析。选择适当的比率水平进行估计对于实现这一准确性至关重要。我们要求肿瘤至少有两个不同拷贝数的畸变,每个畸变有十多个阵列探针,以减少由定义不清的比率水平和断点引起的误差。此外,只有比率水平偏差超过0.15(log2从基线选择比例),这意味着当拷贝数分别更改为3或5拷贝时,需要高于24%(二倍体)和36%(四倍体)的肿瘤分数(附加数据文件12)。

GeneCount和FISH数据之间的一些差异与我们的模型无关,而是与统计方法检测某些畸变的能力有关。因此,GeneCount和FISH结果之间的一致性与GLAD检测模拟数据中断点的可靠性相似[9]. 对于包含至少三个阵列探针的定义明确的异常区域,GeneCount结果的精确度最高。在这些情况下,获得了代表相应拷贝数的比率水平,并且检测到畸变的概率很高。窄像差结果的不确定性增加意味着它们应该通过像FISH这样的单独技术进行确认。此外,为了确保有足够的比率动力学,因此,断点检测的概率很高,需要肿瘤细胞分数高于某个值,这取决于实验噪声和肿瘤倍性。在我们实验的噪声中(附加数据文件6),二倍体中肿瘤细胞分数高于23%,超二倍体的肿瘤细胞分数略高,可以使用三个以上的阵列探针分离畸变(附加数据文档13)。这一部分还可以检测到涉及十多个阵列探针的异质DNA拷贝数(附加数据文件10)。在含有更多噪音的实验中,例如,由于DNA质量差,需要较高的肿瘤细胞分数。相比之下,建议至少50%的肿瘤细胞用于常规CGH的增益和损耗的最佳检测[29].

当使用覆盖断裂区域的探针时,FISH无法直接评估易位基因的DNA拷贝数,因为在易位衍生物中检测到来自原始染色体的信号。要校正探针信号以获得真正的拷贝数,需要了解断裂点和与易位有关的基因。实体肿瘤中的可靠FISH分析,其中易位未被很好地识别,并且可能发生在整个基因组中[30]因此,这尤其具有挑战性。通过aCGH,探针信号的测量独立于探针所覆盖DNA的实际基因组组织。因此,在平衡易位的情况下,即使探针覆盖断点,也会得到正确的结果。如果探针位于扩增或缺失区域(不平衡易位)的开始或结束处,相邻探针的aCGH比率可确保计算出正确的拷贝数。因此,我们的模型提供了一种新的方法来评估平衡和不平衡易位区域中的拷贝数,而不需要知道易位的存在。

目前分析aCGH数据的方法通常基于比率水平对遗传增益和损失进行评分[31-36]. 利用GLAD和CGH-Explorer等统计算法可以高精度地检测单个肿瘤中的断点。然而,现有的下游分析使用通用比率水平对肿瘤的畸变进行评分,无法确定高倍性和正常细胞含量情况下的得失。通过使用GeneCount,比率水平被替换为相对于总DNA含量的绝对拷贝数,作为基因剂量的度量,可以在不同肿瘤之间进行比较,而不考虑倍性和正常细胞含量。因此,在宫颈癌中发现了基于比率水平的分析未检测到的拷贝数变化,但与基因表达有显著相关性,这表明取得了改进的结果。此外,许多预后不佳的患者MRPS23型根据比率水平,GeneCount的增益没有增加。在后一种情况下,正常细胞的高含量或高倍性掩盖了增益,这表明GeneCount在检测基因畸变患者时更为敏感。该发现进一步证明,GeneCount适用于肿瘤细胞分数通常未知且必须通过该方法估计的实体肿瘤。当前统计分析方法的进展可能会利用可调整的比率水平进行得分增益和损失,根据比率动力学的数学评估优化每个肿瘤的截止比率。这种方法可以解释二倍体、三倍体和四倍体肿瘤的不同倍性和正常细胞含量。然而,该策略对像1.25倍体这样的中等倍体肿瘤无效(图(图1c)。1c个). 相反,相对于总DNA含量或基因剂量的绝对DNA拷贝数在此类肿瘤中也具有可比性。

我们还表明,GeneCount可以提供全基因组和高分辨率的DNA拷贝数肿瘤内异质性信息。这种异质性以前仅通过FISH在单个基因的基础上检测到,或者通过传统的CGH分析以低分辨率检测到[14,15,20,37,38]可能反映出基因组高度不稳定性[39]. 使用FISH检测包含两个DNA拷贝的异质性具有挑战性,因为异质性肿瘤人群很难与正常细胞区分。使用GeneCount检测异质性的概率取决于具有异质性畸变的肿瘤细胞的比例。显然,概率最大的分数为50%,但也确定了高于70%和低于30%的分数。低拷贝数(如1&2和2&3)中的异质性更容易检测,因为对数转换比率级别之间的分离更大。拷贝数越高,检测异质性的可能性越低,这取决于倍性和正常组织含量。然而,我们也在几个肿瘤中发现了拷贝号为3和4的异质区域,在一个肿瘤中发现拷贝号为4和5的异质区域。最后,检测异质性的概率还取决于受影响基因组的比例。在我们的数据中,可以使用GeneCount(C002/01;附加数据文件9)分析影响多达40%基因组的严重异质性。随着越来越多的基因组受到影响,最终难以找到断点,甚至出现同质畸变,无论采用何种分析方法,结果都不可靠。

异质性数据有助于深入了解拷贝数变化的进化顺序。均匀畸变可能发生在异质畸变之前[14]. 此外,在肿瘤细胞群体的不同部分出现异质性畸变的情况下,这些畸变可以按时间顺序排列为串行和/或并行序列。通过比较同一肿瘤的几次活检数据,不可能总是在建议的序列中确定正确的序列[14]. 然而,异质像差和同质像差的识别表明,可以进一步研究每个亚群中像差的确切组合,例如,使用三色FISH,一个探针用于同质像散区,两个探针用于异质像散区。

在异质性分析中,我们假设所有恶性细胞亚群的倍性相同。这种假设是合理的,因为流式细胞术没有观察到两个非整倍体人群的病例。因此,一个肿瘤中两个非整倍体群体的倍性差异可能小于10%,导致GeneCount计算的拷贝数不确定性小于10%(方程式4;数据未显示)。同样的不确定性也适用于近二倍体和异质性宫颈癌。这些肿瘤通常表现为广泛的G1流式细胞术检测CV高达10%的峰值,可能反映了存在多个倍性在1.0-1.1范围内的亚群。此外,在非整倍体淋巴瘤的二倍体群体中观察到少量或无轻链阳性细胞,这表明二倍体人群主要包含正常细胞。然而,非整倍体宫颈癌的二倍体人群中可能含有恶性细胞,正如我们之前所显示的非整倍体型结直肠癌[40]. 由于使用了错误的二倍体DNA指数,这可能导致异质拷贝数的不确定性增加。通过流式细胞术对二倍体和非整倍体组分进行分类,可以改善此类肿瘤的数据[40]用于单独的aCGH和GeneCount分析。

结论

GeneCount提供了可靠的DNA拷贝数,无论是基于流式细胞术测定的肿瘤细胞分数还是该方法估算的肿瘤细胞百分比。易位染色体区域也获得了准确的数据,如t(14;18)易位涉及的BCL2级我们的方法是唯一一种提供全基因组绝对DNA拷贝数信息的方法。此外,与现有的基因剂量和肿瘤内拷贝数异质性研究方法相比,该方法有了显著的改进。GeneCount的稳健性意味着该方法可以广泛用于造血和实体肿瘤的基因组探索,以可靠的方式解决DNA拷贝数方面的问题,而不考虑可能的易位。这可能会改进疾病分类和结果预测的分析,并有助于确定新癌症治疗的有效靶点。

材料和方法

肿瘤样本、DNA指数和肿瘤细胞分数

对94例B细胞非霍奇金淋巴瘤和99例宫颈鳞癌患者的标本进行了分析。我们使用了新鲜冰冻淋巴瘤细胞悬液,其肿瘤亚型、分期、患者治疗和随访已在之前提出[25]. 宫颈癌为FIGO(国际妇产科联合会)1b-4b期,接受放射治疗。使用在治疗开始前进行的肿瘤活检。

这个使用流式细胞术测定了淋巴瘤和宫颈癌的细胞百分率以及淋巴瘤的肿瘤细胞百分率,其中大多数数据已在早期发表[14,23,25]. 用藻红蛋白标记的肿瘤特征轻链抗体标记淋巴瘤细胞,以识别肿瘤细胞,用Hoechst 33258评估DNA含量。这个由G决定1轻链阳性细胞相对于轻链阴性细胞的峰值位置。肿瘤细胞分数为轻链阳性细胞的分数。这个通过制备干净的细胞核,用碘化丙啶染色,使用去污剂-胰蛋白酶法对宫颈癌进行评估[41]. 来自二倍体细胞系的细胞被用作内部参照物。显示两个不同G的样本1DNA直方图中的峰被归类为非整倍体由G的位置决定1非整倍体细胞的峰值相对于二倍体细胞的相应峰值。单个G的样本1峰被归类为近二倍体。通过对活检中部苏木精和伊红染色切片的组织学检查,对每个宫颈癌样本的肿瘤细胞分数进行估计。这些值用于与GeneCount估计的肿瘤细胞分数进行比较。

列比较基因组杂交

使用挪威镭医院微阵列设施生产的基因组阵列载玻片[42]. 该阵列包含4549个BAC和P1人工染色体(PAC)的独特基因组克隆(英国剑桥威康信托桑格研究所),覆盖整个基因组,分辨率约为1 Mb。使用重叠的BAC和PAC,在1q12和1q25之间用平铺路径探针对1Mb克隆集合进行补充。克隆来自RPCI-11(BAC)和RPC1-1、-3、-4和-5(PAC)库。每个克隆在4-8个阵列点中打印。克隆覆盖的基因来自Ensembl[43].

根据标准方案,从淋巴瘤细胞悬液和宫颈癌活检中分离基因组DNA,包括蛋白酶K、苯酚、氯仿和异戊醇[44]. 使用Dpn公司II内切酶(美国马萨诸塞州贝弗利新英格兰生物实验室),并使用QIAquick PCR纯化试剂盒进行纯化(美国加利福尼亚州巴伦西亚Qiagen)。分别用Cy3-CTP和Cy5-dCTP(Perkin-Elmer Life Sciences,Foster City,CA,USA)通过随机引物反应(BioPrime DNA Labeling System,Invitrogen,CA,Carlsbad,USA[42]. 扫描和图像分析通过使用安捷伦扫描仪(安捷伦技术公司,Palo Alto,CA,USA)和GenePix 6.0图像分析软件(Axon Instruments公司,Union City,CA,USA)进行。微阵列管理和预处理软件BASE[26]用于斑点过滤和比率归一化。使用每个基因组克隆的4-8个点的平均值,前提是标准偏差小于0.2。进行低标准化,使所有克隆的平均对数转化率等于0。GLAD和CGH-Explorer算法用于比率平滑和断点检测[9,11]. 统计惩罚λ的默认值为8(GLAD)和1.5(CGH-Explorer)。平滑比率是GeneCount的输入。

GeneCount原理

对于由几个细胞群(如正常细胞和不同的恶性细胞群)组成的异质性测试样本,每个细胞群的DNA都会影响aCGH比率。理想情况下(即在没有实验偏差的情况下),每个阵列探头的归一化比率由以下公式给出:

R(右) d日 e(电子) = = 1 n个 N个 2 · D类 · F类 · D类 = 1 n个 F类 · D类
(1)

哪里R(右)理想的是样本的aCGH比率n个细胞数量,以及N个,、和F类是DNA拷贝数、DNA指数和细胞群的组织分数分别是。我们假设:参考样本是全基因组中拷贝数为2的正常DNA,男性X和Y染色体除外;进行性别匹配杂交;是相对于正常细胞的DNA含量给出的。

对于单一细胞群的均质样本,例如癌细胞系,方程式1简化为:

R(右) d日 e(电子) = N个 2 · D类
(2)

在具有两种细胞群(即恶性细胞和正常细胞)的临床样本中,比率由下式给出:

R(右) d日 e(电子) = N个 T型 2 · D类 T型 · F类 T型 · D类 T型 F类 T型 · D类 T型 + ( 1 F类 T型 ) + 1 F类 T型 F类 T型 · D类 T型 + ( 1 F类 T型 )
(3)

哪里N个T型,T型、和F类T型分别是DNA拷贝数、DNA指数和样本中恶性细胞的分数。1 -F类T型表示正常细胞的分数,其中和DNA拷贝号(N个)第页,共2页。

从正常雄性DNA与雌性DNA杂交的实验中可以清楚地看出,比率动力学有所降低(图(图1e)。第1页). 动态因素,q个,包含在方程式3中以补偿此影响。由于实验噪声与比率的对数无关(附加数据文件6),因此重写方程式3,以如下方式解释减小的动态:

o个 2 ( R(右) ) = q个 · o个 2 ( N个 T型 2 · D类 T型 · F类 T型 · D类 T型 F类 T型 · D类 T型 + ( 1 F类 T型 ) + 1 F类 T型 F类 T型 · D类 T型 + ( 1 F类 T型 ) )
(4)

动态因子表示由实验偏差引起的对数转换比的系统、非随机减少,其值介于0和1之间,其中后一个值出现在理想情况下,而比率动态没有任何减少。该因子是阵列幻灯序列和实验室方案的一个特征,由一个对照实验中的X染色体比率确定,该实验将男性与女性正常DNA杂交(图(图1e)。第1页). 在GeneCount中使用方程式4计算F类T型N个T型从样本的比率分布中。

通过选择一个或多个aCGH比率水平不同于目测整数值对应水平的肿瘤,来确定DNA拷贝数的瘤内异质性,即除正常细胞外,还有多个恶性细胞群体的病例。通过ANOVA分析,将潜在非均匀区域的比率分布与相邻均匀像差的分布进行比较,并使用-将畸变分为异质性需要0.05的值。采用更通用的方程式1计算具有异质畸变的肿瘤细胞的比例。这个假设所有恶性细胞亚群都是相同的。

基因计数在BASE中的实现

我们使用BASE作为GeneCount的平台,并将算法与在我们的BASE版本中实现的GLAD和CGH-Explorer包的输出相关联。该方法也可以作为单独的程序开发,或集成在其他aCGH分析包中。该算法包括三个主要步骤:所有样本的数据输入;参数未知时肿瘤细胞分数的估计;以及估计每个阵列探针的DNA拷贝数(附加数据文件1中的面板A)。平滑aCGH比率作为输入,与,的q个-控制实验值及其下限和上限(q个最小值,q个最大值)以及肿瘤细胞分数(如果有的话)。

在未知肿瘤细胞分数的情况下,根据两个选定的比率水平,使用肿瘤细胞分数和DNA拷贝数作为独立和q个作为因变量。拷贝数和肿瘤细胞分数分别以1和0.01的步长增加,相应的q个-计算值(附加数据文件1中的面板B)。为了确保估算分数的高精度,要求所选比率水平的绝对值大于0.15。这意味着,当仅存在涉及一个拷贝数变化的畸变时,二倍体和四倍体肿瘤中肿瘤细胞分数分别低于24%和36%的样本无法进行分析(附加数据文件12)。此外,两个选定的比率水平之间需要0.2的最小绝对差值,即约为对数转换比率水平标准偏差的两倍(附加数据文件6)。为了进一步提高估计的可靠性,只选择了10个以上探针的比率水平。我们优化了q个通过允许值在有限范围内变化q个最小值q个最大值,通常是q个±10%,导致对肿瘤细胞分数的相当稳定的估计。基于这些估计值的平均肿瘤细胞分数和相应的平均值q个-在方程式4中使用该值来估计肿瘤的DNA拷贝数。在已知肿瘤细胞分数的情况下,该分数和q个在等式4中使用了来自对照实验的数据。模块的源代码通过与作者的通信提供。BASE中的GeneCount演示版也可用[45].

荧光就地杂交

将淋巴瘤的GeneCount估计值与使用FISH直接评估基因拷贝数进行比较。所有FISH分析都已在之前发布[20-25]. 所有94例肿瘤均采用双色荧光原位杂交。我们使用光谱橙色标记的局部特异碘化丙啶DNA探针来检测淋巴瘤中常见的异常基因(CCND3号机组,骨形态发生蛋白6,个人信息管理1,MYC公司,CDKN2A型,RB1型,TP53型,PMAIP1项目、和MALT1号机组)和光谱绿色标记的着丝粒探针(着丝粒1、6、8、17和18)(美国伊利诺伊州唐纳斯·格罗夫Vysi公司),用于评估实验质量。为了探索易位染色体区域的DNA拷贝数计算,十亿立方厘米2,它经常参与淋巴瘤的t(14;18)(q32;q21)易位。双色易位探针涉及BCL2级并覆盖断点区域(LSIIGH公司光谱绿/LSIBCL2级Spectrum Orange,Vysi公司)。由于移位时探针信号分裂BCL2级拷贝数是用这个探针直接得出的。这个十亿立方厘米2因此,根据来自IGH公司和着丝粒18探针[22].

基因表达微阵列

通过对89例宫颈癌的微阵列分析确定基因表达,并与GeneCount估计值相关。我们使用了挪威镭医院微阵列设施生产的阵列载玻片,其中包含15000个cDNA克隆。48名患者的数据,以及对实验过程的详细描述,已经提交[27]. Cy3-和Cy5-标记的cDNA由总RNA通过锚定寡核苷酸(dT)引物逆转录合成,并与参考样品(美国加利福尼亚州拉霍亚市斯特拉赫内的通用人类参考RNA)在65°C条件下与阵列载玻片共杂交。分别使用安捷伦扫描仪和GenePix 4.1图像分析软件进行扫描和图像分析。在BASE中进行了数据预处理,包括饱和强度的校正、弱点和坏点的过滤以及低阶归一化。所有杂交均在染料浸染设计中进行两次,并在进一步分析中使用基于这两个实验的平均表达率。

ArrayExpress加入

阵列CGH原始数据已存入ArrayExpress存储库(E-TABM-398、E-TABM-999)。

缩写

aCGH,阵列比较基因组杂交;细菌人工染色体;生物阵列软件环境;DI,DNA指数;FISH,荧光就地杂交;PAC,P1人工染色体。

作者的贡献

HL和TS构思并设计了研究,并分析了数据。HL撰写了这篇文章,ML、RSB、DHS、EG和OTB进行了aCGH、FISH和流式细胞术实验并参与了数据分析,LAMZ和OM为aCGH实验作出了贡献,MJ和EH为在BASE中实施GeneCount做出了贡献,GBK提供了临床样本和数据,TS帮助起草了手稿。所有作者阅读并批准了最终手稿。

其他数据文件

本文的在线版本提供了以下附加数据。附加数据文件1是显示GeneCount中计算步骤的图。附加数据文件2是显示FISH探针位置示例的图。附加数据文件是比较非霍奇金淋巴瘤中FISH DNA拷贝数和平滑aCGH比率水平的图。附加数据文件4是一个图示GeneCount和FISH DNA拷贝数之间差异的图。附加数据文件5是一个比较宫颈癌组织学检查和GeneCount估计得出的肿瘤细胞分数的数字。附加数据文件6是显示对数转换aCGH比率的标准偏差(噪声)的图。附加数据文件7是一个比较宫颈癌比率水平和基因计数分析结果的数字。附加数据文件8是一个列出非霍奇金淋巴瘤中DNA拷贝数异质性区域的表格。附加数据文件9是一个列出宫颈癌中DNA拷贝数异质性区域的表格。附加数据文件10图中显示了检测异质拷贝数变化所需的肿瘤细胞分数。附加数据文件11是一个图示异质性肿瘤亚群进化序列分析的图。附加数据文件12是一个显示可以在GeneCount中计算的最小肿瘤细胞分数的图。附加数据文件13图中显示了检测同质拷贝数变化所需的肿瘤细胞分数。

补充材料

附加数据文件1:

GeneCount中的计算步骤。

附加数据文件2:

FISH探头位置示例。

单击此处获取文件(37K,pdf格式)
附加数据文件3:

非霍奇金淋巴瘤中FISH DNA拷贝数和平滑aCGH比率水平的比较。

单击此处获取文件(41K,pdf格式)
附加数据文件4:

GeneCount和FISH DNA拷贝数之间的差异。

附加数据文件5:

宫颈癌组织学检查和GeneCount估计得出的肿瘤细胞组分的比较。

单击此处获取文件(32K,pdf格式)
附加数据文件6:

对数转换aCGH比率的标准偏差(噪声)。

单击此处获取文件(224K,pdf)
附加数据文件7:

宫颈癌比率水平和基因计数分析结果的比较。

附加数据文件8:

非霍奇金淋巴瘤中DNA拷贝数异质性区域。

附加数据文件9:

宫颈癌中DNA拷贝数异质性区域。

附加数据文件10:

检测异质拷贝数变化所需的肿瘤细胞分数。

附加数据文件11:

异质性肿瘤亚群进化序列分析。

单击此处获取文件(205K,pdf)
附加数据文件12:

可以在GeneCount中计算的最小肿瘤细胞分数。

单击此处获取文件(31K,pdf格式)
附加数据文件13:

检测同质拷贝数变化所需的肿瘤细胞分数。

单击此处获取文件(32K,pdf格式)

致谢

我们想感谢挪威微阵列联盟的Vegard Nygaard在实施BASE插件模块方面提供的帮助。这项研究得到了挪威癌症协会和挪威研究委员会的国家功能基因组研究计划(FUGE)微阵列平台的支持。

参考文献

  • Mantripragada KK、Buckley PG、de Stahl TD、Dumanski JP。基因微阵列备受关注。趋势Genet。2004;20:87–94. doi:10.1016/j.tig.2003.12008。[公共医学] [交叉参考][谷歌学者]
  • Pinkel D,Albertson总经理。阵列比较基因组杂交及其在癌症中的应用。自然遗传学。2005年;37(补充):S11–S17。doi:10.1038/ng1569。[公共医学] [交叉参考][谷歌学者]
  • Albertson DG、Collins C、McCormick F、Gray JW。实体瘤中的染色体畸变。自然遗传学。2003;34:369–376. doi:10.1038/ng1215。[公共医学] [交叉参考][谷歌学者]
  • 艾伯森DG。癌症中的基因扩增。趋势Genet。2006;22:447–455. doi:10.1016/j.tig.2006.06.007。[公共医学] [交叉参考][谷歌学者]
  • Knuutila S、Aalto Y、Autio K、Bjorkqvist AM、El-Rifai W、Hemmer S、Huhta T、Kettunen E、Kiuru-Kuhlefelt S、Larramendy ML、Lushnikova T、Monni O、Pere H、Tapper J、Tarkkanen M、Varis A、Wasenius VM、Wolf M、Zhu Y。人类肿瘤中的DNA拷贝数丢失。美国病理学杂志。1999;155:683–694. [PMC免费文章][公共医学][谷歌学者]
  • Chin SF、Teschendorff AE、Marioni JC、Wang Y、Barbosa-Morais NL、Thorne NP、Costa JL、Pinder SE、Wiel MA van de、Green AR、Ellis IO、Porter PL、Tavare S、Brenton JD、Ylstra B、Caldas C.高分辨率阵列-CGH和表达谱分析确定ER阴性乳腺癌的一种新的基因组亚型。基因组生物学。2007;8:R215.doi:10.1186/gb-2007-8-10-R215。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Chen W、Houldsworth J、Olshen AB、Nanjangud G、Chaganti S、Venkatraman ES、Halaas J、Teruya-Feldstein J、Zelenetz AD和Chaganti RS。阵列比较基因组杂交揭示了与弥漫性大B细胞淋巴瘤预后相关的基因组拷贝数变化。鲜血。2006;107:2477–2485. doi:10.1182/bloud-2005-07-2950。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • 癌症染色体畸变的Mitelman数据库http://cgap.nci.nih.gov/染色体/Mitelman
  • Hupe P,Stransky N,Thiery JP,Radvanyi F,Barillot E.阵列CGH数据分析:从信号比到DNA区域的增益和损失。生物信息学。2004;20:3413–3422. doi:10.1093/bioinformatics/bth418。[公共医学] [交叉参考][谷歌学者]
  • Jong K,Marchiori E,Meijer G,Vaart AV,Ylstra B.断点识别和阵列比较基因组杂交数据的平滑。生物信息学。2004;20:3636–3637. doi:10.1093/bioinformatics/bth355。[公共医学] [交叉参考][谷歌学者]
  • Lingjaerde OC、Baumbusch LO、Liestol K、Glad IK、Borresen Dale AL.CGH-Explorer:阵列CGH数据分析程序。生物信息学。2005年;21:821–822. doi:10.1093/bioinformatics/bti113。[公共医学] [交叉参考][谷歌学者]
  • Olshen AB,Venkatraman ES,Lucito R,Wigler M.用于分析基于阵列的DNA拷贝数数据的循环二进制分割。生物统计学。2004;5:557–572. doi:10.1093/biostatistics/kxh008。[公共医学] [交叉参考][谷歌学者]
  • Rosenberg C、Schut TB、Mostert MC、Tanke HJ、Raap AK、Oosterhuis JW、Looijenga LH。低三倍体/超二倍体肿瘤的比较基因组杂交。细胞测定。1997;29:113–121. doi:10.1002/(SICI)1097-0320(19971001)29:2<113::AID-CYTO3>3.0.CO;2-E型。[公共医学] [交叉参考][谷歌学者]
  • Lyng H、Beigi M、Svendsrud DH、Brustugun OT、Stokke T、Kristensen GB、Sundfor K、Skjonsberg A、De Angelis PM。晚期宫颈癌的瘤内染色体异质性。国际癌症杂志。2004;111:358–366. doi:10.1002/ijc.20258。[公共医学] [交叉参考][谷歌学者]
  • Harada K、Nishizaki T、Ozaki S、Kubota H、Ito H、Sasaki K。通过比较基因组杂交和激光扫描细胞术检测人脑胶质瘤的瘤内细胞遗传学异质性。癌症研究。1998;58:4694–4700.[公共医学][谷歌学者]
  • Harada T、Okita K、Shiraishi K、Kusano N、Kondoh S、Sasaki K。通过比较基因组杂交检测胰腺癌中的腺间细胞遗传异质性。癌症研究。2002;62:835–839.[公共医学][谷歌学者]
  • Beroukhim R、Getz G、Nghiemphu L、Barretina J、Hsueh T、Linhart D、Vivanco I、Lee JC、Huang JH、Alexander S、Du J、Kau T、Thomas RK、Shah K、Soto H、Perner S、Prensner J、Debiasi RM、Demichelis F、Hatton C、Rubin MA、Garraway LA、Nelson SF、Liau L、Mischel PS、Cloughesy TF、Meyerson M、Golub TA、Lander ES、Mellinghoff IK等。评估染色体畸变在癌症中的意义:方法学和在神经胶质瘤中的应用。美国国家科学院程序。2007;104:20007–20012. doi:10.1073/pnas.0710052104。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Weir BA、Woo MS、Getz G、Perner S、Ding L、Beroukhim R、Lin WM、Province MA、Kraja A、Johnson LA、Shah K、Sato M、Thomas RK、Barletta JA、Borecki IB、Broderick S、Chang AC、Chiang DY、Chirieac LR、Cho J、Fujii Y、Gazdar AF、Giordano T、Greulich H、Hanna M、Johnson BE、Kris MG、Lash A、Lin L、Lindeman N等。肺腺癌中癌症基因组的特征。自然。2007;450:893–898. doi:10.1038/nature06358。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Mohapatra G、Moore DH、Kim DH、Grewal L、Hyun WC、Waldman FM、Pinkel D、Feuerstein BG。脑肿瘤细胞系的分析证实了荧光之间关系的简单模型就地杂交、DNA指数和比较基因组杂交。基因染色体癌。1997;20:311–319. doi:10.1002/(SICI)1098-2264(199712)20:4<311::AID-GCC1>3.0.CO;2-4.[公共医学] [交叉参考][谷歌学者]
  • 双色荧光法评估B细胞非霍奇金淋巴瘤中Galteland E、Holte H、Stokke T.c-MYC、RB-1、TP53和着丝粒8和17拷贝数就地杂交。细胞测定。1999;38:53–60. doi:10.1002/(SICI)1097-0320(19990415)38:2<53::AID-CYTO2>3.0.CO;2-0.[公共医学] [交叉参考][谷歌学者]
  • Galteland E,Smedshammer L,Suo Z,DeAngelis P,Stokke T.B细胞非霍奇金淋巴瘤中pRB的增殖依赖性表达和磷酸化:依赖于RB1拷贝数。白血病。2002;16:1549–1555. doi:10.1038/sj.leu.2402644。[公共医学] [交叉参考][谷歌学者]
  • Galteland E、Sivertsen EA、Svendsrud DH、Smedshammer L、Kresse SH、Meza-Zepeda LA、Myklebost O、Suo Z、Mu D、DeAngelis PM、Stokke T.染色体转移T(14;18)和获得18/BCL2:对B细胞非霍奇金淋巴瘤中BCL2表达和凋亡的影响。白血病。2005年;19:2313–2323. doi:10.1038/sj.leu.2403954。[公共医学] [交叉参考][谷歌学者]
  • Sivertsen EA、Galteland E、Mu D、Holte H、Meza-Zepeda L、Myklebost O、Patzke S、Smeland EB、Stokke T。染色体6p的增加是B细胞非霍奇金淋巴瘤中PIM1表达增加的罕见原因。白血病。2006;20:539–542. doi:10.1038/sj.leu.2404094。[公共医学] [交叉参考][谷歌学者]
  • Stokke T、Galteland E、Holte H、Smedshammer L、Suo Z、Smeland EB、Borresen Dale AL、DeAngelis P、Steen HB。在B细胞非霍奇金淋巴瘤中,p53途径中的癌基因畸变与高S期分数和低患者生存率相关。国际癌症杂志。2000;89:313–324. doi:10.1002/1097-0215(20000720)89:4<313::AID-IJC1>3.0.CO;二维。[公共医学] [交叉参考][谷歌学者]
  • Stokke T、DeAngelis P、Smedshammer L、Galteland E、Steen HB、Smeland EB、Delabie J、Holte H。染色体11q21-23.1和17p的丢失以及染色体6p的增加是B细胞非霍奇金淋巴瘤的独立预后指标。英国癌症杂志。2001;85:1900–1913. doi:10.1054/bjoc.2001.2164。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Saal LH、Troein C、Vallon-Christersson J、Gruvberger S、Borg A、Peterson C.生物阵列软件环境(BASE):一个综合管理和分析微阵列数据的平台。基因组生物学。2002;:SOFTWARE0003.doi:10.1186/gb-2002-3-8-软件0003。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Lyng H、Brovig RS、Svendsrud DH、Holm R、Kaalhus O、Knutstad K、Oksefjell H、Sundfor K、Kristensen GB、Stokke T。与子宫颈癌转移表型相关的基因表达和拷贝数。BMC基因组学。2006;7:268.网址:10.1186/1471-2164-7-268。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Davies JJ、Wilson IM、Lam WL。阵列CGH技术及其在癌症基因组中的应用。染色体研究。2005年;13:237–248. doi:10.1007/s10577-005-2168-x。[公共医学] [交叉参考][谷歌学者]
  • Kallioniemi OP,Kallioniema A,Piper J,Isola J,Waldman FM,Gray JW,Pinkel D.优化比较基因组杂交以分析实体肿瘤中DNA序列拷贝数的变化。基因染色体癌。1994;10:231–243. doi:10.1002/gcc.2870100403。[公共医学] [交叉参考][谷歌学者]
  • Mitelman F、Johansson B、Mertens F。易位和基因融合对癌症病因的影响。Nat Rev癌症。2007;7:233–245。doi:10.1038/nrc2091。[公共医学] [交叉参考][谷歌学者]
  • Kim SW,Kim JW,Kim YT,Kim J H,Kim S,Yoon BS,Nam EJ,Kin HY。使用高分辨率阵列比较基因组杂交分析浆液性卵巢癌的染色体变化:化疗耐药疾病的潜在预测标记。基因染色体癌。2007;46:1-9.数字对象标识代码:10.1002/gcc.20384。[公共医学] [交叉参考][谷歌学者]
  • Nigro JM、Misra A、Zhang L、Smirnov I、Colman H、Griffin C、Ozburn N、Chen M、Pan E、Koul D、Yung WK、Feuerstein BG、Aldape KD。集成阵列比较基因组杂交和表达阵列图谱可识别胶质母细胞瘤的临床相关分子亚型。癌症研究。2005年;65:1678–1686. doi:10.1158/0008-5472.CAN-04-2921。[公共医学] [交叉参考][谷歌学者]
  • Pierga JY、Reis-Filho JS、Cleator SJ、Dexter T、Mackay A、Simpson P、Fenwick K、Iravani M、Salter J、Hills M、Jones C、Ashworth A、Smith IE、Powles T、Dowsett M.接受新辅助化疗的乳腺癌患者基于微阵列的比较基因组杂交。英国癌症杂志。2007;96:341–351. doi:10.1038/sj.bjc.6603483。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Ruano Y、Mollejo M、Ribalta T、Fiano C、Camacho FI、Gomez E、de Lope AR、Hernandez-Moneo JL、Martinez P、Melendez B。通过表达和CGH微阵列分析检测的多形性胶质母细胞瘤扩增子中新候选靶基因的鉴定。摩尔癌症。2006;5:39.网址:10.1186/1476-4598-5-39。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • van Wieringen WN、Belien JA、Vosse SJ、Achame EM、Ylstra B.ACE-it:基因剂量和RNA表达数据的全基因组整合工具。生物信息学。2006;22:1919–1920. doi:10.1093/bioinformatics/btl269。[公共医学] [交叉参考][谷歌学者]
  • van Duin M、van Marion R、Watson JE、Paris PL、Lapuk A、Brown N、Oseroff VV、Albertson DG、Pinkel D、de Jong P、Nacheva EP、Dinjens W、van Dekken H、Collins C.构建和应用全覆盖、高分辨率人类染色体8q基因组微阵列进行比较基因组杂交。细胞计量学A。2005年;63:10–19.[公共医学][谷歌学者]
  • Di VA、Infusini E、Peveri C、Sciutto A、Orecchia R、Geido E、Monaco R、Giaretti W。通过FISH获得的1、7、17和18号染色体的瘤内异质性,以及与人类结直肠癌流式细胞术DNA指数的关联。细胞测定。1999;35:369–375. doi:10.1002/(SICI)1097-0320(19990401)35:4<369::AID-CYTO10>3.0.CO;2-6.[公共医学] [交叉参考][谷歌学者]
  • Jenkins RB、Qian J、Lieber MM、Bostwick DG。荧光法检测转移性前列腺癌c-myc癌基因扩增和染色体异常就地杂交。癌症研究。1997;57:524–531.[公共医学][谷歌学者]
  • Lengauer C,Kinzler KW,Vogelstein B.人类癌症中的遗传不稳定性。自然。1998;396:643–649. doi:10.1038/25292。[公共医学] [交叉参考][谷歌学者]
  • De Angelis PM、Stokke T、Beigi M、Flatberg G、Enger M、Haug K、Aass HC、Schjolberg A、Andresen PA、Ariansen S、Bo AS、Mjaland O、Clausen OP。非整倍体结直肠癌DNA二倍体成分的染色体20q增益。国际癌症杂志。2007;120:2734–2738. doi:10.1002/ijc.22537。[公共医学] [交叉参考][谷歌学者]
  • Vindelov LL,Christensen IJ,Nissen NI。一种用于流式细胞术DNA分析细胞核制备的洗涤剂-胰蛋白酶法。细胞测定。1983;:323–327. doi:10.1002/cyto.990030503。[公共医学] [交叉参考][谷歌学者]
  • Meza Zepeda LA、Kresse SH、Barragan Polania AH、Bjerkehagen B、Ohnstad HO、Namlos HM、Wang J、Kristiansen BE、Myklebost O。阵列比较基因组杂交揭示了胃肠道间质瘤和平滑肌肉瘤之间明显的DNA拷贝数差异。癌症研究。2006;66:8984–8993. doi:10.1158/0008-5472.CAN-06-1972。[公共医学] [交叉参考][谷歌学者]
  • 合奏http://www.ensembl.org/Homo_sapiens/searchview
  • De Angelis PM,Clausen OP,Schjolberg A,Stokke T.CGH检测的原发性结直肠癌的染色体增益和丢失及其与肿瘤DNA倍体、基因型和表型的关系。英国癌症杂志。1999;80:526–535. doi:10.1038/sj.bjc.6690388。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • BASE中GeneCount的演示版本http://alba.uio.no/base/local/genecountdemo/

文章来自基因组生物学由以下人员提供BMC公司