跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
基因组生物学。2006; 7(12):R117。
2006年12月11日在线发布。 数字对象标识:10.1186/gb-2006-7-12-r117
预防性维修识别码:第794430页
PMID:17156469

将转移基因表达特征分解为不同成分

关联数据

补充资料

简短摘要

根据肿瘤与基质的表达将预测性表达特征分解为不同的组分,这表明转移相关基因的分布明显倾斜。

摘要

背景

转移,即癌细胞扩散的过程,在一定程度上是由于癌细胞与周围基质之间不完全理解的相互作用引起的。基因表达研究通常分析含有肿瘤细胞和基质的样本。肿瘤细胞少于50%的样本通常被排除在外,从而减少了可以从临床相关特征中受益的患者数量。

结果

对于预测淋巴结转移的头颈部鳞状细胞癌(HNSCC)原发肿瘤表达特征,我们首先表明肿瘤细胞比例降低会导致预测准确性降低。为了确定基质对预测信号的影响,并研究肿瘤细胞与周围微环境之间的相互作用,我们使用激光捕获显微切割,根据肿瘤与基质的表达以及与转移表型的相关性,将转移特征分为六个不同的成分。转移相关基因的分布明显偏斜。

结论

将预测性签名分解为不同的组成部分对于表达签名的设计和我们对转移过程的理解具有重要意义。与未形成转移的原发性肿瘤相比,转移的原发性HNSCC肿瘤的特点是肿瘤细胞特异性基因显著下调,而基质细胞特异性基因仅上调。偏态分布与含有少于50%肿瘤细胞的样本的不良特征表现一致。本文介绍了减少肿瘤成分偏差的方法,这些偏差可提高预测准确性,并增加可包括的样本类型。

背景

DNA微阵列技术通过提供不同肿瘤类型的全基因组mRNA表达测量,提高了我们对癌症的理解[1-]. 这些研究已被用于确定新的癌症亚型[4-7]. 已经发现可以预测治疗反应的特定基因表达特征[8],转移性疾病[9,10],和复发率[11]这与癌症患者的不良预后有关[12,13]. 尽管签名发现研究的某些方面仍需要优化[14-16]癌症基因组学的潜力已经开始实现,第一批特征可用于临床或在其最后的前瞻性验证阶段[17].

尽管在少数情况下,激光捕获显微切割(LCM)已被应用[18,19],实体瘤的表达谱研究通常采用由肿瘤细胞和周围组织微环境组成的整个肿瘤切片。这包括细胞外基质成分和基质细胞,如成纤维细胞和免疫反应细胞[20]. 因为基因表达模式是从肿瘤细胞和肿瘤基质中衍生出来的,所以考虑基质细胞的内含物对肿瘤轮廓研究结果的影响程度是很重要的。

当考虑预测转移的特征时,这个一般性问题特别有趣。转移是癌细胞扩散到体内其他部位的过程,是癌症相关死亡的主要原因。为了选择合适的治疗策略,评估癌症患者是否存在转移至关重要[21]. 最近,基质细胞在肿瘤细胞扩散中发挥着积极作用,这是由肿瘤与宿主的相互作用引起的,在肿瘤细胞的侵袭和转移扩散过程中,肿瘤细胞周围的微环境是一个积极的伙伴[20,22-24]. 事实上,转移预测信号的功能分析表明,这些信号可能还包含许多在肿瘤基质中特异表达的基因[9,10,25].

虽然最近已经明确肿瘤基质在肿瘤侵袭和转移中起着重要作用,但癌症研究传统上集中于肿瘤细胞内的过程。微阵列研究通常只包括肿瘤细胞比例较高的肿瘤切片,因此从特征分析中排除了大量样本。为了增加可能受益于新开发的诊断特征的患者数量,值得考虑设计特征的方法,同时考虑具有低肿瘤细胞百分比的肿瘤样本。对基质成分的更多关注也可能提高我们对肿瘤发生机制的理解。

头颈部鳞状细胞癌(HNSCC)发生于上消化道,是西方人口中第五常见的恶性肿瘤,由于一般预期寿命的延长以及酒精和烟草消费的增加,其发病率在全球范围内呈上升趋势[26,27]. 与其他肿瘤类型一样,适当的治疗取决于对疾病进展的评估,尤其是对靠近原发肿瘤部位的区域淋巴结是否存在转移的评估。由于难以可靠地检测这种(微小)转移,许多患者目前没有接受最合适的治疗[28-30]. 最近报道了一些HNSCC的表达特征,可以区分转移性肿瘤和良性肿瘤[25,31-33]. 尽管大规模的多中心验证仍在进行中,但对独立样本的评估表明,临床实践中的实施可以改善多达65%的口腔和口咽部HNSCC患者的治疗[25].

与其他实体肿瘤轮廓研究一样,后一项研究中纳入样本的标准之一是分析切片中存在50%以上的肿瘤细胞[13]. 在这里,我们研究了基质/肿瘤百分比的影响,并表明对肿瘤细胞百分比较低的样本的转移状态预测不太准确。利用LCM生成35个相关样本,人工改变基质与肿瘤细胞的比例,进一步研究预测准确性的损失以及肿瘤细胞与基质之间的关系。确定了685个转移相关基因的表达模式,根据肿瘤与基质中的表达以及与转移或非转移表型的关联,将转移特征分解为若干组分。特征基因在不同成分上的分布非常不均匀,这对我们理解转移过程和设计表达特征具有重要意义。

结果

肿瘤细胞百分比降低降低预测准确性

HNSCC淋巴结转移特征先前已经使用包含肿瘤细胞和肿瘤间质的完整原发肿瘤切片进行了鉴定[25]. 含有少于50%肿瘤细胞的样本被排除在之前的研究之外,这导致识别了800多个转移相关基因,这些基因可用于预测各种特征成分[34]. 在这些先前研究中包含的样本中,显示了对较低肿瘤百分比样本的预测准确性较低的趋势(图(图1a,1a个,灰色条)。在分析肿瘤细胞低于50%的新样本时,这种趋势更加明显(图(图1a,1a个,白色条)。从60%到70%的最佳肿瘤百分比开始(图(图1c),1c个),对于肿瘤细胞含量低于50%的样本,预测因子的判别能力明显降低(图(图1b),1磅)这与预测准确度的下降一致(图(图1a)。1a个). 有趣的是,肿瘤百分比最高的样本也显示出轻微的辨别力下降(图(图1c),1c个)这表明可能存在一个最佳的肿瘤样本切片组成,以准确预测转移状态。这些结果表明,尽管转移信号携带了大量可能在基质中表达的基因,但预测准确性的降低与肿瘤切片中基质细胞的增加有关[9,34].

保存图片、插图等的外部文件。对象名称为gb-2006-7-12-r117-1.jpg

对于肿瘤百分比低的样本,转移特征的预测准确性降低。(a)每个肿瘤百分比组转移性HNSCC特征的预测准确性。预测准确性表示为先前发布的120-基因原发肿瘤特征[25]根据与手术切除颈部淋巴组织的组织学检查的比较,正确确定无转移或有转移的样本百分比。肿瘤百分比为(b)50%或更少,(c)60%至70%之间(d)80%或以上。标志性结果小于零表示转移(N+),结果大于零表示非转移(N0)。实心圆圈表示来自转移患者的肿瘤样本;开圆圈表示来自无转移患者的肿瘤样本。

激光捕获显微切割样品显示出预测偏差

肿瘤细胞百分比的影响分析受到以下因素的干扰:足够的样本代表了广泛的切片成分,在每个成分范围内,足够的样本表示可能的预测结果,即有转移(N+)或无转移(N0)。为了避免这个问题,我们应用LCM从完整的原发肿瘤切片中生成了多个仅在肿瘤百分比上有所不同的人工样本(见图图22材料和方法)。本分析选择的样本代表了N0和N+结果的一系列预测准确度,包括预测效果不佳的样本(图(图3a,3a年,第一列)。通过改变肿瘤细胞的比例(0%至100%),共生成35个人工样本。这种方法的优点是,来自单个肿瘤的多个人工样本之间的特征曲线差异完全是由于肿瘤百分比不同,而不是单个样本的异质性。为了确定这种方法是否有效,我们首先测试了保留原始肿瘤百分比的LCM样本(图(图2h)2小时)显示出与原始完整肿瘤切片相同的标志性结果。分析结果(图(图3a,3a年(第三列与第二列)证实了使用LCM生成人工样本和实施所需的额外RNA扩增程序本身不会破坏预测结果(图(图3a3a年).

保存图片、插图等的外部文件。对象名称为gb-2006-7-12-r117-2.jpg

从完整的原发肿瘤切片中分离肿瘤细胞和肿瘤基质。使用LCM显微切割分离肿瘤和基质区域,从完整的原发肿瘤切片中生成人工样本。(a、d、g)从原发肿瘤切片来看,主要包括(b)肿瘤细胞或(e)肿瘤间质,或(h)使用LCM分离随机圆。通过以不同比例组合多个肿瘤细胞区域(b)和多个肿瘤基质区域(e)来制备具有不同肿瘤百分比的样品。通过分离随机分布在肿瘤截面(h)上的多个圆形区域,制作保留原始肿瘤基质比例的人工样本。有关详细信息,请参见材料和方法。(c、f、i)所需区域LCM后的原发肿瘤切片。此处显示的组织切片用苏木精-伊红染色染色。

保存图片、插图等的外部文件。对象名称为gb-2006-7-12-r117-3.jpg

HNSCC转移标志物结果显示,由于标志物成分的偏斜分布,肿瘤细胞百分比存在偏差。(a)七个分析过的原发性HNSCC的转移特征图谱基于:完整的肿瘤切片和最初确定的102个特征基因[25](原始);完整切片和685个转移相关预测基因的集合(完整);以及保留了原始肿瘤基质比例(lcm)的685基因集和合成样本。蓝色表示非转移(N0)剖面,黄色表示转移(N+)剖面。(b)来自7个原发性肿瘤的合成样本的转移特征图谱,这些样本分别保留了原始肿瘤百分比(lcm)或包含0%、25%、50%、75%或100%肿瘤细胞。剖面基于预测685基因集;颜色如(a)所示。(c)根据其表达水平与35个分析肿瘤百分比的相关性,对685个预测基因集进行排序。颜色基于肿瘤细胞和肿瘤基质的直接微阵列比较,这证实了负相关(<-0.50)基因主要在基质中表达,而正相关基因(>0.50)与肿瘤细胞相关。绿色表示肿瘤间质中的表达高于肿瘤细胞,红色表示肿瘤细胞中的表达大于肿瘤间质。685个特征基因中,哪些分布在不同的组分上,详见附加数据文件1.(d)预测基因的肿瘤百分比相关性和特征相关性(N0或N+)。肿瘤百分比相关组如(c)所示。蓝色表示与N0特征图谱相关的基因,黄色表示与N+图谱相关的基因。基质基因大多与N+相关,即在N+原发肿瘤切片中表达较高,而N0轮廓相关的预测基因更常见于肿瘤细胞中表达,即在N+原发癌中表达下调。(e)As(b),但用于肿瘤和基质特异性预测基因(259个基因)。(f)As(b),但对于在肿瘤细胞和肿瘤基质之间表达相似的非特异性预测基因(肿瘤百分比相关性介于-0.50和0.50之间)。

从七个原发性HNSCC肿瘤样本(三个N0和四个N+,其中一个N+样本(A16)弱分类为N0)中的每一个样本中,通过组合孤立的肿瘤创建五个人工样本(图(图2b)2亿)和基质区域(图(图2e)第二版)以不同的比例,从而产生总共35个样本,其中包括0%、25%、50%、75%或100%的肿瘤细胞。对这35个样本进行了染色重复DNA微阵列分析,并使用由685个基因组成的预测因子测试了HNSCC预测特征结果。这些基因来自825个转移相关基因[34]通过去除在LCM分析少量可用材料所需的双扩增程序中显示任何偏差的基因(参见材料和方法)。有趣的是,预测结果受到肿瘤百分比的显著影响(图(图3b)。第3页). 对于肿瘤含量低的样品尤其如此,并且与图中所示的低肿瘤百分比切片的趋势一致图1a。1a个虽然N0和N+肿瘤之间的差异仍然存在,但所有七个分析的肿瘤在基质百分比增加时都显示出倾向于转移(N+)的特征,而在肿瘤细胞百分比增加时,都显示出偏向于非转移(N0)的特征。由于这种违反直觉的肿瘤百分比倾向可能是由肿瘤或基质细胞特异性基因表达引起的,我们决定将特征基因分为不同类别,并确定特征的不同成分如何以肿瘤百分比依赖的方式影响预测结果。

转移以原发性肿瘤基因表达缺失和基质细胞激活为特征

划分转移相关基因的第一个标准是基于基因是否主要在基质、肿瘤细胞或两者中表达(图(图3c)。3立方厘米). 根据基因表达与全套35个人工样本中不同肿瘤百分比的相关性,将基因细分为三个子集,基因顺序从左至右分别为基质表达和肿瘤表达。为了验证这一细分,将100%肿瘤细胞LCM样品与100%基质LCM样品直接在12个额外的微阵列上进行比较(对仍有足够LCM材料的6个样品中的每个样品进行染色-水重复)。这种直接比较的比率如图中绿色(基质表达)和红色(肿瘤表达)所示图3c3立方厘米并根据与所有不同肿瘤百分比的相关性确定细分。有趣的是,结果显示,预测特征中12%的基因主要表达于间质,25%的基因更具肿瘤细胞特异性,其中大部分基因在肿瘤和间质中表达相同。

然后根据上调是否与转移相关,将这三组进一步细分为两类(图(图3d)。三维). 以这种方式细分特征基因后,两个引人注目的观察结果变得显而易见。第一个是基因在六个不同类别上的偏态分布。虽然有大量基质表达基因的上调与转移的存在相关,但实际上没有基质表达基因上调与无转移相关(图(图3d,三维,左侧)。换句话说,转移的存在与特定基质表达基因的上调有关,但与原发肿瘤中基质特异基因的失活无关。对于签名中的肿瘤细胞表达基因,相反的偏斜分布也很明显,尽管程度稍低(图(图3d,三维,右侧)。有大量肿瘤细胞表达基因的表达增加与无转移相关,但有少量肿瘤细胞表达的基因的表达上调与转移相关。因此,对于口腔或口咽中的HNSCC,转移性原发肿瘤的特征是基质特异性基因上调和肿瘤细胞特异性基因失活。685个转移相关基因及其在不同特征成分上的分布见附加数据文件1。

除了对转移过程本身提供重要的见解外,这种偏斜分布可能解释了特征基因的倾向性,即对肿瘤百分比降低的样本错误预测了转移的存在(图(图3b)。3亿). 因为转移与基质特异性基因子集的表达增加有关,基质特异性的基因几乎没有下调,所以整个肿瘤切片中基质比例的增加将导致N+预测的偏差,即使是事实上为N0的原发肿瘤。分布中的另一个偏差,即N+肿瘤中肿瘤细胞特异性基因的下调多于上调,以同样的方式起作用,并增加了低肿瘤细胞百分比样本中N+预测的倾向。为了验证偏态分布是预测肿瘤细胞百分比降低的样本中N+表型的偏见的基础这一观点,在35个人工合成的LCM样本上重复了N0/N+预测,只使用那些在肿瘤细胞或基质中特异表达的特征基因。正如预期的那样,与全套特征基因相比,该特征更倾向于预测N+表型(图(图3e第三版与数字对比图3b第3页).

转移相关基因在不同特征成分中的倾斜分布

将特征基因细分为不同类别后,可以对基质和肿瘤中表达的基因进行第二个明显的重要观察(图(图3d,三维,中间组)。仅使用在基质细胞和肿瘤细胞中等效表达的特征基因将是避免特征中肿瘤细胞百分比偏差的理想方法。虽然该组几乎没有发现任何N0/N+分布的偏斜,但与肿瘤细胞和基质特异性基因相比,区分N0和N+肿瘤的预测能力显著降低。这从与N+或N0表型的较低关联度中可以明显看出(图(图3d)。三维). 由于它们与N0或N+表型的关联性较弱,仅基于肿瘤细胞和基质中表达的基因的特征不足以对N0和N+原发肿瘤进行有力区分,无论是人工生成的样本(图(图3f),第3页),或在用于生成图图11(总准确率从86%降至76%)。

基于上述结果,可以将先前识别的预测性HNSCC信号分离为一个部分,该部分包含在肿瘤和间质中同等表达的基因,但预测能力有限,第二部分是肿瘤和基质特异性基因,这些基因具有很强的辨别力,但N0/N+分布不均匀。该成分的模型和预测中随后的偏差表明存在四个分布不均的成分(图(图4a),4a类)以及这些基质和肿瘤细胞特异性基因的实际分布(图(图4b)。4b个). 这两大组分包含N0相关肿瘤基因(肿瘤N0)和N+相关基质基因(基质N+)。这两个较小的组分包含一些肿瘤N+基因,几乎没有任何基质N0基因(图(图4b)。4b个). 如图所示(图4a、b),这四个成分的偏斜大小导致了一个信号,对于不同的肿瘤百分比,其预测结果是不稳定的(图(图3e)。第三版). 如果这个模型是准确的,调整以纠正过度表达应该会导致预测性特征,减少不同肿瘤百分比的偏差,如图所示的模型所示图4c。4c类因此,从最初的综合转移相关基因集合中,选择了一组119个预测基因,这些预测基因在不同的特征成分中表现出最大的平衡(图(图4d;第4天; 附加数据文件1)。正如预期的那样,如果这些模型是正确的,当在人工合成的LCM样品上进行测试时,平衡的HNSCC转移信号确实显示出其预测结果的肿瘤细胞百分比偏差大大降低(图(图4e)。第四版). 使用平衡特征,肿瘤百分比在25%到100%之间的人工肿瘤样本现在显示出预测结果,这在很大程度上与肿瘤百分比无关,并且对于不含肿瘤细胞的N0样本,N+倾向性显著降低(图(图4e第四版).

保存图片、插图等的外部文件。对象名称为gb-2006-7-12-r117-4.jpg

平衡肿瘤和间质性HNSCC特征成分可产生更稳健和准确的预测曲线。(a)肿瘤细胞特异性和肿瘤基质特异性HNSCC特征基因可分为四个部分:基质N+、肿瘤N+、基质N0和肿瘤N0。浅灰色表示N0缔合,深灰色表示N+缔合。(b)(a)中所示四个成分对初始HNSCC签名的相对贡献模型。将这四个组成部分合并为一个预测结果(用箭头表示)会导致肿瘤百分比特征偏差。低肿瘤百分比样本(左侧)显示出更多的N+偏倚轮廓(深灰色),而肿瘤百分比非常高的样本(右侧)显示出对N0轮廓的偏倚(浅灰色)。(c)如(b)所示,但对于校正后的特征成分,其在低肿瘤百分比和高肿瘤百分比样本的预测结果中没有表现出强烈的偏差。(d)选择一组119个HNSCC特征基因,这些基因在四个不同组分中均匀分布,绘制类似于(a)。(e)基于(d)中所示119个基因组成的校正特征的预测结果。校正后的特征显示,对于肿瘤百分比低或非常高的样本,预测偏差显著降低;颜色如图3b所示。(f)基于原始特征、平衡特征和基于样本的肿瘤细胞百分比的加权校正预测转移的特征结果的比值比。

平衡特征在低肿瘤细胞百分比样本上表现更好

为了测试使用平衡特征的预测偏差校正是否仅适用于LCM组成的样本,在77个完整的原发肿瘤切片上测定了平衡特征的性能(图(图1),1)包括肿瘤细胞少于50%的额外样本。这里,平衡的HNSCC转移特征优于原始特征[34]尤其是对于肿瘤细胞程度较低的样本(图(图4f)。第4页). 比值比表示性能基于随机发生的可能性。应用平衡特征后,小于50%的肿瘤细胞样本的总体预测准确性的比值比从6.5(p=0.07)上升到12(p=0.02)。这种改进是渐进的,但对于希望从未来诊断特征中受益的患者来说意义重大,尤其是因为这表明,可以通过考虑特征基因分布偏斜的可能性,在特征分析中包括更多的样本组。调整特征的另一种可能方法是根据样本中肿瘤细胞的百分比加权单个特征成分的预测相关性。这种数学校正在预测准确性方面也有类似的改进(图(图4f)。第4页). 下文将讨论在未来的研究中考虑偏斜签名组合的替代方法。

讨论

在这项研究中,我们研究了肿瘤成分对预测特征表现的影响,将特征分解为不同的成分,并表明低肿瘤细胞百分比样本的预测准确性损失部分是由于这些不同成分中的特征基因分布不均造成的。这些结果对我们理解转移是如何发生的、对转移的治疗有意义,并提出了一些可以改进表达特征的方法。

基质与肿瘤细胞的相互作用

分类器的功能类别分析先前表明,转移相关特征中存在肿瘤细胞特异性和基质表达基因[9,25,34]. 通过直接比较LCM基质场和肿瘤场,我们发现,对于685个HNSCC淋巴结转移相关基因的详尽收集,12%主要在基质中表达,25%在肿瘤细胞中表达,大多数在肿瘤和基质中表达。这与最近的发现一致,这些发现强调了周围微环境对癌症发展的贡献[35-37]肿瘤和基质细胞之间的相互作用导致转移[22,24,38].

一个引人注目的发现是基质细胞和肿瘤细胞表达基因的分布偏斜,这与是否存在转移有关(图(图3d)。三维). 与未显示转移的原发性肿瘤相比,转移性原发性头颈部肿瘤的特征是基质特异性基因子集的特异性上调,同时肿瘤特异性基因的子集主要失活。这与肿瘤细胞周围的组织积极转化为支持转移的微环境的想法是一致的[20,22,24]. 转移与肿瘤细胞特异性基因的下调比其激活更密切相关,这一事实表明,在肿瘤细胞中,功能丧失在获得转移表型方面比功能获得方面起着更重要的作用。未来的分析可能表明,是否有任何肿瘤细胞转移相关基因是基质表达伴随变化的原因。大规模685个转移相关基因的解剖[34]将具有明确表达的强转移相关基因分成更小的组应该简化寻找治疗转移的合适治疗靶点的任务。

构成HNSCC转移特征的三分之二基因在肿瘤细胞和基质中的表达相似。就其本身而言,这些基因只对N0和N+肿瘤有轻微区别,可能是因为这两种肿瘤类型之间这些基因的表达差异较小。因为这些基因在基质细胞和肿瘤细胞中都表达,并且表现出较少的区分能力,所以这些基因可能是与转移表型相关的遗传多态性的间接标记,而不是转移的直接原因。这种想法与转移表达特征是遗传多态性的产物而不是肿瘤发生过程中引起的变化的迹象相一致[39]. 特征基因的另一个有趣的特征是缺乏能够区分N0和N+肿瘤或间质的高度特异的单个基因表达。这与寻找原发性肿瘤高度特异性转移标记物的困难以及成功的标记需要大量基因的贡献才能准确预测这一事实相一致。这也表明转移表型是由大量基因表达相对较小的变化引起的。

表情签名设计

转移特征基因在不同组分上的偏态分布(图(图3))对表达式签名的设计具有重要意义。由低于50%的肿瘤组成的样本通常被排除在轮廓研究之外。这是一个重要但没有充分记录的问题。例如,我们目前收集的头颈部肿瘤样本中约有30%的肿瘤不符合这一标准(P Roepman,未发表的结果)。此类样本已被排除在许多成功的特征分析研究之外,除非设计出基于准确预测的方法,否则无法纳入诊断特征分析的未来实施中。即使肿瘤含量略微下降到40%或25%,纳入未来的研究,对患者来说也是向前迈出的重要一步。

在此,我们确认,对肿瘤细胞比例较低的样本的转移状态的预测确实不太准确(图(图1)1)并证明,这至少在一定程度上是由于转移相关基因在几个不同特征成分上的偏斜分布所致(图(图3)。). 因为最强烈的转移相关基因是上调的基质基因和下调的肿瘤细胞基因(图(图3d),三维),更多基质材料的存在将先验的使转移特征易于进行N+预测。在整个肿瘤切片上观察到的辨别力损失并不总是倾向于对较低肿瘤百分比样本进行错误的N+预测(图(图1b),1磅)这表明样本异质性等其他因素也起到了作用。由于需要大量样本来对抗异质性,目前不可能明确确定对于较低肿瘤细胞百分比的样本,是否所有预测准确性的损失都被观察到(图(图1a)1a个)这可以归因于特征基因的偏态分布。然而,人工LCM生成样本的结果有所改善(图(图4e)第四版)并完成肿瘤切片(图(图4f)第4页)指出,如果采取步骤分析特征成分并纠正不同成分上的偏斜分布,那么将来会有更多的患者受益于诊断特征。

在本研究中,我们提出了三种改进的预测低肿瘤百分比样本的方法。第一种方法包括选择在肿瘤细胞和基质中表达相似的特征基因。这些基因的弱辨别力可能与在肿瘤或基质中没有特定作用有关。当单独使用时,即使所有426个这样的基因一起使用,签名也缺乏足够的辨别力(图(图3f)。第3页). 另外两种方法确实包括了倾斜的特征成分,但通过选择平衡数量的基因来补偿由此产生的偏差(图(图4d),第4天)或通过肿瘤细胞百分比加权校正单个成分预测。这两种方法都提高了对低肿瘤细胞百分比样本的预测准确度,而不会损失总体准确度。需要对肿瘤百分比明显较低的样本进行分析,以确定这些是否确实是最佳方法。这项研究还可以研究设计两种不同独立签名的可能性:一种是基于低肿瘤百分比样本的“基质相关”签名,另一种是根据高肿瘤百分比样本设计的“肿瘤相关”签名。通过这种方法,一个生物学特性,即肿瘤和基质细胞之间的相互作用,将被分为两个独立的特征。此外,由于将样本集拆分为两个,因此需要至少两倍的样本才能实现类似的统计显著性。我们收集的此类样本数量不足,因此还无法得出这种方法是否可行的结论。无论当前样本可用性如何,本研究的重要性在于,它成功地将临床相关的诊断特征分解为单独的成分,并且表明,特征基因在不同组分上的偏态分布导致对低肿瘤率样本的预测准确性较低。重要的是要确定其他特征是否具有类似的属性,未来的研究现在可以考虑特征基因的倾斜分布的可能性,从而纳入更多的样本,并增加可应用诊断特征的患者数量。

结论

从包含多种组织类型的样本中衍生出的表达特征可以分解为多个成分。对于与HNSCC淋巴结转移相关的685个基因特征,在特征的六个不同组成部分上,基因的分布存在显著的偏差。转移性原发肿瘤的特点是肿瘤细胞特异性基因下调,基质基因上调。以这种方式解剖685个转移相关基因可以评估哪些基因产物更适合靶向治疗。特征基因在不同组分上的倾斜分布解释了含有较少肿瘤细胞的样本预测准确性的损失。预测准确性的损失可以部分地通过选择基因来解决,这些基因共同形成一个在不同成分上具有平衡组成的特征。这将允许在未来的分析中包含更多肿瘤细胞数量较少的样本。

材料和方法

肿瘤样本

本研究使用了66例原发性HNSCC肿瘤样本的先前确定的基因表达数据[25]. 此外,对11个额外的肿瘤样本进行了基因表达谱分析。这组额外样本的选择标准与前一组66个样本相同,只是这11个样本的完整肿瘤切片显示肿瘤含量低于50%。如前所述,对11个样本进行RNA处理、微阵列杂交和分析[25].

人工肿瘤百分比样本

对于从先前分析的66个样本集中选择的7个原发肿瘤(3N0、4N+),生成了5个含有0%、25%、50%、75%或100%肿瘤细胞的人工样本,以及一个保留了原始肿瘤百分比的人工样本。人造肿瘤百分比样本由肿瘤组织切片的LCM生成,从而分离出1 mm2肿瘤组织总数。通过组合多个分离的肿瘤细胞区域(图(图2b)2亿)和多个分离的肿瘤间质区(图(图2e)第二版)例如,以不同的比率,75%的样品由0.75 mm的LCM生成2肿瘤细胞和0.25mm2肿瘤基质。保留了原始成分的人工样品是通过从完整的肿瘤切片中分离出随机的圆形区域生成的(图(图2h2小时).

LCM和RNA分离

将冰冻肿瘤切片(10μm)固定在PALM膜载玻片上(PALM MicroLaser Systems,Bernried,Germany),并用苏木精染色30秒。使用PALM微束系统进行LCM。使用PicoPure™RNA分离试剂盒(美国加利福尼亚州森尼维尔市Arcturus)从捕获的显微切割细胞中分离出总RNA。在2100生物分析仪上检查RNA质量(安捷伦,圣克拉拉,加利福尼亚州,美国)。

RNA扩增和荧光标记

使用两轮T7线性扩增对LCM样品中分离的RNA进行扩增。第一轮是按照其他地方的描述进行的[25]除了T7体外转录(IVT)进行了两个小时而不是四个小时,并且没有加入氨基烯丙基UTP。第一轮cRNA被用作第二轮扩增的模板。将样品真空浓缩至9μl,并添加1μl随机引物(1μg/μl;英维特罗根,佩斯利,苏格兰)。随后,如前所述进行第一链cDNA合成[25]然后在94°C下培养5分钟。在冰上冷却样品后,添加1μl先前使用的双锚定T7-poly(dT)底漆[25]样品在70℃下培养5分钟,随后在48℃下培养3分钟。第二链cDNA合成、第二轮IVT和cRNA清除如别处所述进行[25]. 在第二轮扩增期间,氨基烯丙基UTP被并入生成的cRNA中,从而在杂交之前实现荧光团的直接偶联。cy5或cy3荧光团的直接偶联如前所述[25]. 利用分光光度法和2100生物分析仪(安捷伦)对产量、质量和标签掺入进行量化。

基因表达分析

使用包含21000多个人类基因特征的70-mer寡核苷酸DNA微阵列确定基因表达模式[25]. 杂交前,将微阵列载玻片在硼水合物缓冲液(2×SSC(0.3 M NaCl,50 mM柠檬酸钠)、0.05%十二烷基硫酸钠和0.25%w/v硼水合物钠(Sigma-Aldrich,St.Louis,MO,USA)中在42°C下孵育30分钟。我们将300 ng cy5或cy3标记的样本靶点(标记的核苷酸掺入量为3%至5%)与300 ng反向标记的参考cRNA结合[25]然后使用Ambion的碎片化工具(Ambion,德克萨斯州奥斯汀,美国)将其碎片化。如别处所述进行微阵列杂交[40]. 载玻片在安捷伦G2565AA DNA微阵列扫描仪中进行扫描。使用Imagene软件(Biodiscovery,El Segundo,CA,USA)对图像进行量化和背景校正。如前所述,将量化表达数据标准化[25]. 微阵列布局、表达数据和协议已按照MIAME保存在ArrayExpress数据库中,注册号为A-UMCU-3和E-TABM-152。

转移特征结果

如前所述,通过计算特定基因表达模式与先前确定的典型转移(N+)和非转移(N0)图谱的相关性,确定每个分析的HNSCC样本的转移预测特征结果[25]. 结合起来,N+和N0剖面相关性表示一组特定预测基因的每个分析样本的单一预测特征结果。正相关表示N+剖面,负相关表示N0剖面。从先前确定的825个综合预测基因中[34]在此分析了685个基因,这些基因在包括LCM和双扩增程序时表现出稳健的特征。由于引入LCM和双扩增程序,删除的140个基因在表达测量中显示出偏差,并且由于技术程序的改变,7个分析肿瘤样本中至少有3个的表达差异是1.5倍。其余685个基因在7个分析的肿瘤样本中的1个或2个样本中没有或只显示出表达的微小变化。

其他数据文件

本文的在线版本提供了以下附加数据。附加数据文件1表中列出了685个转移相关基因及其在不同特征成分上的分布。

补充材料

其他文件数据1:

685个转移相关基因及其在不同特征成分上的分布

单击此处获取文件(833K,xls)

致谢

我们感谢M Groot Koerkamp和D Bouwmeester的微阵列制作,感谢A Leijen和Y El Hankouri的计算机协助。这项工作由荷兰生物医学遗传学中心和荷兰科学研究组织(NOW)资助901-01-238。

工具书类

  • Huang E、Ishida S、Pittman J、Dressman H、Bild A、Kloos M、D'Amico M、Pestell RG、West M、Nevins JR。预测致癌途径活性的基因表达表型模型。自然遗传学。2003;34:226–230。doi:10.1038/ng1167。[公共医学] [交叉参考][谷歌学者]
  • Segal E、Friedman N、Kaminski N、Regev A、Koller D。从特征到模型:利用微阵列了解癌症。自然遗传学。2005;37:S38–45。doi:10.1038/ng1561。[公共医学] [交叉参考][谷歌学者]
  • Bild AH、Yao G、Chang JT、Wang Q、Potti A、Chasse D、Joshi MB、Harpole D、Lancaster JM、Berchuck A等。人类癌症中的致癌途径特征作为靶向治疗的指南。自然。2006;439:353–357. doi:10.1038/nature04296。[公共医学] [交叉参考][谷歌学者]
  • Valk PJ、Verhaak RG、Beijen MA、Erpelinck CA、Barjesteh van Waalwijk van Doorn-Khosrovani S、Boer JM、Beverloo HB、Moorhouse MJ、van der Spek PJ、Lowenberg B、Delwel R.急性髓系白血病中的预后有用基因表达谱。N英格兰医学杂志。2004;350:1617–1628. doi:10.1056/NEJMoa040465。[公共医学] [交叉参考][谷歌学者]
  • Perou CM、Sorlie T、Eisen MB、van de Rijn M、Jeffrey SS、Rees CA、Pollack JR、Ross DT、Johnsen H、Akslen LA等。人类乳腺肿瘤的分子肖像。自然。2000;406:747–752. doi:10.1038/35021093。[公共医学] [交叉参考][谷歌学者]
  • Golub TR、Slonim DK、Tamayo P、Huard C、Gaasenbeek M、Mesirov JP、Coller H、Loh ML、Downing JR、Caligiuri MA等。癌症的分子分类:通过基因表达监测进行分类发现和分类预测。科学。1999;286:531–537。doi:10.1126/science.286.5439.531。[公共医学] [交叉参考][谷歌学者]
  • Alizadeh AA、Eisen MB、Davis RE、Ma C、Lossos IS、Rosenwald A、Boldrick JC、Sabet H、Tran T、Yu X等。通过基因表达谱确定的不同类型的弥漫性大B细胞淋巴瘤。自然。2000;403:503–511. doi:10.1038/35000501。[公共医学] [交叉参考][谷歌学者]
  • Ma XJ,Wang Z,Ryan PD,Isakoff SJ,Barmettler A,Fuller A,Muir B,Mohapatra G,Salunga R,Tuggle JT等。双基因表达率预测他莫昔芬治疗乳腺癌患者的临床结局。癌细胞。2004;5:607–616. doi:10.1016/j.ccr.2004.05.015。[公共医学] [交叉参考][谷歌学者]
  • Ramaswamy S,Ross KN,Lander ES,Golub TR。原发性实体瘤转移的分子标志。自然遗传学。2003;33:49–54. doi:10.1038/ng1060。[公共医学] [交叉参考][谷歌学者]
  • Wang Y,Klijn JG,Zhang Y,Sieuwerts AM,Look MP,Yang F,Talantov D,Timmermans M,Meijer-van Gelder ME,Yu J等。预测淋巴结阴性原发性乳腺癌远处转移的基因表达谱。柳叶刀。2005;365:671–679.[公共医学][谷歌学者]
  • Paik S、Shak S、Tang G、Kim C、Baker J、Cronin M、Baehner FL、Walker MG、Watson D、Park T等。预测三苯氧胺治疗的结节阴性乳腺癌复发的多基因分析。N英格兰医学杂志。2004;351:2817–2826。doi:10.1056/NEJMoa041588。[公共医学] [交叉参考][谷歌学者]
  • Huang E,Cheng SH,Dressman H,Pittman J,Tsou MH,Horn CF,Bild A,Iversen ES,Liao M,Chen CM等。乳腺癌预后的基因表达预测因子。柳叶刀。2003;361:1590–1596. doi:10.1016/S0140-6736(03)13308-9。[公共医学] [交叉参考][谷歌学者]
  • van’t Veer LJ、Dai H、van de Vijver MJ、He YD、Hart AA、Mao M、Peterse HL、van der Kooy K、Marton MJ、Witteveen AT等。基因表达谱预测乳腺癌的临床结局。自然。2002;415:530–536. doi:10.1038/415530a。[公共医学] [交叉参考][谷歌学者]
  • Tinker AV,Boussioutas A,Bowtell DD。基因表达微阵列对人类癌症研究的挑战。癌细胞。2006;9:333–339. doi:10.1016/j.cr.2006.05.001。[公共医学] [交叉参考][谷歌学者]
  • Simon R,Radmacher MD,Dobbin K,McShane LM。DNA微阵列数据用于诊断和预后分类的缺陷。美国国家癌症研究所杂志。2003;95:14–18.[公共医学][谷歌学者]
  • Ransohoff DF公司。癌症分子标记发现和验证的证据规则。Nat Rev癌症。2004;4:309–314. doi:10.1038/nrc1322。[公共医学] [交叉参考][谷歌学者]
  • Kallioniemi O.医学:肿瘤简介。自然。2004;428:379–382. doi:10.1038/428379b。[公共医学] [交叉参考][谷歌学者]
  • Alevizos I、Mahadevappa M、Zhang X、Ohyama H、Kohno Y、Posner M、Gallagher GT、Varvares M、Cohen D、Kim D等。口腔癌体内激光捕获显微切割和微阵列分析辅助的基因表达谱分析。致癌物。2001;20:6196–6204. doi:10.1038/sj.onc.1204685。[公共医学] [交叉参考][谷歌学者]
  • Yamabuki T、Daigo Y、Kato T、Hayama S、Tsunoda T、Miyamoto M、Ito T、Fujita M、Hosokawa M、Kondo S、Nakamura Y。食管鳞癌的全基因组基因表达谱分析。国际癌症杂志。2006;28:1375–1384.[公共医学][谷歌学者]
  • Bissell MJ,Radisky D.将肿瘤放在背景中。Nat Rev癌症。2001;1:46–54. doi:10.1038/35094059。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
  • Forastiere A、Koch W、Trotti A、Sidransky D.头颈癌。N英格兰医学杂志。2001;345:1890–1900. doi:10.1056/NEJMra001375。[公共医学] [交叉参考][谷歌学者]
  • Mueller MM,Fusenig NE。朋友还是敌人——癌症中肿瘤基质的双极效应。Nat Rev癌症。2004;4:839–849. doi:10.1038/nrc1477。[公共医学] [交叉参考][谷歌学者]
  • Hanahan D,Weinberg RA。癌症的特征。单元格。2000;100:57–70. doi:10.1016/S0092-8674(00)81683-9。[公共医学] [交叉参考][谷歌学者]
  • Liotta LA,Kohn EC。肿瘤-宿主界面的微环境。自然。2001;411:375–379. doi:10.1038/35077241。[公共医学] [交叉参考][谷歌学者]
  • Roepman P、Wessels LF、Kettelarij N、Kemmeren P、Miles AJ、Lignzaad P、Tilanus MG、Koole R、Hordijk GJ、van der Vliet PC等。原发性头颈鳞癌淋巴结转移诊断的表达谱。自然遗传学。2005;37:182–186. doi:10.1038/ng1502。[公共医学] [交叉参考][谷歌学者]
  • Reid BC、Winn DM、Morse DE、Pendrys DG。头部和颈部就地癌症:发病率、趋势和生存率。口腔癌。2000;36:414–420. doi:10.1016/S1368-8375(00)00028-2。[公共医学] [交叉参考][谷歌学者]
  • Bray F,Moller B。预测癌症的未来负担。Nat Rev癌症。2006;6:63–74. doi:10.1038/nrc1781。[公共医学] [交叉参考][谷歌学者]
  • Robbins KT、Clayman G、Levine PA、Medina J、Sessions R、Shaha A、Som P、Wolf GT。颈部解剖分类更新:美国头颈学会和美国耳鼻喉科-头颈外科学会提出的修订。耳鼻咽喉头颈外科。2002;128:751–758.[公共医学][谷歌学者]
  • Jones AS、Phillips DE、Helliwell TR、Roland NJ。头颈部鳞癌的隐性淋巴结转移。欧洲耳鼻咽喉科。1993;250:446–449。doi:10.1007/BF00181087。[公共医学] [交叉参考][谷歌学者]
  • 弗吉尼亚州沃尔加。N0颈部的病理学。英国口腔颌面外科杂志。1999;37:205–209. doi:10.1054/bjom.1999.0035。[公共医学] [交叉参考][谷歌学者]
  • Schmalbach CE、Chepeha DB、Giordano TJ、Rubin MA、Teknos TN、Bradford CR、Wolf GT、Kuick R、Misek DE、Trask DK、Hanash S.与转移性口腔/咽部鳞癌相关基因的分子剖析和鉴定。耳鼻咽喉头颈外科。2004;130:295–302. doi:10.1001/archotol.130.3.295。[公共医学] [交叉参考][谷歌学者]
  • Cromer A、Carles A、Millon R、Ganguli G、Chalmel F、Lemaire F、Young J、Dembele D、Thibault C、Muller D等。通过微阵列分析鉴定与下咽癌肿瘤发生和转移潜能相关的基因。致癌物。2004;23:2484–98. doi:10.1038/sj.onc.1207345。[公共医学] [交叉参考][谷歌学者]
  • Chung CH、Parker JS、Karaca G、Wu J、Funkhouser WK、Moore D、Butterfoss D、Xiang D、Zanation A、Yin X等。利用基因表达模式对头颈部鳞癌进行分子分类。癌细胞。2004;5:489–500. doi:10.1016/S1535-6108(04)00112-6。[公共医学] [交叉参考][谷歌学者]
  • Roepman P、Kemmeren P、Wessels LF、Slootweg PJ、Holstege FC。检测头颈癌淋巴结转移的多个稳健特征。癌症研究。2006;66:2361–2366. doi:10.1158/0008-5472.CAN-05-3960。[公共医学] [交叉参考][谷歌学者]
  • Kallui R,Zeisberg M.癌症中的成纤维细胞。Nat Rev癌症。2006;6:392–401. doi:10.1038/nrc1877。[公共医学] [交叉参考][谷歌学者]
  • 波拉德JW。肿瘤诱导的巨噬细胞促进肿瘤进展和转移。Nat Rev癌症。2004;4:71–78. doi:10.1038/nrc1256。[公共医学] [交叉参考][谷歌学者]
  • Balkwill F.癌症和趋化因子网络。Nat Rev癌症。2004;4:540–550. doi:10.1038/nrc1388。[公共医学] [交叉参考][谷歌学者]
  • 乔伊斯·JA。肿瘤微环境的治疗靶向性。癌细胞。2005;7:513–520. doi:10.1016/j.ccr.2005.05.024。[公共医学] [交叉参考][谷歌学者]
  • Hunter K,Welch DR,Liu ET。遗传背景是转移潜能的重要决定因素。自然遗传学。2003;34:23–24. doi:10.1038/ng0503-23b。作者回复25。[公共医学] [交叉参考][谷歌学者]
  • van de Peppel J、Kemmeren P、van Bakel H、Radonjic M、van Leenen D、Holstege FC。在外部控制的微阵列实验中监测全球信使RNA的变化。EMBO代表。2003;4:387–393. doi:10.1038/sj.embor.embor798。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]

文章来自基因组生物学由以下人员提供BMC公司