拉曼光谱利用外周血样本进行癌症筛查的潜力
,1 ,1 ,2 ,三 ,三 ,4,5 ,1 ,6 ,1 ,7 ,8和9 安德鲁·哈里斯
1英国利兹利兹大学利兹牙科研究所口腔生物学
安塞拉·隆加里(Anxhela Lungari)
1英国利兹大学利兹牙科研究所口腔生物学
希拉·费舍尔
4英国利兹大学利兹分子医学研究所实验治疗科
5英国布拉德福德大学健康研究学院
薛斌B Yang
1英国利兹利兹大学利兹牙科研究所口腔生物学
尼古拉·库珀
6利兹教学医院NHS信托基金会和英国利兹利兹大学
詹妮弗·柯克汉姆
1英国利兹利兹大学利兹牙科研究所口腔生物学
D阿拉斯泰尔·史密斯
7AVACTA集团有限公司,英国约克约克科学公园约克生物中心
多米尼克·P·马丁·赫斯
8英国约克郡Calderdale和Huddersfield NHS Trust耳鼻喉科/头颈外科
Alec S高
9英国利兹大学利兹牙科研究所病理学系
1英国利兹利兹大学利兹牙科研究所口腔生物学
2英国利兹大学计算学院
三英国约克大学电子系
4英国利兹大学利兹分子医学研究所实验治疗科
5英国布拉德福德大学健康研究学院
6利兹教学医院NHS信托和英国利兹大学
7AVACTA集团有限公司,英国约克约克科学公园约克生物中心
8英国约克郡Calderdale和Huddersfield NHS Trust耳鼻喉科/头颈外科
9英国利兹利兹大学利兹牙科研究所病理学系
通讯作者。 2009年8月26日收到;2009年9月17日接受。
版权©2009 Harris等人;被许可方BioMed Central Ltd。 摘要
癌症对健康构成巨大负担,预计未来十年全球发病率将翻一番。在英国,有宫颈癌、乳腺癌和结直肠癌的筛查计划。仅使用外周血样本筛查实体恶性肿瘤的能力将彻底改变癌症服务,并允许早期诊断和干预。拉曼光谱通过光与物质的相互作用来检测天然生物化学,产生目标物质的高清晰度生物化学“指纹”。本文探讨了利用拉曼光谱通过外周血样本区分癌症和非癌症患者的可能性。从头颈癌患者和呼吸系统疾病患者中采集40份血样作为阳性对照。对所有样品进行拉曼光谱分析,并将结果光谱用于构建分类器,以区分癌症患者和呼吸系统患者的光谱;首先使用主成分分析(PCA)/线性判别分析(LDA),其次使用遗传进化算法。PCA/LDA分类器对区分癌症和呼吸系统组的敏感性和特异性为65%。通过“经过训练的”进化算法,敏感性得分达到75%,特异性达到75%。总之,这项初步研究已经证明了通过外周血样本将拉曼光谱用于癌症筛查和实体瘤诊断的可行性。这项技术需要在临床环境中进行进一步的研究。
介绍
癌症对健康构成巨大负担,预计未来十年全球发病率将翻一番[1]. 在英国,有宫颈癌、乳腺癌和结直肠癌的筛查计划,前提是早期检测可以提供早期干预,提高治愈率。目前的筛查计划针对的是一个无症状的亚组人群中的一种癌症,该亚组人群被认为具有较高的患病风险。通过外周血样本筛查社区患者是否患有任何实体恶性肿瘤的潜力将彻底改变癌症服务。阳性结果的患者可以转诊进行进一步调查;而阴性结果将减轻焦虑,并减少进一步昂贵调查的必要性和可能的相关发病率。
先前的工作调查了血浆和血清中脱氧核糖核酸(DNA)和核糖核酸的水平,试图检测癌症的存在[2-5]. 据报道,癌症患者的血清和血浆样品中这些核酸的浓度通常高于对照样品。水平升高的原因尚未完全阐明,但被认为是由于各种不同的机制,包括:;细胞凋亡、肿瘤坏死和可能的活性释放。然而,一项大型的欧洲多中心随机对照试验利用了来自不同类型癌症患者、健康对照组和慢性阻塞性肺病患者的样本,得出结论:DNA的血浆浓度对于癌症诊断或筛查来说既不敏感也不特异性[6].
荧光光谱也被用于检测血液样本中的潜在癌症[7]. 这些实验表明,癌症和非癌症队列之间的差异可能是由于肿瘤相关代谢物对荧光团的修饰、蛋白质组成的变化以及荧光团环境的可能变化,从而改变其物理化学性质。迄今为止,荧光光谱尚未应用于癌症检测的临床设置。
这突出表明需要进行敏感的生化分析,以检测血液制品生化成分的变化。这样就有可能检测出一个人是否因异常分子的存在而患有癌症;天然生化产物水平增加;或肿瘤形成引起的天然生物化学变化。
拉曼光谱依赖于入射光与目标物质相互作用时光子的散射。分子相互作用导致频率偏移,反映特定分子振动的能量。这些振动是特定于分子键的,允许用这种材料构建“生物化学指纹”。因此,任何导致天然生物化学变化的生理变化或病理过程都会导致拉曼光谱的变化。这些光谱非常详细,可以识别生物化学中的细微差异。该技术在组织诊断可能性方面受到了广泛关注,但通过外周血样本将其应用于癌症诊断的文献却很少[8-11].
生化化合物的拉曼光谱产生高维多元数据集;为了“解锁”这些数据以检测队列之间的细微差异,通过同样复杂的技术进行分析是至关重要的。多元统计方法,如主成分分析(PCA)和线性判别分析(LDA),通常被用于拉曼光谱的分类[12,13]. 主成分分析将数据转换为一个子空间,在该子空间中,主要变化模式被捕获为原始输入的线性组合。LDA是一种简单的分类方案,其目的不是根据数据的变化来降低数据的维数,而是有效地选择输入的线性组合,以最佳地将每个示例的分类区分为相应的标签,例如癌症/非癌症。与传统技术一起,本研究使用了一种更新颖的方法,即使用遗传进化规划来进化分类器。这种模式识别技术结合了规则和特征,以进化出分类器。
无论是基于对癌症产品的检测还是基于身体对疾病过程的反应,通过外周血样本进行癌症筛查的优势都是显而易见的。这项初步研究的目的是确定拉曼光谱结合复杂的数据分析技术是否可以区分癌症患者和非癌症患者的外周血样本。
材料和方法
患者样本
所有参与本研究的患者在完全知情同意的情况下都这样做了。从利兹头颈多学科诊所的20名患者采集外周血样本。所有患者都是新转诊到诊所的患者,尽管这也包括之前接受过癌症切除术并再次出现复发的患者。患者头部和颈部有肿瘤;舌、喉、皮肤和唾液腺。肿瘤的类型、级别和分期各不相同。
对照样本取自利兹胸科诊所的患者。这些患者患有一系列呼吸道疾病,包括哮喘、慢性阻塞性肺病(COPD)和支气管扩张症。有癌症病史或正在接受癌症治疗的患者被排除在研究之外。
伦理学
利兹-西德道德委员会寻求并批准了道德意见。参考号:06/Q1205/226。
每个患者在含有3.2%柠檬酸钠的专用试管中采集2份血样。立即以3000 rpm的转速离心样品约10分钟。去除上清液(血浆)并将其分为4个冷冻瓶。这些小瓶在使用前放置在-80°C的冷冻柜中储存。
拉曼光谱
使用Renishaw“System 1000”拉曼显微镜从所有样品中获得拉曼光谱。Sacher Lasertechnik Littrow外腔激光器以783 nm的波长进行激发。拉曼散射光的检测是通过Renishaw RenCam NIR增强型热电冷却CCD相机进行的。光谱仪与徕卡DMLM显微镜耦合;激发光通过50倍徕卡显微镜物镜传递到样品,散射光从样品中收集。光谱仪使用全息陷波滤光片从收集的光中去除瑞利散射光。然后,拉曼散射光通过单级250 mm焦距光栅光谱仪分散在CCD阵列探测器上。显微镜配备了电动XYZ定位台(Prior),在X和Y轴上集成了位置传感器(Renishaw)。使用Renishaw WiRE软件进行仪器控制和数据采集,该软件在Galactic GRAMS软件中运行。
拉曼测量
每个样品都被解冻并用吸管移到石英显微镜载玻片上。在进行拉曼光谱测量之前,让其风干。记录了600-1800 nm的扩展光谱读数。对于所有样品,获取光谱读数的时间为20秒。显微镜透镜是一个具有0.75数值孔径的50倍空气物镜。从每个血浆样品中获得了十个光谱。然后可以将这10个光谱转换为每个样品的平均光谱。癌症患者和非癌症患者的血浆样本交替进行,以排除时间和机器变异性的任何可能影响。
数据规范化
每个拉曼光谱的强度不仅取决于样品特性,还取决于操作设备。目前使用的设备未经校准,因为尚未设计实验校准协议。对原始数据进行归一化处理,以便对样本数据进行比较,如下所示:;
•对数据进行重新采样,以便通过最近点之间的插值,所有测量值都对应于相同的拉曼位移点(601、602、1800)。
•对每个光谱进行归一化处理,以使x=700和1400的拉曼位移之间的曲线下面积相等。归一化因子仅基于此部分,因为在此范围之外的光谱会出现更大的变化;然而,对于每个样本,在整个频谱上使用相同的乘法因子。归一化过程似乎很好地对齐了光谱强度。整个曲线下的实际面积在1.6和1.9之间变化。
•使用高斯窗口函数(加权线性滤波器)对数据进行平滑处理,以消除一些噪声影响。使用的重量为[0.0146 0.0831 0.2356 0.3333 0.2356 0.0831 0.0146]。由于使用了测量技术,我们期望光谱局部平滑,并且此过程有助于减少数据中的测量噪声。
•然后生成每个患者的平均光谱,用于分析。
分类
拉曼光谱是高维数据集。每个光谱包含1200个拉曼位移强度。我们希望能够从每个患者的平均光谱中区分癌症和非癌症(呼吸道)样本。通常,降低数据的维数是有用的,这里我们考虑了三种方法:(1)通过使用双样本t检验从1200个数据点中选择25个最佳特征来识别二进制分类任务的良好特征,(2)使用主成分分析(PCA)将数据映射到低维空间,这里有25个分量,(3)使用两者的组合,首先选择100个最佳特征,然后PCA将其减少到25。为了区分癌症和非癌症队列,对简化的光谱进行了LDA。为了评估性能,进行了100次十倍的交叉验证,并计算了平均性能,以避免分区中的偏差。
遗传算法
平均谱作为输入序列提供给隐式上下文表示笛卡尔遗传规划算法(IRCGP)[14,15]. IRCGP使用进化计算方法学习能够区分数据类的分类器。诱导分类器采用应用于输入数据序列中特定偏移量的编程表达式的形式。这些表达式由一组简单的数学函数组成。函数的选择和连通性,以及输入序列中使用的偏移量的选择,都由算法的进化过程决定。将输入序列平均分为训练集和测试集。为了防止过度学习,一旦测试序列的分类精度开始下降,就停止分类器的训练。
结果
所有癌症患者都同意参与研究。平均年龄为64.7岁,其中男性12例,女性8例。对照组招募了21名患者,1名患者因当天晚些时候进行肾透析而减少,因此使用了20名患者。对照组患者的平均年龄为66.8岁,其中男性11岁,女性9岁。表描述了本研究中患者的癌症类型。表描述了呼吸系统患者所患的疾病。
表1
癌症类型 | 患者人数 | 淋巴结受累 |
鳞状细胞癌 | 15 | 8 |
|
恶性黑色素瘤 | 1 | 1 |
|
基底细胞癌 | 1 | 0 |
|
未知主节点 | 1 | 1 |
|
默克尔细胞瘤 | 1 | 1 |
|
粘液表皮样 | 1 | 0 |
表2
呼吸道疾病 | 患者人数 |
慢性阻塞性肺病和哮喘 | 1 |
|
仅COPD | 11 |
|
仅哮喘 | 4 |
|
支气管扩张症伴Kartagener综合征 | 1 |
|
支气管扩张 | 1 |
|
支气管扩张与哮喘 | 1 |
|
肺纤维化 | 1 |
原始光谱显示了强度水平的一些变化(图),并且所概述的归一化程序似乎为每个个体创建了对齐良好的光谱(图).
从癌症患者血浆样品中获得的十个拉曼光谱的示例集x轴表示入射光的波长偏移(拉曼偏移)。
数据(图1)经过归一化处理后,癌症患者血浆样品的十个拉曼光谱示例集.
数字和说明了20名呼吸系统患者和20名癌症患者的平均拉曼光谱的图形表示。可以看出,每个队列内以及队列之间的光谱都是相似的。图证明了癌症组和非癌症(呼吸)组的两组光谱是多么相似。
用于对癌症和呼吸系统数据进行分类的四种分类方案的分类结果如表所示在100次10倍交叉验证的平均运行中,传统LDA方法的准确度约为65%。遗传进化算法的最佳性能是75%的灵敏度和75%的特异性,其准确率为83%。显示的结果来自一个10倍的交叉验证,性能的提高是由于学习的规则以非线性的方式组合各种特征来预测类标签。作为一项额外的测试,当光谱被随机分配给癌症/非癌症标签时,所有分类器的表现都不比随机好,这进一步证明了我们可以区分癌症和非癌症样本。
表3
各种分类器系统在区分癌症和非癌症(呼吸道)样本方面获得的结果。
分类器方法 | 准确度(%) | 灵敏度(%) | 特异性(%) |
t检验中最佳25项特征的LDA | 57.9 | 55.6 | 60 |
|
PCA-LDA(25个主要组成部分的LDA) | 65 | 64.7 | 65.3 |
|
100最佳>PCA 25>LDA | 65.8 | 64.9 | 66.7 |
|
遗传进化算法 | 83 | 75 | 75 |
图示出了接收器工作特性曲线(ROC曲线)。这描述了敏感性与1-特异性。对于使用的进化算法,可以看出,最准确的算法在测试数据上产生了75%的灵敏度和75%的特异性。
通过进化算法对癌症和非癌症样本进行分类的ROC曲线.
讨论
由于呼吸系统疾病患者的年龄、性别分布和生活方式风险因素相似,以及他们的并存状态,因此将他们作为本研究的对照组。因此,我们希望消除由于身体对疾病过程的共同反应而导致的队列之间的任何差异。
我们已经证明,使用拉曼光谱和LDA分析可以在外周血样本中对癌症和非癌症进行大约65%的敏感性和特异性鉴别。然而,当遗传程序应用于数据时,这将敏感性提高到75%,特异性提高到75%。
在一项与我们的Pichardo-Molina类似的研究中等使用拉曼光谱比较乳腺癌患者和非癌症患者的血清样本[16]. 他们招募了11名癌症患者(4名患有转移性疾病)和12名健康对照者参与研究。最初,PCA用于定义两个队列之间的波长差异,并最终确定天然生物化学中的差异发生在哪里。由于复杂的拉曼“指纹”和光谱中多个可能的峰值来源,后者被证明是不成功的。作者利用PCA评分的LDA获得了90%的灵敏度,并得出结论,拉曼光谱的差异与β-胡萝卜素水平有关(峰值约为1155和1523);癌症队列中的数值通常较低。Li报告了类似的发现等2001使用入射波长为488 nm和514.5 nm的拉曼系统[17]. 使用了1022个包含各种恶性肿瘤、健康对照和其他疾病的样本的大型训练集,然后是432个测试样本。结果表明,癌症组、非癌症组和其他疾病组的准确率在70%至100%之间,尽管他们的血液样本在4°C下保存了长达4天,使得样本降解成为一个可能的问题;特别是如果在不同的时间点运行不同的队列。在我们的研究中,LDA还强调了1150区域拉曼光谱的差异。进化算法发现了1000个光谱区域中癌症组和非癌症(呼吸)组之间的差异。该区域以苯丙氨酸带为主,可能代表该化合物在癌症发生时的天然状态变化。必须记住的是,虽然化合物在光谱的某些区域显示出强烈的信号,但它们还有许多其他峰,可以用来确定潜在的生物化学复合物。
在对传统巴氏涂片检查准确性的回顾中,Nanda及其同事发现敏感性在30到87%之间,特异性在86到100%之间[18]. 乳腺癌筛查通过三年一次的乳房X光检查进行;Houssami及其同事(2003年)发现,乳房X光检查的敏感性约为75%,特异性约为88%[19]. 英国最近推出了针对50岁以上人群的粪便隐血检测。根据受影响的肠道区域,敏感性有很大差异(12-82%);特异性约为95%[20]. 我们在当前研究中测试的敏感性与已建立的筛查计划的敏感性大致相似。重要的因素是特异性需要非常高,这样就不会遗漏任何癌症。在这项工作中使用ROC曲线允许采用“滑动尺度”方法,其中敏感性增加与特异性降低相匹配,反之亦然,允许设置“决策阈值”。
我们的研究存在局限性,尤其是样本量,这使得对人群进行推断变得困难。这项研究是作为一个试点项目进行的;选择了头颈部患者,但选择的恶性肿瘤不仅仅是鳞状细胞癌(90%的头颈部癌症)。该小组将进行的下一项试验是区分恶性肿瘤(胃肠道、乳腺等)和非癌症队列。然后需要进一步的工作来对患者进行肿瘤负荷和扩散的分类。这些试验中使用的患者需要在测量完成后进行随访,尤其是非癌症组;因为这可能包括尚未确诊的癌症患者或尚未记录的癌前病变患者。在这种情况下,看似错误的结果很可能是准确的。
最终目的是能够在临床环境中区分癌症;在这项研究中,各组表现得相当粗糙,但最初的研究只是为了使用这种方法区分癌症和非癌症。
未来很可能证明拉曼光谱可以从外周血样本中诊断实体肿瘤;然而,一个更可行的前景是能够筛查有癌症风险的个体。与在医院进行的有创性子宫颈筛查和乳房X射线照相相比,拉曼血液分析可以在局部手术中实现。除了筛查之外,该测试还可以作为那些有恶性疾病症状的全科医生的辅助诊断手段。
结论
这项初步研究证明了通过外周血样本将拉曼光谱用于癌症筛查和实体肿瘤诊断的可行性。这项技术需要在临床环境中进行进一步的研究。
作者的贡献
ATH和AL对血液样本进行了拉曼光谱分析。CJN对数据进行了预处理,并进行了线性判别分析。MAL和SLS对进化算法进行了训练和测试。SEF、ASH和NC提供了样本支持。DAS为拉曼系统提供支持。JK、SEF、DAS、ASH和XY为样本收集和方法提供了支持。DPM-H为临床应用提供了支持。所有作者都提供了编辑稿件。
所有作者都阅读并批准了手稿。
致谢
作者希望感谢英国癌症研究所对主要作者的资助。
非常感谢利兹头颈MDT和利兹胸科诊所。
工具书类
- 伊顿L.全球癌症发病率将在2020年翻一番。英国医学杂志。2003;326:728.doi:10.1136/bmj.326.7392.728/a。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]
- Teare医学博士,Woll PJ。基因组测试:癌症不可靠?重点关注循环DNA和肺癌。专家修订版分子诊断。2007;7:699–702. doi:10.1586/14737159.7.699。[公共医学] [交叉参考][谷歌学者]
- Xue X、Zhu YM、Woll PJ。循环DNA与肺癌。Ann N Y科学院。2006;1075:154–164. doi:10.1196/annals.1368.021。[公共医学] [交叉参考][谷歌学者]
- Leon SA、Shapiro B、Sklaroff DM、Yaros MJ。癌症患者血清中游离DNA及治疗效果。癌症研究。1977年;37:646–650.[公共医学][谷歌学者]
- Shapiro B,Chakrabarty M,Cohn EM,Leon SA。良性或恶性胃肠疾病患者循环DNA水平的测定。癌症。1983;51:2116–2120. doi:10.1002/1097-0142(19830601)51:11<2116::AID-CNCR2820511127>3.0.CO;2-S型。[公共医学] [交叉参考][谷歌学者]
- Gormally E、Hainaut P、Caboux E、Airoldi L、Autrup H、Malaveille C、Dunning A、Garte S、Matullo G、Overviad K等。血浆中DNA含量与癌症风险:一项前瞻性研究。国际癌症杂志。2004;111:746–749. doi:10.1002/ijc.20327。[公共医学] [交叉参考][谷歌学者]
- Madhuri S、Vengadesan N、Aruna P、Koteeswaran D、Venkatesan P、Ganesan S。血浆天然荧光光谱在口腔恶性肿瘤表征中的应用。光化学和光生物学。2003;78:197–204. doi:10.1562/0031-8655(2003)078<0197:NFSOBP>2.0.CO;2[公共医学] [交叉参考][谷歌学者]
- Koljenovic S、Schut TB、Vincent A、Kros JM、Puppels GJ。拉曼光谱检测硬脑膜脑膜瘤。分析化学。2005;77:7958–7965. doi:10.1021/ac0512599。[公共医学] [交叉参考][谷歌学者]
- Mahadevan-Jansen A、Mitchell MF、Ramanujam N、Utzinger U、Richards-Kortum R。开发光纤探针以测量活体颈部组织的NIR拉曼光谱。光化学-光生物。1998年;68:427–431. doi:10.1111/j.1751-1097.1998.tb09703.x。[公共医学] [交叉参考][谷歌学者]
- Molckovsky A、Song LM、Shim MG、Marcon NE、Wilson BC。结肠近红外拉曼光谱的诊断潜力:区分腺瘤和增生性息肉。胃肠内脏检查。2003;57:396–402. doi:10.1067/mge.2003.105。[公共医学] [交叉参考][谷歌学者]
- Stone N,Stavroulaki P,Kendall C,Birchall M,Barr H.拉曼光谱早期检测喉癌:初步结果。喉镜。2000;110:1756–1763. doi:10.1097/00005537-20010000-00037。[公共医学] [交叉参考][谷歌学者]
- 诺丁汉一世、杰尔·G、诺丁汉PL、比森一世、青岛O、波拉克·JM、史蒂文斯·MM、亨奇·LL。活体细胞体外非侵入性研究中拉曼光谱的多元分析。分子结构杂志。2005;744-747:179–185。doi:10.1016/j.molstruc.2004.12.046。[交叉参考][谷歌学者]
- Notingher I.基于细胞的拉曼光谱生物传感器。传感器。2007;7:1343–1358. doi:10.3390/s7081343。[交叉参考][谷歌学者]
- Smith SL,Leggett S,Tyrrell AM。进化图像处理过滤器的隐式上下文表示。程序。第七届图像分析和信号处理进化计算研讨会。计算机科学课堂讲稿。2005;3449:407–416。 [谷歌学者]
- Smith SL、Gaughan P、Halliday DM、Ju Q、Aly NM、Playfer JR。使用进化算法诊断帕金森病。遗传编程和进化机器。2007;8:433–447。doi:10.1007/s10710-007-9043-9。[交叉参考][谷歌学者]
- Pichardo-Molina JL、Frausto-Reyes C、Barbosa-Garcia O、Huerta-Franco R、Gonzalez-Trujillo JL、Ramirez-Alvarado CA、Gutierrez-Juarez G、Medina-Gutierrez C。乳腺癌患者血清样品的拉曼光谱和多元分析。激光医学科学。2007;22:229–236. doi:10.1007/s10103-006-0432-8。[公共医学] [交叉参考][谷歌学者]
- Li X,Bai J.血清荧光和拉曼光谱在癌症诊断中的研究。SPIE会议记录。2001;4432:124–129.完整文本。[谷歌学者]
- Nanda K、McCorry DC、Myers ER、Bastian LA、Hasselblad V、Hickey JD、Matchar DB。帕巴尼科劳试验在宫颈细胞学异常筛查和随访中的准确性:一项系统综述。Ann医学实习生。2000;132:810–819.[公共医学][谷歌学者]
- Houssami N,Irwig L,Simpson JM,McKessar M,Blome S,Noakes J.悉尼乳房成像准确性研究:有症状的年轻女性乳房造影和超声检查的敏感性和特异性比较。AJR Am J伦琴诺。2003;180:935–940.[公共医学][谷歌学者]
- Nakama H,Kamijo N,Fujimori K,Horiuchi A,Fattah AS,Zhang B.粪便隐血试验对肛门疾病的临床诊断准确性。Int J Qual医疗保健。1997;9:139–141. doi:10.1093/intqhc/9.2.139。[公共医学] [交叉参考][谷歌学者]