基于人群的病例对照研究中,靶向蛋白组学衍生生物标记谱在液体活检中开发了一种多蛋白分类器,用于早期检测食管鳞癌
,#1,2 ,#三 ,4 ,4 ,4 ,5 ,6 ,5,7 ,5,7 ,1,2,5和5,6,8 杨晓荣
1中国山东省济南市文化西路107号山东大学齐鲁医院临床流行病学室,邮编:250012
2山东大学临床研究中心,山东大学齐鲁医院,济南
陈索
三复旦大学公共卫生学院流行病学与卫生统计系,中国上海
张同超
4山东大学公共卫生学院流行病学与卫生统计系,济南
尹晓林
4山东大学公共卫生学院流行病学与卫生统计系,济南
金玉满
4山东大学公共卫生学院流行病学与卫生统计系,济南
余静茹
6瑞典斯德哥尔摩卡罗琳斯卡研究所医学流行病学和生物统计学系
李进
5复旦大学泰州卫生科学研究院,中国泰州
7中国上海市松湖路2005号复旦大学人类表型研究所和生命科学学院基因工程国家重点实验室,200438
陈兴东
5复旦大学泰州卫生科学研究院,中国泰州
7中国上海市松湖路2005号复旦大学人类表型研究所和生命科学学院基因工程国家重点实验室,200438
明路
1中国山东省济南市文化西路107号山东大学齐鲁医院临床流行病学室,邮编:250012
2山东大学临床研究中心,山东大学齐鲁医院,中国济南
5复旦大学泰州卫生科学研究院,中国泰州
叶伟民
5复旦大学泰州卫生科学研究院,中国泰州
6瑞典斯德哥尔摩卡罗林斯卡研究所医学流行病学和生物统计学系
8福建医科大学消化道肿瘤流行病学与卫生统计系暨教育部重点实验室,福州
1中国山东省济南市文化西路107号山东大学齐鲁医院临床流行病学室,邮编:250012
2山东大学临床研究中心,山东大学齐鲁医院,济南
三复旦大学公共卫生学院流行病学与卫生统计系,中国上海
4山东大学公共卫生学院流行病学与卫生统计系,济南
5复旦大学泰州卫生科学研究院,中国泰州
6瑞典斯德哥尔摩卡罗林斯卡研究所医学流行病学和生物统计学系
7中国上海市松湖路2005号复旦大学人类表型研究所和生命科学学院基因工程国家重点实验室,200438
8福建医科大学消化道肿瘤流行病学与卫生统计系暨教育部重点实验室,福州
通讯作者。 #贡献均等。
收到日期:2020年11月25日;2021年2月4日验收。
- 补充资料
附加文件1:表S1。92个蛋白质来自Olink multiplex Oncology II小组。表S2。基于不同癌症阶段的选定参与者、对照组和病例的一般信息。图S1。23个初步鉴定的蛋白质的蛋白质相互作用。每个节点代表一种蛋白质,基因名称标记在节点的右上角。表S3。对早期ESCC和对照组之间差异表达的23种已鉴定蛋白质进行基因本体富集分析,包括三类,即分子功能、细胞成分和生物过程。选择了每个富集类别中的前5个基因本体。数据来自在线ConsensusPathDB-人机交互网络数据库http://cpdb.molgen.mpg.de/.表S4。对23种在早期ESCC和对照之间差异表达的蛋白质进行通路富集分析。选择了前7个富集途径。数据来自在线ConsensusPathDB-人机交互网络数据库http://cpdb.molgen.mpg.de/.图S2。对23种初步鉴定的蛋白质进行无监督的分层聚类分析,以区分早期食管鳞癌(ESCC)和健康对照。图S3。基于ROC曲线下面积(AUC),通过十倍交叉验证,提出了最小绝对收缩和选择算子(LASSO)的选择特征。通过基于最小标准误差的十倍交叉验证,选择LASSO模型中的调谐参数(λ)。y轴表示AUC。下x轴表示对数(λ)。沿着上x轴的数字表示预测因子的平均数量。红点表示具有给定λ的每个模型的平均AUC值,穿过红点的竖线表示AUC的上下值。垂直黑线定义了λ的最佳值,其中模型最适合数据。图S4。基于确定的五蛋白组预测个体ESCC风险的列线图。 GUID:EC193345-91B1-4986-B69C-FD70A6E70481
- 数据可用性声明
应合理要求,可从相应作者处获得支持本研究结果的所有数据。
摘要
背景
由于缺乏特异性血液生物标记物,食管鳞状细胞癌(ESCC)的早期诊断仍然是一个挑战。我们旨在开发一种血清多蛋白标记物,用于早期检测ESCC。
方法
我们从中国一个高危地区完成的ESCC病例对照研究中选择了70名健康对照、30名癌前患者、60名I期患者、70名II期患者和70名III/IV期ESCC患者。Olink Multiplex Oncology II靶向蛋白质组学小组使用邻近延伸法同时检测血清中92种癌症相关蛋白的水平。
结果
我们发现血清中10个上调和13个下调的蛋白质生物标记物可以区分早期食管鳞癌和健康对照,这通过与食管鳞癌病理进展的显著剂量反应关系得到了验证。应用最小绝对收缩和选择算子(LASSO)回归和反向消除算法,将ANXA1(annexin A1)、hK8(kallikrein-8)、hK14(kallikrein-14)、VIM(vimentin)和RSPO3(R-spondin-3)保留在最终模型中,以区分早期ESCC病例和曲线下面积(AUC)健康对照组0.936(95%置信区间:0.899~0.973)。通过五次交叉验证,五蛋白分类器在训练和测试数据中的平均准确率分别为0.861和0.825。
结论
我们的研究表明,ANXA1、hK8、hK14、VIM和RSPO3血清蛋白的组合可被视为ESCC筛查和早期诊断的潜在工具,特别是建立了ESCC控制的三级分层筛查策略。
补充信息
在线版本包含补充材料,请访问10.1186/s40364-021-00266-z。
关键词:食管鳞癌,早期检测,诊断生物标志物,亲和蛋白质组学,邻近延伸分析,筛选
背景
据国际癌症研究机构估计,2018年全球新增食管癌病例572034例,食管癌死亡人数508585人,大多数国家的死亡率超过0.8[1]. 食管癌的5年总生存率为15%至25%,因为大多数患者诊断为晚期,预后不佳[2,三]. 证据表明,东亚地区以人群为基础的上消化道癌症筛查项目可以有效识别癌前病变和早期癌症,及时治疗可改善预后[4,5]. 政府资助的内镜筛查项目也针对中国食管癌高发地区的无症状成年人进行,但是正在进行的项目给公共卫生带来了巨大的负担:只有一小部分居民可以参加胃镜检查项目,即使在这一小部分人群中,对高危受试者的长期随访在内镜管理方面也变得越来越繁重[6]. 因此,为了确定真正的内窥镜检查高危人群,经济高效的快速血液筛查试验(液体活检)是风险分层的理想解决方案[7].
目前,人们已经探索了各种血液生物标记物,包括无细胞DNA、无细胞RNA、非编码RNA、蛋白质等的突变和甲基化状态,以通过不同的检测平台实现多种癌症类型的早期检测[8——11]. 食管鳞状细胞癌(ESCC)是食管癌的主要组织学亚型(>80%),特别是在亚洲和东非[12]显示食管腺癌的危险因素和分子特征。到目前为止,在临床应用中很少建立用于筛选早期ESCC的有效生物标志物,因为大多数潜在生物标志物的曲线下面积(AUC)通常低于80%[8,13].
为了鉴定新的蛋白质生物标志物,邻近延伸分析(PEA)的发展使得能够在每个实验中同时定量一堆样品的多个靶向蛋白质生物标志物,从而能够快速筛选可能的生物标志物。PEA创新性地将抗体连锁检测方法的特异性与聚合酶链反应(PCR)的敏感性结合起来,允许仅使用微升血清进行多重生物标记物检测和定量,具有可靠的分析精度[14]. 本研究基于中国上消化道癌高发区泰兴(约113万人口)基于前瞻性设计的基于人群的病例对照研究,应用PEA技术鉴定早期ESCC的候选血清蛋白生物标志物。
方法
研究设计和参与者
我们在以往的研究中描述了这项基于大规模人群的病例对照研究的研究设计[15——18]. 简言之,我们试图招募2010年10月至2013年9月泰兴所有新诊断的食管癌患者,纳入标准仅限于居住在泰兴至少5年的40-85岁参与者。在当地四家最大医院的内窥镜病房(涵盖了近90%的当地临床诊断),受试者被邀请由经过培训的采访者完成问卷调查,如果他们被怀疑患有上消化道肿瘤,则提供生物样本。此外,我们还通过与当地癌症登记系统匹配,在内镜检查单元中登记了错过的食管癌患者。我们最终从医院内窥镜室收集了1401例疑似食管病例,并在3年内通过当地癌症登记系统收集了280例报告的食管病例,本研究包括33例癌前病变患者(高度上皮内瘤变、原位癌和高度异型增生)和1418例ESCC患者。根据美国癌症分期联合委员会手册第8版,通过住院病历评估1418名ESCC患者的肿瘤分期[19]我们发现另外4名癌前患者(从ESCC中重新分类)、84名I期患者、333名II期患者、158名III期患者、145名IV期患者和694名未知肿瘤分期患者。在同一时期,我们采用了按性别和5岁年龄组进行频率匹配的方法来选择上消化道癌症病例的对照参与者。最后,1992名合格对照组参与了我们的研究(参与率:70.4%)。
92种蛋白质的假设检验显著性水平设置为0.001,统计能力设置为90%。由于本研究致力于鉴定高效血清蛋白生物标记物,因此估计患者组和对照组之间显著生物标记物的差异应至少为标准偏差的0.8倍。每组的样本量计算为69人,我们计划为每组选择70名受试者。
在本研究中,我们进一步将合适的血样限制为临床治疗前采集的、没有中度溶血的血样。排除溶血样本和治疗后样本后,将其余30例癌前患者和60例I期患者纳入研究。然后,我们首先从II期食管鳞癌患者中随机选择70名患者,并通过性别和5岁年龄组与II期食管癌患者匹配,随机选择70例晚期患者(III期或IV期)和70名健康对照。如果某一年龄组的患者样本量不足,则从相邻年龄组中补充。
我们最终在生物标记物研究中纳入了30名癌前患者、60名I期患者、70名II期患者、70-III/IV期患者和70名健康对照(图). 在我们的研究中,早期ESCC被定义为癌前病变和I期癌症,因为其具有微创治疗、较好的预后和较小的样本量以及社区实践中的早期筛查要求[20]. 在没有外部验证的情况下,我们进行了血清蛋白水平和ESCC病理进展之间的剂量-反应关系,以进一步说明所确定的生物标记物的可靠性。
Olink多重肿瘤学II靶向蛋白质组学小组
使用Olink肿瘤学II 96-well分析血清蛋白,其中92个寡核苷酸标记的抗体探针对基于PEA技术与其特定靶蛋白结合[14,21]. 制造商已记录PEA分析的精确度、再现性和可扩展性(网址:http://www.olik.com)和相关文章[14,21]. Olink肿瘤学II小组92种蛋白质的蛋白质名称、基因名称和缩写如表S所示1.
样品处理和检测
血液样本在装运前已储存在−80°C冰箱中。使用冷链将血清样本运送至Olink Proteomics AB(瑞典乌普萨拉),并将样本随机放置在四个96 well板中。在每个板上,我们包括三个用于板间数据标准化的“板间对照”和三个用于建立背景水平的“阴性对照”。根据制造商的协议,对从平板生成的数据进行分析,包括归一化和线性化。蛋白质水平表示为归一化蛋白质表达(NPX)值,这是对数尺度上的相对定量,是通过减去延伸对照的值而归一化的循环阈值。所有化验特征,包括检测限值、化验性能测量和验证,均可从制造商网站获取(http://www.olik.com/products网站/).
统计方法
采用卡方检验或单因素方差分析检验亚组中分类变量或连续变量分布的差异。采用探索性多元分析(主成分分析,PCA)测试研究组的潜在聚类。使用无条件logistic回归分析了每个蛋白NPX值与早期ESCC之间的关系,并用P(P)通过Benjamini-Hochberg方法调整值以控制假发现率(FDR<0.01)。对于潜在的蛋白质生物标记物,我们进一步应用Spearman相关性来评估蛋白质水平与ESCC分期之间的剂量-反应关系,并且P值也通过Benjamini-Hochberg方法进行了调整。对于所有初步验证的蛋白质,将无监督聚类方法应用于数据,以识别蛋白质簇并直观评估其与疾病状态的关联。使用STRING数据库对识别的蛋白质进行蛋白质相互作用网络分析(https://string-db.org/). 在线ConsensusPathDB人际互动网络数据库(http://cpdb.molgen.mpg.de/)用于已识别蛋白质生物标记物的基因本体(GO)富集分析和通路富集分析。检查了三种GO富集类型,即生物过程、细胞成分和分子功能。
为了开发多生物标记物分类器来区分早期ESCC病例和健康对照,我们使用最小绝对收缩和选择算子(LASSO)回归来选择最佳蛋白质。此外,我们还进一步使用了后向淘汰逻辑回归模型来构建更简洁有效的分类模型。使用受试者操作特征(ROC)曲线评估分类器的特异性和敏感性,并使用尤登指数选择最佳截止点,使灵敏度和特异性之和最大化。应用AUC来总结诊断模型的分类准确性,并通过非参数bootstrap估计95%置信区间(CI)。在构建分类器所用的相同数据上,使用五倍交叉验证来评估我们的多蛋白模型的有效性。所有统计分析和图形绘制均使用R(3.6.2版)进行。
结果
患者概述和分析性能特征
健康对照组和表S中四组不同癌症分期的食管鳞癌患者的年龄和性别分布均匀2基于质量控制样品,四个平板的平均灰内和灰间变异系数(CV)分别为5%和23%。
主成分分析
70名健康对照组、30名癌前患者、60名I期患者、70名II期患者和70名III/IV期患者的主成分分析结果如图所示a.轴上的数字表示每个主成分捕获的变化。前两个主要成分(PC1 27.9%,PC2 12.3%)解释了92个血清蛋白水平的40.2%,并从患有PC2的ESCC患者中分离出健康对照组。因此,PC2在不同组中的分布如图所示。b、 方差分析发现五组之间存在显著差异(P(P) = 2.5e-10)和两两比较显示,健康对照组与各ESCC组有显著差异。
蛋白质在不同参与者群体中的分布。一,基于92个蛋白质的主成分分析(PCA)的1维(PC1)和2维(PC2)分布。b条与健康对照组相比,与主成分2(PC2)的方差分析成对比较
评估每种蛋白质的诊断效率
为了确定早期食管鳞癌的潜在蛋白质生物标记物P(P)图中显示了由每种蛋白质的FDR(Q值)和AUC调整的值,以区分健康对照组和早期ESCC病例根据Q值小于0.01的标准,初步鉴定出26个潜在蛋白,即(按Q值排序)、ANXA1、hK8、CDKN1A、ABL1、SCAMP3、EGF、LYN、MetAP2、PVRL4、KLK13、ADAMTS15、hK14、VIM、TXLNA、GPC1、RSPO3、hK11、TRAIL、5NT、CPE、FADD、TGFR2、SEZ6L、CD160、FCRLB和ESM 1。26种蛋白质中ANXA1的最大和最小AUC分别为0.770和ESM 1的0.652。
92种蛋白质的点图用于区分早期食管鳞癌和健康对照P(P)值、通过Benjamini-Hochberg方法调整的Q值以及每个蛋白质的曲线面积(AUC)
为了评估蛋白质水平与从健康对照组到晚期食管鳞癌进展之间的剂量反应关系,不同组的小提琴图和P(P)图中显示了这26种蛋白质经FDR(Q值)调整后的Spearman相关值根据Q值小于0.01的标准,血清中其余10个上调(ANXA1、CDKN1A、ABL1、SCAMP3、EGF、LYN、MetAP2、VIM、TXLNA和FADD)和13个下调(hK8、KLK13、ADAMTS15、hK14、GPC1、RSPO3、hK11、TRAIL、5NT、CPE、TGFR2、SEZ6L和CD160)蛋白生物标记物被鉴定为潜在的ESCC生物标记物。
初步鉴定了26种蛋白质在五组中的分布。通过Benjamini Hochberg方法调整的Q值代表血清中每种蛋白质水平与食管鳞状细胞癌分期之间的Spearman相关性。Y轴为各值血清蛋白水平的NPX值
蛋白质相互作用网络和GO富集分析
蛋白质相互作用网络分析(图S1)23个初步鉴定的蛋白质中,5NT、ABL1、ANXA1、CDKN1A、EGF、GPC1、hK11、hK14、hK8、KLK13、LYN、TGFR2和VIM具有潜在的相互作用。GO富集分析进一步揭示,信号受体结合和催化活性是“分子功能”类别的顶级本体,而细胞外空间和细胞外器官是“细胞成分”类别的顶层本体,刺激反应的负调节和刺激反应的调节是“生物过程”类别中最丰富的本体论(表S三). 路径富集分析表明,TP53网络和Glypican 1网络是前两个富集路径(表S4). 对23种初步鉴定的蛋白质进行的无监督分层聚类分析表明,早期ESCC病例与健康对照组有显著差异(图S2).
多蛋白诊断模型的建立
考虑到这23个蛋白质之间的复杂关系以及使用这些生物标记物的临床可行性,进行了LASSO回归,以基于降维选择最佳蛋白质,以开发紧凑的多蛋白分类器(图S三). 剩下的11个蛋白,即ANXA1、hK8、CDKN1A、MetAP2、hK14、VIM、GPC1、RSPO3、TRAIL、5NT和SEZ6L,用于构建AUC为0.950(95%CI:0.918~0.982,图红线)。由于该模型仍然存在多重共线性和冗余蛋白质生物标志物的问题,因此进一步应用向后消除算法构建了一个简单有效的多蛋白模型。最后,保留ANXA1、hK8、hK14、VIM和RSPO3以区分早期ESCC病例和健康对照组,AUC为0.936(95%CI:0.899~0.973,图。黑线)。在最优尤登指数下,分类器的特异性和敏感性分别为78.6%和96.7%,分类准确度为0.888。此外,通过5倍交叉验证,五蛋白模型在训练和测试数据中的平均准确率分别为0.861和0.825。为了直观理解,蛋白质水平(四分位数)的逻辑回归分析结果如表所示,并创建了一个易于使用的预测列线图工具,以基于五蛋白面板评估单个ESCC风险(图S4).
所选多蛋白分类器的受试者操作特性(ROC)曲线。用11种蛋白质模型拟合曲线下的红线和面积(AUC)值,即ANXA1、hK8、CDKN1A、MetAP2、hK14、VIM、GPC1、RSPO3、TRAIL、5NT、SEZ6L。用ANXA1、hK8、hK14、VIM和RSPO3 5个紧凑蛋白模型拟合95%置信区间(CI)和AUC值的黑线。利用logistic回归建立诊断模型
表1
蛋白质 | 控制 | 案例 | 原油OR95%CI | 调整后OR(95%CI)† |
---|
ANXA1作为分类变量 |
第一个四分位数(低) | 30 | 10 | 1.0(参考) | 1.0(参考) |
第二个四分位数 | 21 | 19 | 2.714 (1.071–7.209) | 3.364 (0.722–17.31) |
第三个四分位数 | 13 | 27 | 6.231 (2.351–16.513) | 8.128(1.403–57.13) |
第四个四分位数(高) | 6 | 34 | 17.00 (5.520–52.359) | 31.76 (3.804–355.3) |
P(P)用于趋势 | | | 1.1e-07日 | 0.0020 |
hK8作为分类变量 |
第一个四分位数(低) | 9 | 31 | 1.0(参考) | 1.0(参考) |
第二个四分位数 | 28 | 23 | 0.677 (0.242–1.840) | 0.995 (0.197–4.927) |
第三个四分位数 | 19 | 21 | 0.321 (0.118–0.826) | 0.384 (0.067–2.013) |
第四个四分位数(高) | 30 | 10 | 0.097 (0.033–0.261) | 0.034 (0.004–0.200) |
P(P)用于趋势 | | | 2月1日至06日 | 0.0002 |
hK14作为分类变量 |
第一个四分位数(低) | 8 | 32 | 1.0(参考) | 1.0(参考) |
第二个四分位数 | 13 | 27 | 0.519 (0.181–1.418) | 0.766(0.158–3.576) |
第三个四分位数 | 20 | 20 | 0.250 (0.089–0.655) | 0.220 (0.041–1.025) |
第四个四分位数(高) | 29 | 11 | 0.095 (0.032–0.257) | 0.054 (0.008–0.283) |
P(P)用于趋势 | | | 2月1日至06日 | 0.0004 |
VIM作为分类变量 |
第一个四分位数(低) | 26 | 14 | 1.0(参考) | 1.0(参考) |
第二个四分位数 | 25 | 15 | 1.114 (0.446–2.794) | 6.818 (1.529–35.43) |
第三个四分位数 | 11 | 29 | 4.896 (1.939–13.11) | 14.87 (2.629–107.6) |
第四个四分位数(高) | 8 | 32 | 7.429 (2.802–21.50) | 69.80 (7.297–1145.4) |
P(P)用于趋势 | | | 3.8e-06日 | 0.0006 |
RSPO3作为分类变量 |
第一个四分位数(低) | 6 | 34 | 1.0(参考) | 1.0(参考) |
第二个四分位数 | 16 | 24 | 0.265 (0.084–0.744) | 0.250 (0.042–1.312) |
第三个四分位数 | 23 | 17 | 0.130 (0.041–0.362) | 0.064 (0.008–0.359) |
第四个四分位数(高) | 25 | 15 | 0.106 (0.033–0.295) | 0.017 (0.001–0.128) |
P(P)用于趋势 | | | 2005年12月 | 0.0002 |
在对logistic回归模型中的年龄和性别进行调整后进行敏感性分析后,总体结果没有显著变化。
讨论
蛋白质特征与现有研究的比较
蛋白质组学研究旨在通过使用不同的生物样本,如体液(血浆、血清等)、肿瘤组织(新鲜冷冻组织或福尔马林固定石蜡包埋组织)和体外细胞,探索潜在的ESCC诊断生物标记物。2016年,Harada等人总结了18项基于血清、组织和细胞系样品的质谱技术用于ESCC诊断的有限样本量的非靶向蛋白质组学研究,并鉴定了几种新的ESCC诊断标记物,如载脂蛋白A-I、管蛋白β链丝氨酸Aα、HSP70等[22]. 多年来,基于血液的诊断研究被广泛用作一种经济高效的快速筛查工具,以了解疾病和药物治疗效率,血浆中的器官特异性蛋白可能反映器官功能障碍[23]. 发展一种早期ESCC检测的液体活检方法将显著提高后续胃镜检查的效率,特别是对于无症状的高危人群。
最近,一项研究使用RayBiotech的蛋白芯片AAH-BLG-507在血清中鉴定了13种蛋白质生物标记物,用于从中国10名健康对照组中鉴别10名早期ESCC患者[24]. Liao等人报告,使用ELISA结合血浆FAPα和传统生物标记物(CEA、CYFRA211、SCCA)可以显著区分(AUC=0.745)ESCC(n个 = 151,I期:29+II期:59+III期/IV:63)来自非恶性对照(n个 = 230,健康:194+良性:36)[25]. Huang等人根据一项包括107名对照组和37名早期ESCC患者的研究报告,血清IGFBP7的AUC为0.725[26]. Xu等人报告了血清自身抗体(p53、MMP-7、HSP70、Prx VI和Bmi-1)可以区分早期ESCC患者(n个 = 76)正常控制(n个 = 134)在验证队列中敏感性为45%,特异性为96%[13]. 在我们的研究中,23个蛋白质,即ANXA1、hK8、CDKN1A、ABL1、SCAMP3、EGF、LYN、MetAP2、KLK13、ADAMTS15、hK14、VIM、TXLNA、GPC1、RSPO3、hK11、TRAIL、X5NT、CPE、FADD、TGFR2、SEZ6L和CD160,显示了鉴别早期ESCC和对照组的潜在诊断实用性,其血清水平与ESCC分期呈显著的剂量-反应关系。然而,在上述研究中发现很少重叠的蛋白质,这可能是由于各种研究中使用的候选蛋白质特征、样本大小、ESCC阶段、样本的生物学性质(血浆与血清)和检测方法(PEA与蛋白芯片vs.ELISA)的差异。
这是第一项评估Olink肿瘤学II小组早期诊断ESCC的效率的研究。虽然该面板不是专门用于识别ESCC患者的,但肿瘤学II面板上的大多数蛋白质是分泌蛋白,在多种癌症的组织或血清中显示异常表达[21,27,28]. 特别是一些蛋白质,如ANXA1、CEACAM5(又称CEA)、VIM、ALB1和IL6,已被报道为ESCC诊断的潜在生物标记物[24,25,29——32]然而,肿瘤II组的大多数蛋白质尚未在ESCC血样中检测其表达。
模型性能
为了避免过度拟合,并考虑早期诊断ESCC的临床可行性,创建了一个包含ANXA1、hK8、hK14、VIM和RSPO3的简明多蛋白分类器。用于区分早期食管鳞癌和对照组的五蛋白分类器的AUC为0.936(95%CI:0.899~0.973)。最佳Youden指数的特异性和敏感性分别为78.6%和96.7%,分类准确度为0.888。我们使用五倍交叉验证来估计五蛋白分类器的平均准确率,在发现集和验证集中相应的数字分别为0.861和0.825。总的来说,我们的多蛋白分类器的分化效率相对优于其他研究[13,25,26,33].
生物功能
在我们的研究中,在不同阶段ESCC患者和健康对照者的血清中检测到92个肿瘤相关候选蛋白,以预测癌症状态,并初步确定23个蛋白为ESCC的潜在诊断蛋白生物标记物。对这23个蛋白的功能富集通路分析表明,它们参与信号受体结合、细胞外空间、刺激反应的调节以及与ESCC发育相关的TP53网络。因此,它们在血清中的成分可以反映促肿瘤ESCC微环境,并可用于监测ESCC的进展。
在早期ESCC的最终诊断分类器中,选择了ANXA1、hK8、hK14、VIM和RSPO3。ESCC患者血清ANXA1和VIM水平高表达,而hK8、hK14和RSPO3水平下降。
ANXA1(annexin A1)是一种内源性抗炎蛋白,现已被公认为与肿瘤细胞增殖、侵袭、分化、凋亡、转移和化疗敏感性密切相关,可通过调控多种肿瘤相关通路[34,35]. 此外,ANXA1在各种癌症类型中的表达情况存在差异:在肺癌、结直肠癌和胰腺癌中过度表达,而在宫颈癌、前列腺癌、鼻咽癌等中缺乏表达[34,36]我们发现食管鳞癌患者血清中ANXA1水平较高,这与之前的研究结果一致,该研究显示食管鳞癌组织中ANXA水平高于匹配的正常组织[30]. 然而,大多数先前的研究报道,与邻近的正常组织相比,ESCC患者的细胞系和组织中ANXA1的表达显著下调[29,32,37——39]. 需要进一步的研究来检测肿瘤ANXA1的表达与血清水平的相关性。
VIM(vimentin)是III类中间丝蛋白之一,通过上皮-间充质转化参与细胞骨架完整性、细胞粘附和细胞迁移[40,41]组织中VIM水平上调已被报道为多种癌症的潜在诊断和预后标志物,如前列腺癌、乳腺癌、恶性黑色素瘤和肺癌[42]. 与邻近正常组织相比,ESCC组织中VIM过度表达[30]这与我们的研究结果有些一致。波形蛋白的生物表达受TGF-β信号转导诱导的转录因子Twist、Zeb1、Snail和Slug调控[43].
激肽释放酶相关肽酶(KLKs)的失调与各种癌症的差异表达特征有关[44,45]但人们对其在ESCC发展中的作用知之甚少。Olink肿瘤学II小组检测到四种来自激肽释放酶相关肽酶家族的蛋白质,即hK8(激肽释放酶原-8)、hK11(激肽分泌酶原-11)、KLK13(激肽排泄酶原-13)和hK14(激肽排出酶原-14),我们发现与健康对照组相比,无论肿瘤分期,ESCC患者的血清中所有这些蛋白质的水平均较低。KLKs是最大的分泌型丝氨酸蛋白酶家族,通过激活PARs、释放活性生长因子、调节蛋白水解网络和激活雄激素受体信号传导,参与癌细胞的生长、迁移、侵袭和化疗耐药性[45,46].
RSPO3(R-spondin-3)是典型Wnt信号通路和PI3K/AKT通路的激活剂,是血管生成和上皮-间质转化的关键调节因子,在结直肠癌、肺鳞癌和前列腺癌中表达较低,但在膀胱癌中表达上调,卵巢癌与肺腺癌[47——50]. 我们的研究表明,血清中RSPO3水平与ESCC进展呈负相关。
局限性和未来展望
我们的模型结果应该谨慎解释。首先,该研究是在中国ESCC高危地区进行的,这可能会削弱我们的五蛋白预测分类器对其他相对正常风险地区的通用性。第二,尽管我们发现已识别生物标志物的血清水平与ESCC分期之间总体上存在良好的剂量-反应关系,但某些蛋白质的趋势并不完美,这建议需要外部独立研究来验证和推广我们的发现。此外,经鉴定的ESCC蛋白生物标记物通常是多种肿瘤的通用生物标记物。还需要进一步的工作来确定我们的五蛋白分类器对ESCC诊断的特异性与其他癌症类型的特异性。考虑到在食管鳞癌高发区建立“环境暴露+血液活检+食管胃十二指肠镜检”三级分层筛查策略,我们的血清多蛋白分类器具有较高的敏感性和特异性,在高危人群中具有良好的应用价值。已确定的ESCC生物标记物也参与了ESCC的进展,这突出了它们作为预后生物标记物的可能应用。
总之,我们确定并建立了一个多蛋白分类器,用于区分早期食管鳞癌患者和健康对照组,这可能有助于改进三级分层筛查策略,以减少食管鳞癌高发地区的负担。然而,这些结果需要在前瞻性队列研究中进一步验证。
致谢
作者感谢复旦大学泰州卫生科学研究院的采访人员和技术人员对数据收集和样品制备的宝贵贡献,感谢泰兴市疾病预防控制中心的工作人员在组织现场工作方面的帮助,以及泰兴市人民医院的工作人员对样本采集的协助。
缩写
ESCC公司 | 食管鳞状细胞癌 |
拉索 | 最小绝对收缩和选择运算符 |
ANXA1公司 | 膜联蛋白A1 |
小时K8 | 卡利克莱因-8 |
hK14型 | Kallikrein公司-14 |
VIM公司 | 波形蛋白 |
RSPO3号机组 | R-响应蛋白-3 |
AUC公司 | 曲线下面积 |
豌豆 | 邻近延伸分析 |
聚合酶链反应 | 聚合酶链式反应 |
净现值 | 标准化蛋白质表达 |
PCA公司 | 主成分分析 |
财务总监 | 错误发现率 |
去 | 基因本体论 |
世界车王争霸赛 | 接收机工作特性 |
CI公司 | 置信区间 |
个人简历 | 变异系数 |
个人计算机 | 主要组成部分 |
hK11型 | 卡利克莱因-11 |
KLK13型 | 卡利克莱因-13 |
作者的贡献
XRY和CS:收集研究数据集,分析数据并起草手稿;TCZ、XLY、JYM、ZYY:参与样本采集和病历评估;JRY和WMY在瑞典组织了蛋白质检测;ML、XDC、WMY和LJ发起、组织和监督了该研究;ML、XDC和WMY:对手稿进行了批判性修订;ML和XDC:提供技术支持。所有作者阅读并批准了手稿的最终版本。
基金
本研究得到了国家自然科学基金(81973116、82073637、91846302和81573229)、国家重点研发计划(2017YFC0907002和2017YFC 0907003)、中国国际科技合作计划(2015DFE32790)、欧洲研究理事会(682663)、,山东省自然科学基金项目(ZR2020 QH302)。
数据和材料的可用性
应合理要求,可从相应作者处获得支持本研究结果的所有数据。
道德批准和参与同意
研究方案由复旦大学生命科学学院机构审查委员会(日期:2009年2月19日)、山东大学齐鲁医院(日期:2010年3月8日)和斯德哥尔摩伦理审查委员会(2018/357-31)批准。该研究是根据批准的方案进行的,所有参与者都提供了书面知情同意书。
出版同意书
我们已收到参与本研究的所有参与者的同意。同意书将根据要求提供。
脚注
出版商笔记
Springer Nature在公布的地图和机构关联中的管辖权主张方面保持中立。
杨晓荣和陈锁对这项工作做出了同样的贡献。
工具书类
1Bray F、Ferlay J、Soerjomataram I、Siegel RL、Torre LA、Jemal A.2018年全球癌症统计:GLOBOCAN对185个国家36种癌症的全球发病率和死亡率的估计。CA癌症临床杂志。2018;68(6):394–424. doi:10.3322/caac.21492。[公共医学] [交叉参考][谷歌学者] 2Njei B、McCarty TR、Birk JW。1973年至2009年美国成年人食管癌生存趋势:SEER数据库分析。胃肠病学肝病杂志。2016;31(6):1141–1146. doi:10.1111/jgh.13289。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 三。曾H,郑R,郭毅,张S,邹X,王恩,等。2003-2005年中国癌症生存率:一项基于人群的研究。国际癌症杂志。2015;136(8):1921–1930. doi:10.1002/ijc.29227。[公共医学] [交叉参考][谷歌学者] 4Shen L,Shan YS,Hu HM,Price TJ,Sirohi B,Yeh KH,等。亚洲胃癌管理:资源批准指南。柳叶刀Oncol。2013;14(12) :e535–e547。doi:10.1016/S1470-2045(13)70436-4。[公共医学] [交叉参考][谷歌学者] 5Chiu Y、Uedo N、Singh R、Gotoda T、Ng W、Yao K等。亚洲对肿瘤诊断性上消化道内镜标准的共识。内脏。2019;68(2):186–197. doi:10.1136/gutjnl-2018-317111。[公共医学] [交叉参考][谷歌学者] 6Lao-Sireix P,Fitzgerald RC。食管癌筛查。Nat Rev临床肿瘤学。2012;9(5):278–287. doi:10.1038/nrclinonc.2012.35。[公共医学] [交叉参考][谷歌学者] 7di Pietro M,Canto MI,Fitzgerald RC。早期食管腺癌和鳞癌的内镜治疗:筛查、诊断和治疗。胃肠病学。2018;154(2):421–436. doi:10.1053/j.gastro.2017.07.041。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 8Cohen JD、Li L、Wang Y、Thoburn C、Afsari B、Danilova L等。用多分析物血液测试检测和定位可手术切除的癌症。科学。2018[PMC免费文章][公共医学] 9Mader S,Pantel K。液体活检:现状和未来展望。Oncol Res治疗。2017;40(7–8):404–408. doi:10.1159/000478018。[公共医学] [交叉参考][谷歌学者] 10Brucher BL、Li Y、Schnabel P、Daumer M、Wallace TJ、Kube R等。基因组学、微RNA、表观遗传学和蛋白质组学在上消化道癌症未来诊断、治疗和监测反应中的应用。临床翻译医学。2016;5(1):13. doi:10.1186/s40169-016-0093-6。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 11Chen X,Gole J,Gore A,He Q,Lu M,Min J等。使用血液测试进行常规诊断前四年的癌症无创早期检测。国家公社。2020;11(1):3475. doi:10.1038/s41467-020-17316-z。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 12Arnold M、Soerjomataram I、Ferlay J、Forman D。2012年食道癌组织学亚型全球发病率。内脏。2015;64(3):381–387. doi:10.1136/gutjnl-2014-308124。[公共医学] [交叉参考][谷歌学者] 13徐玉伟,彭玉华,陈斌,吴志勇,吴建业,沈建华,等。自身抗体作为食管鳞癌早期检测的潜在生物标志物。美国胃肠病杂志。2014;109(1):36–45. doi:10.1038/ajg.2013.384。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 14Assarsson E、Lundberg M、Holmquist G、Bjorkesten J、Thorsen SB、Ekman D等。同质96-plex PEA免疫分析具有高灵敏度、特异性和良好的可扩展性。公共科学图书馆一号。2014;9(4) :e95192。doi:10.1371/journal.pone.0095192。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 15Yang X,Chen X,Zhuang M,Yuan Z,Nie S,Lu M,等。吸烟和饮酒与食管鳞癌风险的关系:一项中国基于人群的病例对照研究。科学代表。2017;7(1):17249. doi:10.1038/s41598-017-17617-2。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 16Yang X,Ni Y,Yuan Z,Chen H,Plymoth A,Jin L,等。在中国高危地区饮用热茶增加食管鳞癌风险:一项基于人群的病例对照研究。临床流行病学。2018;10:1307–1320. doi:10.2147/CLEP。S171615。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 17Yang X,Zhang T,Yin X,Yuan Z,Chen H,Plymoth A,等。成人身高、体重指数变化和体型变化与食管鳞癌风险的关系:一项中国基于人群的病例对照研究。癌症医学。2019;8(12):5769–5778. doi:10.1002/cam4.2444。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 18Ekheden I,Yang X,Chen H,Chen X,Yuan Z,Jin L,et al.中国高危地区胃萎缩及其与口腔健康不良的相互作用与食管鳞癌风险的相关性:一项基于人群的病例对照研究。《美国流行病学杂志》。2020;189(9):931–941. doi:10.1093/aje/kwz283。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 19Rice TW、Ishwaran H、Ferguson MK、Blackstone EH、Goldstraw P.食管和食管胃交界处癌症:第八版分期引物。《胸科肿瘤学杂志》。2017;12(1):36–42. doi:10.1016/j.jtho.2016.10.016。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 20Rice TW、Gress DM、Patil DT、Hofstetter WL、Kelsen DP、Blackstone EH。美国癌症联合委员会第八版癌症分期手册中食管癌和食管胃交界处的主要变化。CA癌症临床杂志。2017;67(4):304–317. doi:10.3322/caac.21399。[公共医学] [交叉参考][谷歌学者] 21Skubitz APN、Boylan KLM、Geschwind K、Cao Q、Starr TK、Geller MA等。同时测量92种血清蛋白生物标记物,以开发用于卵巢癌检测的多蛋白分类器。癌症预防研究(Phila)2019;12(3):171–184. doi:10.1158/1940-6207.CAPR-18-0221。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 22Harada K、Mizrak Kaya D、Shimodaira Y、Song S、Baba H、Ajani JA。蛋白质组学方法用于识别上消化道癌的生物标记物。蛋白质组学专家评论。2016;13(11):1041-53. [公共医学] 23Malmström E、Kilsgård O、Hauri S、Smeds E、Herwald H、Malmström L等。使用定量靶向蛋白质组学对革兰氏阳性败血症血浆中的蛋白质组织起源进行大规模推断。国家公社。2016;7:10261.doi:10.1038/ncomms10261。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 24童Q,王XL,李SB,杨GL,金S,高ZY,等。联合检测IL-6和IL-8有助于早期食管鳞癌的诊断:基于蛋白芯片筛选血清标志物的初步研究。Onco针对Ther。2018;11:5777–5787. doi:10.2147/OTT。S171242。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 25廖毅,邢S,徐斌,刘伟,张刚。成纤维细胞活化蛋白α循环水平对食管鳞癌诊断的评价。Oncotarget公司。2017;8(18):30050–30062. doi:10.18632/目标16274。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 26黄X,洪C,彭毅,杨S,黄L,刘C,等。血清IGFBP7对食管鳞癌的诊断价值。癌症杂志。2019;10(12):2687–2693. doi:10.7150/jca.32393。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 27Bhardwaj M,Weigl K,Tikk K,Benner A,Schrotz-King P,Brenner H.对275个血浆蛋白生物标记物进行多重筛选,以确定结直肠癌早期检测的特征。Mol Oncol公司。2020;14(1):8–21. doi:10.1002/1878-0261.12591。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 28Berggrund M、Enroth S、Lundberg M、Assarsson E、Stalberg K、Lindquist D等。使用多重邻近延伸分析鉴定宫颈癌候选血浆蛋白生物标记物。分子细胞蛋白质组学。2019;18(4):735–743. doi:10.1074/mcp。RA118.001208。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 29张杰,王凯,张杰,刘SS,戴蕾,张JY。使用蛋白质组学方法鉴定肿瘤相关蛋白作为人类食管鳞癌的生物标记物。蛋白质组研究杂志。2011;10(6):2863–2872. doi:10.1021/pr200141c。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 30陈JY,徐磊,方WM,韩JY,王凯,朱凯。PA28β作为人类食管鳞癌潜在新生物标志物的鉴定。肿瘤生物学。2017;39(10):1010428317719780.[公共医学][谷歌学者] 31Mao YS,Zhang DC,Zhao XH,Wang LJ,Qi J,Li XX。食管癌CEA、SCC和Cyfra21-1血清检测的意义。中国癌症杂志。2003;25(5) :457–460。[公共医学][谷歌学者] 32Moghanibashi M,Jazii FR,Soheili ZS,Zare M,Karkhane A,Parivar K等。从波斯患者建立的一种新的食管癌细胞系的蛋白质组学。基因。2012;500(1):124–133. doi:10.1016/j.gene.2012.03.038。[公共医学] [交叉参考][谷歌学者] 33徐玉伟,刘长通,黄雪英,黄立生,罗玉华,洪春秋,等。血清STIP1自身抗体作为食管鳞癌诊断的潜在生物标志物。Dis标记。2017:5384091.[PMC免费文章][公共医学] 34Foo SL、Yap G、Cui J、Lim LHK。Annexin-A1——癌症的福还是祸?分子医学趋势。2019;25(4):315–327. doi:10.1016/j.molmed.2019.02.004。[公共医学] [交叉参考][谷歌学者] 35Ganesan T、Sinniah A、Ibrahim ZA、Chik Z、Alshawsh MA。Annexin A1:癌症的祸害还是福音?系统回顾。分子。2020;25:16.doi:10.3390/分子25163700。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 36Fu Z,Zhang S,Wang B,Huang W,Zheng L,Cheng A.Annexin A1:作为新型癌症生物标记物的双刃剑。临床化学学报。2020;504:36–42. doi:10.1016/j.cca.2020.01.022。[公共医学] [交叉参考][谷歌学者] 37夏S-H,胡L-P,胡H,英W-T,徐X,蔡Y,等。膜联蛋白I的三种亚型优先在正常食管上皮表达,但在食管鳞癌中表达下调。致癌物。2002;21(43):6641–6648. doi:10.1038/sj.onc.1205818。[公共医学] [交叉参考][谷歌学者] 38Chung JY,Braunschweig T,Hu N,Roth M,Traicoff JL,Wang QH,等。用于蛋白质组分析的多重组织免疫印迹分析:食管鳞癌正常向肿瘤转变的初步研究。癌症流行生物标记预防。2006;15(7):1403–1408. doi:10.1158/1055-9965.EPI-05-0651。[公共医学] [交叉参考][谷歌学者] 39胡恩,弗莱格·乔丹,苏H,寿J-Z,罗斯·乔丹,李维杰,等。食管鳞癌膜联蛋白I改变的综合表征。临床癌症研究。2004年;10(18第1部分):6013–6022。doi:10.1158/1078-0432.CCR-04-0317。[公共医学] [交叉参考][谷歌学者] 40Sharma P、Alsharif S、Fallatah A、Chung BM。作为癌症发展和转移效应器的中间丝:对角蛋白、波形蛋白和巢蛋白的关注。细胞。2019;8(5):497. doi:10.3390/cells8050497。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 41Chen Z,Fang Z,Ma J.波形蛋白在乳腺癌中的调节机制和临床意义。生物药物治疗。2021;133:111068.doi:10.1016/j.biopha.2020.111068。[公共医学] [交叉参考][谷歌学者] 42Satelli A,Li S.波形蛋白在癌症中的作用及其作为癌症治疗分子靶点的潜力。细胞分子生命科学。2011;68(18):3033–3046. doi:10.1007/s00018-011-0735-1。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 43Strouhalova K,PřechováM,GandalovičováA,Brábek J,Gregor M,Rosel D.Vimentin中间丝作为癌症治疗的潜在靶点。癌症(巴塞尔)2020;12:1.doi:10.3390/cancers1201184。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 44Tailor PD、Kodeboyina SK、Bai S、Patel N、Sharma S、Ratnani A等。激肽释放酶家族基因在不同癌症类型中的诊断和预后生物标志物潜力。Oncotarget公司。2018;9(25):17876–17888. doi:10.18632/oncotarget.24947。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 45Kryza T、Silva ML、Loessner D、Heuzé-Vurc'h N、Clements JA。激肽释放酶相关肽酶家族:癌症进展中的失调和功能。生物化学。2016;122:283–299. doi:10.1016/j.biochi.2015.09.002。[公共医学] [交叉参考][谷歌学者] 46Filippou PS、Karagiannis GS、Musrap N、Diamandis EP。激肽释放酶相关肽酶(KLKs)和癌症的特征。临床实验室科学评论。2016;53(4):277–291. doi:10.3109/10408363.2016.1154643。[公共医学] [交叉参考][谷歌学者] 47Wu L,Zhang W,Qian J,Wu J,Jiang L,Ling C.反应蛋白家族成员作为肺癌的新生物标志物和预后因素。Oncol Lett公司。2019;18(4):4008–4015. [PMC免费文章][公共医学][谷歌学者] 48Mesci A、Lucien F、Huang X、Wang EH、Shin D、Meringer M等。RSPO3是前列腺癌侵袭性的预后生物标志物和介质。《运输医学杂志》。2019;17(1):125. doi:10.1186/s12967-019-1878-3。 [PMC免费文章][公共医学] [交叉参考][谷歌学者] 49Chen Z,Zhou L,Chen L,Xiong M,Kazobinka G,Pang Z,等。RSPO3通过Wnt/β-catenin和hedgehog信号通路促进膀胱癌的侵袭性。致癌。2019;40(2):360–369. doi:10.1093/carcin/bgy140。[公共医学] [交叉参考][谷歌学者] 50顾H,屠H,刘L,刘T,刘Z,张伟,等。RSPO3是预测卵巢癌肿瘤侵袭性的候选标记物。Ann Transl医学。2020;8(21):1351. doi:10.21037/atm-20-3731。 [PMC免费文章][公共医学] [交叉参考][谷歌学者]