跳到主页面内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https公司

该站点是安全的。
这个https://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2001年6月;7(6):673-9.
doi:10.1038/89044。

利用基因表达谱和人工神经网络对癌症进行分类和诊断预测

附属公司

利用基因表达谱和人工神经网络对癌症进行分类和诊断预测

J·汗等。 自然·医学. 2001年6月.

摘要

本研究的目的是利用人工神经网络(ANN)开发一种基于基因表达特征的癌症分类方法。我们以小而圆的蓝细胞肿瘤(SRBCT)为模型训练神经网络。这些癌症属于四种不同的诊断类别,在临床实践中经常出现诊断难题。人工神经网络正确地对所有样本进行了分类,并确定了与分类最相关的基因。据报道,其中一些基因在SRBCT中表达,但大多数与这些癌症无关。为了测试训练后的ANN模型识别SRBCT的能力,我们分析了以前未用于训练过程的其他盲样本,并在所有情况下对其进行了正确分类。本研究展示了这些方法在肿瘤诊断和确定治疗候选靶点方面的潜在应用。

PubMed免责声明

数字

图1
图1
人工神经网络。,分析过程示意图。首先对所有88个实验的整个数据集进行质量过滤(1),然后通过主成分分析(PCA)将维度从最初的6567个表达值进一步降低到10个PCA投影(2)。接下来,将25个测试实验放在一边,将63个训练实验随机分为3组(3)。其中一组用于验证,其余两组用于校准(4)。然后使用10个PCA值作为输入,癌症类别作为输出,对每个样本的ANN模型进行校准(5)。对于每个模型,使用100个迭代周期(epoch)对校准进行优化。使用3组中的每一组进行重复验证(6)。再次随机分割样本,重复整个训练过程(7)。对于验证组的每一个选择,都会校准一个模型,从而得到总共3750个经过训练的模型。一旦模型被校准,它们就被用来根据基因在分类中的重要性对基因进行排序(8)。整个过程(2-7)只使用排名靠前的基因重复(9)。随后,使用所有校准模型对25个试验进行分类。b条、监测模型的校准。每个样本的平均分类误差(使用平方误差总和函数)在训练迭代(epoch)期间绘制,用于训练样本和验证样本。一对线,紫色(训练)和灰色(验证)代表一个模型。随着时间的增加,分类错误的减少表明了对模型的学习,以区分这些癌症。显示的结果是200个不同模型的结果,每个模型对应于数据的随机分区。所有模型在训练和验证方面都表现良好,如每个样本的平均平方和分类误差的平行下降(随着时间的增加)所示。此外,没有过度训练的迹象:如果模型开始学习训练集中的特征,而这些特征在验证集中不存在,这将导致验证时的误差增加,曲线将不再保持平行。c(c),最小化基因数量。所有3750个模型的误分类样本的平均数量与使用的基因数量的增加相比较。使用排名最高的96个基因将错误分类降至零。
图2
图2
样品的分类和诊断。根据最高委员会投票(所有ANN输出的平均值)将样本分类为癌症类别,并将其放置在相应的图中。对于每个样本,绘制的是从委员会投票到该诊断类别理想投票的距离(例如,对于EWS,它是EWS=1,RMS=NB=BL=0)。因此,完全分类的样本将以零距离绘制。训练样本显示为正方形,测试样本显示为三角形。非SRBCT样本为黑色。所有SRBCT样本,包括20次测试,均已正确分类。与训练样本的第95个百分位对应的距离由虚线表示,超出该虚线的样本诊断将被拒绝。所有5个非SRBCT测试样本的诊断均被拒绝,因为它们位于各自虚线之外。三个SRBCT样本(EWS-T13、TEST-10和TEST-20)虽然分类正确,但无法确定诊断结果。
图3
图3
层次聚类和多维尺度分析。采用ANN模型排名前96位的基因进行分析。,多维标度分析。这里显示了训练样本MDS图的两个投影。EWS用黄色圆圈表示,RMS用红色表示,BL用蓝色表示,NB用绿色表示。样本根据4种不同的癌症类别紧密聚集。b条样本和基因的层次聚类。每行代表96个cDNA克隆中的一个,每列代表一个单独的样本。所示为相对红色强度的伪彩色表示,红色表示高表达,绿色表示低表达,比例如下所示。右侧是IMAGE id、基因符号、基因高度表达的类别(见补充方法)和ANN秩*,尚未报道与这些癌症相关的基因。c(c),放大了样本的层次聚类树状图b条所有63名训练和20名测试SRBCT均正确归入其诊断类别。在这两种情况下,两个样本均来自同一细胞系,即BL-C2和C4,以及NB-C2和C7,每个样本在同一集群中彼此相邻。该标尺显示了用于构建树状图的皮尔逊相关系数。当样本聚集成四个诊断类别时,皮尔逊相关截点为0.54。

中的注释

  • 微阵列——21世纪的预言杆?
    何YD,朋友SH。 何育德等。 Nat Med.2001年6月;7(6):658-9. doi:10.1038/89022。 《国家医学》,2001年。 采购管理信息:11385496 没有可用的摘要。

类似文章

引用人

工具书类

    1. Pizzo,P.A.《儿科肿瘤学原理与实践》(Lippincott-Raven,Philadelphia,1997)。
    1. Triche TJ、Askin FB。神经母细胞瘤和小、圆、蓝细胞肿瘤的鉴别诊断。Hum Pathol(Hum病态)。1983;14:569–595.-公共医学
    1. Taylor C等。基于荧光原位杂交检测t(11;22)的尤因肉瘤和外周神经外胚层肿瘤诊断。英国癌症杂志。1993;67:128–133.-项目管理咨询公司-公共医学
    1. McManus AP、Gusterson BA、Pinkerton CR、Shipley JM。小圆细胞肿瘤的分子病理学与诊断、预后和分类的关系。病理学杂志。1996;178:116–121.-公共医学
    1. Khan J等。利用cDNA微阵列对肺泡横纹肌肉瘤进行基因表达谱分析。1998年癌症研究;58:5009–5013.-公共医学

出版物类型

MeSH术语

LinkOut-更多资源