常规结肠镜检查中的胃肠道病变

2016年10月14日捐赠

该数据集包含从用于检测胃肠道病变的结肠镜视频中提取的特征。它包含76个病灶:15个锯齿状腺瘤,21个增生性病灶和40个腺瘤。

数据集特征

多变量

主题领域

计算机科学

关联的任务

分类

功能类型

真实

#实例

76

#功能

698

数据集信息

其他信息

该数据集包含从结肠镜视频数据库中提取的显示胃肠道病变的特征。它还包含从专家图像检查和组织学收集的基本事实(在xlsx文件中)。共有76个病灶的特征向量,共有3种类型的病灶:增生型、腺瘤型和锯齿状腺瘤型。通过将腺瘤和锯齿状腺瘤合并在同一类别中,可以将此分类问题视为二元问题。根据这一点,增生性病变属于“良性”类别,而其他两种类型的胃肠道病变属于“恶性”类别。数据集的第一行/行对应于病变名称(文本标签)。每个病变都会出现两次,因为它是使用两种类型的光记录的:白光(WL)和窄带成像(NBI)。第二行代表病变类型(3代表腺瘤,1代表增生,2代表锯齿状)。最后,第三行/行是使用的灯光类型(1表示WL,2表示NBI)。所有其他行都是原始特征(没有任何预处理):422 2D纹理特征-前166个特征:AHT:自相关均匀纹理(不变Gabor纹理)-下256:旋转不变LBP76 2D颜色特征-16颜色命名-13鉴别颜色-7色调-7对手-33色灰度共生矩阵200 3D形状特征-100形状DNA-100 KPCA(千帕)该数据集的主要目的是研究计算机如何从常规结肠镜视频中诊断胃肠道病变。为了比较机器学习方法与人类提供的方法的性能,我们提供了文件ground_truth.xlsx,其中包括组织病理学后的基本事实以及7名临床医生(4名专家和3名初学者)的意见。一种自动组织分类方法可以避免使用染色内镜(一种使用靛蓝胭脂红的耗时染色程序),从而节省临床医生的时间,并且可以帮助评估许多息肉患者的单个病变的严重程度,以便胃肠科医生直接关注需要息肉切除的患者。进行分类的一种可能方法是将每个病变的两种类型的光的信息串联起来,即创建每个病变1396个元素的单个矢量。技术目标是最大限度地提高准确性,同时最小化假阳性(不需要切除但分类为需要切除的病灶)和假阴性(需要切除但归类为不需要切除的病变)。特别是,我们对最大限度地提高准确性同时减少假阴性特别感兴趣,即最大限度地减少被归类为增生的腺瘤和锯齿状腺瘤的数量。相反的情况并不严重:切除增生性息肉,将其视为腺瘤或锯齿状腺瘤。另一个有趣的实验是比较我们能得到的最佳机器学习方法与人工操作员(专家和初学者)提供的方法的性能。到目前为止,在二元情况下,使用留一和1000棵树的随机森林(使用颜色+纹理+3D和NBI)获得的最佳结果对应于约89.5%的准确度、约94.5%的灵敏度和约76%的特异性(考虑到切除作为阳性条件)。这是迄今为止发现的最佳混淆矩阵:分类为非还原还原切除52 3无保留5 16在多类情况下,使用SVM的leave-one-out和Random Subspace(颜色+纹理+使用WL的3D)获得的最佳结果如下:分类为Hyp.序列号。阿德。液压18 0 3序号2 9 4广告7 4 29总精度:0.7368科目连字符。0.84Acc序列号0.87会计科目0.76Sen Hyp.0.86传感器参议员0.6参议院0.725比重0.84规格序列0.93规范0.81

缺少值?

变量信息

前422个属性:2D纹理特征-166个特征:AHT:自相关均匀纹理(不变Gabor纹理)-下256:旋转不变LBP接下来的76个属性:2D COLOR FEATURES-16颜色命名-13鉴别颜色-7色调-7对手-33色灰度共生矩阵最后200个属性:3D SHAPE FEATURES-100形状DNA-100千帕斯卡

评论

目前还没有对此数据集的评论。

登录以撰写评论
下载
0次引用
3352个视图

创建者

巴勃罗·梅塞霍

丹尼尔·皮萨罗

内政部

许可证

通过使用UCI机器学习库,您承认并接受UCI机器学习库使用的cookie和隐私实践。

读取策略