×

群集适配

swMATH ID: 44049
软件作者: 严雪婷、Ishan Misra、Abhinav Gupta、Deepti Ghadiyaram、Dhruv Mahajan
描述: ClusterFit:改进视觉表现的泛化。具有弱监督和自监督策略的预训练卷积神经网络在一些计算机视觉任务中越来越流行。然而,由于缺乏强辨别信号,这些学习到的表示可能超出预训练目标(例如,哈希标签预测),并且不能很好地推广到下游任务。在这项工作中,我们提出了一种简单的策略——ClusterFit(CF),以提高在预训练期间学习的视觉表征的稳健性。给定一个数据集,我们(a)使用k-均值对从预先训练的网络中提取的特征进行聚类,(b)使用聚类分配作为伪标签在该数据集上从头开始重新训练新的网络。我们的经验表明,聚类有助于从提取的特征中减少预训练任务特定信息,从而将过拟合降至最低。我们的方法可扩展到不同的预培训框架(弱的和自我监督的)、模式(图像和视频)以及预培训任务(对象和动作分类)。通过对11个不同词汇和粒度的不同目标数据集的广泛迁移学习实验,我们表明,与最先进的大规模(百万/十亿)弱监督图像和视频模型以及自监督图像模型相比,ClusterFit显著提高了表示质量。
主页: https://arxiv.org/abs/1912.03330
关键词: 机器学习;arXiv_cs。LG公司;计算机视觉;模式识别;arXiv_cs。个人简历
相关软件: Pfinder(查找器);OpenGL公司;交通运输部;款式GAN2;ResMLP公司;布里斯克;效率检测;面2面;OpenPose(打开姿势);NIMA公司;网格实验室;SegStereo公司;锚网;软剪刀;MVS网络;效率网;时尚-MNIST;摄像头网络;DISN公司;PWC-网络
引用于: 1文件

1位作者引用

1 理查德·塞利斯基

在1个序列中引用

1 计算机科学课文

在1个字段中引用

1 计算机科学(68至XX)

按年份列出的引文