FixMatch:以一致性和信心简化半监督学习

的一部分神经信息处理系统的进展33(NeurIPS 2020)

作者反馈 Biptex公司 MetaReview公司 纸类 审查 补充的

作者

Kihyuk Sohn、David Berthelot、Nicholas Carlini、Zizhao Zhang、Han Zhang,Colin A.Raffel、Ekin Dogus Cubuk、Alexey Kurakin、Chun-Liang Li

摘要

半监督学习(SSL)提供了一种利用未标记数据提高模型性能的有效方法。这一领域最近取得了快速进展,但代价是需要更复杂的方法。在本文中,我们提出了FixMatch,这是一种大大简化了现有SSL方法的算法。FixMatch首先使用模型对弱增强的未标记图像的预测生成伪标签。对于给定的图像,只有当模型产生高置信度预测时,才会保留伪标签。然后对模型进行训练,以便在输入同一图像的增强版本时预测伪标签。尽管它很简单,但我们发现FixMatch在各种标准半监督学习基准测试中实现了最先进的性能,包括CIFAR-10上的94.93%准确率(250个标签)和88.61%准确率(40个标签,每个类只有4个标签)。我们进行了广泛的消融研究,以梳理出对FixMatch成功最重要的实验因素。该代码可在https://github.com/google-research/fixmatch。