广义类别发现
CVPR 2022中


萨加·瓦泽1
韩凯(Kai Han)1, 2
安德烈亚·维达尔迪1
安德鲁·齐瑟曼1


牛津大学VGG
香港大学




泪人的身影。




摘要

在本文中,我们考虑一个高度通用的图像识别设置,其中,给定一组标记和未标记的图像,任务是对未标记集合中的所有图像进行分类。在这里,未标记的图像可能来自标记类或新类。现有的识别方法无法处理这种设置,因为它们做出了一些限制性假设,例如,只有来自已知或未知类的未标记实例,以及先验已知的未知类的数量。我们将其命名为“广义类别发现”,并对所有这些假设提出质疑。我们首先从新的类别发现中提取最先进的算法,并将其用于此任务,从而建立强大的基线。接下来,我们建议在这个开放世界环境中使用视觉变换器和对比表征学习。然后,我们引入了一种简单而有效的半监督k均值方法来将未标记的数据自动聚类为可见类和不可见类,大大超过基准。最后,我们还提出了一种新的方法来估计未标记数据中的类数。我们利用最新的Semantic Shift Benchmark套件,对公共数据集和细粒度数据集上的通用对象分类方法进行了全面评估。



引用

纸张缩略图

广义类别发现

Sagar Vaze、Kai Han、Andrea Vedaldi和Andrew Zisserman

CVPR,2022年。

@会议记录{vaze2022gcd,title={广义类别发现},author={Sagar Vaze和Kai Han以及Andrea Vedaldi和Andrew Zisserman},booktitle={IEEE计算机视觉和模式识别会议},年份={2022}}



致谢

这项研究由Facebook AI研究奖学金资助皇家学会研究教授RP\R1\191132,以及EPSRC计划资助VisualAI EP/T028572/1。此模板最初由菲利普·伊索拉张曦轲对于丰富多彩的项目,并继承所做的修改张杰.可以找到代码在这里.