视觉几何组-牛津大学

广义类别发现

S.Vaze公司,K·韩,A.维达尔迪，A.齐瑟曼

2022年IEEE计算机视觉和模式识别会议

下载出版物：

在本文中，我们考虑一个高度通用的图像识别设置，其中，给定一组标记和未标记的图像，任务是对未标记集中的所有图像进行分类。在这里，未标记的图像可能来自标记类或新类。现有的识别方法无法处理此设置，因为它们做出了一些限制性假设，例如未标记的实例仅来自已知或未知类，以及未知类的数量是预先已知的。我们解决了更无约束的设置，将其命名为“广义类别发现”，并挑战所有这些假设。我们首先从新的类别发现中提取最先进的算法，并将其用于此任务，从而建立强大的基线。接下来，我们建议在这个开放世界环境中使用视觉变换器和对比表征学习。然后，我们引入了一种简单而有效的半监督k-means方法，将未标记数据自动聚类为可见类和不可见类，大大优于基线。最后，我们还提出了一种新的方法来估计未标记数据中的类数。我们利用最新的Semantic Shift Benchmark套件，对公共数据集和细粒度数据集上的通用对象分类方法进行了全面评估。

链接：

BibTex参考：

@诉讼中{Vaze22a，author=“Sagar Vaze和Kai Han以及Andrea Vedaldi和Andrew Zisserman”，title=“广义类别发现”，booktitle=“IEEE计算机视觉和模式识别会议”，年=“2022”，}

数据库中的其他出版物：

»Sagar Vaze公司
»韩凯
»安德烈亚·维达尔迪
»安德鲁·齐瑟曼

出版物

广义类别发现

链接：

项目页面

代码

BibTex参考：

数据库中的其他出版物：