本材料旨在确保学术和技术工作的及时传播。版权及其所有权利由作者或其他版权所有者保留。所有复制此信息的人都应遵守每个作者的版权所引用的条款和限制。在大多数情况下,未经版权所有者明确许可,不得转载这些作品。



广义类别发现

S.Vaze公司,K·韩,A.维达尔迪,A.齐瑟曼
2022年IEEE计算机视觉和模式识别会议
下载出版物:vaze22a.pdf[4.5Mo] 
在本文中,我们考虑一个高度通用的图像识别设置,其中,给定一组标记和未标记的图像,任务是对未标记集中的所有图像进行分类。在这里,未标记的图像可能来自标记类或新类。现有的识别方法无法处理此设置,因为它们做出了一些限制性假设,例如未标记的实例仅来自已知或未知类,以及未知类的数量是预先已知的。我们解决了更无约束的设置,将其命名为“广义类别发现”,并挑战所有这些假设。我们首先从新的类别发现中提取最先进的算法,并将其用于此任务,从而建立强大的基线。接下来,我们建议在这个开放世界环境中使用视觉变换器和对比表征学习。然后,我们引入了一种简单而有效的半监督k-means方法,将未标记数据自动聚类为可见类和不可见类,大大优于基线。最后,我们还提出了一种新的方法来估计未标记数据中的类数。我们利用最新的Semantic Shift Benchmark套件,对公共数据集和细粒度数据集上的通用对象分类方法进行了全面评估。

链接:


BibTex参考:

@诉讼中{Vaze22a,author=“Sagar Vaze和Kai Han以及Andrea Vedaldi和Andrew Zisserman”,title=“广义类别发现”,booktitle=“IEEE计算机视觉和模式识别会议”,年=“2022”,}

数据库中的其他出版物: