本材料旨在确保学术和技术工作的及时传播。版权及其所有权利由作者或其他版权所有者保留。 所有复制此信息的人都应遵守每个作者的版权所引用的条款和限制。 在大多数情况下,未经版权所有者明确许可,不得转载这些作品。
PASS:ImageNet替代了无需人工的自我监督预训练
2021年神经信息处理系统跟踪数据集和基准会议录
下载出版物:
计算机视觉长期以来依赖于ImageNet和其他从互联网上采集的大型图像数据集来预处理模型。然而,这些数据集存在道德和技术缺陷,例如包含未经同意而获取的个人信息、不明确的许可证使用、偏见,在某些情况下甚至包含有问题的图像内容。另一方面,目前最先进的预处理是通过无监督方法获得的,这意味着对于模型预处理来说,标记数据集(如ImageNet)可能不是必需的,甚至可能不是最佳的。因此,我们提出了一个未标记的数据集PASS:用于自我监督的无人机图片。PASS仅包含具有CC-BY许可证和完整属性元数据的图像,解决了版权问题。最重要的是,它根本不包含任何人的图像,并且还避免了其他类型的图像,这些图像对数据保护或道德有问题。我们表明,PASS可用于MoCo-v2、SwAV和DINO等方法的预训练。在转移学习环境中,它产生了与ImageNet预训练类似的下游性能,甚至在涉及人类的任务上,例如人类姿势估计。PASS不会使现有数据集过时,例如,它不足以进行基准测试。然而,它表明,在使用更安全的数据时,模型预处理通常是可行的,并且它也为更稳健地评估预处理方法提供了基础。
链接:
BibTex参考:
@诉讼程序{asano21a,author=“Yuki M Asano和Christian Rupprecht以及Andrew Zisserman和Andrea Vedaldi”,title=“PASS:ImageNet替代了无人值守的自我监督预训练”,booktitle=“神经信息处理系统程序跟踪数据集和基准”,年=“2021”,}
数据库中的其他出版物: