提供此材料是为了确保学术和技术工作的及时传播。版权及其所有权利由作者或其他版权持有人保留。所有复制此信息的人都应该遵守每个作者的版权所引用的条款和约束。在大多数情况下,未经著作权人明确许可,不得转载这些作品。



PASS:ImageNet替代无人机的自我监督预训练

Y、 浅野先生,C、 Rupprecht公司,A、 齐瑟曼,A、 韦达尔迪
神经信息处理系统会议记录数据集和基准,2021年
下载出版物:阿萨诺21a。pdf[3.3百万] 
长期以来,计算机视觉一直依赖于ImageNet和其他从互联网上采样的图像的大数据集来进行模型的预训练。然而,这些数据集在伦理和技术上都存在缺陷,例如包含未经同意而获取的个人信息、许可证使用不明确、存在偏差,甚至在某些情况下甚至存在问题的图像内容。另一方面,目前最先进的预训练是通过无监督的方法获得的,这意味着像ImageNet这样的标记数据集对于模型预训练来说可能不是必要的,甚至可能不是最优的。因此,我们提出了一种无标记的数据集传递:无需人工监督的图片。PASS仅包含具有CC-BY许可证和完整属性元数据的图像,解决了版权问题。最重要的是,它根本不包含人的图像,而且还避免了其他类型的图像,这些图像对于数据保护或道德规范是有问题的。结果表明,PASS可以用于MoCo-v2、SwAV和DINO等方法进行预训练。在转移学习环境下,它产生的下游性能类似于ImageNet预训练,即使是涉及人类的任务,如人体姿势估计。PASS不会使现有的数据集过时,例如,它不足以进行基准测试。然而,它表明模型预训练在使用更安全的数据时通常是可行的,并且它也为更稳健地评估预训练方法提供了基础。

链接:


BibTex参考:

@在生产中{asano21a,author=“Yuki M Asano和Christian Rupprecht和Andrew Zisserman和Andrea Vedaldi”,title=“PASS:ImageNet替代无人值守的自我监督预训练”,booktitle=“神经信息处理系统会议记录跟踪数据集和基准”,年份=“2021”,}

数据库中的其他出版物: