通过
ImageNet替代了无需人工的自我监督预训练

PASS是一个不包括任何人类的大规模图像数据集,可用于高质量的预训练,同时显著减少隐私问题。

0

人类

我们的数据集不包括任何可识别的人类。这保护了图像创作者的隐私。

140万

图像

PASS包含1439589张不包含人类或个人身份信息的图像。


140万

许可证文件

整个数据集仅包含具有完整属性信息的CC-BY授权图像。

与IN-1k的比较



图像的位置
数据集在地理上是多样化的,几乎三分之一的图像包含地理位置。

预览

示例-图像

您还可以探索数据集在这里

下载

为了下载PASS,我们提供了一个链接我们关于zenodo的文件.

该页面包含下载图像和许可证/创建者文件的链接。对于图像,只需下载tar并提取它们。

或从url列表,例如.

查找预处理模型 在这里.

数据

PASS数据集

代码和型号

如本文所述,运行评估的预训练模型和代码。

许可证

PASS数据集可以下载用于商业/研究目的Creative Commons Attribution 4.0国际许可。可以找到许可证的完整版本在这里。

隐私

虽然这个数据集被设计成不包含任何人类、人体部位或任何其他个人身份信息,但有些信息可能已经漏掉了。如果您发现任何东西,或想要删除您拍摄的照片,请联系以下作者。或者写匿名给我们。

出版物

如果您使用数据集,请引用以下内容。

NeurIPS数据集跟踪,2021年

@第{条,
author=“Yuki M.Asano和Christian Rupprecht以及Andrew Zisserman和Andrea Vedaldi”,
title=“PASS:ImageNet替代了无人值守的自我监督预训练”,
journal=“NeurIPS跟踪数据集和基准”,
year=“2021”
}



致谢

我们感谢阿比谢克·杜塔和阿什什·桑达文的大力支持。我们感谢Rajan及其在Elancer的解说员团队所做的精确工作。我们感谢AWS机器学习研究奖(MLRA)、EPSRC自主智能机器与系统博士培训中心[EP/L015897/1]、高通创新奖学金、皇家学会研究所的支持教授职位和EPSRC计划资助VisualAI EP/T028572/1。C.R.由Innovate UK(项目71653)代表英国研究与创新(UKRI)和欧洲研究理事会(ERC)IDIU-638009提供支持。