Lite夹子

CLIP Lite的Pytorch实现| AISTATS 2023接受|纸张

安装

环境

从他们的下载站点安装基于Python 3.7.x的Anaconda或Miniconda发行版。
克隆存储库

git克隆git@github.com：4m4n5/CLIP-Litegit

创建一个conda环境并安装所有依赖项。

cd vislang-infomax光盘conda create-n vlinfo python=3.7--文件=环境.ymlconda激活vlinfopip安装-r要求.txt

登录日志权重和偏差
- 运行wandb登录在航站楼或进口魔杖；wandb.login（）在python解释器中，并按照提示进行操作

数据集集合

假设数据集存在于./data/datasets/目录（相对于项目根目录）遵循下面指定的结构。

COCO用于预培训。当Detectron2用于下游任务时，此结构是兼容的。

./data/datasets/coco/注释/标题_{火车，val}2017.json实例_{火车，val}2017.json2017年培训/#2017年列车拆分中的图像2017年5月/#2017年val中的图像分割

PASCAL VOC用于下游分类/检测任务

./data/datasets/VOC2007/注释/图像集/主要/trainval.txt（训练值.txt）测试.txtJPEG图像/

ImageNet用于下游微调任务

./data/datasets/imagenet/列车/#每个类别一个目录，其中包含图像val值/#每个类别一个目录，其中包含图像ILSVRC2012_devkit_t12.tar.gz（ILSVRC2012 _ devkit _ t12.tar.gz）

iNaturalist 2018用于下游分类任务

./data/datasets/inaturalist数据集/2018年全年列车/注释/2018.json列车val2018.json公司

预处理数据

序列化COCO标题(2017年列车和2017年5月拆分）到LMDB文件中。预培训期间，这些数据读取速度更快。

python脚本/coco_preprocess.py\--模式列车_伯特\--data-root/data/datasets/coco/\--分体式列车\--输出数据集/序列化/

培训

第一次编辑工厂.py以包含所需数据集的路径。训练参数由位于的配置文件（YAML）指定./configs/已完成/.每次运行都会在检查点-目录日志和检查点的目录。

蟒蛇训练.py\--配置配置/sbert/from_scratch/fs_bs1024_ni250k.yaml\--每台机器8个gpus\--cpu工作人员0\--checkpoints-dir保存/检查点

姓名		姓名	上次提交消息	上次提交日期
最近一次提交历史 3个承诺
配置/完成		配置/完成
数据		数据
model_zoo（模型_动物园）		model_zoo（模型_动物园）
最佳		最佳
脚本		脚本
实用程序		实用程序
.gitignore（.git忽略）		.gitignore（.git忽略）
许可证		许可证
自述.md		自述.md
__初始化__.py		__初始化__.py
bias_eda.py公司		bias_eda.py公司
配置.py		配置.py
编码器.py		编码器.py
环境.yml		环境.yml
工厂.py		工厂.py
linear_clf.py公司		线性_线性.py
丢失.py		丢失.py
模型.py		模型.py
要求.txt		要求.txt
检索.py		检索.py
列车.py		列车.py
voc_clf.py电话		voc_clf.py电话
voc_det.py（语音_数据.py）		voc_det.py（语音_数据.py）
零快照.py		零快照.py

提供反馈

保存的搜索

使用保存的搜索更快地筛选结果

存储库文件导航

Lite夹子

安装

环境

数据集集合

预处理数据

培训

关于

发布

包装

语言文字

许可证

4m4n5/CLIP-Lite系列

文件夹和文件

最近一次提交

历史

存储库文件导航

Lite夹子

安装

环境

数据集集合

预处理数据

培训

关于

话题

资源

许可证

星星

观察者

叉子

发布

包装0

语言文字

包装