PASSL代码解读[01] readme

news/2024/4/27 12:30:24

在这里插入图片描述

介绍

PASSL 是一个基于 PaddlePaddle 的视觉库,用于使用 PaddlePaddle 进行最先进的视觉自监督学习研究。PASSL旨在加速自监督学习的研究周期:从设计一个新的自监督任务到评估所学的表征

PASSL 主要特性:

  • 自监督前沿算法实现

    PASSL 实现了多种前沿自监督学习算法,包括不限于 SimCLR、MoCo(v1)、MoCo(v2)、MoCo-BYOL、CLIP、BYOL、BEiT。同时支持有监督分类训练。

  • 模块化设计

    易于建立新的任务和重用其他任务的现有组件 (Trainer, models and heads, data transforms, etc.)

🛠️ PASSL 的最终目标是利用自监督学习为下游任务提供更合适的预训练权重,同时大幅度降低数据标注成本。

模型库

  • Self-Supervised Learning Models

PASSL 实现了一系列自监督学习算法,更具体的使用文档请参阅 Document

EpochsOfficial resultsPASSL resultsBackboneModelDocument
MoCo20060.660.64ResNet-50downloadTrain MoCo
SimCLR10064.565.3ResNet-50downloadTrain SimCLR
MoCo v220067.767.72ResNet-50downloadTrain MoCo
MoCo-BYOL30071.5672.10ResNet-50downloadTrain MoCo-BYOL
BYOL30072.5071.62ResNet-50downloadTrain BYOL
PixPro10055.1(fp16)57.2(fp32)ResNet-50downloadTrain PixPro
SimSiam10068.368.4ResNet-50downloadTrain SimSiam
DenseCL20063.6263.37ResNet-50downloadTrain PixPro
SwAV10072.172.4ResNet-50downloadTrain SwAV

Benchmark Linear Image Classification on ImageNet-1K.

  • Classification Models

PASSL 实现了视觉 Transformer 等具有影响力的图像分类算法,并提供了相应的预训练权重。旨在支持自监督、多模态、大模型算法的建设和研究。更多使用细节请参阅 Classification_Models_Guide.md

DetailTutorial
ViT/PaddleEdu
Swin Transformer/PaddleEdu
CaiTconfigPaddleFleet
T2T-ViTconfigPaddleFleet
CvTconfigPaddleFleet
BEiTconfigunofficial
MLP-MixerconfigPaddleFleet
ConvNeXtconfigPaddleFleet

🔥 PASSL 提供了详细的算法剖析,具体请参阅 Tutorial

安装

请参阅 INSTALL.md 进行安装

快速开始

请参阅 GETTING_STARTED.md 了解 PASSL 的基本用法

Awesome SSL

自监督学习 (Self-Supervised Learning, SSL) 是一个发展十分迅速的领域,这里列出一些具有影响力的 Paper 供研究使用。PASSL 会争取实现具有应用潜力的自监督算法

  • Masked Feature Prediction for Self-Supervised Visual Pre-Training by Chen Wei, Haoqi Fan, Saining Xie, Chao-Yuan Wu, Alan Yuille, Christoph Feichtenhofer.
  • Masked Autoencoders Are Scalable Vision Learners by Kaiming He, Xinlei Chen, Saining Xie, Yanghao Li, Piotr Dollár, Ross Girshick.
  • Corrupted Image Modeling for Self-Supervised Visual Pre-Training by Yuxin Fang, Li Dong, Hangbo Bao, Xinggang Wang, Furu Wei.
  • Are Large-scale Datasets Necessary for Self-Supervised Pre-training? by Alaaeldin El-Nouby, Gautier Izacard, Hugo Touvron, Ivan Laptev, Hervé Jegou, Edouard Grave.
  • PeCo: Perceptual Codebook for BERT Pre-training of Vision Transformers by Xiaoyi Dong, Jianmin Bao, Ting Zhang, Dongdong Chen, Weiming Zhang, Lu Yuan, Dong Chen, Fang Wen, Nenghai Yu.
  • SimMIM: A Simple Framework for Masked Image Modeling by Zhenda Xie, Zheng Zhang, Yue Cao, Yutong Lin, Jianmin Bao, Zhuliang Yao, Qi Dai, Han Hu.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.cpky.cn/p/11167.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

批量删除 rabbitmq中随机队列

批量删除 amq.gen–* 随机队列 操作错误产生了无效随机队列,需要批量删除 过滤列出指定amq.gen–队列 # 列出 指定 vhost/qq 以amq.gen开头的所有队列 rabbitmqctl list_queues --vhost / | grep ^amq.gen-# 批量删除队列 #由于list_queues会列出队列名称以及对应…

设计模式——观察者模式Observer

Q:观察者模式属于哪一类设计模式 A:观察者模式属于行为学模式 Q:什么是观察者模式 A:当一个对象的状态发生改变时,所有依赖它的对象都得到通知,并自动更新 观察者模式解析:报纸类维护了一个…

如何使用极狐GitLab 自定义 Pages 根域名

本文作者:徐晓伟 GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署极狐GitLab。 本文主要讲述了极狐GitLab Pages …

html页面使用@for(){},@if(){},利用jquery 获取当前class在列表中的下标

基于以前的项目进行修改优化,前端代码根据List元素在html里进行遍历显示 原先的代码: 其中,noticeGuide.Id是标识noticeGuide的唯一值,但是不是从0开始的【是数据库自增字段】 但是在页面初始化加载的时候,我们只想…

蓝桥杯刷题之路径之谜

题目来源 路径之谜 不愧是国赛的题目 题意 题目中会给你两个数组,我这里是分别用row和col来表示 每走一步,往左边和上边射一箭,走到终点的时候row数组和col数组中的值必须全部等于0这个注意哈,看题目看了半天,因为…

第十二届蓝桥杯省赛CC++ 研究生组-卡片

solution1 直接依次计算&#xff0c;思维上最直接 #include<stdio.h> int main(){int a[10], n 1, t1, t2, flag 1;for(int i 0; i < 10; i)a[i] 2021;while(flag){t1 n;while(t1){t2 t1 % 10;a[t2]--;if(a[t2] < 0){flag 0;break;} t1 / 10;}if(!t1 &…