pytorch-image-models

huggingface

The largest collection of PyTorch image encoders / backbones. Including train, eval, inference, export scripts, and pretrained weights -- ResNet, ResNeXT, EfficientNet, NFNet, Vision Transformer (ViT), MobileNetV4, MobileNet-V3 & V2, RegNet, DPN, CSPNet, Swin Transformer, MaxViT, CoAtNet, ConvNeXt, and more

AI 简介

这是一个面向计算机视觉任务的PyTorch图像模型库，提供海量预训练图像编码器（backbone）及配套训练、评估与推理工具。核心功能包括统一接口支持ResNet、ViT、ConvNeXt、MobileNet等数十种主流架构，内置数据增强（如RandAugment、AugMix）、分布式训练、模型导出（ONNX/TorchScript）及高性能推理基准测试。技术特点涵盖标准化预训练权重管理、灵活的模型配置系统、跨架构一致的API设计，以及对新型视觉架构（如NaFlexViT、Hiera、CSATv2）的快速支持。适用于图像分类、特征提取、迁移学习及作为下游视觉模型（如检测、分割）的骨干网络。

Python

Apache License 2.0

在 GitHub 查看官方网站

37k

Stars

5.2k

Forks

321

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+55

综合评分75.5

默认分支main

pytorch-image-models

Star 增长

加入交流群