
pytorch-image-models
huggingface
The largest collection of PyTorch image encoders / backbones. Including train, eval, inference, export scripts, and pretrained weights -- ResNet, ResNeXT, EfficientNet, NFNet, Vision Transformer (ViT), MobileNetV4, MobileNet-V3 & V2, RegNet, DPN, CSPNet, Swin Transformer, MaxViT, CoAtNet, ConvNeXt, and more
AI 简介
huggingface/pytorch-image-models 是一个包含大量 PyTorch 图像编码器和骨干网络的集合。该项目提供了多种流行的模型,如 ResNet、EfficientNet、Vision Transformer (ViT) 和 ConvNeXt 等,并且支持训练、评估、推理和导出脚本,同时提供了预训练权重。其核心功能包括分布式训练、数据增强技术(如 AugMix 和 RandAugment)、以及多种优化器选择。适用于需要高效图像分类、特征提取或迁移学习的应用场景,特别适合于计算机视觉研究者和开发者在学术研究或工业应用中使用。
Python
Apache License 2.036.9k
Stars
5.2k
Forks
318
Watchers
44
Issues
Star 增长
今日0
近 7 天+18
近 30 天+105
综合评分89
默认分支main