microsoft

Swin-Transformer

microsoft

This is an official implementation for "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows".

AI 简介

Swin Transformer 是一种基于分层视觉变换器的图像处理框架,通过使用移位窗口机制来提升模型在多种视觉任务上的性能。该项目的核心功能包括图像分类、目标检测、实例分割和语义分割等,并且支持视频动作识别等多种扩展应用。它采用了层级式的注意力机制设计,能够在保持高精度的同时有效减少计算成本。适合于需要高性能图像分析与理解的应用场景,如自动驾驶、医学影像分析以及任何要求精细视觉感知能力的领域。

Python
MIT License
16k
Stars
2.2k
Forks
125
Watchers
186
Issues

Star 增长

今日+11
近 7 天+22
近 30 天+55
综合评分106.5
默认分支main