THU-MIG

yoloe

THU-MIG

YOLOE: Real-Time Seeing Anything [ICCV 2025]

AI 简介

YOLOE是一个高效、统一且开放的对象检测与分割模型,旨在实现实时识别各种对象。它通过文本、视觉输入以及无提示范式等多种提示机制进行工作,相比传统的封闭集YOLO系列模型,YOLOE在保持零推理和迁移开销的同时,能够适应更加开放的场景。该模型采用PyTorch框架实现,并引入了可重参数化区域-文本对齐(RepRTA)策略来优化预训练文本嵌入,增强视觉-文本的一致性。此外,对于基于视觉的提示,YOLOE提出了语义激活的视觉处理方法。此项目适用于需要灵活应对未知类别对象检测及分割的应用场景,如智能监控、自动驾驶等。

Python
GNU Affero General Public License v3.0
2.2k
Stars
204
Forks
11
Watchers
80
Issues

Star 增长

今日+3
近 7 天+13
近 30 天+38
综合评分75.24
默认分支main