ByteDance-Seed

Bagel

ByteDance-Seed

Open-source unified multimodal model

AI 简介

BAGEL 是一个开源的统一多模态模型,具有70亿活跃参数(总共140亿),在大规模交织的多模态数据上进行训练。其核心功能包括多模态理解和生成,能够在标准多模态理解排行榜上超越当前顶级开源视觉-语言模型,并在文本到图像生成方面与专业生成器如SD3相媲美。此外,BAGEL在经典图像编辑场景中表现出色,并且能够扩展到自由形式的视觉操作、多视角合成和世界导航等任务,这些能力超出了以往图像编辑模型的范围。该项目适合需要高级多模态处理能力的应用场景,例如跨模态内容生成、复杂图像编辑以及虚拟环境中的导航任务。

Python
Apache License 2.0
6k
Stars
533
Forks
50
Watchers
142
Issues

Star 增长

今日0
近 7 天+17
近 30 天+85
综合评分81.18
默认分支main