
ERNIE-Image
baidu
ERNIE-Image is an open text-to-image generation model developed by the ERNIE-Image team at Baidu. It is built on a single-stream Diffusion Transformer (DiT), with only 8B DiT parameters, it reaches state-of-the-art performance among open-weight text-to-image models.
AI 简介
ERNIE-Image 是由百度 ERNIE-Image 团队开发的一款开源文本到图像生成模型。该模型基于单流扩散变换器(DiT),仅使用80亿参数就能在开放权重的文本到图像模型中达到最先进的性能,同时配备了一个轻量级的提示增强器来丰富用户的简短输入。其核心功能包括高质量的文字渲染、复杂指令跟随以及结构化视觉内容生成,特别适用于海报、信息图、用户界面类图像等文本密集型视觉内容的创建。此外,ERNIE-Image 支持多种风格的图像生成,并且可以在具有24G显存的消费级GPU上运行,便于实际部署。
Python
Apache License 2.0475
Stars
34
Forks
3
Watchers
12
Issues
Star 增长
今日0
近 7 天+8
近 30 天+35
综合评分52.13
默认分支main