CompVis

stable-diffusion

CompVis

A latent text-to-image diffusion model

AI 简介

Stable Diffusion 是一个基于潜在扩散模型的文本到图像生成工具。该项目利用了CLIP ViT-L/14文本编码器来根据给定的文字提示生成高质量图像,其核心架构包括一个860M参数的UNet和一个轻量级的123M参数文本编码器,使得该模型能够在至少拥有10GB显存的GPU上运行。适合用于需要从自然语言描述中快速创建视觉内容的应用场景,如艺术创作、设计辅助及创意原型开发等。此外,通过与Stability AI等机构的合作,Stable Diffusion在大规模数据集上进行了训练,确保了生成图像的质量与多样性。

Jupyter Notebook
Other
73.1k
Stars
10.6k
Forks
567
Watchers
540
Issues

Star 增长

今日+1
近 7 天+21
近 30 天+114
综合评分72.5
默认分支main