stable-diffusion

CompVis

A latent text-to-image diffusion model

AI 简介

Stable Diffusion 是一个基于潜在空间的文本到图像扩散生成模型，通过冻结的 CLIP 文本编码器理解提示词，并在轻量级 UNet 架构中迭代去噪生成 512×512 分辨率图像。其技术特点是采用降采样因子为 8 的自编码器压缩图像表征，显著降低计算开销，可在单张 10GB 显存 GPU 上本地运行。模型训练于 LAION-5B 子集，兼顾生成质量与推理效率，适用于研究型图像生成、AI 艺术创作辅助、可控内容合成等需要开源可部署文本生成图像能力的场景。

Jupyter Notebook

Other

在 GitHub 查看官方网站

73.2k

Stars

10.6k

Forks

567

Watchers

540

Issues

Star 增长

今日0

近 7 天0

近 30 天+37

综合评分73.7

默认分支main

stable-diffusion

Star 增长

加入交流群