lucidrains

deep-daze

lucidrains

Simple command line tool for text to image generation using OpenAI's CLIP and Siren (Implicit neural representation network). Technique was originally created by https://twitter.com/advadnoun

AI 简介

Deep Daze 是一个基于命令行的文本到图像生成工具,利用 OpenAI 的 CLIP 和 Siren(隐式神经表示网络)技术。其核心功能是将自然语言描述转化为高质量的图像,支持通过增加层数和使用更多显存来提高生成图片的质量。该项目适合需要快速从文字描述中创建视觉内容的场景,如艺术创作、设计概念可视化等。用户只需简单的命令即可开始生成过程,例如 `imagine "a house in the forest"`,并且可以通过添加参数调整输出效果。要求运行环境具备至少 4GB 显存的 GPU。

Python
MIT License
4.3k
Stars
311
Forks
72
Watchers
89
Issues

Star 增长

今日0
近 7 天0
近 30 天+2
综合评分59.68
默认分支main