
DALLE-pytorch
lucidrains
Implementation / replication of DALL-E, OpenAI's Text to Image Transformer, in Pytorch
AI 简介
该项目是DALL-E的PyTorch实现,旨在将文本转化为图像。它基于Transformer架构,采用注意力机制和多模态处理技术来生成高质量的图像。项目提供了CLIP模型以对生成的图像进行排名,并支持通过Deepspeed进行高效训练。适合用于需要根据描述性文本自动生成图像的应用场景,如创意设计、内容创作等。此外,项目还提供了一些预训练模型和在线服务部署示例,方便用户快速上手使用。
Python
MIT License5.6k
Stars
642
Forks
91
Watchers
120
Issues
Star 增长
今日0
近 7 天0
近 30 天+4
综合评分34.82
默认分支main