lucidrains

DALLE-pytorch

lucidrains

Implementation / replication of DALL-E, OpenAI's Text to Image Transformer, in Pytorch

AI 简介

该项目是DALL-E的PyTorch实现,旨在将文本转化为图像。它基于Transformer架构,采用注意力机制和多模态处理技术来生成高质量的图像。项目提供了CLIP模型以对生成的图像进行排名,并支持通过Deepspeed进行高效训练。适合用于需要根据描述性文本自动生成图像的应用场景,如创意设计、内容创作等。此外,项目还提供了一些预训练模型和在线服务部署示例,方便用户快速上手使用。

Python
MIT License
5.6k
Stars
642
Forks
91
Watchers
120
Issues

Star 增长

今日0
近 7 天0
近 30 天+4
综合评分34.82
默认分支main