lucidrains

DALLE2-pytorch

lucidrains

Implementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytorch

AI 简介

该项目实现了OpenAI的DALL-E 2文本到图像合成神经网络的PyTorch版本。它通过一个额外的先验网络(可以是自回归变换器或扩散模型)来预测基于CLIP文本嵌入的图像嵌入,从而生成高质量的图像。此实现专注于构建性能最佳的扩散先验网络,并且使用了因果变换器作为去噪网络。适用于需要从文本描述生成高质量图像的应用场景,比如创意设计、内容创作等。项目提供了预训练模型和训练脚本,支持大规模并行训练。

Python
MIT License
11.3k
Stars
1.1k
Forks
119
Watchers
68
Issues

Star 增长

今日0
近 7 天+3
近 30 天+5
综合评分41.1
默认分支main