lucidrains

imagen-pytorch

lucidrains

Implementation of Imagen, Google's Text-to-Image Neural Network, in Pytorch

AI 简介

该项目是Imagen的PyTorch实现,这是一种由Google开发的文本到图像的神经网络,其性能超越了DALL-E2。核心功能包括基于大型预训练T5模型(注意力网络)生成高质量图像,采用级联DDPM架构,并结合动态裁剪、噪声水平调节及内存高效UNet设计以优化分类器无指导效果。适用于需要高精度文本到图像转换的应用场景,如创意设计、虚拟内容生成等。

Python
MIT License
8.4k
Stars
800
Forks
113
Watchers
101
Issues

Star 增长

今日0
近 7 天+1
近 30 天+20
综合评分47.21
默认分支main