
IF
deep-floyd
暂无描述
AI 简介
DeepFloyd/IF 是一个先进的开源文本到图像生成模型,能够根据文本提示生成高度逼真的图像。该项目的核心功能包括一个冻结的文本编码器和三个级联的像素扩散模块,分别负责生成64x64、256x256和1024x1024分辨率的图像。这些模块基于T5变压器提取文本嵌入,并通过增强的UNet架构实现高效的图像合成。DeepFloyd IF特别适合需要高质量图像生成的应用场景,如创意设计、虚拟内容创作等。其卓越的性能在COCO数据集上的零样本FID得分为6.66,展示了其在当前同类模型中的领先地位。
Python
Other7.8k
Stars
527
Forks
82
Watchers
90
Issues
Star 增长
今日0
近 7 天0
近 30 天0
综合评分31.17
默认分支develop