nv-tlabs

PiD

nv-tlabs

PiD: Fast and High-Resolution Latent Decoding with Pixel Diffusion

AI 简介

PiD是一个即插即用的扩散解码器,能够将潜在表示直接转换为高分辨率像素图像。其核心技术特点是通过条件像素空间扩散模型统一了解码和上采样过程,在单次传递中直接在高分辨率像素空间进行去噪并生成超分辨率图像。该项目使用Python编写,适合于需要从低分辨率或潜在表示快速生成高质量图像的应用场景,如图像处理、计算机视觉任务等。此外,PiD支持多种流行的扩散模型框架,并提供了预训练权重以简化部署流程。

Python
Other
717
Stars
36
Forks
10
Watchers
7
Issues

Star 增长

今日+13
近 7 天+90
近 30 天+564
综合评分98.67
默认分支main