ZhengrongYue

PAE

ZhengrongYue

Official Implementation of "What Matters for Diffusion-Friendly Latent Manifold? Prior-Aligned Autoencoders for Latent Diffusion"

AI 简介

PAE(Prior-Aligned AutoEncoder)是一个旨在为潜在扩散模型构建扩散友好型潜在流形的框架。该项目通过特定的先验对齐正则化,优化了潜在空间的空间结构一致性、局部流形连续性和全局流形语义这三个关键属性,从而在不依赖于单纯的重建保真度或预训练表示的情况下,显著提升了生成质量和收敛速度。实验表明,在ImageNet 256×256数据集上,PAE实现了1.03的gFID值,并且比同类方法RAE快13倍达到收敛。此项目适合需要高效生成高质量图像的应用场景,如图像合成、风格迁移等。

Python
MIT License
61
Stars
5
Forks
3
Watchers
1
Issues

Star 增长

今日+2
近 7 天+3
近 30 天+7
综合评分48.53
默认分支main