FoundationVision

VAR

FoundationVision

[NeurIPS 2024 Best Paper Award][GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". An *ultra-simple, user-friendly yet state-of-the-art* codebase for autoregressive image generation!

AI 简介

FoundationVision/VAR 是一个专注于自回归图像生成的项目,通过预测下一尺度来实现可扩展的图像生成。该项目提供了一个极其简单且用户友好的代码库,同时具备最先进的技术特性。它基于GPT风格模型超越了扩散模型,在视觉生成领域取得了显著进展,并观察到了生成过程中的规模法则。VAR特别适合需要高质量图像生成的应用场景,如创意设计、虚拟现实内容创作等。采用Jupyter Notebook编写,易于上手和扩展。

Jupyter Notebook
MIT License
8.7k
Stars
568
Forks
100
Watchers
57
Issues

Star 增长

今日0
近 7 天+2
近 30 天+13
综合评分56.57
默认分支main