VAR

FoundationVision

[NeurIPS 2024 Best Paper Award][GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". An *ultra-simple, user-friendly yet state-of-the-art* codebase for autoregressive image generation!

AI 简介

FoundationVision/VAR 是一个专注于自回归图像生成的项目，通过预测下一尺度来实现可扩展的图像生成。该项目提供了一个极其简单且用户友好的代码库，同时具备最先进的技术特性。它基于GPT风格模型超越了扩散模型，在视觉生成领域取得了显著进展，并观察到了生成过程中的规模法则。VAR特别适合需要高质量图像生成的应用场景，如创意设计、虚拟现实内容创作等。采用Jupyter Notebook编写，易于上手和扩展。

Jupyter Notebook

MIT License

auto-regressive-model autoregressive-models diffusion-models generative-ai generative-model gpt gpt-2 image-generation large-language-models neurips transformers vision-transformer

在 GitHub 查看

8.7k

Stars

568

Forks

100

Watchers

Issues

Star 增长

今日0

近 7 天+2

近 30 天+13

综合评分56.57

默认分支main