Saiyan-World

goku

Saiyan-World

[CVPR2025 Highlight] Video Generation Foundation Models: https://saiyan-world.github.io/goku/

AI 简介

Goku 是一个基于修正流Transformer的图像和视频联合生成模型,旨在实现工业级的高性能视觉生成。该项目通过精心的数据整理、模型设计和流公式化技术,提供了高质量的图像和视频生成能力。其核心功能包括文本到视频、图像到视频以及文本到图像的生成任务,并在多个基准测试中表现出色,如在GenEval(文本到图像生成)上得分为0.76,在DPG-Bench(文本到图像生成)上为83.65,在VBench(文本到视频生成)上达到84.85。Goku适用于需要高质量视频和图像生成的应用场景,例如创意内容制作、虚拟现实体验及广告制作等。

Python
2.9k
Stars
310
Forks
141
Watchers
2
Issues

Star 增长

今日0
近 7 天0
近 30 天+3
综合评分36.78
默认分支main