UniVidX

houyuanchen111

[SIGGRAPH 2026 / TOG] Official code of the paper "UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors".

AI 简介

UniVidX 是一个统一的多模态视频生成框架，通过扩散先验技术实现多种视频生成任务。该项目集成了随机条件掩码（SCM）、解耦门控LoRA（DGL）和跨模态自注意力机制（CMSA），使得单个模型能够高效地处理多样化的视频生成需求，包括内在任务（如UniVid-Intrinsic）及Alpha通道处理（如UniVid-Alpha）。其在数据效率方面表现尤为突出，仅需少于1000个训练视频即可达到优异性能。该工具特别适用于需要灵活且高质量视频内容生成的应用场景，比如创意设计、影视特效制作等领域。

Python

在 GitHub 查看

226

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天+3

近 30 天+105

综合评分51.5

默认分支main