
UniVidX
houyuanchen111
[SIGGRAPH 2026 / TOG] Official code of the paper "UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors".
AI 简介
UniVidX 是一个统一的多模态视频生成框架,通过扩散先验技术实现多种视频生成任务。该项目集成了随机条件掩码(SCM)、解耦门控LoRA(DGL)和跨模态自注意力机制(CMSA),使得单个模型能够高效地处理多样化的视频生成需求,包括内在任务(如UniVid-Intrinsic)及Alpha通道处理(如UniVid-Alpha)。其在数据效率方面表现尤为突出,仅需少于1000个训练视频即可达到优异性能。该工具特别适用于需要灵活且高质量视频内容生成的应用场景,比如创意设计、影视特效制作等领域。
Python
226
Stars
9
Forks
1
Watchers
4
Issues
Star 增长
今日0
近 7 天+3
近 30 天+105
综合评分51.5
默认分支main