
MultiWorld
CIntellifusion
Official Implementation of MultiWorld: Scalable Multi-Agent Multi-View Video World Models
AI 简介
MultiWorld 是一个用于多智能体多视角视频世界建模的统一框架,旨在实现对多个智能体的精确控制并保持多视角一致性。该项目的核心功能包括通过Agent Identity Embedding和Adaptive Action Weighting来增强多智能体可控性,以及利用冻结的VGGT骨干网络从部分观察中提取隐式3D全局环境信息以提高多视角一致性。此外,MultiWorld支持自回归推理,能够生成超出训练上下文长度的内容,并且能有效扩展到不同的智能体数量和摄像机视角上。此项目适用于需要在复杂动态环境中进行多智能体协作与控制的研究场景,如游戏生成、机器人学等领域。
Python
225
Stars
12
Forks
3
Watchers
1
Issues
Star 增长
今日+3
近 7 天+6
近 30 天+24
综合评分51.74
默认分支main