open-gigaai

giga-brain-0

open-gigaai

GigaBrain-0: A World Model-Powered Vision-Language-Action Model

AI 简介

GigaBrain-0 是一个基于世界模型的视觉-语言-动作(VLA)模型,旨在通过合成数据减少对大规模真实机器人数据的依赖,从而提高跨任务的泛化能力。其核心功能包括利用世界模型生成多样化数据、RGBD输入建模以及具身链式思维监督,这些技术共同提升了模型在执行复杂任务时的空间几何理解、物体状态识别及长期依赖关系处理能力。适用于需要高效训练和良好泛化性能的通用机器人场景,特别是在灵巧操作、长周期任务及移动操作等领域展现出显著优势。

Python
Apache License 2.0
2.5k
Stars
197
Forks
144
Watchers
10
Issues

Star 增长

今日+3
近 7 天+7
近 30 天+26
综合评分70.99
默认分支main