Robbyant

lingbot-va

Robbyant

[RSS 2026] Causal video-action world model for generalist robot control

AI 简介

LingBot-VA 是一个用于通用机器人控制的因果视频-动作世界模型。该项目通过自回归框架统一了视觉动态预测和动作推断,同时保持两者在概念上的区别。其核心技术特点包括高效的双流混合变压器架构(MoT),支持异步执行与KV缓存机制,从而提升了样本效率、长时间任务成功率以及对新场景的泛化能力。适用于需要高精度和长时序操作的机器人应用场合,如自动化生产线、服务机器人等。

Python
Apache License 2.0
1.3k
Stars
110
Forks
12
Watchers
44
Issues

Star 增长

今日0
近 7 天+35
近 30 天+139
综合评分81.64
默认分支main