
LaST-R1
CHEN-H01
LaST-R1
AI 简介
LaST-R1 是一个旨在通过自适应物理潜在推理来增强机器人操作能力的框架。它利用视觉基础模型提供物理基础的潜在目标,以指导基于指令的潜在链式思维推理,并生成动作。在强化学习后训练阶段,LaST-R1 通过与环境进行闭环交互,存储潜在状态、动作和奖励,从而共同重塑潜在空间和动作空间,进一步实现了根据任务动态调整推理长度的能力。该项目适合需要提高机器人在多样化任务中执行稳定性和泛化能力的场景使用。代码基于 Python 3.10 构建,依赖 PyTorch 2.2.0 及 CUDA 12.0 或更高版本。
Python
MIT License101
Stars
6
Forks
1
Watchers
6
Issues
Star 增长
今日0
近 7 天+2
近 30 天+10
综合评分44.54
默认分支main