rai-opensource

q2rl

rai-opensource

Q-Estimation and Q-Gating from BC for RL

AI 简介

q2rl项目专注于从行为克隆中提取Q值,以支持机器人上的强化学习任务。其核心功能包括Q估计与Q门控技术,旨在通过利用已有的行为克隆数据来生成有效的Q函数,从而减少对大规模在线交互的需求。该方案基于Python实现,并采用了JAX等高效计算库进行加速。适用于需要在有限样本条件下快速部署强化学习模型的场景,特别是对于那些难以获取大量实际操作数据的复杂机器人控制系统而言,q2rl提供了一种成本效益高的解决方案。

Python
MIT License
34
Stars
4
Forks
30
Watchers
0
Issues

Star 增长

今日0
近 7 天+2
近 30 天+2
综合评分43.3
默认分支main