RL_Envs_101

adithya-s-k

Building and Scaling RL environments in the age of LLMs

AI 简介

这是一个面向大语言模型（LLM）强化学习应用的环境构建教学项目，旨在帮助开发者系统理解并实践在不同RL框架中实现同一环境的标准化方法。项目提供Jupyter代理、Wordle求解器和桌面操作等多场景参考环境，并在OpenEnv、ORS、NeMo Gym、Verifiers、SkyRL Gym和GEM等6个主流框架中分别实现，覆盖工具调用、状态建模、奖励设计与episode管理等核心组件；所有示例均可直接运行并支持与TRL的GRPOTrainer集成。适用于LLM智能体开发、工具增强型Agent训练、以及需要跨框架评估或迁移RL环境的研究与工程场景。

Python

Apache License 2.0

在 GitHub 查看官方网站

151

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+5

综合评分3.77

默认分支main

RL_Envs_101

Star 增长

加入交流群