rllm

rllm-org

Democratizing Reinforcement Learning for LLMs

AI 简介

rLLM 是一个面向大语言模型智能体的强化学习训练框架，旨在降低 RL 训练 AI agent 的技术门槛。它支持与 LangGraph、OpenAI Agents SDK 等主流 agent 框架无缝集成，仅需极少代码修改（如添加装饰器）即可自动追踪 LLM 调用并接入 RL 训练流程；内置 GRPO、REINFORCE 等多种算法，提供 CLI 一键评估/训练能力，并兼容单机（tinker）与分布式多 GPU（verl）两种训练后端。适用于需要提升智能体推理、编程或决策能力的场景，如数学求解、金融分析、代码生成等任务的 agent 优化。

Python

Apache License 2.0

agent-framework agentic-workflow coding-agent distributed-training llm-reasoning llm-training machine-learning ml-infrastructure ml-platform reinforcement-learning search-agent swe-agent tinker verl

在 GitHub 查看官方网站

5.7k

Stars

582

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+32

综合评分67.5

默认分支main

rllm

Star 增长

加入交流群