ART

OpenPipe

Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen3.6, GPT-OSS, Llama, and more!

AI 简介

ART（Agent Reinforcement Trainer）是一个面向多步智能体的开源强化学习训练框架，专为大语言模型（如Qwen3、Llama、GPT-OSS等）设计，支持基于GRPO算法的端到端在线式代理训练。其核心提供轻量级Python API、LoRA适配支持，以及与W&B集成的Serverless RL后端，实现免运维的自动扩缩容训练与即时推理部署。适用于需让LLM代理在真实任务（如工具调用、多步决策、交互式任务）中持续积累经验并优化策略的场景，尤其适合研究者与工程团队快速迭代可信赖的自主智能体系统。

Python

Apache License 2.0

agent agentic-ai grpo llms lora qwen qwen3 reinforcement-learning rl

在 GitHub 查看官方网站

10.3k

Stars

937

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+158

综合评分78.92

默认分支main

ART

Star 增长

加入交流群