OpenPipe

ART

OpenPipe

Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen3.6, GPT-OSS, Llama, and more!

AI 简介

Agent Reinforcement Trainer (ART) 是一个用于通过GRPO训练多步骤代理执行现实任务的工具,特别适用于Qwen3.6、GPT-OSS、Llama等语言模型。其核心功能包括利用强化学习让大型语言模型从经验中学习,并提供了一个易于集成GRPO到任何Python应用中的框架。技术特点上,ART支持W&B Training服务,该服务可以自动管理训练和推理基础设施,从而降低40%的成本,提高28%的训练速度,并消除基础设施管理的麻烦。此外,它还提供了即时部署的能力,使得每个检查点都能立即通过W&B Inference获得。此项目非常适合需要快速迭代开发、减少运维负担以及希望在真实环境中优化AI代理表现的应用场景。

Python
Apache License 2.0
10k
Stars
891
Forks
66
Watchers
63
Issues

Star 增长

今日0
近 7 天+31
近 30 天+460
综合评分90.35
默认分支main