Search-R1

PeterGriffinJin

Search-R1: An Efficient, Scalable RL Training Framework for Reasoning & Search Engine Calling interleaved LLM based on veRL

AI 简介

Search-R1 是一个基于强化学习（RL）的开源框架，用于训练支持推理与搜索引擎调用交替执行的大型语言模型（LLM）。它基于 veRL 实现，支持 PPO、GRPO 等多种 RL 算法，兼容 Qwen2.5、Llama3.2 等主流 3B 级基础模型，并可对接本地检索器或在线搜索引擎。项目通过规则化结果奖励机制，使模型自主习得分步推理与工具调用协同能力。适用于需要开放域问答、事实核查、多跳搜索等任务的研究与工程场景，为 DeepSeek-R1 和 OpenAI DeepResearch 类技术提供可复现、可扩展的开源替代方案。

Python

Apache License 2.0

在 GitHub 查看官方网站

5.1k

Stars

451

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+41

综合评分68.07

默认分支main

Search-R1

Star 增长

加入交流群