PeterGriffinJin

Search-R1

PeterGriffinJin

Search-R1: An Efficient, Scalable RL Training Framework for Reasoning & Search Engine Calling interleaved LLM based on veRL

AI 简介

Search-R1 是一个基于强化学习的框架,用于训练能够进行推理和调用搜索引擎的语言模型。该项目支持多种强化学习方法(如PPO、GRPO、Reinforce)、不同类型的大型语言模型(例如Llama3、Qwen2.5等)以及不同的搜索引擎(包括本地稀疏/密集检索器和在线搜索引擎)。通过这些技术组合,Search-R1使基础模型能够自主发展出复杂的推理能力和有效的工具调用技能。该框架适用于需要增强语言模型以执行复杂任务或获取外部信息的应用场景,比如知识问答系统、智能助手等。此外,Search-R1提供了完全开源的训练流程,为研究人员和技术开发者提供了一个强大的实验平台。

Python
Apache License 2.0
4.9k
Stars
439
Forks
19
Watchers
26
Issues

Star 增长

今日0
近 7 天+49
近 30 天+207
综合评分79.93
默认分支main