Awesome-RL-for-LRMs

TsinghuaC3I

A Survey of Reinforcement Learning for Large Reasoning Models

AI 简介

这是一个系统梳理强化学习（RL）在大型推理模型（LRMs）中应用的开源综述项目。项目以结构化方式整理了RL赋能推理建模的关键方法，涵盖奖励建模、策略优化、环境构建、评估基准等核心方向，并同步维护前沿论文、开源工具与实践案例（如TTRL、MARTI、SSRL）。技术特点包括分类清晰、更新及时、兼顾理论与工程落地，所有内容基于MIT协议开放。适用于AI研究者、大模型算法工程师及希望将RL引入复杂推理任务（如数学证明、代码生成、多步决策）的技术团队快速掌握领域进展。

TeX

MIT License

awesome-list deepseek-r1 llm lrm open-source reasoning rl

在 GitHub 查看官方网站

2.5k

Stars

131

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+2

综合评分58.56

默认分支main

Awesome-RL-for-LRMs

Star 增长

加入交流群