huggingface

open-r1

huggingface

Fully open reproduction of DeepSeek-R1

AI 简介

Open R1 是一个旨在完全开源复现 DeepSeek-R1 的项目。该项目的核心功能包括通过GRPO和SFT训练模型,以及利用Distilabel生成合成数据。技术特点上,它提供了一套简洁易用的脚本与Makefile命令来简化R1管道中的各个步骤,支持从基础模型到RL调优的多阶段训练过程。适合于需要在数学、推理和编程等领域进行高质量语料库构建及模型训练的研究者和开发者使用。

Python
Apache License 2.0
26k
Stars
2.4k
Forks
281
Watchers
292
Issues

Star 增长

今日+2
近 7 天+15
近 30 天+34
综合评分84.9
默认分支main