
DeepSeek-R1
deepseek-ai
暂无描述
AI 简介
DeepSeek-R1 是一个专注于推理任务的生成模型。该项目包括两个主要模型:DeepSeek-R1-Zero 和 DeepSeek-R1,前者通过大规模强化学习训练而成,后者则在前者基础上引入了冷启动数据以解决重复、可读性和语言混合等问题,从而进一步提升推理性能。DeepSeek-R1 在数学、代码和推理任务上的表现与OpenAI-o1相当,而其基于Llama和Qwen蒸馏出的密集模型(如DeepSeek-R1-Distill-Qwen-32B)在多个基准测试中超越了OpenAI-o1-mini,达到了新的技术水平。此项目适合需要高质量推理能力的应用场景,例如复杂问题解答、代码生成及数学解题等,并且为研究者提供了开源资源支持。
MIT License
92k
Stars
11.7k
Forks
599
Watchers
20
Issues
Star 增长
今日0
近 7 天+12
近 30 天+41
综合评分77.1
默认分支main