deepseek-ai

DeepSeek-Math

deepseek-ai

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

AI 简介

DeepSeekMath是一个专注于提升开放语言模型中数学推理能力的项目。它基于DeepSeek-Coder-v1.5 7B进行预训练,使用了来自Common Crawl的数学相关标记以及自然语言和代码数据,总训练量达到500亿个标记。该项目的核心功能包括无需外部工具包或投票技术即可在竞赛级别的MATH基准测试中取得51.7%的高分,接近Gemini-Ultra和GPT-4的表现水平。此外,为了便于研究,项目还公开发布了基础、指令调优及强化学习版本的模型检查点。DeepSeekMath特别适合需要高级数学推理能力的应用场景,如教育软件开发、自动解题系统构建等。

Python
MIT License
3.3k
Stars
582
Forks
38
Watchers
38
Issues

Star 增长

今日+7
近 7 天+19
近 30 天+46
综合评分88.4
默认分支main