
MiMo
XiaomiMiMo
MiMo: Unlocking the Reasoning Potential of Language Model – From Pretraining to Posttraining
AI 简介
MiMo项目旨在解锁语言模型的推理潜力,从预训练到后训练全面提升模型性能。它通过扩展监督微调(SFT)数据集规模和增强强化学习(RL)训练窗口大小来优化模型,特别是在数学、编程及STEM领域的问题解决能力上取得了显著进步。技术上,MiMo使用Python开发,并且在多个基准测试中展示了其7B参数模型能够超越更大规模模型的表现。该项目适合需要强大逻辑推理能力的应用场景,如教育辅助软件、自动代码生成工具等。
Python
Apache License 2.02.2k
Stars
94
Forks
9
Watchers
38
Issues
Star 增长
今日0
近 7 天+14
近 30 天+51
综合评分50.03
默认分支main