
Cortex
qibin0506
从零构建大模型:从预训练到RLHF的完整实践
AI 简介
Cortex 是一个从零开始构建大模型的项目,涵盖了从预训练到强化学习(RLHF)的完整流程。该项目的核心功能包括国产芯片适配、轻量级MoE架构支持以及LLM作为裁判的PPO训练等,旨在降低个人开发者训练大型语言模型的成本和技术门槛。此外,Cortex还引入了思考控制机制和前沿的Attention Residuals架构特性,增强了模型的功能性和灵活性。适合于对自然语言处理感兴趣的研究人员、开发爱好者或小型团队,在有限资源条件下探索和实验大模型技术的应用场景。
Python
Apache License 2.02.7k
Stars
207
Forks
8
Watchers
8
Issues
Star 增长
今日+4
近 7 天+5
近 30 天+24
综合评分71.85
默认分支master