qibin0506

Cortex

qibin0506

从零构建大模型:从预训练到RLHF的完整实践

AI 简介

Cortex 是一个从零开始构建大模型的项目,涵盖了从预训练到强化学习(RLHF)的完整流程。该项目的核心功能包括国产芯片适配、轻量级MoE架构支持以及LLM作为裁判的PPO训练等,旨在降低个人开发者训练大型语言模型的成本和技术门槛。此外,Cortex还引入了思考控制机制和前沿的Attention Residuals架构特性,增强了模型的功能性和灵活性。适合于对自然语言处理感兴趣的研究人员、开发爱好者或小型团队,在有限资源条件下探索和实验大模型技术的应用场景。

Python
Apache License 2.0
2.7k
Stars
207
Forks
8
Watchers
8
Issues

Star 增长

今日+4
近 7 天+5
近 30 天+24
综合评分71.85
默认分支master