
how-to-train-your-gpt
raiyanyahya
Build a modern LLM from scratch. Every line commented. Explained like we are five.
AI 简介
这个项目是一个从零开始构建现代语言模型的教育指南。它通过12个章节,超过3900行代码,详细解释了如何一步步实现一个类似GPT的语言模型,包括分词器、嵌入层、注意力机制、训练循环和推理引擎等核心组件。每行代码都附有注释,以最简单的术语解释其功能与原理,特别适合Python基础开发者、对Transformer架构感兴趣的学者以及想要深入了解大语言模型内部运作机制的工程师学习使用。无需任何机器学习背景知识,只需具备基本的Python编程技能即可上手。
Jupyter Notebook
MIT License2.2k
Stars
294
Forks
15
Watchers
1
Issues
Star 增长
今日0
近 7 天+34
近 30 天+1412
综合评分86.41
默认分支master