
build-nanogpt
karpathy
Video+code lecture on building nanoGPT from scratch
AI 简介
这个项目是关于从零开始构建nanoGPT的视频教程及代码实现。核心功能包括逐步重现GPT-2(124M)模型,通过详细的Git提交记录和YouTube视频讲解,让学习者能够清晰地理解每一步开发过程。采用Python语言编写,适合对自然语言处理特别是基于Transformer架构的语言模型感兴趣的开发者、研究人员或学生学习使用。该项目不仅提供了一个低成本复现GPT-2的方法,还为深入理解大规模语言模型的工作原理提供了宝贵资源。注意,本项目不涵盖聊天微调等内容。
Python
5.3k
Stars
828
Forks
49
Watchers
18
Issues
Star 增长
今日0
近 7 天+21
近 30 天+242
综合评分62.26
默认分支master