karpathy

minGPT

karpathy

A minimal PyTorch re-implementation of the OpenAI GPT (Generative Pretrained Transformer) training

AI 简介

minGPT是一个使用PyTorch重新实现的OpenAI GPT(生成式预训练Transformer)模型,旨在提供简洁、可解释性强且教育意义丰富的代码库。项目核心在于通过约300行Python代码实现了GPT模型的基本功能,包括训练与推理过程,并特别关注了批处理技巧以提高效率。它适合用于教学场景、快速原型开发以及对Transformer架构有兴趣的研究人员和开发者学习使用。尽管该项目已进入半存档状态,但其提供的基础仍为理解和构建更复杂的自然语言处理任务打下了坚实的基础。

Python
MIT License
24.5k
Stars
3.3k
Forks
266
Watchers
49
Issues

Star 增长

今日+4
近 7 天+43
近 30 天+186
综合评分88
默认分支master