
nanoGPT
karpathy
The simplest, fastest repository for training/finetuning medium-sized GPTs.
AI 简介
nanoGPT 是一个用于训练和微调中等规模 GPT 模型的简洁快速仓库。项目的核心功能包括通过简单的代码实现 GPT-2(1.24 亿参数)在 OpenWebText 数据集上的复现,支持从零开始训练新模型或对预训练模型进行微调。其技术特点在于代码结构清晰易读,`train.py` 和 `model.py` 分别仅约300行,便于用户根据需求进行修改。适用于需要快速上手GPT模型训练与微调的研究者、开发者以及对深度学习感兴趣的初学者,在有限计算资源下也能轻松开展实验。
Python
MIT License59.5k
Stars
10.3k
Forks
506
Watchers
246
Issues
Star 增长
今日+52
近 7 天+290
近 30 天+1668
综合评分110
默认分支master