naklecha

llama3-from-scratch

naklecha

llama3 implementation one matrix multiplication at a time

AI 简介

该项目是从零开始逐步实现Llama3模型,通过逐个张量和矩阵乘法来构建。它使用Jupyter Notebook作为开发环境,并直接从Meta提供的模型文件中加载权重。项目不包括BPE分词器的实现,但提供了链接指向Karpathy的简洁实现。该实现适合对深度学习模型有深入了解的研究人员或开发者,特别是那些希望深入理解大型语言模型内部机制的人。此外,对于需要自定义修改或扩展Llama3功能的场景也非常适用。

Jupyter Notebook
MIT License
15.2k
Stars
1.3k
Forks
103
Watchers
16
Issues

Star 增长

今日0
近 7 天0
近 30 天0
综合评分39.33
默认分支main