
llama3-from-scratch
naklecha
llama3 implementation one matrix multiplication at a time
AI 简介
该项目是从零开始逐步实现Llama3模型,通过逐个张量和矩阵乘法来构建。它使用Jupyter Notebook作为开发环境,并直接从Meta提供的模型文件中加载权重。项目不包括BPE分词器的实现,但提供了链接指向Karpathy的简洁实现。该实现适合对深度学习模型有深入了解的研究人员或开发者,特别是那些希望深入理解大型语言模型内部机制的人。此外,对于需要自定义修改或扩展Llama3功能的场景也非常适用。
Jupyter Notebook
MIT License15.2k
Stars
1.3k
Forks
103
Watchers
16
Issues
Star 增长
今日0
近 7 天0
近 30 天0
综合评分39.33
默认分支main