
lit-llama
Lightning-AI
Implementation of the LLaMA language model based on nanoGPT. Supports flash attention, Int8 and GPTQ 4bit quantization, LoRA and LLaMA-Adapter fine-tuning, pre-training. Apache 2.0-licensed.
AI 简介
Lit-LLaMA 是一个基于nanoGPT实现的LLaMA语言模型,支持闪存注意力、Int8和GPTQ 4位量化、LoRA和LLaMA-Adapter微调以及预训练。该项目采用Python编写,具有简洁的单文件实现,并且在数值上与原始模型等效,同时优化了在消费级硬件或大规模环境下的运行性能。适用于需要开源许可(Apache 2.0)下进行预训练、微调及推理的语言模型应用场景。不过需要注意的是,此仓库已不再积极维护,建议关注其继任者项目LitGPT。
Python
Apache License 2.06.1k
Stars
518
Forks
66
Watchers
100
Issues
Star 增长
今日0
近 7 天0
近 30 天0
综合评分64.15
默认分支main