Lightning-AI

lit-llama

Lightning-AI

Implementation of the LLaMA language model based on nanoGPT. Supports flash attention, Int8 and GPTQ 4bit quantization, LoRA and LLaMA-Adapter fine-tuning, pre-training. Apache 2.0-licensed.

AI 简介

Lit-LLaMA 是一个基于nanoGPT实现的LLaMA语言模型,支持闪存注意力、Int8和GPTQ 4位量化、LoRA和LLaMA-Adapter微调以及预训练。该项目采用Python编写,具有简洁的单文件实现,并且在数值上与原始模型等效,同时优化了在消费级硬件或大规模环境下的运行性能。适用于需要开源许可(Apache 2.0)下进行预训练、微调及推理的语言模型应用场景。不过需要注意的是,此仓库已不再积极维护,建议关注其继任者项目LitGPT。

Python
Apache License 2.0
6.1k
Stars
518
Forks
66
Watchers
100
Issues

Star 增长

今日0
近 7 天0
近 30 天0
综合评分64.15
默认分支main