qlora

artidoro

QLoRA: Efficient Finetuning of Quantized LLMs

AI 简介

QLoRA 是一种高效微调量化大语言模型（LLM）的技术方案，通过4位量化（NF4）、双重量化与分页优化器等创新，在单张48GB GPU上即可微调65B参数模型，同时保持接近全精度微调的性能。其核心基于 bitsandbytes 量化库，并深度集成 Hugging Face 的 PEFT 和 transformers 生态，支持 LoRA 适配器在冻结的4-bit模型上反向传播梯度。适用于资源受限场景下的高质量指令微调、对话模型训练及大规模模型轻量化适配，尤其适合学术研究、中小团队快速迭代定制化 LLM。

Jupyter Notebook

MIT License

在 GitHub 查看官方网站

11k

Stars

875

Forks

Watchers

193

Issues

Star 增长

今日0

近 7 天0

近 30 天+10

综合评分69.83

默认分支main

qlora

Star 增长

加入交流群