tloen

alpaca-lora

tloen

Instruct-tune LLaMA on consumer hardware

AI 简介

Alpaca-LoRA 项目旨在通过低秩适应(LoRA)技术在消费级硬件上对LLaMA模型进行指令调优。该项目基于Stanford Alpaca的研究成果,利用Hugging Face的PEFT库和bitsandbytes优化工具实现高效低成本的微调过程,使得即使是在如Raspberry Pi这样的低性能设备上也能运行类似text-davinci-003质量的指令模型,并且支持扩展到更大规模的模型(13b、30b、65b)。它适用于需要在有限计算资源条件下快速迭代自然语言处理任务场景下的研究者与开发者使用。此外,项目提供了详细的训练脚本及预训练权重下载链接,方便用户直接部署或进一步调整参数以获得更佳性能。

Jupyter Notebook
Apache License 2.0
18.9k
Stars
2.2k
Forks
150
Watchers
333
Issues

Star 增长

今日0
近 7 天0
近 30 天0
综合评分70
默认分支main