
Firefly
yangjianxin1
Firefly: 大模型训练工具,支持训练Qwen2.5、Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya2、Vicuna、Bloom等大模型
AI 简介
Firefly是一个开源的大模型训练工具,支持多种主流大模型的预训练、指令微调和DPO。该项目的核心功能包括全量参数训练、LoRA及QLoRA高效训练方式,特别适合资源有限情况下的指令微调任务。技术特点上,Firefly通过配置文件简化了模型训练流程,使得即使是初学者也能快速上手上手,并且支持使用Unsloth加速训练过程以节省显存。此外,项目还提供了丰富的开源指令微调数据集以及一系列经过验证的高效训练模型权重。适用于需要对现有大模型进行定制化训练或优化的研究人员与开发者。
Python
6.6k
Stars
585
Forks
59
Watchers
203
Issues
Star 增长
今日+2
近 7 天+2
近 30 天+3
综合评分66.6
默认分支master