mistral-finetune

mistralai

暂无描述

AI 简介

mistral-finetune 是一个轻量级的代码库，旨在实现 Mistral 模型的记忆高效和高性能微调。该项目基于 LoRA（低秩适应）技术，通过冻结大部分权重并仅训练额外 1-2% 的低秩矩阵扰动来优化模型。推荐使用 A100 或 H100 GPU 以达到最佳效率，且该代码库针对多 GPU 单节点训练进行了优化，但较小的模型如 7B 版本单个 GPU 也足够使用。此项目为希望对 Mistral 模型进行微调的用户提供了一个简单、指导性强的入口点，特别适合那些寻求快速上手而不需要深入定制化选项的研究者或开发者。注意，它在数据格式等方面具有一定的倾向性，并不追求跨多种模型架构或硬件类型的全面覆盖。

Python

Apache License 2.0

在 GitHub 查看

3.1k

Stars

318

Forks

Watchers

Issues

Star 增长

今日0

近 7 天+2

近 30 天+3

综合评分47.81

默认分支main