torchtune

meta-pytorch

PyTorch native post-training library

AI 简介

torchtune 是 PyTorch 官方推出的轻量级大语言模型（LLM）后训练库，专注于简化微调、对齐与量化等 post-training 任务。核心功能包括支持监督微调（SFT）、DPO、PPO、GRPO、知识蒸馏及量化感知训练，提供开箱即用的 YAML 配置、PyTorch 原生模型实现（如 Llama、Gemma、Qwen 等），并深度集成 PyTorch 最新 API 实现高效内存利用与多节点扩展。适用于研究者和工程师在 GPU 环境下快速实验 LLM 微调策略、算法对比与轻量部署，尤其适合需可复现、模块化训练流程的学术与原型开发场景。

Python

BSD 3-Clause "New" or "Revised" License

在 GitHub 查看官方网站

5.8k

Stars

733

Forks

Watchers

341

Issues

Star 增长

今日0

近 7 天0

近 30 天+5

综合评分65.1

默认分支main

torchtune

Star 增长

加入交流群