google

tunix

google

A Lightweight LLM Post-Training Library

AI 简介

Tunix 是一个基于 JAX 的轻量级大型语言模型后训练库。它支持在 TPU 上实现顶级的训练性能、监督微调、强化学习及代理强化学习等功能,并通过与 Flax NNX 等建模框架无缝集成,以及与 vLLM 和 SGLang-JAX 等高性能推理引擎结合,提供高效且可扩展的支持。Tunix 适用于需要对大型语言模型进行后训练优化的各种场景,特别是在追求计算效率和模型性能改进的研究和开发环境中。

Python
Apache License 2.0
2.3k
Stars
306
Forks
22
Watchers
44
Issues

Star 增长

今日+3
近 7 天+9
近 30 天+58
综合评分75.76
默认分支main