young-geng

EasyLM

young-geng

Large language models (LLMs) made easy, EasyLM is a one stop solution for pre-training, finetuning, evaluating and serving LLMs in JAX/Flax.

AI 简介

EasyLM 是一个简化大型语言模型(LLM)预训练、微调、评估和服务的一站式解决方案,基于 JAX/Flax 实现。项目的核心功能包括支持 LLaMA、LLaMA 2 和 LLaMA 3 等流行模型的训练与部署,并通过 JAX 的 pjit 功能实现跨多个 TPU/GPU 加速器的大规模并行训练,有效解决单个加速器内存不足的问题。此外,EasyLM 基于 Hugging Face 的 transformers 和 datasets 库构建,提供了易于使用和定制的代码库。该项目适用于需要高效训练和部署大规模语言模型的研究人员和开发者,特别适合在 Google Cloud TPU Pods 上进行多主机训练。

Python
Apache License 2.0
2.5k
Stars
260
Forks
37
Watchers
28
Issues

Star 增长

今日0
近 7 天0
近 30 天+2
综合评分59.45
默认分支main