
metaseq
facebookresearch
Repo for external large-scale work
AI 简介
Metaseq是一个用于处理大规模预训练Transformer模型(如OPT)的代码库。它支持从125M到175B参数规模的模型,并通过与Hugging Face Transformers、Alpa、Colossal-AI、CTranslate2、FasterTransformer以及DeepSpeed等工具和框架集成,提供了高效的训练、推理及部署能力。技术特点包括对多种硬件平台的支持(如不同代次的GPU)、8位量化等优化手段以减少资源消耗。适用于需要利用大规模语言模型进行研究或应用开发的场景,尤其是在预算有限且追求高性能计算效率的情况下。
Python
MIT License6.5k
Stars
718
Forks
8
Watchers
105
Issues
Star 增长
今日0
近 7 天0
近 30 天0
综合评分34.57
默认分支main