
ms-swift
modelscope
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.6, DeepSeek-V4, GLM-5.1, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Gemma4, Llava, Phi4, ...) (AAAI 2025).
AI 简介
ms-swift 是一个由 ModelScope 社区提供的大规模模型和多模态大规模模型微调与部署框架。它支持超过600种文本大模型和400种多模态大模型的预训练、微调、对齐、推理、评估、量化和部署,涵盖Qwen3.6、DeepSeek-R1、GLM-5.1等文本模型及Qwen3-VL、Qwen3-Omni等多模态模型。项目集成了包括Megatron并行技术(如TP、PP、CP、EP)在内的最新训练技术,以加速模型训练过程,并支持多种GRPO算法家族中的强化学习算法,如GRPO、DAPO、GSPO等,以优化模型性能。ms-swift适用于需要高效处理大规模语言模型和多模态模型的研究者和开发者,在自然语言处理、计算机视觉以及跨模态任务中有着广泛的应用场景。
Python
Apache License 2.014.5k
Stars
1.5k
Forks
50
Watchers
985
Issues
Star 增长
今日+39
近 7 天+117
近 30 天+384
综合评分119.5
默认分支main