NVIDIA-NeMo

Megatron-Bridge

NVIDIA-NeMo

Training library for Megatron-based models with bidirectional Hugging Face conversion capability

AI 简介

NeMo Megatron Bridge 是一个用于基于Megatron模型训练的库,支持双向Hugging Face模型转换。其核心功能包括高效的模型训练、灵活的模型转换以及对多种预训练模型的支持,如DeepSeek V4、Nemotron-3 Nano Omni等,并提供了从自回归到扩散模型的转换能力。技术上,该项目采用Python语言编写,确保了良好的兼容性和易用性。适用于需要大规模语言模型训练和多模态处理的应用场景,例如自然语言处理、图像识别及音频分析等领域。通过提供详细的文档和示例代码,帮助开发者快速上手并部署相关模型。

Python
712
Stars
357
Forks
8
Watchers
212
Issues

Star 增长

今日0
近 7 天+9
近 30 天+22
综合评分55.36
默认分支main