
verl-omni
verl-project
RL training framework for diffusion and omni-modality models
AI 简介
VeRL-Omni 是一个专注于多模态生成模型的强化学习(RL)训练框架。该项目基于 `verl` 构建,支持扩散生成模型、统一多模态理解和生成模型以及全模态模型的后训练优化。其核心功能包括通过 `vLLM-Omni` 实现的高吞吐量推演、灵活的奖励计算管道、模块化的训练后端支持现有并行化技术如FSDP和USP,以及提供了端到端示例与基准测试。适用于需要高效处理文本、图像、音频及视频联合生成任务的研究者或开发者场景中,特别是在追求提高训练效率时表现尤为突出。
Python
Apache License 2.0338
Stars
50
Forks
2
Watchers
17
Issues
Star 增长
今日0
近 7 天+54
近 30 天+203
综合评分75.12
默认分支main