verl-omni

verl-project

Multimodal RL training framework for diffusion & omni models

AI 简介

VeRL-Omni 是一个面向多模态生成模型的强化学习（RL）训练框架，专为扩散模型与全模态（omni-modality）模型设计。它支持文本→图像/视频/音频等跨模态生成任务的RL后训练，核心特性包括基于 vLLM-Omni 的高性能 rollout、灵活的多模态奖励计算 pipeline、对 FSDP/USP 等分布式训练技术的原生集成，以及异步 reward 计算带来的吞吐提升。适用于需对 Qwen-Image、HunyuanImage-3.0、Qwen3-Omni 等多模态生成模型进行 RLHF 或策略优化的研究与工程场景。

Python

Apache License 2.0

在 GitHub 查看官方网站

500

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+67

综合评分9.61

默认分支main

verl-omni

Star 增长

加入交流群