redai-infra

Relax

redai-infra

An Asynchronous Reinforcement Learning Engine for Omni-Modal Post-Training at Scale

AI 简介

Relax 是一个用于大规模多模态后训练的异步强化学习引擎。它基于Ray Serve构建,采用服务导向的六层架构设计,利用Megatron-LM作为训练后端和SGLang作为推理引擎,并通过TransferQueue实现训练与推理的完全解耦。该框架支持文本、图像、视频及音频等多模态数据的端到端强化学习训练,特别适用于需要跨模态处理能力的大规模语言模型优化场景。此外,Relax还具备弹性扩展、全异步操作以及丰富的内置算法库等特点,能够满足复杂环境下的高性能需求。

Python
Apache License 2.0
423
Stars
45
Forks
343
Watchers
8
Issues

Star 增长

今日+10
近 7 天+20
近 30 天+61
综合评分81.09
默认分支main