
Relax
redai-infra
An Asynchronous Reinforcement Learning Engine for Omni-Modal Post-Training at Scale
AI 简介
Relax 是一个用于大规模多模态后训练的异步强化学习引擎。它基于Ray Serve构建,采用服务导向的六层架构设计,利用Megatron-LM作为训练后端和SGLang作为推理引擎,并通过TransferQueue实现训练与推理的完全解耦。该框架支持文本、图像、视频及音频等多模态数据的端到端强化学习训练,特别适用于需要跨模态处理能力的大规模语言模型优化场景。此外,Relax还具备弹性扩展、全异步操作以及丰富的内置算法库等特点,能够满足复杂环境下的高性能需求。
Python
Apache License 2.0423
Stars
45
Forks
343
Watchers
8
Issues
Star 增长
今日+10
近 7 天+20
近 30 天+61
综合评分81.09
默认分支main