
ROLL
alibaba
An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models
AI 简介
ROLL 是一个专为大规模语言模型设计的高效且用户友好的强化学习库。它通过利用大型GPU资源显著提升了语言模型在人类偏好对齐、复杂推理和多轮交互场景中的表现。项目采用基于Ray的多角色分布式架构,支持灵活的资源分配与异构任务调度,并整合了Megatron-Core、SGLang及vLLM等前沿技术以加速模型训练与推理过程。ROLL 适用于需要提升大模型性能的研究者或开发者,特别是在处理复杂的对话系统或智能助手应用时。
Python
Apache License 2.03.2k
Stars
289
Forks
14
Watchers
94
Issues
Star 增长
今日0
近 7 天+20
近 30 天+64
综合评分75.79
默认分支main