
rllm
rllm-org
Democratizing Reinforcement Learning for LLMs
AI 简介
rLLM 是一个用于训练AI代理的强化学习开源框架。它支持任何代理框架,用户只需定义奖励函数,即可利用强化学习进行训练,几乎无需修改原有代码。项目提供了多种强化学习算法选项及两种训练后端(分布式多GPU训练和单机/CPU设置),并拥有超过50个内置基准测试。rLLM特别适用于需要快速迭代、评估不同规模模型性能的研究场景以及希望简化其机器学习基础设施的企业应用中。
Python
Apache License 2.05.6k
Stars
575
Forks
30
Watchers
77
Issues
Star 增长
今日0
近 7 天+13
近 30 天+104
综合评分80.78
默认分支main