astraflow

Infini-AI-Lab

Dataflow-Oriented Reinforcement Learning for (Multi-)Agentic LLMs

AI 简介

AstraFlow 是一个面向数据流的强化学习系统，专为多智能体大语言模型（LLM）的 RL 训练设计。它支持全异步多策略协同训练、弹性异构跨区域 rollout、可替换的 rollout 与 trainer 服务，以及可组合的数据算法，无需针对特定功能进行系统级工程改造。基于数据流范式构建，具备高灵活性与横向扩展能力，适用于需要动态资源调度、多策略联合优化及分布式异构硬件协同的 LLM 强化学习场景，如数学推理、多角色协作任务等。

Python

Apache License 2.0

agentic-ai llm llm-rl mlsys reinforcement-learning rl

在 GitHub 查看官方网站

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天0

综合评分43.69

默认分支main

astraflow

Star 增长

加入交流群