Infini-AI-Lab

astraflow

Infini-AI-Lab

Dataflow-Oriented Reinforcement Learning for (Multi-)Agentic LLMs

AI 简介

AstraFlow是一个面向数据流的强化学习系统,专为提高灵活性和可扩展性设计。该项目的核心功能包括全异步多策略协作强化学习、弹性异构跨区域部署、可替换的部署和训练服务以及可组合的数据算法,无需特定功能的系统工程即可支持大规模语言模型(LLM)的强化学习训练。这些特性使得AstraFlow非常适合需要在不同硬件和地理区域之间动态调整资源分配的大规模分布式强化学习场景,特别是当涉及多个智能体协同工作时。

Python
Apache License 2.0
85
Stars
12
Forks
70
Watchers
1
Issues

Star 增长

今日0
近 7 天+8
近 30 天+13
综合评分48.64
默认分支main