
QuantumFlow
zimingttkx
QuantumFlow - Distributed LLM inference scheduling framework with multi-backend support (vLLM, TGI, SGLang), adaptive scheduling strategies, and cluster management.
AI 简介
QuantumFlow 是一个支持多后端的分布式大模型推理调度框架,能够智能地管理和调度大规模语言模型的推理任务。该项目采用 Python 编写,核心功能包括智能调度、分布式部署以及对多种后端如 vLLM、TGI 和 SGLang 的支持,并且具备自适应调度策略和集群管理能力,旨在提高单卡利用率和显存管理效率。QuantumFlow 适合需要高效处理大规模语言模型推理需求的企业或研究机构使用,在多租户、限流及容灾等方面也有所规划,以满足生产环境下的实际需求。
Python
MIT License174
Stars
0
Forks
2
Watchers
0
Issues
Star 增长
今日+1
近 7 天+14
近 30 天+99
综合评分58.9
默认分支main