
sglang
sgl-project
SGLang is a high-performance serving framework for large language models and multimodal models.
AI 简介
SGLang 是一个面向大规模语言模型和多模态模型的高性能服务框架。它支持多种模型架构,如GPT、LLaMA等,并集成了CUDA、TPU等多种硬件加速技术,以实现高效的推理性能。项目提供了丰富的API接口,便于开发者快速集成和部署。此外,SGLang还具有强大的可扩展性,能够轻松应对从单机到分布式集群的各种应用场景。该工具非常适合需要高效处理自然语言理解和生成任务的企业或研究机构使用,尤其是在资源受限且对响应时间有严格要求的情况下。
Python
Apache License 2.028.9k
Stars
6.4k
Forks
155
Watchers
653
Issues
Star 增长
今日+2
近 7 天+50
近 30 天+1399
综合评分104
默认分支main