vllm-project

semantic-router

vllm-project

System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge

AI 简介

vLLM Semantic Router 是一个面向云、数据中心和边缘环境的系统级智能路由解决方案,用于混合模型。它基于信号驱动机制,帮助团队构建更高效、更安全且更具适应性的模型系统。其核心功能包括:通过减少无效令牌来优化成本(Token经济学)、增强大语言模型的安全性以防止越狱和敏感信息泄露,并通过协调不同成本、隐私及能力边界的本地、私有和前沿模型实现全网智能。适用于需要在多环境中部署复杂AI应用的企业或研究机构,特别是在对模型性能、安全性及资源利用效率有较高要求的场景下。

Go
Apache License 2.0
4.3k
Stars
704
Forks
58
Watchers
96
Issues

Star 增长

今日0
近 7 天+35
近 30 天+132
综合评分88.04
默认分支main