kserve

kserve

kserve

Standardized Distributed Generative and Predictive AI Inference Platform for Scalable, Multi-Framework Deployment on Kubernetes

AI 简介

KServe是一个标准化的分布式生成式和预测性AI推理平台,支持在Kubernetes上进行可扩展的多框架部署。其核心功能包括对多种机器学习框架的支持(如TensorFlow、PyTorch、XGBoost等),以及针对生成式AI的优化后端、GPU加速、模型缓存等特性。此外,它还提供了智能路由、金丝雀发布、自动伸缩等功能来满足复杂的AI工作负载需求。KServe适合于需要高效部署和管理AI模型的企业级场景,尤其是那些希望利用Kubernetes生态优势进行大规模AI应用开发与维护的组织。

Go
5.6k
Stars
1.5k
Forks
70
Watchers
511
Issues

Star 增长

今日+2
近 7 天+24
近 30 天+123
综合评分88.55
默认分支main