
skypilot
skypilot-org
Run, manage, and scale AI workloads on any AI infrastructure. Use one system to access & manage all AI compute (Kubernetes, Slurm, 20+ clouds, on-prem).
AI 简介
SkyPilot 是一个用于在任何AI基础设施上运行、管理和扩展AI工作负载的系统。其核心功能包括通过统一控制面板管理Kubernetes、Slurm、20多个云平台及本地计算资源,支持分布式训练、超参数调优、GPU和TPU优化等高级调度与编排特性。该项目特别适合需要跨多种计算环境高效部署机器学习模型的企业或研究团队使用,能够显著提高资源利用率并降低成本。基于Python开发,采用Apache License 2.0开源许可。
Python
Apache License 2.010.1k
Stars
1.1k
Forks
74
Watchers
127
Issues
Star 增长
今日+5
近 7 天+19
近 30 天+123
综合评分98.61
默认分支master