val1813

kaiwu

val1813

本地开源模型部署器,一键部署,支持各类系统,主流模型。

AI 简介

Kaiwu 是一个本地开源模型部署工具,支持一键部署各类主流模型。其核心功能在于自动探测硬件配置、模型架构及KV缓存选项,并根据实际性能调整上下文窗口大小,以实现最优的运行速度和资源利用效率,同时保持与OpenAI API兼容。该工具特别适用于需要高效利用有限GPU资源来运行大型语言模型的场景,如个人开发者或小型团队在普通消费级硬件上进行模型开发与测试。通过智能调优,即使是在8GB显存的笔记本电脑上也能有效运行30B参数规模的模型,极大提升了模型的实际可用性。

Go
MIT License
254
Stars
17
Forks
241
Watchers
19
Issues

Star 增长

今日0
近 7 天+5
近 30 天+10
综合评分47.27
默认分支main