Luce-Org

lucebox-hub

Luce-Org

Fast LLM speculative inference server for consumer hardware.

AI 简介

Lucebox Hub 是一个针对特定消费级硬件优化的大规模语言模型(LLM)推理引擎。项目通过定制内核、推测性预填充和解码以及量化GGUF路径等技术手段,显著提升了在本地运行LLM的速度与效率。它支持包括NVIDIA CUDA 12+和AMD HIP 7+在内的多种GPU平台,并且对Qwen、Laguna等多个流行模型进行了专门优化。特别适用于需要高性能LLM推理但又受限于硬件条件的个人开发者或小型团队,在游戏开发、内容生成等领域具有广泛的应用潜力。

C++
Apache License 2.0
2.4k
Stars
220
Forks
20
Watchers
23
Issues

Star 增长

今日0
近 7 天+37
近 30 天+404
综合评分87.53
默认分支main