ggml-org

llama.cpp

ggml-org

LLM inference in C/C++

AI 简介

llama.cpp 是一个用 C/C++ 实现的大型语言模型(LLM)推理项目。它利用了 ggml 库,能够高效地在 CPU 上运行 LLM 推理任务,支持多种量化格式以优化内存使用和计算效率。该项目还提供了 REST API 服务、WebUI 和多模态支持等功能,便于开发者集成到不同的应用场景中。适合需要低资源消耗环境下进行 LLM 推理的应用场景,如嵌入式设备或边缘计算环境下的自然语言处理任务。

C++
MIT License
115.6k
Stars
19.3k
Forks
749
Watchers
694
Issues

Star 增长

今日+412
近 7 天+1473
近 30 天+6587
综合评分120
默认分支master