antirez

llama.cpp-deepseek-v4-flash

antirez

Experimental implementation of DeepSeek v4 flaash in llama.cpp

AI 简介

该项目是基于llama.cpp的一个实验性分支,实现了对DeepSeek v4 Flash的支持。它通过2位量化路由专家生成GGUF文件,旨在使仅配备128GB RAM的MacBook能够运行该模型。项目采用C++编写,并支持CPU和Metal后端以提高运行效率。尽管此版本在聊天场景下表现良好,但尚未经过广泛测试。适合需要在资源有限的设备上部署大型语言模型的应用场景,如个人电脑或轻量级服务器环境。

C++
MIT License
304
Stars
53
Forks
8
Watchers
6
Issues

Star 增长

今日0
近 7 天+6
近 30 天+69
综合评分55.1
默认分支main