
Rapid-MLX
raullenchai
The fastest local AI engine for Apple Silicon. 4.2x faster than Ollama, 0.08s cached TTFT, 100% tool calling. 17 tool parsers, prompt cache, reasoning separation, cloud routing. Drop-in OpenAI replacement. Works with Claude Code, Cursor, Aider.
AI 简介
Rapid-MLX 是一个专为 Apple Silicon 设计的本地AI引擎,旨在提供比其他解决方案更快的推理速度。项目使用 Python 开发,支持多种大语言模型,并通过优化实现了在Mac设备上的高效运行,如Qwen、Nemotron-Nano等,其处理速度可达每秒数百个token。它具备17种工具解析器、提示缓存及推理分离等功能,能够完全替代OpenAI API,适用于需要快速响应且成本敏感的应用场景,例如代码辅助、聊天机器人等。对于希望在Mac上离线运行AI模型而不依赖云端服务或支付API费用的用户来说,Rapid-MLX是一个理想选择。
Python
2.7k
Stars
338
Forks
57
Watchers
27
Issues
Star 增长
今日0
近 7 天+45
近 30 天+541
综合评分86.59
默认分支main