
mlx-vlm
Blaizzy
MLX-VLM is a package for inference and fine-tuning of Vision Language Models (VLMs) on your Mac using MLX.
AI 简介
MLX-VLM 是一个用于在 Mac 上通过 MLX 进行视觉语言模型(VLMs)和全模态模型(支持音频和视频的 VLMs)推理与微调的软件包。该项目利用 Python 编程语言,支持多种先进的功能和技术特性,包括但不限于:命令行界面(CLI)、推测解码、基于 Gradio 的聊天用户界面、Python 脚本集成、FastAPI 服务器部署选项等。此外,它还提供了针对特定模型的详细文档,涵盖从 OCR 到多模态理解等多种应用场景的最佳实践。该工具特别适合需要在本地环境中高效处理多媒体内容分析与生成任务的研究人员和开发者使用。
Python
5k
Stars
577
Forks
33
Watchers
116
Issues
Star 增长
今日0
近 7 天+169
近 30 天+320
综合评分87.29
默认分支main