
voxtral.c
antirez
Pure C inference of Mistral Voxtral Realtime 4B speech to text model
AI 简介
Voxtral.c 是一个用于 Mistral AI 的 Voxtral Realtime 4B 语音转文字模型的纯 C 推理实现。该项目不依赖任何外部库,仅使用 C 标准库,支持通过 MPS 进行快速推理,并提供 BLAS 加速选项(尽管速度较慢)。音频处理采用分块编码器和重叠窗口技术,确保无论输入长度如何都能控制内存使用。此外,它还支持从标准输入或麦克风实时捕获音频进行转录,同时提供了一个流式 C API 以逐步接收音频并即时输出文本。适用于需要轻量级、无依赖环境下的实时语音转文字场景,如嵌入式系统或资源受限的设备。需要注意的是,项目仍需进一步测试以达到生产级别质量。
C
MIT License1.7k
Stars
118
Forks
16
Watchers
4
Issues
Star 增长
今日+4
近 7 天+17
近 30 天+42
综合评分74.93
默认分支main