sherpa-onnx

k2-fsa

Speech-to-text, text-to-speech, speaker diarization, speech enhancement, source separation, and VAD using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, HarmonyOS, Raspberry Pi, RISC-V, RK NPU, Axera NPU, Ascend NPU, x86_64 servers, websocket server/client, support 12 programming languages

AI 简介

sherpa-onnx 是一个离线运行的端侧语音处理工具集，基于 ONNX Runtime 实现无需联网的本地化语音识别（ASR）、语音合成（TTS）、说话人日志（diarization）、声源分离、语音增强、VAD 等功能。核心特点是跨平台支持广泛（x86_64、ARM32/64、RISC-V、HarmonyOS、Android/iOS 及多种国产 NPU），并提供 C++/Python/Java 等 12 种语言绑定。适用于边缘设备、嵌入式系统、隐私敏感场景及资源受限环境下的实时语音交互与音频分析。

C++

asr onnx windows linux macos cpp android ios raspberry-pi aarch64 arm32 csharp dotnet mfc speech-to-text text-to-speech vits risc-v lazarus object-pascal

在 GitHub 查看

13.4k

Stars

1.5k

Forks

118

Watchers

548

Issues

Star 增长

今日0

近 7 天0

近 30 天+227

综合评分76.56

默认分支main

sherpa-onnx

Star 增长

加入交流群