
sherpa-onnx
k2-fsa
Speech-to-text, text-to-speech, speaker diarization, speech enhancement, source separation, and VAD using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, HarmonyOS, Raspberry Pi, RISC-V, RK NPU, Axera NPU, Ascend NPU, x86_64 servers, websocket server/client, support 12 programming languages
AI 简介
sherpa-onnx 是一个基于下一代 Kaldi 和 onnxruntime 的本地语音处理工具,无需互联网连接即可实现语音转文字、文字转语音、说话人分割、语音增强等功能。其核心功能包括支持多种语音处理任务如ASR(自动语音识别)、TTS(文本到语音转换)、VAD(语音活动检测)等,并且能够运行在广泛的硬件平台上,从嵌入式系统(如树莓派、RISC-V)到服务器级架构(x86_64)。该项目特别适合需要在没有网络连接的环境下进行高效语音处理的应用场景,比如移动设备上的离线语音助手或隐私敏感环境中的语音交互解决方案。支持12种编程语言和多种神经处理单元(NPU),极大增强了其跨平台部署能力。
C++
12.9k
Stars
1.5k
Forks
114
Watchers
539
Issues
Star 增长
今日0
近 7 天+151
近 30 天+665
综合评分96.51
默认分支main