lifeiteng

OmniVAD-Kit

lifeiteng

Cross-platform VAD & Audio Event Detection toolkit — Python (PyPI) + TypeScript (npm) + C API. DFSMN models ~2MB, 200x real-time. Runs everywhere: native, browser (WASM), Node.js.

AI 简介

OmniVAD-Kit 是一个跨平台的语音活动检测(VAD)和音频事件检测(AED)工具包,支持 Python (PyPI)、TypeScript (npm) 和 C API。其核心功能包括非流式语音检测、实时语音检测以及音频事件检测(如语音、唱歌、音乐)。基于 DFSMN 架构的模型大小约为 2MB,支持超过 100 种语言,并能在原生环境、浏览器(通过 WASM)及 Node.js 上运行。该工具包适用于需要高效处理音频数据的应用场景,例如语音识别前处理、音频内容分析等。

Python
Apache License 2.0
79
Stars
5
Forks
1
Watchers
0
Issues

Star 增长

今日0
近 7 天+2
近 30 天+3
综合评分43.63
默认分支main