
speechbrain
speechbrain
A PyTorch-based Speech Toolkit
AI 简介
SpeechBrain 是一个基于 PyTorch 的开源语音工具包,旨在加速对话式 AI 技术的开发。其核心功能包括语音识别、说话人识别、语音增强、语音分离、语言建模等,并支持多种预训练模型的微调,如 Whisper、Wav2Vec2 和 WavLM 等。该工具包采用模块化设计,便于快速构建和实验复杂的语音处理系统。SpeechBrain 适用于需要高效实现语音和文本处理任务的场景,例如开发智能语音助手、聊天机器人以及大型语言模型。其丰富的教程和文档也为开发者提供了极大的便利。
Python
Apache License 2.0asraudioaudio-processingdeep-learninghuggingfacelanguage-modelpytorchspeaker-diarizationspeaker-recognitionspeaker-verificationspeech-enhancementspeech-processingspeech-recognitionspeech-separationspeech-to-textspeech-toolkitspeechrecognitionspoken-language-understandingtransformersvoice-recognition
11.6k
Stars
1.7k
Forks
137
Watchers
127
Issues
Star 增长
今日+3
近 7 天+13
近 30 天+78
综合评分89.99
默认分支develop