
FunASR
modelscope
Industrial-grade speech recognition toolkit: 170x realtime, 50+ languages, speaker diarization, emotion detection, streaming, and OpenAI-compatible API.
AI 简介
FunASR是一个全面的端到端语音识别工具包,支持语音识别、语音活动检测、文本后处理等功能。它基于PyTorch构建,集成了多种先进的模型架构如Conformer、Paraformer等,并提供一系列预训练模型以加速开发流程。此外,FunASR还涵盖了标点恢复、说话人验证及多说话人场景下的语音识别等高级特性,使得其在学术研究与工业应用之间架起了一座桥梁。适用于需要高效准确地实现自动语音识别的各种场景,例如智能客服、会议记录自动化以及多媒体内容分析等。
Python
MIT License17.7k
Stars
1.8k
Forks
114
Watchers
11
Issues
Star 增长
今日+176
近 7 天+678
近 30 天+1694
综合评分119.78
默认分支main