
MiMo-V2.5-ASR
XiaomiMiMo
Robust Speech Recognition Across Languages, Dialects, and Complex Acoustic Scenarios
AI 简介
MiMo-V2.5-ASR是一个由小米MiMo团队开发的端到端自动语音识别模型,旨在实现跨语言、方言和复杂声学场景下的鲁棒语音识别。该模型支持普通话和英语、多种中国方言(如吴语、粤语、闽南语、四川话等)、中英文代码切换、歌曲歌词、知识密集型内容、嘈杂环境以及多人对话等多种场景下的高精度转录。通过大规模预训练、高质量监督微调及新颖的强化学习算法,MiMo-V2.5-ASR在多个公开基准测试中取得了领先性能。适用于需要处理多语言、方言混合、噪声环境或多人会议记录等复杂音频场景的应用。
Python
Apache License 2.0257
Stars
24
Forks
2
Watchers
3
Issues
Star 增长
今日0
近 7 天+7
近 30 天+68
综合评分54.49
默认分支main