MiMo-V2.5-ASR

XiaomiMiMo

Robust Speech Recognition Across Languages, Dialects, and Complex Acoustic Scenarios

AI 简介

MiMo-V2.5-ASR 是小米 MiMo 团队研发的端到端多语言语音识别模型，支持普通话、英语及吴语、粤语、闽南语、四川话等多种中文方言，具备代码混说、歌曲歌词识别、强噪声与远场环境鲁棒识别、多人重叠对话转录、知识密集型内容（如古诗、专有名词）精准识别等能力。其技术特点包括大规模中训、高质量监督微调与创新强化学习优化策略，在公开基准测试中表现领先。适用于智能音箱、会议记录、车载语音、跨方言服务、内容创作辅助等真实复杂语音场景。

Python

Apache License 2.0

在 GitHub 查看

301

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+16

综合评分45.94

默认分支main

MiMo-V2.5-ASR

Star 增长

加入交流群