whisper

openai

Robust Speech Recognition via Large-Scale Weak Supervision

AI 简介

Whisper 是一个开源的通用语音识别模型，支持多语言语音转文字、语音翻译及语言识别。它基于 Transformer 架构，采用大规模弱监督训练，具备强泛化能力与跨语言鲁棒性；单模型统一处理多种语音任务，无需级联多个专用模块。适用于会议记录、字幕生成、无障碍辅助、多语种内容分析等需要高精度、低配置门槛语音理解的场景。

Python

MIT License

在 GitHub 查看

104.7k

Stars

12.8k

Forks

751

Watchers

122

Issues

Star 增长

今日0

近 7 天0

近 30 天+1212

综合评分80

默认分支main

whisper

Star 增长

加入交流群