openai

whisper

openai

Robust Speech Recognition via Large-Scale Weak Supervision

AI 简介

Whisper 是一个通用的语音识别模型,能够处理多语言语音识别、语音翻译和语言识别等多种任务。它基于Transformer序列到序列架构,通过大规模多样化音频数据集训练而成,能够在单一模型中集成传统语音处理流程中的多个阶段。Whisper的核心技术特点是其多任务学习能力,使用一组特殊标记作为任务指示符或分类目标,使得模型能够灵活应对不同的语音处理需求。适用于需要高质量、多语言支持的语音转文字应用场景,如会议记录、视频字幕生成以及跨语言交流辅助等。

Python
MIT License
102.2k
Stars
12.5k
Forks
742
Watchers
122
Issues

Star 增长

今日+140
近 7 天+1045
近 30 天+3043
综合评分120
默认分支main