
RealtimeSTT
KoljaB
A robust, efficient, low-latency speech-to-text library with advanced voice activity detection, wake word activation and instant transcription.
AI 简介
RealtimeSTT 是一个用于实时语音转文字的Python库,它具备先进的语音活动检测、唤醒词激活以及即时转录功能。项目的核心特性包括使用WebRTC VAD和Silero VAD进行精准的语音活动检测、支持多种可选引擎实现最终及实时转录,并且能够通过Porcupine或OpenWakeWord设置唤醒词。此外,该库还允许直接从麦克风输入或应用程序提供的音频片段中读取数据,并提供了丰富的事件回调选项以满足不同需求。RealtimeSTT适用于需要快速准确地将语音转换为文本的应用场景,如智能助手、听写工具、浏览器流媒体服务器等。其简洁易用的设计使得开发者仅需几行代码即可集成强大的语音处理能力到自己的项目中。
Python
MIT License9.9k
Stars
836
Forks
73
Watchers
124
Issues
Star 增长
今日+11
近 7 天+40
近 30 天+116
综合评分114.77
默认分支master