
voice-pro
abus-aikorea
Gradio WebUI for creators and developers, featuring key TTS (Edge-TTS, kokoro) and zero-shot Voice Cloning (E2 & F5-TTS, CosyVoice), with Whisper audio processing, YouTube download, Demucs vocal isolation, and multilingual translation.
AI 简介
Voice-Pro 是一个基于 AI 的 Web 应用程序,用于语音识别、翻译和多语言配音。其核心功能包括文本转语音(TTS)、零样本语音克隆(E2 & F5-TTS, CosyVoice)、Whisper 音频处理、YouTube 视频下载、Demucs 人声分离以及多语言翻译。该工具使用了先进的技术栈如 Whisper、Edge-TTS 和 Gradio 等,支持 CUDA 加速以提高性能。Voice-Pro 适用于需要处理 YouTube 视频、生成字幕、进行语音到文本转换及多语言配音的场景,是创作者和开发者理想的多媒体处理工具。
Python
GNU General Public License v3.010.9k
Stars
1.6k
Forks
65
Watchers
36
Issues
Star 增长
今日0
近 7 天+57
近 30 天+1049
综合评分89.6
默认分支main