
AudioGPT
AIGC-Audio
AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head
AI 简介
AudioGPT 是一个用于理解和生成语音、音乐、声音以及说话头像的项目。它集成了多种预训练模型,支持文本到语音、风格转换、语音识别、音频修复等功能,并且能够处理从文本到音频、图像到音频等多种任务。技术上,AudioGPT 基于 Python 开发,利用了 FastSpeech2、VITS 等先进的语音合成模型和 Whisper 语音识别模型等。适用于需要高质量音频内容生成或处理的应用场景,如虚拟助手、媒体制作、教育工具等领域。
Python
Other10.2k
Stars
856
Forks
131
Watchers
44
Issues
Star 增长
今日0
近 7 天0
近 30 天+1
综合评分48.9
默认分支main