AudioGPT

AIGC-Audio

AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head

AI 简介

AudioGPT 是一个面向多模态音频理解与生成的开源框架，支持语音、音乐、环境音及说话人头像（talking head）的识别、合成与编辑任务。其核心能力涵盖文本到语音/歌声/音频生成、语音增强与分离、语音识别、音色迁移、图像转音频、声音检测与提取等，基于 Whisper、VITS、DiffSinger、Make-An-Audio 等主流模型构建，并提供统一接口与预训练权重。适用于智能语音交互、音视频内容创作、无障碍辅助、教育配音及科研原型开发等场景。

Python

Other

audio gpt music sound speech talking-head

在 GitHub 查看官方网站

10.2k

Stars

853

Forks

131

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天0

综合评分68.79

默认分支main

AudioGPT

Star 增长

加入交流群