bark

suno-ai

🔊 Text-Prompted Generative Audio Model

AI 简介

Bark 是 Suno 开源的文本驱动生成式音频模型，支持将文本直接转换为高质量、多语种语音，并可生成音乐片段、环境音效、情感化非语言声音（如笑声、叹息）等多样化音频内容。基于 Transformer 架构，提供预训练权重，兼容 GPU/CPU 推理，支持商业用途。适用于创意音频生成、无障碍内容制作、游戏音效原型设计及语音研究等需要灵活、多模态音频合成的场景。需注意其生成结果具有不可预测性，属研究型模型而非传统 TTS 系统。

Jupyter Notebook

MIT License

在 GitHub 查看

39.2k

Stars

4.7k

Forks

335

Watchers

236

Issues

Star 增长

今日0

近 7 天0

近 30 天+26

综合评分72.6

默认分支main

bark

Star 增长

加入交流群