Spark-TTS

SparkAudio

Spark-TTS Inference Code

AI 简介

Spark-TTS 是一个基于大型语言模型（LLM）的高效文本转语音系统，能够生成高度准确且自然的声音。其核心功能包括通过Qwen2.5直接从LLM预测的代码重构音频，简化了流程并提高了效率；支持零样本语音克隆，无需特定训练数据即可复制说话人的声音，适用于跨语言和代码切换场景；并且提供中英文双语支持。该系统适合需要高质量语音合成的研究和生产环境使用，如虚拟助手、有声读物制作等。项目采用Python开发，依赖PyTorch 2.5+运行，并遵循Apache License 2.0开源许可协议。

Python

Apache License 2.0

在 GitHub 查看

11k

Stars

1.2k

Forks

Watchers

188

Issues

Star 增长

今日0

近 7 天+2

近 30 天+6

综合评分50.8

默认分支main