SparkAudio

Spark-TTS

SparkAudio

Spark-TTS Inference Code

AI 简介

Spark-TTS 是一个基于大型语言模型(LLM)的高效文本转语音系统,能够生成高度准确且自然的声音。其核心功能包括通过Qwen2.5直接从LLM预测的代码重构音频,简化了流程并提高了效率;支持零样本语音克隆,无需特定训练数据即可复制说话人的声音,适用于跨语言和代码切换场景;并且提供中英文双语支持。该系统适合需要高质量语音合成的研究和生产环境使用,如虚拟助手、有声读物制作等。项目采用Python开发,依赖PyTorch 2.5+运行,并遵循Apache License 2.0开源许可协议。

Python
Apache License 2.0
11k
Stars
1.2k
Forks
67
Watchers
188
Issues

Star 增长

今日0
近 7 天+2
近 30 天+6
综合评分50.8
默认分支main