
Spark-TTS
SparkAudio
Spark-TTS Inference Code
AI 简介
Spark-TTS 是一个基于大型语言模型(LLM)的高效文本转语音系统,能够生成高度准确且自然的声音。其核心功能包括通过Qwen2.5直接从LLM预测的代码重构音频,简化了流程并提高了效率;支持零样本语音克隆,无需特定训练数据即可复制说话人的声音,适用于跨语言和代码切换场景;并且提供中英文双语支持。该系统适合需要高质量语音合成的研究和生产环境使用,如虚拟助手、有声读物制作等。项目采用Python开发,依赖PyTorch 2.5+运行,并遵循Apache License 2.0开源许可协议。
Python
Apache License 2.011k
Stars
1.2k
Forks
67
Watchers
188
Issues
Star 增长
今日0
近 7 天+2
近 30 天+6
综合评分50.8
默认分支main