
WavTTS
cwx-worst-one
WavTTS: Towards High-Quality Zero-Shot TTS via Direct Raw Waveform Modeling
AI 简介
WavTTS 是一个端到端的零样本文本转语音(TTS)框架,能够在原始波形空间直接生成高质量语音。其核心功能包括基于流匹配和DiT的模型架构,结合波形块化、多尺度梅尔谱图监督以及优化噪声调度等技术特点,无需依赖中间声学表示如梅尔谱图或编码器令牌。WavTTS 适用于需要高质量语音合成且不希望进行大量前期训练数据准备的场景,特别适合于多语言环境下的快速原型设计和开发工作。
Python
MIT License171
Stars
5
Forks
3
Watchers
1
Issues
Star 增长
今日+6
近 7 天+102
近 30 天+102
综合评分84.33
默认分支main