
F5-TTS
SWivid
Official code for "F5-TTS: A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching"
AI 简介
F5-TTS是一个基于流匹配技术生成流畅且逼真语音的文本转语音系统。该项目采用了Diffusion Transformer与ConvNeXt V2相结合的技术方案,显著提升了训练速度和推理效率;同时引入了Sway Sampling策略,在推理阶段通过优化流步采样进一步增强性能。适用于需要高质量语音合成的应用场景,如虚拟助手、有声读物制作以及游戏配音等。项目采用Python语言开发,并在GitHub上获得了广泛的关注和支持,遵循MIT许可协议开放源代码。
Python
MIT License14.7k
Stars
2.2k
Forks
130
Watchers
45
Issues
Star 增长
今日+27
近 7 天+69
近 30 天+216
综合评分120
默认分支main