SWivid

F5-TTS

SWivid

Official code for "F5-TTS: A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching"

AI 简介

F5-TTS是一个基于流匹配技术生成流畅且逼真语音的文本转语音系统。该项目采用了Diffusion Transformer与ConvNeXt V2相结合的技术方案,显著提升了训练速度和推理效率;同时引入了Sway Sampling策略,在推理阶段通过优化流步采样进一步增强性能。适用于需要高质量语音合成的应用场景,如虚拟助手、有声读物制作以及游戏配音等。项目采用Python语言开发,并在GitHub上获得了广泛的关注和支持,遵循MIT许可协议开放源代码。

Python
MIT License
14.7k
Stars
2.2k
Forks
130
Watchers
45
Issues

Star 增长

今日+27
近 7 天+69
近 30 天+216
综合评分120
默认分支main