Zyphra

Zonos

Zyphra

Zonos-v0.1 is a leading open-weight text-to-speech model trained on more than 200k hours of varied multilingual speech, delivering expressiveness and quality on par with—or even surpassing—top TTS providers.

AI 简介

Zonos-v0.1是一个先进的文本转语音模型,基于超过20万小时的多语言语音数据训练而成,其表现力和音质可媲美甚至超越顶级TTS供应商。该模型通过提供说话者嵌入或音频前缀实现高度自然的语音生成,并支持仅需几秒钟参考音频片段的语音克隆。此外,它还允许对语速、音调变化、音频质量以及情绪(如快乐、恐惧、悲伤和愤怒)进行精细控制,输出采样率为44kHz的高质量语音。Zonos适用于需要高保真度语音合成的应用场景,例如虚拟助手、有声读物制作、在线教育等,同时也为研究者提供了强大的工具以探索更复杂的语音处理任务。

Python
Apache License 2.0
7.2k
Stars
810
Forks
65
Watchers
137
Issues

Star 增长

今日+3
近 7 天+7
近 30 天+18
综合评分76.03
默认分支main