k2-fsa

OmniVoice

k2-fsa

High-Quality Voice Cloning TTS for 600+ Languages

AI 简介

OmniVoice 是一个支持超过600种语言的高质量语音克隆文本转语音(TTS)系统。其核心技术基于新颖的扩散语言模型架构,能够以卓越的推理速度生成高品质语音,并支持零样本多语言处理、语音克隆及自定义声音设计等功能。用户可以通过调整性别、年龄、音调等属性来控制输出的声音特性,同时该系统还提供了非语言符号和发音校正的支持。由于其广泛的多语言支持与高效的运行性能,OmniVoice 非常适合需要跨语言或多语言应用场景下的音频内容创作、辅助技术开发等领域使用。

Python
Apache License 2.0
7.3k
Stars
1.1k
Forks
48
Watchers
43
Issues

Star 增长

今日+138
近 7 天+517
近 30 天+850
综合评分115.17
默认分支master