FunAudioLLM

CosyVoice

FunAudioLLM

Multi-lingual large voice generation model, providing inference, training and deployment full-stack ability.

AI 简介

CosyVoice是一个多语言大型语音生成模型,提供从推理、训练到部署的全栈能力。它支持包括中文、英文、日文等在内的九种常见语言以及18种以上的中国方言/口音,具备零样本跨语言语音克隆功能。项目在内容一致性、说话人相似度和韵律自然性方面达到领先水平,并支持发音修复、文本归一化及双流处理等功能,使得其在低延迟下仍能保持高质量音频输出。此外,通过指令支持多种自定义设置如语速、音量等,适用于需要高度定制化和自然流畅语音合成的应用场景,如虚拟助手、有声读物制作等。

Python
Apache License 2.0
21.6k
Stars
2.5k
Forks
132
Watchers
763
Issues

Star 增长

今日+30
近 7 天+149
近 30 天+617
综合评分120
默认分支main