netease-youdao

Confucius4-TTS

netease-youdao

Confucius4-TTS: a Multilingual and Cross-Lingual Zero-Shot TTS Engine

AI 简介

Confucius4-TTS 是一个基于大型语言模型的多语言和跨语言零样本文本转语音系统。它采用语音编码器加大型语言模型架构,支持14种语言,包括中文、英文、日文等,并具备无约束语音克隆、跨语言语音转换、零样本语音转移及无缝情感转移等功能。该系统能够在保持说话人身份一致的情况下,实现高质量的多语言语音合成。适用于需要在不同语言间无缝切换且保持同一声音的应用场景,如全球化多媒体内容制作、跨文化交流工具开发等领域。

Python
Apache License 2.0
145
Stars
13
Forks
2
Watchers
1
Issues

Star 增长

今日+1
近 7 天+6
近 30 天+32
综合评分51.64
默认分支main