bytedance

MegaTTS3

bytedance

暂无描述

AI 简介

MegaTTS 3 是一个基于 PyTorch 的文本转语音(TTS)系统。其核心功能包括使用轻量级且高效的扩散变换器作为骨干网络,参数量仅为0.45亿,能够生成高质量的语音克隆,并支持中英文双语及代码切换。该项目还提供了对口音强度的控制以及未来将实现的发音和时长微调功能。适用于需要高质量语音合成的研究场景或应用开发,如虚拟助手、有声读物制作等。

Python
Apache License 2.0
6.1k
Stars
471
Forks
50
Watchers
86
Issues

Star 增长

今日0
近 7 天0
近 30 天+1
综合评分51.12
默认分支main