
metavoice-src
metavoiceio
Foundational model for human-like, expressive TTS
AI 简介
MetaVoice-1B是一个用于生成类似人类、富有表现力的文本转语音(TTS)的基础模型。该项目基于PyTorch框架开发,拥有1.2亿参数量,并通过10万小时的语音数据训练而成,专注于英语中的情感语音节奏和音调表达,支持零样本克隆美国与英式口音(仅需30秒参考音频),同时具备跨语言声音克隆能力,甚至使用最少1分钟的数据即可对印度语种进行微调优化。此外,它能够处理任意长度的文字合成任务。适用于需要高质量语音合成的应用场景,如虚拟助手、有声读物制作或游戏配音等。项目遵循Apache 2.0许可证发布,用户可以自由地使用该技术而无任何限制。
Python
Apache License 2.04.2k
Stars
692
Forks
80
Watchers
57
Issues
Star 增长
今日0
近 7 天+2
近 30 天+4
综合评分61.92
默认分支main