metavoice-src

metavoiceio

Foundational model for human-like, expressive TTS

AI 简介

MetaVoice-1B 是一个面向高表现力语音合成的开源基础模型，专注于生成自然、富有情感韵律的英文语音。它基于1.2B参数架构，使用10万小时语音数据训练，支持零样本语音克隆（仅需30秒参考音频）、跨语言微调适配（如印度英语），并可合成任意长度文本。技术上采用PyTorch实现，强调语音节奏、语调与情感建模，适用于内容创作、无障碍服务、虚拟助手等需高质量、个性化语音输出的场景。

Python

Apache License 2.0

ai deep-learning pytorch speech speech-synthesis text-to-speech tts voice-clone zero-shot-tts

在 GitHub 查看官方网站

4.2k

Stars

692

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+1

综合评分60.62

默认分支main

metavoice-src

Star 增长

加入交流群