
VoxCPM
OpenBMB
VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative Voice Design, and True-to-Life Cloning
AI 简介
VoxCPM 是一个无需分词器的文本转语音系统,通过端到端的扩散自回归架构直接生成连续语音表示,从而实现高度自然和富有表现力的语音合成。其最新版本 VoxCPM2 拥有 20 亿参数,基于超过 200 万小时的多语言语音数据训练而成,支持 30 种语言、语音设计、可控的声音克隆以及 48kHz 的高保真音频输出。该系统特别适合需要高质量多语言语音合成的应用场景,如跨语言内容创作、虚拟助手、游戏开发等。此外,VoxCPM2 还允许用户仅凭自然语言描述创建全新的声音,并能够从短参考音频中克隆任何声音,同时提供情感等风格指导选项。
Python
Apache License 2.028.2k
Stars
3.2k
Forks
127
Watchers
109
Issues
Star 增长
今日+226
近 7 天+2676
近 30 天+10204
综合评分120
默认分支main