canopyai

Orpheus-TTS

canopyai

Towards Human-Sounding Speech

AI 简介

Orpheus TTS 是一个基于 Llama-3b 架构的开源文本转语音系统,旨在生成接近人类自然发音的语音。其核心功能包括零样本声音克隆、通过简单标签控制情感和语调以及低延迟实时应用支持,最低可达约100毫秒的流式传输延迟。技术上,Orpheus利用大规模语言模型进行语音合成,提供了两个英文版本的预训练和微调模型,并发布了多语言模型系列以促进更广泛的应用场景探索。该项目适用于需要高质量、自然流畅且可定制化语音输出的各种应用场景,如客户服务自动化、虚拟助手开发及内容创作等。

Python
Apache License 2.0
6.2k
Stars
527
Forks
73
Watchers
116
Issues

Star 增长

今日+14
近 7 天+24
近 30 天+47
综合评分100.87
默认分支main