huggingface

parler-tts

huggingface

Inference and training library for high-quality TTS models.

AI 简介

Parler-TTS 是一个轻量级的文本转语音(TTS)模型,能够生成高质量、自然的声音,并模仿特定说话人的风格(如性别、音调、说话方式等)。该项目的核心功能包括完全开源的训练代码和数据集,支持用户自定义开发强大的TTS模型。技术特点上,它兼容SDPA和Flash Attention 2,优化了生成速度,并且提供了不同规模的预训练模型(880M参数的小型模型和2.3B参数的大型模型),这些模型基于45,000小时的有声书数据训练而成。Parler-TTS适用于需要高质量语音合成的应用场景,例如虚拟助手、有声读物制作或任何需要自然语音输出的项目。

Python
Apache License 2.0
5.6k
Stars
590
Forks
56
Watchers
116
Issues

Star 增长

今日0
近 7 天0
近 30 天+3
综合评分44.61
默认分支main