flybirdxx

ComfyUI-Qwen-TTS

flybirdxx

A Simple Implementation of Qwen3-TTS's ComfyUI

AI 简介

ComfyUI-Qwen-TTS 是一个基于阿里巴巴Qwen团队开源的Qwen3-TTS项目的语音合成、克隆和设计插件。其核心功能包括高质量的文本转语音、零样本语音克隆以及根据自然语言描述创建自定义声音特性。该项目使用Python开发,支持10种语言,并且具有高效的推理能力和超低延迟的流式传输能力。用户还可以选择不同的注意力机制来优化模型性能。此外,它内置了模型加载管理功能,无需额外的加载节点即可按需加载模型并进行全局缓存。此项目适用于需要快速生成多样化语音的应用场景,如多角色对话系统、个性化语音助手等。请注意,为了确保兼容性,请安装指定版本的transformers库(4.57.3)。

Python
1.6k
Stars
168
Forks
9
Watchers
53
Issues

Star 增长

今日0
近 7 天+23
近 30 天+80
综合评分71.18
默认分支main