kizuna-intelligence

Irodori-TTS-Lite

kizuna-intelligence

Int4-quantized inference runtime for Faster-Irodori-TTS2 voice-design DiT. ~1GB VRAM end-to-end.

AI 简介

Irodori-TTS-Lite 是一个用于Faster-Irodori-TTS2语音设计的4位量化推理运行时,支持在约1GB显存下完成端到端处理。项目通过将原始FP32检查点压缩至279MB磁盘空间,并在DiT模型上仅需552MB峰值GPU内存即可运行,同时保持几乎无损的音质。此外,用户还可以选择使用`--codec-int4`选项以4位精度运行DACVAE编解码器,进一步降低整体内存占用至约1GB。该工具非常适合于资源受限但对音频生成质量有一定要求的应用场景,如移动设备或边缘计算环境中的文本转语音服务。

Python
Other
73
Stars
4
Forks
64
Watchers
2
Issues

Star 增长

今日0
近 7 天+5
近 30 天+9
综合评分45.5
默认分支main