Irodori-TTS-Lite

kizuna-intelligence

Int4-quantized inference runtime for Faster-Irodori-TTS2 voice-design DiT. ~1GB VRAM end-to-end.

AI 简介

Irodori-TTS-Lite 是一个专为 Faster-Irodori-TTS2 语音合成模型设计的轻量级 4-bit 量化推理运行时。它支持 DiT 主干网络与 DACVAE 声码器的端到端 INT4 量化，在保持音质几乎无损（CER 0.00%）的前提下，将模型磁盘占用降至 279 MB，端到端峰值 GPU 显存压缩至约 1 GB（实测 988.7 MB）。采用 on-the-fly dequant 和 packed embedding 技术，避免全量权重解量化，兼顾效率与精度。适用于显存受限的边缘设备、低功耗部署场景及需快速迭代的语音合成服务开发。

Python

Other

在 GitHub 查看

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+2

综合评分42.3

默认分支main

Irodori-TTS-Lite

Star 增长

加入交流群