remsky

Kokoro-FastAPI

remsky

Dockerized FastAPI wrapper for Kokoro-82M text-to-speech model w/multiplatform CPU, AMD, NVIDIA GPU PyTorch support, handling, and auto-stitching

AI 简介

Kokoro-FastAPI 是一个基于 Docker 的 FastAPI 封装,用于 Kokoro-82M 文本转语音模型,支持 CPU 和 NVIDIA GPU 推理。该项目的核心功能包括多语言支持(英语、日语、中文等)、OpenAI 兼容的语音端点、基于音素的音频生成以及按词时间戳字幕生成。技术特点方面,它提供了调试端点以监控系统状态,并在本地主机上集成了一个 Web UI。此外,项目还支持通过 PyTorch 在多种硬件平台上进行推理,包括 Apple Silicon (MPS)。适用于需要高质量文本转语音服务的应用场景,如虚拟助手、自动语音合成和多媒体内容制作等。

Python
Apache License 2.0
5k
Stars
822
Forks
38
Watchers
98
Issues

Star 增长

今日0
近 7 天+37
近 30 天+141
综合评分89.25
默认分支master