Blaizzy

mlx-audio

Blaizzy

A text-to-speech (TTS), speech-to-text (STT) and speech-to-speech (STS) library built on Apple's MLX framework, providing efficient speech analysis on Apple Silicon.

AI 简介

MLX-Audio 是一个基于 Apple 的 MLX 框架构建的文本转语音 (TTS)、语音转文本 (STT) 和语音转语音 (STS) 库,专为 Apple Silicon 设计以提供高效的语音处理。该项目的核心功能包括针对 M 系列芯片优化的快速推理、支持多种模型架构和多语言、自定义和克隆声音的能力、可调节的语速控制以及 3D 音频可视化等。此外,它还提供了与 OpenAI 兼容的 REST API 和 Swift 包,便于 iOS/macOS 应用集成。适用于需要高效语音处理的应用场景,如智能助手、语音识别系统或任何涉及语音交互的服务。

Python
MIT License
7.3k
Stars
629
Forks
52
Watchers
73
Issues

Star 增长

今日0
近 7 天+74
近 30 天+195
综合评分94.4
默认分支main