argmaxinc

argmax-oss-swift

argmaxinc

On-device Speech AI for Apple Silicon

AI 简介

Argmax Open-Source SDK 是一个面向 Apple 设备的语音 AI 解决方案,使用 Swift 语言编写。该项目的核心功能包括通过 WhisperKit 实现语音转文字、SpeakerKit 进行说话人分割以及 TTSKit 完成文本转语音。它支持多种先进的模型和技术,如 OpenAI 的 Whisper 和 Qwen-TTS,适用于需要在设备上直接进行语音处理的应用场景,无需依赖云端服务。这使得开发者能够在 iOS 和 macOS 平台上构建高效且隐私友好的语音识别和合成应用。

Swift
MIT License
6.2k
Stars
572
Forks
45
Watchers
91
Issues

Star 增长

今日+4
近 7 天+21
近 30 天+120
综合评分92.77
默认分支main