
parlor
fikrikarim
On-device, real-time multimodal AI. Have natural voice and vision conversations with an AI that runs entirely on your machine. Powered by Gemma 4 E2B and Kokoro.
AI 简介
Parlor 是一个在设备上运行的实时多模态AI项目,能够通过语音和视觉与用户进行自然对话。该项目利用Gemma 4 E2B模型处理语音和视觉输入,Kokoro模型实现文本到语音的转换,整个过程完全在本地完成,无需依赖云端服务器。其核心技术特点包括基于浏览器的语音活动检测、打断功能以及句子级TTS流式传输,使得交互更加流畅自然。适用于希望保护隐私且需要离线工作的场景,特别是对于语言学习者而言,能够在没有网络连接的情况下提供有效的口语练习支持。
HTML
Apache License 2.01.8k
Stars
224
Forks
21
Watchers
5
Issues
Star 增长
今日+9
近 7 天+26
近 30 天+74
综合评分93.46
默认分支main