
voice-agents-from-scratch
pguso
From-scratch voice agents in Python: end-to-end speech pipelines, runnable chapters, and a small shared library. Local models, explicit streaming behavior.
AI 简介
该项目旨在从零开始构建实时语音代理,实现从麦克风输入到语音识别、语言模型处理再到文本转语音输出的完整流程。核心功能包括端到端的语音处理管道、可运行的章节教程以及一个小型共享库,支持本地模型和显式的流式传输行为。技术特点上,项目使用Python编写,并利用了Faster-Whisper等工具进行语音活动检测与处理。适用于需要在边缘设备上部署低延迟语音交互系统的场景,如智能家居控制、虚拟助手等。
Python
MIT License36
Stars
3
Forks
1
Watchers
0
Issues
Star 增长
今日+1
近 7 天+4
近 30 天+7
综合评分46.51
默认分支main