GLM-4-Voice

zai-org

GLM-4-Voice | 端到端中英语音对话模型

AI 简介

GLM-4-Voice 是一个端到端的中英文语音对话模型，支持语音输入理解、文本推理与语音生成一体化处理。其核心采用三模块架构：基于Whisper改进的语音分词器（支持12.5 token/秒高效离散化）、基于Flow Matching的流式语音解码器（最低10 token即可启动合成）、以及在GLM-4-9B基础上对齐语音模态的大语言模型，具备情感/语调/语速/方言可控能力。适用于实时语音助手、多语种智能客服、教育口语交互等低延迟、高表现力的语音对话场景。

Python

Apache License 2.0

在 GitHub 查看

3.2k

Stars

281

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+5

综合评分59.85

默认分支main

GLM-4-Voice

Star 增长

加入交流群