
LLaMA-Omni
ictnlp
LLaMA-Omni is a low-latency and high-quality end-to-end speech interaction model built upon Llama-3.1-8B-Instruct, aiming to achieve speech capabilities at the GPT-4o level.
AI 简介
LLaMA-Omni 是一个基于 Llama-3.1-8B-Instruct 的端到端语音交互模型,旨在实现GPT-4级别的语音能力。其核心功能包括低延迟(最低226毫秒)的高质量语音交互,能够同时生成文本和语音响应。该模型在训练过程中仅使用了4个GPU,并在不到3天的时间内完成,展示了高效的训练效率。LLaMA-Omni适用于需要实时语音交流的应用场景,如智能助手、客户服务系统以及多轮对话应用等,尤其适合对响应速度和交互质量有高要求的环境。
Python
Apache License 2.03.1k
Stars
223
Forks
34
Watchers
51
Issues
Star 增长
今日0
近 7 天0
近 30 天+2
综合评分59.25
默认分支main