ictnlp

LLaMA-Omni

ictnlp

LLaMA-Omni is a low-latency and high-quality end-to-end speech interaction model built upon Llama-3.1-8B-Instruct, aiming to achieve speech capabilities at the GPT-4o level.

AI 简介

LLaMA-Omni 是一个基于 Llama-3.1-8B-Instruct 的端到端语音交互模型,旨在实现GPT-4级别的语音能力。其核心功能包括低延迟(最低226毫秒)的高质量语音交互,能够同时生成文本和语音响应。该模型在训练过程中仅使用了4个GPU,并在不到3天的时间内完成,展示了高效的训练效率。LLaMA-Omni适用于需要实时语音交流的应用场景,如智能助手、客户服务系统以及多轮对话应用等,尤其适合对响应速度和交互质量有高要求的环境。

Python
Apache License 2.0
3.1k
Stars
223
Forks
34
Watchers
51
Issues

Star 增长

今日0
近 7 天0
近 30 天+2
综合评分59.25
默认分支main