
higgs-audio
boson-ai
Text-audio foundation model from Boson AI
AI 简介
Higgs Audio 是由 Boson AI 开发的一款文本-音频基础模型,旨在通过深度语言和声学理解生成富有表现力的音频。该项目的核心功能包括自然多说话人对话生成、自动韵律调整、克隆声音哼唱以及同时生成语音和背景音乐等,这些特性在传统 TTS 系统中较为罕见。技术上,Higgs Audio V2.5 优化了模型架构至 10 亿参数规模,在保持甚至超越前代 30 亿参数模型的速度与准确度的同时,显著提升了效率与稳定性。适用于需要高质量音频合成的各种场景,如多媒体内容创作、虚拟助手开发及教育软件等。
Python
Apache License 2.08.2k
Stars
627
Forks
57
Watchers
89
Issues
Star 增长
今日0
近 7 天+38
近 30 天+89
综合评分92.29
默认分支main