higgs-audio

boson-ai

Text-audio foundation model from Boson AI

AI 简介

Higgs Audio 是一个开源的文本到音频基础模型，专注于高表现力语音生成。其核心功能包括多语言语音合成、多说话人对话生成、语音克隆、情感与语调自适应、哼唱及语音+背景音乐同步生成；技术上采用大规模音频-文本联合预训练（1000万小时音频），V2.5版本通过GRPO对齐策略将参数压缩至1B，兼顾推理速度与生成质量。适用于AI配音、有声内容创作、虚拟助手语音输出、教育语音素材生成等需要自然、多样化语音表达的生产场景。

Python

Apache License 2.0

在 GitHub 查看

8.3k

Stars

644

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+24

综合评分66.83

默认分支main

higgs-audio

Star 增长

加入交流群