nari-labs

dia

nari-labs

A TTS model capable of generating ultra-realistic dialogue in one pass.

AI 简介

Dia 是一个由 Nari Labs 开发的1.6B参数文本转语音模型,能够一次性生成高度逼真的对话。其核心功能包括直接从文字脚本生成自然对话,并支持通过音频条件控制情感和语调,还能产生如笑声、咳嗽等非言语交流。该模型基于Python开发,采用Hugging Face Transformers框架,目前仅支持英语。适用于需要高质量语音合成的应用场景,例如虚拟助手、有声读物制作或游戏角色配音等。开发者提供了预训练模型权重及推理代码以加速研究进度,同时在Hugging Face平台上开放了在线试用空间。

Python
Apache License 2.0
19.3k
Stars
1.7k
Forks
162
Watchers
68
Issues

Star 增长

今日+4
近 7 天+12
近 30 天+28
综合评分86.48
默认分支main