scenema-audio

ScenemaAI

Zero-shot expressive voice cloning and speech generation. Generate anything from short clips to full-length audiobooks with realistic emotional delivery, pacing, and breath control. Clone any voice from a 10-second reference and perform emotions the original speaker never recorded.

AI 简介

Scenema Audio 是一个零样本、高表现力的语音克隆与语音合成系统，支持仅凭10秒参考音频克隆任意人声，并在生成中精准控制情绪、语速、呼吸节奏和情感变化。其核心技术基于从LTX-2模型提取的音频扩散Transformer，具备真实场景级语音建模能力，可生成从短语音片段到完整有声书的高质量语音输出。适用于影视配音、有声读物制作、交互式语音内容创作等对情感表达和声音表现力要求较高的专业场景。

Python

MIT License

在 GitHub 查看官方网站

532

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+6

综合评分50.24

默认分支main

scenema-audio

Star 增长

加入交流群