Alibaba-Quark

LiveAvatar

Alibaba-Quark

Implementation of "Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length"

AI 简介

Live Avatar 是一个实现实时音频驱动的无限长度虚拟形象生成的框架。该项目利用140亿参数的扩散模型,能够在多张H800 GPU上以45帧每秒的速度生成高质量的虚拟形象视频,并支持长达10,000秒以上的流媒体视频处理。其核心技术特点包括高效的4步采样方法和块自回归处理技术,确保了长时间视频生成过程中的稳定性和流畅性。适用于需要实时交互式虚拟形象的应用场景,如在线教育、虚拟主播、远程会议等。

Python
Apache License 2.0
2.1k
Stars
242
Forks
63
Watchers
39
Issues

Star 增长

今日+9
近 7 天+27
近 30 天+66
综合评分97.26
默认分支main