
daVinci-MagiHuman
GAIR-NLP
暂无描述
AI 简介
daVinci-MagiHuman 是一个快速的音视频生成基础模型,采用单一流架构。项目核心功能包括通过仅使用自注意力机制处理文本、视频和音频的15B参数40层Transformer,提供高质量的人脸表情、自然语音-表情协调、逼真身体动作及精准音视频同步。支持多种语言如中文(普通话和粤语)、英语、日语等,并能在单个H100 GPU上实现极快的推理速度。该模型在人机对比测试中表现出色,胜率高达80%。适用于需要高效生成高质量多模态内容的场景,例如虚拟人物创建、视频合成等。代码完全开源,包含基础模型、蒸馏模型、超分辨率模型及推理代码。
Python
2k
Stars
211
Forks
15
Watchers
22
Issues
Star 增长
今日+11
近 7 天+23
近 30 天+56
综合评分90.08
默认分支main