
LLaDA2.0-Uni
inclusionAI
LLaDA2.0-Uni: Understanding and Generation the World.
AI 简介
LLaDA2.0-Uni是一个基于扩散大语言模型的多模态理解和生成统一框架。该项目通过一个统一的dLLM-MoE架构,将图像理解与文本到图像生成等功能整合在一起,支持高效的8步推理过程。其核心技术包括使用SigLIP-VQ将视觉输入转化为离散语义令牌,以及采用专门设计的扩散解码器来实现高质量的内容生成。此外,LLaDA2.0-Uni还提供了灵活的图像编辑功能,能够在保持原始细节的同时进行精确修改。此项目适用于需要高级别多模态处理能力的应用场景,如自动问答系统、文档理解工具及创意内容生产等。
Python
759
Stars
49
Forks
6
Watchers
3
Issues
Star 增长
今日0
近 7 天+4
近 30 天+22
综合评分50.3
默认分支main