Lumina-T2X

Alpha-VLLM

Lumina-T2X is a unified framework for Text to Any Modality Generation

AI 简介

Lumina-T2X 是一个统一的文本到任意模态生成框架，支持将文本提示转化为图像、视频、音频等多种输出形式，并适配不同分辨率与持续时间。其核心技术基于流式（flow-based）大扩散变换器（Diffusion Transformer），融合扩散模型与Transformer架构，在生成质量、跨模态一致性与推理效率上取得平衡。项目开源、轻量、模块化设计，便于研究者快速验证新模态生成任务或集成到多模态AIGC工作流中，适用于学术研究、多模态内容创作工具开发及AI原生应用原型构建等场景。

Python

MIT License

aigc diffusion diffusion-model diffusion-models diffusion-transformer generation-models transformer transformers

在 GitHub 查看

2.2k

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天0

综合评分27.95

默认分支main

Lumina-T2X

Star 增长

加入交流群