Alpha-VLLM

Lumina-T2X

Alpha-VLLM

Lumina-T2X is a unified framework for Text to Any Modality Generation

AI 简介

Lumina-T2X 是一个统一的文本到任意模态生成框架。该项目利用基于流的大规模扩散变压器模型,能够将文本转换为不同分辨率和时长的各种模态内容,如图像、视频等。其核心功能包括多模态生成、高分辨率输出以及灵活的时长控制,采用Python语言实现,并已在ICLR 2025和NeurIPS 2024上展示。适合需要从文本描述中自动生成高质量视觉内容的应用场景,例如创意设计、广告制作及多媒体内容生成等领域。

Python
MIT License
2.3k
Stars
95
Forks
32
Watchers
54
Issues

Star 增长

今日0
近 7 天0
近 30 天0
综合评分57.95
默认分支main