LargeWorldModel

LWM

LargeWorldModel

Large World Model -- Modeling Text and Video with Millions Context

AI 简介

Large World Model (LWM) 是一个通用的大规模上下文多模态自回归模型,能够处理文本、图像和视频的理解与生成。该项目利用RingAttention技术在大规模数据集上进行训练,支持从4K到100万token的上下文大小,解决了内存限制和计算复杂性等挑战。LWM的核心功能包括跨百万级上下文的事实检索、长达一小时的视频问答、基于图像的聊天以及从文本生成视频和图像。适合用于需要深度理解长文本或视频内容的应用场景,例如教育、娱乐、新闻分析等领域。

Python
Apache License 2.0
7.4k
Stars
558
Forks
67
Watchers
54
Issues

Star 增长

今日0
近 7 天+5
近 30 天+9
综合评分47.64
默认分支main