
LWM
LargeWorldModel
Large World Model -- Modeling Text and Video with Millions Context
AI 简介
Large World Model (LWM) 是一个通用的大规模上下文多模态自回归模型,能够处理文本、图像和视频的理解与生成。该项目利用RingAttention技术在大规模数据集上进行训练,支持从4K到100万token的上下文大小,解决了内存限制和计算复杂性等挑战。LWM的核心功能包括跨百万级上下文的事实检索、长达一小时的视频问答、基于图像的聊天以及从文本生成视频和图像。适合用于需要深度理解长文本或视频内容的应用场景,例如教育、娱乐、新闻分析等领域。
Python
Apache License 2.07.4k
Stars
558
Forks
67
Watchers
54
Issues
Star 增长
今日0
近 7 天+5
近 30 天+9
综合评分47.64
默认分支main