
vjepa2
facebookresearch
PyTorch code and models for VJEPA2 self-supervised learning from video.
AI 简介
V-JEPA 2 是一个基于自监督学习的视频编码器训练方法,使用大规模互联网视频数据进行训练,在运动理解和人类行为预测任务中达到顶尖性能。其核心功能包括密集预测损失、深层自监督和多模态分词器等技术特点,能够学习高质量且时间一致的密集特征。V-JEPA 2 及其变体 V-JEPA 2-AC 和 V-JEPA 2.1 适用于需要对视频内容有深入理解的应用场景,如机器人操作任务、视频内容分析及预测等领域。此外,通过少量机器人轨迹交互数据的后训练,V-JEPA 2-AC 能够解决机器人操纵任务,无需特定环境的数据收集或任务特定训练。项目提供了官方 PyTorch 代码库和预训练模型,便于研究人员和开发者快速上手。
Python
MIT License4.1k
Stars
505
Forks
47
Watchers
66
Issues
Star 增长
今日0
近 7 天+45
近 30 天+206
综合评分90.11
默认分支main