facebookresearch

vjepa2

facebookresearch

PyTorch code and models for VJEPA2 self-supervised learning from video.

AI 简介

V-JEPA 2 是一个基于自监督学习的视频编码器训练方法,使用大规模互联网视频数据进行训练,在运动理解和人类行为预测任务中达到顶尖性能。其核心功能包括密集预测损失、深层自监督和多模态分词器等技术特点,能够学习高质量且时间一致的密集特征。V-JEPA 2 及其变体 V-JEPA 2-AC 和 V-JEPA 2.1 适用于需要对视频内容有深入理解的应用场景,如机器人操作任务、视频内容分析及预测等领域。此外,通过少量机器人轨迹交互数据的后训练,V-JEPA 2-AC 能够解决机器人操纵任务,无需特定环境的数据收集或任务特定训练。项目提供了官方 PyTorch 代码库和预训练模型,便于研究人员和开发者快速上手。

Python
MIT License
4.1k
Stars
505
Forks
47
Watchers
66
Issues

Star 增长

今日0
近 7 天+45
近 30 天+206
综合评分90.11
默认分支main