
TrackCraft3r
cvlab-kaist
Official code implementation for TrackCraft3R: Repurposing Video Diffusion Transformers for Dense 3D Tracking
AI 简介
TrackCraft3R 是一个将预训练的视频扩散变压器重新用于密集3D跟踪的项目。其核心功能是通过单次前向传递,从单目视频及其预测的深度和相机信息中预测出密集的3D轨迹。技术上,它基于Wan2.1-T2V-1.3B模型,并在训练过程中引入了LoRA(低秩适应)等技术以优化性能。该项目适合需要进行高精度3D目标跟踪的应用场景,例如自动驾驶、增强现实或虚拟现实领域中的物体追踪任务。开发环境要求包括Python 3.10、PyTorch 2.4以及CUDA支持的GPU。
Python
Apache License 2.092
Stars
4
Forks
1
Watchers
1
Issues
Star 增长
今日0
近 7 天+5
近 30 天+5
综合评分45.1
默认分支main