NVlabs

FoundationStereo

NVlabs

[CVPR 2025 Best Paper Nomination] FoundationStereo: Zero-Shot Stereo Matching

AI 简介

FoundationStereo 是一个零样本立体匹配项目,旨在通过输入一对立体图像输出密集视差图,进而转换为度量尺度深度图或3D点云。其核心功能包括构建大规模(100万对立体图像)高逼真度的合成训练数据集、自动自我筛选流程去除模糊样本,以及设计了一系列网络架构组件来增强模型的可扩展性。技术特点涵盖了利用视觉基础模型中的丰富单目先验信息来减少模拟与现实之间的差距,并通过长距离上下文推理实现有效的代价体积过滤。该项目适用于需要跨领域鲁棒性和准确性且无需特定领域微调的场景,如自动驾驶、机器人导航等。

Python
Other
2.7k
Stars
262
Forks
51
Watchers
78
Issues

Star 增长

今日+9
近 7 天+20
近 30 天+68
综合评分94.06
默认分支master