microsoft

MoGe

microsoft

[CVPR'25 Oral] MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision

AI 简介

MoGe 是一个用于从单目开放域图像中恢复3D几何结构的强大模型,能够生成度量点图、深度图、法线图和相机视场。其核心功能包括高精度的3D几何估计、可选的真实视场输入以进一步提高准确性、对不同分辨率和宽高比的支持以及优化后的快速推理速度(在A100或RTX3090上达到每张图片60毫秒的延迟)。该工具非常适合需要从单张图片中获取高质量3D信息的应用场景,如增强现实、虚拟现实、自动驾驶等。

Python
Other
2.5k
Stars
188
Forks
56
Watchers
74
Issues

Star 增长

今日+17
近 7 天+29
近 30 天+67
综合评分100.03
默认分支main