spatial-vqa-bench

sitodowubb

Spatial-VQA-Bench: a focused benchmark of spatial visual reasoning for multimodal LLMs.

AI 简介

Spatial-VQA-Bench 是一个专注于多模态大语言模型的空间视觉推理基准测试项目。该项目通过五个任务家族（2D关系、3D关系、旋转、遮挡和视角）中的3,200个手工验证的条目，评估模型在理解物体之间空间位置关系方面的能力。其核心功能包括支持多种类型的视觉问题生成与评估，并提供了一个简洁的架构用于模型预测结果的评分。特别适合于需要对多模态AI系统进行深入空间推理能力测试的研究场景，如室内环境下的物体相对位置判断或复杂视角变换下的物体识别等任务。

Python

Other

在 GitHub 查看

220

Stars

7.6k

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+195

综合评分60

默认分支main