mrvellang

vlm-probe-suite

mrvellang

FineVLM-Probe: a lightweight harness for fine-grained probing of frozen vision-language models (CLIP / SigLIP / BLIP-2 / LLaVA).

AI 简介

FineVLM-Probe 是一个轻量级工具包,用于对冻结的视觉-语言模型(如CLIP、SigLIP、BLIP-2和LLaVA)进行细粒度探测。该项目提供了多种探针定义和数据集加载器,支持用户针对特定问题进行深入分析,例如评估模型在不同图像分辨率下的表现或检查文本编码器与视觉编码器的相对贡献。核心功能包括灵活的模型适配机制,新增模型仅需编写约30行代码。适用于需要对预训练视觉-语言模型的具体行为进行细致探究的研究场景。

Python
Other
220
Stars
0
Forks
5
Watchers
0
Issues

Star 增长

今日0
近 7 天+54
近 30 天+167
综合评分70
默认分支main