kepengxu

PRISM-VL

kepengxu

PRISM-VL studies measurement-grounded VLM learning with RAW-derived Meas.-XYZ inputs, camera-conditioned grounding, and exposure-bracketed supervision transfer.

AI 简介

PRISM-VL 是一个研究项目,旨在探索基于测量域数据(如RAW图像衍生的Meas.-XYZ输入)的视觉语言模型学习。该项目的核心功能包括使用相机条件定位和曝光包围监督转移来改进模型推理能力。技术上,它基于Qwen3-VL框架,并引入了新的视觉接口,从传统的ISP后RGB图像转换为更原始的测量域数据加上相机元数据。适合于需要更高精度视觉理解的应用场景,尤其是在RGB图像处理过程中丢失了传感器证据的情况下。此外,项目还提供了基准测试集、训练语料库、评估流水线及LoRA权重等资源,便于复现研究成果。

Python
Apache License 2.0
423
Stars
15
Forks
5
Watchers
2
Issues

Star 增长

今日+25
近 7 天+131
近 30 天+232
综合评分93.61
默认分支main