shawn0728

OpenSearch-VL

shawn0728

🔍 OpenSearch-VL provides a fully open recipe for training strong multimodal deep search agents through high-quality data curation, diverse visual/search tools, and fatal-aware agentic reinforcement learning.

AI 简介

OpenSearch-VL 是一个用于训练前沿多模态深度搜索代理的完全开源方案。该项目通过高质量的数据整理、多样化的视觉和搜索工具以及致命感知的代理强化学习,使模型能够以闭环方式处理图像,包括裁剪或增强感兴趣区域、执行网络和图像搜索、访问检索到的页面,并基于收集到的证据生成答案。其核心技术特点包括冷启动代理SFT、多轮次致命感知GRPO及视觉工具使用。适用于需要复杂多模态理解和交互的场景,如高级图像搜索、研究辅助等。项目采用Python开发,遵循Apache License 2.0许可协议。

Python
Apache License 2.0
212
Stars
18
Forks
4
Watchers
3
Issues

Star 增长

今日+3
近 7 天+9
近 30 天+59
综合评分60.24
默认分支main