
OpenSearch-VL
shawn0728
🔍 OpenSearch-VL provides a fully open recipe for training strong multimodal deep search agents through high-quality data curation, diverse visual/search tools, and fatal-aware agentic reinforcement learning.
AI 简介
OpenSearch-VL 是一个用于训练前沿多模态深度搜索代理的完全开源方案。该项目通过高质量的数据整理、多样化的视觉和搜索工具以及致命感知的代理强化学习,使模型能够以闭环方式处理图像,包括裁剪或增强感兴趣区域、执行网络和图像搜索、访问检索到的页面,并基于收集到的证据生成答案。其核心技术特点包括冷启动代理SFT、多轮次致命感知GRPO及视觉工具使用。适用于需要复杂多模态理解和交互的场景,如高级图像搜索、研究辅助等。项目采用Python开发,遵循Apache License 2.0许可协议。
Python
Apache License 2.0212
Stars
18
Forks
4
Watchers
3
Issues
Star 增长
今日+3
近 7 天+9
近 30 天+59
综合评分60.24
默认分支main