OpenGVLab

InternVL

OpenGVLab

[CVPR 2024 Oral] InternVL Family: A Pioneering Open-Source Alternative to GPT-4o. 接近GPT-4o表现的开源多模态对话模型

AI 简介

InternVL 是一个开源的多模态对话模型,旨在提供接近GPT-4o表现的替代方案。该项目的核心功能包括图像分类、图像文本检索、语义分割和视频分类等,基于多种视觉-语言模型(如VIT-22B, VIT-6B)构建,能够处理复杂的多模态任务。技术上,InternVL利用了大规模预训练技术和强化学习方法来提升模型的推理能力和效率。适合需要高性能多模态理解与生成能力的应用场景,例如智能客服、内容审核及自动图文创作等领域。

Python
MIT License
10.1k
Stars
782
Forks
66
Watchers
304
Issues

Star 增长

今日0
近 7 天+10
近 30 天+36
综合评分67.28
默认分支main