QwenLM

Qwen3-VL

QwenLM

Qwen3-VL is the multimodal large language model series developed by Qwen team, Alibaba Cloud.

AI 简介

Qwen3-VL是由阿里云Qwen团队开发的多模态大语言模型系列。它具备卓越的文字理解和生成能力、深度视觉感知与推理功能、扩展的上下文长度以及增强的空间和视频动态理解能力,还拥有强大的代理交互能力。该模型支持密集型和MoE架构,适用于从边缘到云端的部署,并提供指令优化版和增强推理版以满足不同场景需求。其核心功能包括视觉代理操作、视觉编码加速、高级空间感知、长文本及视频理解、增强的多模态推理、升级的视觉识别以及扩展的OCR支持。Qwen3-VL适合需要结合图像与文本进行复杂任务处理的应用场景,如自动办公助手、多媒体内容创作工具等。

Jupyter Notebook
Apache License 2.0
19.4k
Stars
1.8k
Forks
90
Watchers
380
Issues

Star 增长

今日0
近 7 天+56
近 30 天+178
综合评分89.75
默认分支main