Qwen-VLA

QwenLM

The official repository of Qwen-VLA

AI 简介

Qwen-VLA 是一个统一的视觉-语言-动作（VLA）通用模型，旨在跨任务、环境与机器人本体实现端到端具身智能决策。其核心由 Qwen3.5-4B 视觉语言骨干网络和 1.15B 参数的 DiT 流匹配动作解码器构成，支持操纵、导航、自视角动作建模与轨迹预测等任务共享同一动作-轨迹预测空间；通过本体感知提示条件化实现单权重适配多机器人平台，无需针对不同硬件设计专用输出头。适用于仿真与真实机器人场景下的通用具身策略学习与部署。

在 GitHub 查看

694

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+39

综合评分49.09

默认分支main

Qwen-VLA

Star 增长

加入交流群