AwareVLN

GWxuan

[CVPR 2026] AwareVLN: Reasoning with Self-awareness for Vision-Language Navigation

AI 简介

AwareVLN 是一个面向视觉-语言导航（VLN）任务的新型方法，通过在关键导航节点引入稀疏的自省式推理机制，提升智能体对自身状态与环境关系的理解能力。其核心技术包括：统一多模态大模型（VLM）在 [REASON] 与 [ACT] 模式间动态切换、基于自动数据引擎生成的高质量稀疏推理标注、以及对 NaVILA 架构（Llama-3 8B + SigLIP）的端到端微调。项目适用于室内场景下的指令驱动导航研究，尤其适合需平衡推理效率与决策鲁棒性的机器人导航、具身AI仿真训练等场景。

Python

Apache License 2.0

在 GitHub 查看官方网站

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+10

综合评分42.43

默认分支main

AwareVLN

Star 增长

加入交流群