wangpan-ustc

AtlasVA

wangpan-ustc

暂无描述

AI 简介

AtlasVA是一个无教师视觉技能记忆框架,专为视觉-语言模型(VLM)代理设计。其核心功能包括三层互补的视觉记忆结构:空间热图、视觉样本和符号文本技能,并通过直接从轨迹统计数据演化的危险和亲和力地图提供密集的、坐标感知的强化学习指导。这使得AtlasVA能够在无需外部大型语言模型监督的情况下统一感知、记忆与优化过程,在如Sokoban、FrozenLake等空间密集型任务上表现出色。该项目使用Python开发,适合需要在复杂环境中进行高效自主导航或操作的研究者及开发者应用。

Python
71
Stars
3
Forks
60
Watchers
0
Issues

Star 增长

今日0
近 7 天+3
近 30 天+9
综合评分38.21
默认分支main