
WorldVLN.code
EmbodiedCity
暂无描述
AI 简介
WorldVLN是一个用于空中视觉-语言导航的自回归世界动作模型。该项目利用Python实现,其核心功能包括自回归推理以实现闭环动作预测,以及两阶段训练流程:一是监督主干网络和动作解码器的训练,二是基于GRPO的动作感知优化。技术上,WorldVLN依赖于PyTorch框架,并且提供了预训练模型权重供用户下载使用。此项目非常适合那些需要在复杂环境中通过自然语言指令控制无人机完成特定任务的研究者或开发者,如室内无人机导航、搜救行动等应用场景。
Python
Creative Commons Attribution 4.0 International77
Stars
7
Forks
3
Watchers
2
Issues
Star 增长
今日+1
近 7 天+4
近 30 天+17
综合评分45.41
默认分支main