
realtime-vla-flash
dexmal
暂无描述
AI 简介
realtime-vla-flash 是一个用于扩散模型的实时视觉语言动作(VLA)推测推理框架。其核心功能包括以7.8毫秒完成双视角推测,支持超过125Hz的实时推理速度;采用与视觉-语言模型对齐的草图架构设计,并通过定制化的Triton内核实现平均任务级加速3.04倍。该项目适合需要高性能、低延迟视觉理解与决策的应用场景,如机器人控制、自动驾驶等。使用Python编写,易于部署和扩展。
Python
Apache License 2.081
Stars
7
Forks
69
Watchers
0
Issues
Star 增长
今日+1
近 7 天+5
近 30 天+9
综合评分45.11
默认分支main