
WebDroid-Agent
yeahhe365
Browser-based Android phone agent using WebADB/WebUSB and OpenAI-compatible vision models
AI 简介
WebDroid Agent 是一个基于浏览器的 Android 手机代理实验项目,利用 WebADB/WebUSB 和 OpenAI 兼容的视觉模型实现手机自动化控制。其核心功能包括通过浏览器连接已开启 USB 调试的 Android 设备,截取屏幕并发送给视觉模型处理,再将模型返回的动作解析并通过 ADB 执行。项目支持静态部署和 Docker 部署两种方式,前者完全在前端运行,后者则通过本地 API 代理解决跨域问题。适用于需要快速验证视觉模型与手机控制链路的场景,比如调试动作协议、研究不同风格动作兼容性或进行 Android UI 自动化原型实验。但不推荐用于涉及高风险操作如支付、登录等流程或需要长期稳定托管的生产环境。
TypeScript
MIT License91
Stars
17
Forks
71
Watchers
0
Issues
Star 增长
今日+3
近 7 天+13
近 30 天+19
综合评分58.17
默认分支main