
AppAgent
TencentQQGYLab
AppAgent: Multimodal Agents as Smartphone Users, an LLM-based multimodal agent framework designed to operate smartphone apps.
AI 简介
AppAgent 是一个基于大语言模型的多模态代理框架,旨在操作智能手机应用程序。它通过结合文本和图像处理能力,使代理能够理解并执行复杂的用户指令,从而实现对手机应用的自动化操作。项目采用了先进的生成式AI技术,如GPT-4V等,支持多种多模态模型的选择,并提供了一个可扩展的架构以适应不同的应用场景。此外,AppAgent 还为开发者提供了详细的文档与示例代码,便于快速上手。该工具非常适合需要进行移动应用自动化测试、用户体验研究或辅助功能开发的场景。
Python
MIT License6.8k
Stars
752
Forks
76
Watchers
86
Issues
Star 增长
今日0
近 7 天+6
近 30 天+33
综合评分50.93
默认分支main