X-PLUG

ToolCUA

X-PLUG

ToolCUA: Towards Optimal GUI-Tool Path Orchestration for Computer Use Agents

AI 简介

ToolCUA 是一个专为计算机使用代理(CUA)设计的端到端系统,旨在实现最优的图形用户界面(GUI)与工具路径编排。该项目通过分阶段训练流水线解决了在混合动作空间中选择合适操作路径的问题,包括基于现有GUI数据生成交错的GUI-工具轨迹、利用工具引导的GUI RFT获取工具调用知识以及在线Agentic RL优化以鼓励适当工具使用和更短执行路径。它适用于需要自动化桌面任务并智能决策何时使用GUI操作或调用高级工具的应用场景,如文件管理、应用程序操作等。项目采用Python开发,并在MIT许可下开源。

Python
MIT License
51
Stars
1
Forks
1
Watchers
1
Issues

Star 增长

今日0
近 7 天+12
近 30 天+16
综合评分48.5
默认分支main