bytedance

UI-TARS

bytedance

Pioneering Automated GUI Interaction with Native Agents

AI 简介

UI-TARS是一个基于强大视觉-语言模型的开源多模态代理,能够高效执行虚拟世界中的多样化任务。其核心功能包括通过强化学习实现的高级推理能力,使模型能够在行动前进行思考,从而大幅提升性能。此外,UI-TARS支持本地个人设备操作及网页自动化,适用于需要复杂图形用户界面交互、游戏控制或代码工具使用的场景。该技术特别适合研究者和开发者探索多模态智能体在实际应用中的潜力。

Python
10.9k
Stars
816
Forks
109
Watchers
41
Issues

Star 增长

今日0
近 7 天+47
近 30 天+452
综合评分85.74
默认分支main