
self-operating-computer
OthersideAI
A framework to enable a multimodal model to operate a computer.
AI 简介
Self-Operating Computer Framework 是一个使多模态模型能够操作计算机的框架。它通过模拟人类操作员的输入和输出,让模型能够查看屏幕并决定一系列鼠标和键盘动作以达成目标。该框架支持多种多模态模型,包括GPT-4o、Gemini Pro Vision等,并且易于集成。其主要技术特点包括兼容性强、与主流AI模型集成以及未来将支持更多模型。适用于需要自动化桌面任务的场景,如自动化测试、数据处理或日常办公任务自动化。
Python
MIT License10.2k
Stars
1.4k
Forks
132
Watchers
80
Issues
Star 增长
今日0
近 7 天+1
近 30 天+7
综合评分60.66
默认分支main