OthersideAI

self-operating-computer

OthersideAI

A framework to enable a multimodal model to operate a computer.

AI 简介

Self-Operating Computer Framework 是一个使多模态模型能够操作计算机的框架。它通过模拟人类操作员的输入和输出,让模型能够查看屏幕并决定一系列鼠标和键盘动作以达成目标。该框架支持多种多模态模型,包括GPT-4o、Gemini Pro Vision等,并且易于集成。其主要技术特点包括兼容性强、与主流AI模型集成以及未来将支持更多模型。适用于需要自动化桌面任务的场景,如自动化测试、数据处理或日常办公任务自动化。

Python
MIT License
10.2k
Stars
1.4k
Forks
132
Watchers
80
Issues

Star 增长

今日0
近 7 天+1
近 30 天+7
综合评分60.66
默认分支main