
MMSkills
DeepExperience
MMSkills: Towards Multimodal Skills for General Visual Agents
AI 简介
MMSkills 项目旨在为通用视觉代理开发多模态技能。它提供了一个包含515种多模态技能的库,支持Codex、OpenClaw和Claude Code等代理适配器,使视觉代理能够执行复杂的桌面任务。该项目使用Python 3.10+编写,并遵循Apache License 2.0开源协议。MMSkills适用于需要增强视觉代理功能的场景,如自动化办公任务、人机交互系统以及任何需要多模态处理能力的应用。通过其丰富的技能库和易于集成的特点,MMSkills能够显著提升视觉代理在多种环境下的表现。
Python
Apache License 2.0320
Stars
22
Forks
13
Watchers
5
Issues
Star 增长
今日0
近 7 天0
近 30 天+219
综合评分54.09
默认分支main