om-ai-lab

OmAgent

om-ai-lab

[EMNLP-2024] Build multimodal language agents for fast prototype and production

AI 简介

OmAgent 是一个用于构建多模态语言代理的 Python 库,旨在简化快速原型设计和生产过程。该项目通过封装复杂的工程细节(如工作流编排、任务队列管理和节点优化)来提供简洁易用的接口,并支持可重用组件以构建复杂代理。其核心功能包括基于图的工作流编排引擎、多种内存类型支持上下文推理以及对视频语言模型、实时API、计算机视觉模型和移动设备连接的原生支持,使得开发者能够创建处理文本、图像、视频及音频输入的多模态代理。适用于需要跨媒体理解能力的应用场景,比如智能硬件、虚拟助手等。此外,OmAgent 支持本地部署模型,并拥有完全分布式的架构设计,允许自定义扩展。

Python
Apache License 2.0
2.7k
Stars
290
Forks
131
Watchers
7
Issues

Star 增长

今日+2
近 7 天+3
近 30 天+10
综合评分65.89
默认分支main