facebookresearch

ImageBind

facebookresearch

ImageBind One Embedding Space to Bind Them All

AI 简介

ImageBind 是一个由 Meta AI 研发的多模态嵌入模型,能够在一个统一的嵌入空间中处理包括图像、文本、音频、深度信息、热成像及惯性测量单元数据在内的六种不同模态的数据。该项目基于 PyTorch 实现,并提供了预训练模型,支持跨模态检索、模态组合运算、跨模态检测与生成等应用。通过学习这些不同类型的输入之间的关联性,ImageBind 能够实现零样本分类等任务上的出色表现。适用于需要整合多种类型感知数据以进行综合分析或创建新型交互体验的研究与开发场景。

Python
Other
9k
Stars
843
Forks
95
Watchers
79
Issues

Star 增长

今日0
近 7 天+2
近 30 天+11
综合评分56.88
默认分支main