
MiniCPM-V
OpenBMB
A Pocket-Sized MLLM for Ultra-Efficient Image and Video Understanding on Your Phone
AI 简介
MiniCPM-V 是一个专为手机设计的高效图像和视频理解的小型多模态大语言模型。其核心功能包括对图像、视频和文本输入的理解,采用最新的intra-ViT早期压缩技术,将视觉编码计算成本降低了50%以上,并支持4x/16x混合视觉令牌压缩率,以实现不同任务中性能与效率之间的灵活平衡。MiniCPM-V 4.6版本拥有13亿参数,在保持高性能的同时,展现出优于一些更大或更小模型的效率优势。此项目非常适合需要在移动设备(如iOS、Android及HarmonyOS平台)上进行超高效多媒体内容处理的应用场景使用。
Python
Apache License 2.025.6k
Stars
2k
Forks
166
Watchers
31
Issues
Star 增长
今日+16
近 7 天+71
近 30 天+1006
综合评分119.91
默认分支main