
MiniCPM
OpenBMB
MiniCPM5-1B: A SOTA 1B on-device LLM, small yet powerful.
AI 简介
MiniCPM4 & MiniCPM4.1 是专为终端设备设计的超高效大语言模型,能够实现推理任务生成速度3倍以上的提升。该项目的核心功能包括通过可训练的稀疏注意力机制,在保持高性能的同时大幅提高计算效率,尤其适用于需要在资源受限环境下进行快速推理的应用场景。技术上,它利用了混合推理模型结构和系统级优化策略来减少计算开销,并支持深度推理模式与非推理模式之间的切换。此项目非常适合那些希望在移动设备或边缘计算环境中部署自然语言处理应用的研究者和开发者使用。
Jupyter Notebook
Apache License 2.09.4k
Stars
619
Forks
83
Watchers
12
Issues
Star 增长
今日+23
近 7 天+115
近 30 天+561
综合评分114.38
默认分支main