
minimind-v
jingyaogong
👀「大模型」2小时从0训练65M参数的视觉多模态VLM!Train a 65M-parameter VLM from scratch in just 2h!
AI 简介
MiniMind-V是一个专注于快速训练小型视觉语言模型的项目,能够在2小时内从零开始训练出一个65M参数的多模态模型。该项目采用Python编写,核心功能包括极简结构设计、数据集清洗及预训练等全过程代码支持,使得个人用户即使使用消费级GPU也能完成模型训练与推理。特别适合于对AI感兴趣但资源有限的研究者或开发者作为入门教程来学习和实践视觉-语言模型技术。
Python
Apache License 2.08.1k
Stars
889
Forks
49
Watchers
15
Issues
Star 增长
今日+11
近 7 天+50
近 30 天+259
综合评分114.85
默认分支master