MicroLM

jiaran-king

基于轻量级 LLM 与 Qwen2.5-1.5B 两条主线，完成从数据处理、模型训练、参数高效微调，到评测验证与服务部署的端到端闭环。

AI 简介

MicroLM 是一个面向轻量级大语言模型的端到端训练与部署开源项目，支持自研31.7M参数模型和Qwen2.5-1.5B模型两条技术主线。核心功能涵盖Tokenizer构建、语料清洗与Pipeline处理、Pretrain/SFT训练、LoRA高效微调（最低0.14%可训参数）、KV Cache推理优化及vLLM服务化部署，并提供结构化自动评测体系。技术特点包括纯PyTorch自实现（含einsum）、BPE分词器、RoPE+SwiGLU架构、低开销Adaptor存储（最小仅1MB）及量化验证闭环。适用于教学实践、边缘/本地LLM定制、中小规模业务场景下的模型快速迭代与轻量部署。

Python

MIT License

在 GitHub 查看

197

Stars

Forks

109

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+7

综合评分44.39

默认分支main

MicroLM

Star 增长

加入交流群