[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-73959":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":17,"stars7d":18,"stars30d":19,"stars90d":16,"forks30d":16,"starsTrendScore":20,"compositeScore":21,"rankGlobal":10,"rankLanguage":10,"license":22,"archived":23,"fork":23,"defaultBranch":24,"hasWiki":23,"hasPages":25,"topics":26,"createdAt":10,"pushedAt":10,"updatedAt":30,"readmeContent":31,"aiSummary":32,"trendingCount":16,"starSnapshotCount":16,"syncStatus":33,"lastSyncTime":34,"discoverSource":35},73959,"happy-llm","datawhalechina\u002Fhappy-llm","datawhalechina","📚 从零开始构建大模型","https:\u002F\u002Fdatawhalechina.github.io\u002Fhappy-llm\u002F",null,"Jupyter Notebook",31065,2949,97,52,0,144,301,893,432,45,"Other",false,"main",true,[27,28,29],"agent","llm","rag","2026-06-12 02:03:20","\u003Cdiv align='center'>\n    \u003Cimg src=\".\u002Fimages\u002Fhead.jpg\" alt=\"alt text\" width=\"100%\">\n    \u003Ch1>Happy-LLM\u003C\u002Fh1>\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fdatawhalechina\u002Fhappy-llm?style=flat&logo=github\" alt=\"GitHub stars\"\u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002Fdatawhalechina\u002Fhappy-llm?style=flat&logo=github\" alt=\"GitHub forks\"\u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flanguage-Chinese-brightgreen?style=flat\" alt=\"Language\"\u002F>\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Fhappy-llm\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FGitHub-Project-blue?style=flat&logo=github\" alt=\"GitHub Project\">\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fswanlab.cn\u002F@kmno4\u002FHappy-LLM\u002Foverview\">\u003Cimg src=\"https:\u002F\u002Fraw.githubusercontent.com\u002FSwanHubX\u002Fassets\u002Fmain\u002Fbadge1.svg\" alt=\"SwanLab\">\u003C\u002Fa>\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Ftrendshift.io\u002Frepositories\u002F14175\" target=\"_blank\">\u003Cimg src=\"https:\u002F\u002Ftrendshift.io\u002Fapi\u002Fbadge\u002Frepositories\u002F14175\" alt=\"datawhalechina%2Fhappy-llm | Trendshift\" style=\"width: 250px; height: 55px;\" width=\"250\" height=\"55\"\u002F>\u003C\u002Fa>\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n\n[中文](.\u002FREADME.md) | [English](.\u002FREADME_en.md)\n\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Cp>\u003Ca href=\"https:\u002F\u002Fdatawhalechina.github.io\u002Fhappy-llm\u002F\">📚 在线阅读地址\u003C\u002Fa>\u003C\u002Fp>\n  \u003Ch3>📚 从零开始构建大模型\u003C\u002Fh3>\n  \u003Cp>\u003Cem>深入理解 LLM 核心原理，动手实现你的第一个大模型\u003C\u002Fem>\u003C\u002Fp>\n\u003C\u002Fdiv>\n\n---\n\n## 🎯 项目介绍\n\n> &emsp;&emsp;*很多小伙伴在看完 Datawhale开源项目： [self-llm 开源大模型食用指南](https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Fself-llm) 后，感觉意犹未尽，想要深入了解大语言模型的原理和训练过程。于是我们（Datawhale）决定推出《Happy-LLM》项目，旨在帮助大家深入理解大语言模型的原理和训练过程。*\n\n&emsp;&emsp;本项目是一个**系统性的 LLM 学习教程**，将从 NLP 的基本研究方法出发，根据 LLM 的思路及原理逐层深入，依次为读者剖析 LLM 的架构基础和训练过程。同时，我们会结合目前 LLM 领域最主流的代码框架，演练如何亲手搭建、训练一个 LLM，期以实现授之以鱼，更授之以渔。希望大家能从这本书开始走入 LLM 的浩瀚世界，探索 LLM 的无尽可能。\n\n### ✨ 你将收获什么？\n\n- 📚 **Datawhale 开源免费** 完全免费的学习本项目所有内容\n- 🔍 **深入理解** Transformer 架构和注意力机制\n- 📚 **掌握** 预训练语言模型的基本原理\n- 🧠 **了解** 现有大模型的基本结构\n- 🏗️ **动手实现** 一个完整的 LLaMA2 模型\n- ⚙️ **掌握训练** 从预训练到微调的全流程\n- 🚀 **实战应用** RAG、Agent 等前沿技术\n\n## 📖 内容导航\n\n| 章节 | 关键内容 | 状态 |\n| --- | --- | --- |\n| [学习与环境准备](.\u002Fdocs\u002F学习与环境准备.md) | 分章依赖、硬件建议与实践入口 | ✅ |\n| [前言](.\u002Fdocs\u002F前言.md) | 本项目的缘起、背景及读者建议 | ✅ |\n| [第一章 NLP 基础概念](.\u002Fdocs\u002Fchapter1\u002F第一章%20NLP基础概念.md) | 什么是 NLP、发展历程、任务分类、文本表示演进 | ✅ |\n| [第二章 Transformer 架构](.\u002Fdocs\u002Fchapter2\u002F第二章%20Transformer架构.md) | 注意力机制、Encoder-Decoder、手把手搭建 Transformer | ✅ |\n| [第三章 预训练语言模型](.\u002Fdocs\u002Fchapter3\u002F第三章%20预训练语言模型.md) | Encoder-only、Encoder-Decoder、Decoder-Only 模型对比 | ✅ |\n| [第四章 大语言模型](.\u002Fdocs\u002Fchapter4\u002F第四章%20大语言模型.md) | LLM 定义、训练策略、涌现能力分析 | ✅ |\n| [第五章 动手搭建大模型](.\u002Fdocs\u002Fchapter5\u002F第五章%20动手搭建大模型.md) | 实现 LLaMA2、训练 Tokenizer、预训练小型 LLM | ✅ |\n| [第六章 大模型训练实践](.\u002Fdocs\u002Fchapter6\u002F第六章%20大模型训练流程实践.md) | 预训练、有监督微调、LoRA\u002FQLoRA 高效微调 | ✅ |\n| [第七章 大模型应用](.\u002Fdocs\u002Fchapter7\u002F第七章%20大模型应用.md) | 模型评测、RAG 检索增强、Agent 智能体 | ✅ |\n| [Extra Chapter LLM Blog](.\u002FExtra-Chapter\u002F) | 优秀的大模型 学习笔记\u002FBlog ，欢迎大家来 PR ！| 🚧 |\n\n> 第六章正文已覆盖 Pretrain、SFT 与 PEFT 等核心训练流程，建议结合 [第六章实践说明](.\u002Fdocs\u002Fchapter6\u002Freadme.md) 和 [学习与环境准备](.\u002Fdocs\u002F学习与环境准备.md) 一起阅读；偏好对齐可继续参考 [第六章补充专题](.\u002Fdocs\u002Fchapter6\u002F6.4%5BWIP%5D%20偏好对齐.md)。\n\n### Extra Chapter LLM Blog\n\n- [大模型都这么厉害了，微调0.6B的小模型有什么意义？](.\u002FExtra-Chapter\u002Fwhy-fine-tune-small-large-language-models\u002Freadme.md) @[不要葱姜蒜](https:\u002F\u002Fgithub.com\u002FKMnO4-zx) 2025-7-11\n\n- [Transformer 整体模块设计解读](.\u002FExtra-Chapter\u002Ftransformer-architecture\u002F) @[ditingdapeng](https:\u002F\u002Fgithub.com\u002Fditingdapeng) 2025-7-14\n\n- [文本数据处理详解](.\u002FExtra-Chapter\u002Ftext-data-processing\u002Freadme.md) @[蔡鋆捷](https:\u002F\u002Fgithub.com\u002Fxinala-781) 2025-7-14\n\n- [Qwen3-\"VL\"——超小中文多模态模型的“拼接微调”之路](.\u002FExtra-Chapter\u002Fvlm-concatenation-finetune\u002FREADME.md) @[ShaohonChen](https:\u002F\u002Fgithub.com\u002FShaohonChen) 2025-7-30\n\n- [S1: Thinking Budget with vLLM](.\u002FExtra-Chapter\u002Fs1-vllm-thinking-budget\u002Freadme.md) @[不要葱姜蒜](https:\u002F\u002Fgithub.com\u002Fkmno4-zx) 2025-8-03\n\n\n- [CDDRS: 使用细粒度语义信息指导增强的RAG检索方法](.\u002FExtra-Chapter\u002FCDDRS\u002Freadme.md) @[Hongru0306](https:\u002F\u002Fgithub.com\u002FHongru0306) 2025-8-21\n\n- [大模型生成 Token 的方式有哪些？](.\u002FExtra-Chapter\u002Fgeneration-method\u002Freadme.md) @[不要葱姜蒜](https:\u002F\u002Fgithub.com\u002Fkmno4-zx) 2025-10-17\n\n\n> &emsp;&emsp;*如果大家在学习 Happy-LLM 项目或 LLM 相关知识中有自己独到的见解、认知、实践，欢迎大家 PR 在 [Extra Chapter LLM Blog](.\u002FExtra-Chapter\u002F) 中。请遵守 Extra Chapter LLM Blog 的 [PR 规范](.\u002FExtra-Chapter\u002FReadme.md)，我们会视 PR 内容的质量和价值来决定是否合并或补充到 Happy-LLM 正文中来。*\n\n### 模型下载\n\n| 模型名称 | 下载地址 |\n| --- | --- |\n| Happy-LLM-Chapter5-Base-215M | [🤖 ModelScope](https:\u002F\u002Fwww.modelscope.cn\u002Fmodels\u002Fkmno4zx\u002Fhappy-llm-215M-base) |\n| Happy-LLM-Chapter5-SFT-215M | [🤖 ModelScope](https:\u002F\u002Fwww.modelscope.cn\u002Fmodels\u002Fkmno4zx\u002Fhappy-llm-215M-sft) |\n\n> *ModelScope 创空间体验地址：[🤖 创空间](https:\u002F\u002Fwww.modelscope.cn\u002Fstudios\u002Fkmno4zx\u002Fhappy_llm_215M_sft)*\n\n\n### PDF 版本下载\n\n&emsp;&emsp;***本 Happy-LLM PDF 教程完全开源免费。为防止各类营销号加水印后贩卖给大模型初学者，我们特地在 PDF 文件中预先添加了不影响阅读的 Datawhale 开源标志水印，敬请谅解～***\n\n> *Happy-LLM PDF : https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Fhappy-llm\u002Freleases\u002Ftag\u002Fv1.0.2*  \n\n### PPT 资源下载\n\n&emsp;&emsp;***本项目配套教学讲义PPT课件资源获取链接：https:\u002F\u002Fgithub.com\u002FHZAI-ZJNU\u002Fhappy-llm-ppt 或可在本项目的 [Releases](https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Fhappy-llm\u002Freleases) 页面下载。***\n\n## 💡 如何学习\n\n&emsp;&emsp;本项目适合大学生、研究人员、LLM 爱好者。在学习本项目之前，建议具备一定的编程经验，尤其是要对 Python 编程语言有一定的了解。最好具备深度学习的相关知识，并了解 NLP 领域的相关概念和术语，以便更轻松地学习本项目。\n\n&emsp;&emsp;如果你计划复现章节代码，建议先阅读 [学习与环境准备](.\u002Fdocs\u002F学习与环境准备.md)。仓库当前按章节拆分依赖，不同章节建议使用独立的 Python 环境，以减少版本冲突。\n\n&emsp;&emsp;本项目分为两部分——基础知识与实战应用。第1章～第4章是基础知识部分，从浅入深介绍 LLM 的基本原理。其中，第1章简单介绍 NLP 的基本任务和发展，为非 NLP 领域研究者提供参考；第2章介绍 LLM 的基本架构——Transformer，包括原理介绍及代码实现，作为 LLM 最重要的理论基础；第3章整体介绍经典的 PLM，包括 Encoder-Only、Encoder-Decoder 和 Decoder-Only 三种架构，也同时介绍了当前一些主流 LLM 的架构和思想；第4章则正式进入 LLM 部分，详细介绍 LLM 的特点、能力和整体训练过程。第5章～第7章是实战应用部分，将逐步带领大家深入 LLM 的底层细节。其中，第5章将带领大家者基于 PyTorch 层亲手搭建一个 LLM，并实现预训练、有监督微调的全流程；第6章将引入目前业界主流的 LLM 训练框架 Transformers，带领学习者基于该框架快速、高效地实现 LLM 训练过程；第7章则将介绍 基于 LLM 的各种应用，补全学习者对 LLM 体系的认知，包括 LLM 的评测、检索增强生成（Retrieval-Augmented Generation，RAG）、智能体（Agent）的思想和简单实现。你可以根据个人兴趣和需求，选择性地阅读相关章节。\n\n&emsp;&emsp;在阅读本书的过程中，建议你将理论和实际相结合。LLM 是一个快速发展、注重实践的领域，我们建议你多投入实战，复现本书提供的各种代码，同时积极参加 LLM 相关的项目与比赛，真正投入到 LLM 开发的浪潮中。我们鼓励你关注 Datawhale 及其他 LLM 相关开源社区，当遇到问题时，你可以随时在本项目的 issue 区提问。\n\n&emsp;&emsp;最后，欢迎每一位读者在学习完本项目后加入到 LLM 开发者的行列。作为国内 AI 开源社区，我们希望充分聚集共创者，一起丰富这个开源 LLM 的世界，打造更多、更全面特色 LLM 的教程。星火点点，汇聚成海。我们希望成为 LLM 与普罗大众的阶梯，以自由、平等的开源精神，拥抱更恢弘而辽阔的 LLM 世界。\n\n> - 中国计算机学会(CCF) × Datawhale × GitLink开源平台联合推出AI普惠课程，免费算力报名参加 [【报名地址】](https:\u002F\u002Fmp.weixin.qq.com\u002Fs\u002FP03f3e2vUUh7OxDP40Ra6w)[【GitLink 地址】](https:\u002F\u002Fgitlink.org.cn\u002Fdatawhalechina\u002Fhappy-llm)\n\n## 🤝 如何贡献\n\n我们欢迎任何形式的贡献！\n\n- 🐛 **报告 Bug** - 发现问题请提交 Issue\n- 💡 **功能建议** - 有好想法就告诉我们\n- 📝 **内容完善** - 帮助改进教程内容\n- 🔧 **代码优化** - 提交 Pull Request\n\n## 🙏 致谢\n\n### 核心贡献者\n- [宋志学-项目负责人](https:\u002F\u002Fgithub.com\u002FKMnO4-zx) (Datawhale成员)\n- [邹雨衡-项目负责人](https:\u002F\u002Fgithub.com\u002Flogan-zou) (Datawhale成员-对外经济贸易大学)\n- [朱信忠-指导专家](https:\u002F\u002Fxinzhongzhu.github.io\u002F)（Datawhale首席科学家-浙江师范大学杭州人工智能研究院教授）\n\n### Extra-Chapter 贡献者\n\n- [ditingdapeng](https:\u002F\u002Fgithub.com\u002Fditingdapeng)（内容贡献者-云原生基础架构工程师）\n- [蔡鋆捷](https:\u002F\u002Fgithub.com\u002Fxinala-781)（内容贡献者-福州大学）\n- [ShaohonChen](https:\u002F\u002Fgithub.com\u002FShaohonChen) （情感机器实验室研究员-西安电子科技大学在读硕士）\n- [肖鸿儒, 庄健琨](https:\u002F\u002Fgithub.com\u002FHongru0306) (内容贡献者-同济大学)\n\n### 特别感谢\n- 感谢 [@Sm1les](https:\u002F\u002Fgithub.com\u002FSm1les) 对本项目的帮助与支持\n- 感谢所有为本项目做出贡献的开发者们 ❤️\n\n\u003Cdiv align=center style=\"margin-top: 30px;\">\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Fhappy-llm\u002Fgraphs\u002Fcontributors\">\n    \u003Cimg src=\"https:\u002F\u002Fcontrib.rocks\u002Fimage?repo=datawhalechina\u002Fhappy-llm\" \u002F>\n  \u003C\u002Fa>\n\u003C\u002Fdiv>\n\n## Star History\n\n\u003Cdiv align='center'>\n    \u003Cimg src=\".\u002Fimages\u002Fstar-history-20251017.png\" alt=\"Datawhale\" width=\"90%\">\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Cp>⭐ 如果这个项目对你有帮助，请给我们一个 Star！\u003C\u002Fp>\n\u003C\u002Fdiv>\n\n## 关于 Datawhale\n\n\u003Cdiv align='center'>\n    \u003Cimg src=\".\u002Fimages\u002Fdatawhale.png\" alt=\"Datawhale\" width=\"30%\">\n    \u003Cp>扫描二维码关注 Datawhale 公众号，获取更多优质开源内容\u003C\u002Fp>\n\u003C\u002Fdiv>\n\n---\n\n## 📜 开源协议\n\n本作品采用[知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议](http:\u002F\u002Fcreativecommons.org\u002Flicenses\u002Fby-nc-sa\u002F4.0\u002F)进行许可。\n","Happy-LLM 是一个系统性的大语言模型（LLM）学习教程，旨在帮助读者深入理解 LLM 的核心原理并动手实现自己的第一个大模型。项目的核心功能包括从 NLP 基础概念出发，逐步讲解 Transformer 架构、预训练语言模型以及大语言模型的训练过程，并结合主流代码框架实战搭建和训练 LLaMA2 模型。此外，还涵盖了从预训练到微调的全流程以及 RAG、Agent 等前沿技术的应用。此项目适合希望深入了解 LLM 并亲手实践的开发者、研究人员及学生使用。",2,"2026-06-11 03:48:04","high_star"]