[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-72013":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":17,"stars7d":18,"stars30d":19,"stars90d":16,"forks30d":16,"starsTrendScore":20,"compositeScore":21,"rankGlobal":10,"rankLanguage":10,"license":10,"archived":22,"fork":22,"defaultBranch":23,"hasWiki":22,"hasPages":24,"topics":25,"createdAt":10,"pushedAt":10,"updatedAt":38,"readmeContent":39,"aiSummary":40,"trendingCount":16,"starSnapshotCount":16,"syncStatus":41,"lastSyncTime":42,"discoverSource":43},72013,"all-in-rag","datawhalechina\u002Fall-in-rag","datawhalechina","🔍大模型应用开发实战一：RAG 技术全栈指南，在线阅读地址：https:\u002F\u002Fdatawhalechina.github.io\u002Fall-in-rag\u002F","https:\u002F\u002Fdatawhalechina.github.io\u002Fall-in-rag\u002F",null,"Python",8447,4203,22,12,0,139,341,635,417,41,false,"main",true,[26,27,28,29,30,31,32,33,34,35,36,37],"ai","deepseek","embedding","kimi-k2","langchain","llama-index","llm","milvus","multimodal","neo4j","python","rag","2026-06-12 02:02:57","# All-in-RAG | 大模型应用开发实战一：RAG技术全栈指南\n\n\u003Cdiv align='center'>\n  \u003Cimg src=\".\u002Fdocs\u002Flogo.svg\" alt=\"All-in-RAG Logo\" width=\"70%\">\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Ch2>🔍 检索增强生成 (RAG) 技术全栈指南\u003C\u002Fh2>\n  \u003Cp>\u003Cem>从理论到实践，从基础到进阶，构建你的RAG技术体系\u003C\u002Fem>\u003C\u002Fp>\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fdatawhalechina\u002Fall-in-rag?style=for-the-badge&logo=github&color=ff6b6b\" alt=\"GitHub stars\"\u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002Fdatawhalechina\u002Fall-in-rag?style=for-the-badge&logo=github&color=4ecdc4\" alt=\"GitHub forks\"\u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPython-3.12.7-blue?style=for-the-badge&logo=python&logoColor=white\" alt=\"Python\"\u002F>\n  \u003Ca href=\"https:\u002F\u002Fzread.ai\u002Fdatawhalechina\u002Fall-in-rag\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FAsk_Zread-_.svg?style=for-the-badge&color=00b0aa&labelColor=000000&logo=data%3Aimage%2Fsvg%2Bxml%3Bbase64%2CPHN2ZyB3aWR0aD0iMTYiIGhlaWdodD0iMTYiIHZpZXdCb3g9IjAgMCAxNiAxNiIgZmlsbD0ibm9uZSIgeG1sbnM9Imh0dHA6Ly93d3cudzMub3JnLzIwMDAvc3ZnIj4KPHBhdGggZD0iTTQuOTYxNTYgMS42MDAxSDIuMjQxNTZDMS44ODgxIDEuNjAwMSAxLjYwMTU2IDEuODg2NjQgMS42MDE1NiAyLjI0MDFWNC45NjAxQzEuNjAxNTYgNS4zMTM1NiAxLjg4ODEgNS42MDAxIDIuMjQxNTYgNS42MDAxSDQuOTYxNTZDNS4zMTUwMiA1LjYwMDEgNS42MDE1NiA1LjMxMzU2IDUuNjAxNTYgNC45NjAxVjIuMjQwMUM1LjYwMTU2IDEuODg2NjQgNS4zMTUwMiAxLjYwMDEgNC45NjE1NiAxLjYwMDFaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik00Ljk2MTU2IDEwLjM5OTlIMi4yNDE1NkMxLjg4ODEgMTAuMzk5OSAxLjYwMTU2IDEwLjY4NjQgMS42MDE1NiAxMS4wMzk5VjEzLjc1OTlDMS42MDE1NiAxNC4xMTM0IDEuODg4MSAxNC4zOTk5IDIuMjQxNTYgMTQuMzk5OUg0Ljk2MTU2QzUuMzE1MDIgMTQuMzk5OSA1LjYwMTU2IDE0LjExMzQgNS42MDE1NiAxMy43NTk5VjExLjAzOTlDNS42MDE1NiAxMC42ODY0IDUuMzE1MDIgMTAuMzk5OSA0Ljk2MTU2IDEwLjM5OTlaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik0xMy43NTg0IDEuNjAwMUgxMS4wMzg0QzEwLjY4NSAxLjYwMDEgMTAuMzk4NCAxLjg4NjY0IDEwLjM5ODQgMi4yNDAxVjQuOTYwMUMxMC4zOTg0IDUuMzEzNTYgMTAuNjg1IDUuNjAwMSAxMS4wMzg0IDUuNjAwMUgxMy43NTg0QzE0LjExMTkgNS42MDAxIDE0LjM5ODQgNS4zMTM1NiAxNC4zOTg0IDQuOTYwMVYyLjI0MDFDMTQuMzk4NCAxLjg4NjY0IDE0LjExMTkgMS42MDAxIDEzLjc1ODQgMS42MDAxWiIgZmlsbD0iI2ZmZiIvPgo8cGF0aCBkPSJNNCAxMkwxMiA0TDQgMTJaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik00IDEyTDEyIDQiIHN0cm9rZT0iI2ZmZiIgc3Ryb2tlLXdpZHRoPSIxLjUiIHN0cm9rZS1saW5lY2FwPSJyb3VuZCIvPgo8L3N2Zz4K&logoColor=ffffff\" alt=\"zread\"\u002F>\n  \u003C\u002Fa>\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fdatawhalechina.github.io\u002Fall-in-rag\u002F\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002F📖_在线阅读-立即开始-success?style=for-the-badge&logoColor=white\" alt=\"在线阅读\"\u002F>\n  \u003C\u002Fa>\n  \u003Ca href=\"README_en.md\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002F🌍_English-Version-blue?style=for-the-badge&logoColor=white\" alt=\"English Version\"\u002F>\n  \u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fdatawhalechina\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002F💬_讨论交流-加入我们-purple?style=for-the-badge&logoColor=white\" alt=\"讨论交流\"\u002F>\n  \u003C\u002Fa>\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Cbr>\n  \u003Ctable>\n    \u003Ctr>\n      \u003Ctd align=\"center\">🎯 \u003Cstrong>系统化学习\u003C\u002Fstrong>\u003Cbr>完整的RAG技术体系\u003C\u002Ftd>\n      \u003Ctd align=\"center\">🛠️ \u003Cstrong>动手实践\u003C\u002Fstrong>\u003Cbr>丰富的项目案例\u003C\u002Ftd>\n      \u003Ctd align=\"center\">🚀 \u003Cstrong>生产就绪\u003C\u002Fstrong>\u003Cbr>工程化最佳实践\u003C\u002Ftd>\n      \u003Ctd align=\"center\">📊 \u003Cstrong>多模态支持\u003C\u002Fstrong>\u003Cbr>文本+图像检索\u003C\u002Ftd>\n    \u003C\u002Ftr>\n  \u003C\u002Ftable>\n\u003C\u002Fdiv>\n\n## 项目简介（中文 | [English](README_en.md)）\n\n本项目是一个面向大模型应用开发者的RAG（检索增强生成）技术全栈教程，旨在通过体系化的学习路径和动手实践项目，帮助开发者掌握基于大语言模型的RAG应用开发技能，构建生产级的智能问答和知识检索系统。\n\n**主要内容包括：**\n\n1. **RAG技术基础**：深入浅出地介绍RAG的核心概念、技术原理和应用场景\n2. **数据处理全流程**：从数据加载、清洗到文本分块的完整数据准备流程\n3. **索引构建与优化**：向量嵌入、多模态嵌入、向量数据库构建及索引优化技术\n4. **检索技术进阶**：混合检索、查询构建、Text2SQL等高级检索技术\n5. **生成集成与评估**：格式化生成、系统评估与优化方法\n6. **项目实战**：从基础到进阶的完整RAG应用开发实践\n\n## 项目意义\n\n随着大语言模型的快速发展，RAG技术已成为构建智能问答系统、知识检索应用的核心技术。然而，现有的RAG教程往往零散且缺乏系统性，初学者难以形成完整的技术体系认知。\n\n本项目从实践出发，结合最新的RAG技术发展趋势，构建了一套完整的RAG学习体系，帮助开发者：\n- 系统掌握RAG技术的理论基础和实践技能\n- 理解RAG系统的完整架构和各组件的作用\n- 具备独立开发RAG应用的能力\n- 掌握RAG系统的评估和优化方法\n\n## 项目受众\n\n**本项目适合以下人群学习：**\n- 具备Python编程基础，对RAG技术感兴趣的开发者\n- 希望系统学习RAG技术的AI工程师\n- 想要构建智能问答系统的产品开发者\n- 对检索增强生成技术有学习需求的研究人员\n\n**前置要求：**\n- 掌握Python基础语法和常用库的使用\n- 能够简单使用docker\n- 了解基本的LLM概念（推荐但非必需）\n- 具备基础的Linux命令行操作能力\n\n## 项目亮点\n\n1. **体系化学习路径**：从基础概念到高级应用，构建完整的RAG技术学习体系\n2. **理论与实践并重**：每个章节都包含理论讲解和代码实践，确保学以致用\n3. **多模态支持**：不仅涵盖文本RAG，还包括多模态嵌入和检索技术\n4. **工程化导向**：注重实际应用中的工程化问题，包括性能优化、系统评估等\n5. **丰富的实战项目**：提供从基础到进阶的多个实战项目，帮助巩固学习成果\n\n## 内容大纲\n\n### 第一部分：RAG基础入门\n\n**第一章 解锁RAG** [📖 查看章节](.\u002Fdocs\u002Fchapter1)\n- [x] [RAG简介](.\u002Fdocs\u002Fchapter1\u002F01_RAG_intro.md) - RAG技术概述与应用场景\n- [x] [准备工作](.\u002Fdocs\u002Fchapter1\u002F02_preparation.md) - 环境配置与准备\n- [x] [四步构建RAG](.\u002Fdocs\u002Fchapter1\u002F03_get_start_rag.md) - 快速上手RAG开发\n- [x] [附：环境部署](.\u002Fdocs\u002Fchapter1\u002Fvirtualenv.md) - Python虚拟环境部署方案补充 (贡献者: [@anarchysaiko](https:\u002F\u002Fgithub.com\u002Fanarchysaiko))\n\n**第二章 数据准备** [📖 查看章节](.\u002Fdocs\u002Fchapter2)\n- [x] [数据加载](.\u002Fdocs\u002Fchapter2\u002F04_data_load.md) - 多格式文档处理与加载\n- [x] [文本分块](.\u002Fdocs\u002Fchapter2\u002F05_text_chunking.md) - 文本切分策略与优化\n\n### 第二部分：索引构建与优化\n\n**第三章 索引构建** [📖 查看章节](.\u002Fdocs\u002Fchapter3)\n- [x] [向量嵌入](.\u002Fdocs\u002Fchapter3\u002F06_vector_embedding.md) - 文本向量化技术详解\n- [x] [多模态嵌入](.\u002Fdocs\u002Fchapter3\u002F07_multimodal_embedding.md) - 图文多模态向量化\n- [x] [向量数据库](.\u002Fdocs\u002Fchapter3\u002F08_vector_db.md) - 向量存储与检索系统\n- [x] [Milvus实践](.\u002Fdocs\u002Fchapter3\u002F09_milvus.md) - Milvus多模态检索实战\n- [x] [索引优化](.\u002Fdocs\u002Fchapter3\u002F10_index_optimization.md) - 索引性能调优技巧\n\n### 第三部分：检索技术进阶\n\n**第四章 检索优化** [📖 查看章节](.\u002Fdocs\u002Fchapter4)\n- [x] [混合检索](.\u002Fdocs\u002Fchapter4\u002F11_hybrid_search.md) - 稠密+稀疏检索融合\n- [x] [查询构建](.\u002Fdocs\u002Fchapter4\u002F12_query_construction.md) - 智能查询理解与构建\n- [x] [Text2SQL](.\u002Fdocs\u002Fchapter4\u002F13_text2sql.md) - 自然语言转SQL查询\n- [x] [查询重构与分发](.\u002Fdocs\u002Fchapter4\u002F14_query_rewriting.md) - 查询优化策略\n- [x] [检索进阶技术](.\u002Fdocs\u002Fchapter4\u002F15_advanced_retrieval_techniques.md) - 高级检索算法\n\n### 第四部分：生成与评估\n\n**第五章 生成集成** [📖 查看章节](.\u002Fdocs\u002Fchapter5)\n- [x] [格式化生成](.\u002Fdocs\u002Fchapter5\u002F16_formatted_generation.md) - 结构化输出与格式控制\n\n**第六章 RAG系统评估** [📖 查看章节](.\u002Fdocs\u002Fchapter6)\n- [x] [评估介绍](.\u002Fdocs\u002Fchapter6\u002F18_system_evaluation.md) - RAG系统评估方法论\n- [x] [评估工具](.\u002Fdocs\u002Fchapter6\u002F19_common_tools.md) - 常用评估工具与指标\n\n### 第五部分：高级应用与实战\n\n**第七章 高级RAG架构（拓展部分）** [📖 查看章节](.\u002Fdocs\u002Fchapter7)\n\n- [x] [基于知识图谱的RAG](.\u002Fdocs\u002Fchapter7\u002F20_kg_rag.md)\n\n**第八章 项目实战一** [📖 查看章节](.\u002Fdocs\u002Fchapter8)\n- [x] [环境配置与项目架构](.\u002Fdocs\u002Fchapter8\u002F01_env_architecture.md)\n- [x] [数据准备模块实现](.\u002Fdocs\u002Fchapter8\u002F02_data_preparation.md)\n- [x] [索引构建与检索优化](.\u002Fdocs\u002Fchapter8\u002F03_index_retrieval.md)\n- [x] [生成集成与系统整合](.\u002Fdocs\u002Fchapter8\u002F04_generation_sys.md)\n\n**第九章 项目实战一优化（选修篇）** [📖 查看章节](.\u002Fdocs\u002Fchapter9)\n\n[🍽️ 项目展示](https:\u002F\u002Fgithub.com\u002FFutureUnreal\u002FWhat-to-eat-today)\n- [x] [图RAG架构设计](.\u002Fdocs\u002Fchapter9\u002F01_graph_rag_architecture.md)\n- [x] [图数据建模与准备](.\u002Fdocs\u002Fchapter9\u002F02_graph_data_modeling.md)\n- [x] [Milvus索引构建](.\u002Fdocs\u002Fchapter9\u002F03_index_construction.md)\n- [x] [智能查询路由与检索策略](.\u002Fdocs\u002Fchapter9\u002F04_intelligent_query_routing.md)\n\n**第十章 项目实战二（选修篇）** [📖 查看章节](.\u002Fdocs\u002Fchapter10) *规划中*\n\n### Extra-chapter\n\n- [Neo4J 简单应用](.\u002FExtra-chapter\u002FNeo4J-Simple-Application\u002Freadme.md) （贡献者: [dalvqw](https:\u002F\u002Fgithub.com\u002FFutureUnreal)）\n\n> 如果你在使用 RAG \u002F 向量数据库 \u002F Agentic RAG 等相关技术时，也有值得分享的经验与专题内容，非常欢迎以独立章节的形式投稿到 [Extra Chapter](.\u002FExtra-chapter\u002F) 中。提交前请先阅读 Extra Chapter 的[贡献与 PR 指南](.\u002FExtra-chapter\u002FREADME.md)，我们会根据内容的完整度、实践深度与参考价值综合评估是否合并，并视情况在主教程中进行引用或扩展说明。\n\n## 目录结构说明\n\n```\nall-in-rag\u002F\n├── docs\u002F           # 教程文档\n├── code\u002F           # 代码示例\n├── data\u002F           # 示例数据\n├── models\u002F         # 预训练模型\n├── Extra-chapter\u002F  # 扩展章节与社区实践内容\n└── README.md       # 项目说明\n```\n\n## 实战项目展示\n\n### 第八章 项目一：\n\n![项目一](.\u002Fproject01.png)\n\n### 第九章 项目一（Graph RAG优化）：\n\n![项目一（Graph RAG优化）](.\u002Fproject01_graph.png)\n\n### 第十章 项目二：\n\n## 致谢\n\n**核心贡献者**\n- [dalvqw-项目负责人](https:\u002F\u002Fgithub.com\u002FFutureUnreal)（项目发起人与主要贡献者）\n\n**额外章节贡献者**\n- [孙超-内容创作者](https:\u002F\u002Fgithub.com\u002Fanarchysaiko)（Datawhale成员-上海工程技术大学）\n\n### 特别感谢\n- 感谢 [@Sm1les](https:\u002F\u002Fgithub.com\u002FSm1les) 对本项目的帮助与支持\n- 感谢所有为本项目做出贡献的开发者们\n- 感谢开源社区提供的优秀工具和框架支持\n- 特别感谢以下为教程做出贡献的开发者！\n\n[![Contributors](https:\u002F\u002Fcontrib.rocks\u002Fimage?repo=datawhalechina\u002Fall-in-rag)](https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Fall-in-rag\u002Fgraphs\u002Fcontributors)\n\n*Made with [contrib.rocks](https:\u002F\u002Fcontrib.rocks).*\n\n## 参与贡献\n\n我们欢迎所有形式的贡献，包括但不限于：\n\n- 🚨 **Bug报告**：发现问题请提交 [Issue](https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Fall-in-rag\u002Fissues)\n- 💭 **教程建议**：有好的想法欢迎在 [Discussions](https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Fall-in-rag\u002Fdiscussions) 中讨论\n- 📚 **文档改进**：帮助完善文档内容和示例代码（当前仅支持 Extra-chapter 优质内容pr）\n\n## Star History\n\n[![all-in-rag stats](https:\u002F\u002Fdatawhalechina.github.io\u002Fmembers-visualization\u002Fbadges\u002Fall-in-rag.png)](https:\u002F\u002Fdatawhalechina.github.io\u002Fmembers-visualization\u002Frepo-badge?repo=all-in-rag)\n\n\u003Cdiv align=\"center\">\n  \u003Cp>如果这个项目对你有帮助，请给我们一个 ⭐️\u003C\u002Fp>\n  \u003Cp>让更多人发现这个项目（护食？发来！）\u003C\u002Fp>\n\u003C\u002Fdiv>\n\n![star](.\u002Femoji.png)\n\n## 关于 Datawhale\n\n\u003Cdiv align='center'>\n    \u003Cimg src=\"https:\u002F\u002Fraw.githubusercontent.com\u002Fdatawhalechina\u002Fpumpkin-book\u002Fmaster\u002Fres\u002Fqrcode.jpeg\" alt=\"Datawhale\" width=\"30%\">\n    \u003Cp>扫描二维码关注 Datawhale 公众号，获取更多优质开源内容\u003C\u002Fp>\n\u003C\u002Fdiv>\n\n---\n\n## 许可证\n\n\u003Ca rel=\"license\" href=\"http:\u002F\u002Fcreativecommons.org\u002Flicenses\u002Fby-nc-sa\u002F4.0\u002F\">\u003Cimg alt=\"知识共享许可协议\" style=\"border-width:0\" src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-CC%20BY--NC--SA%204.0-lightgrey\" \u002F>\u003C\u002Fa>\n\n本作品采用 [知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议](http:\u002F\u002Fcreativecommons.org\u002Flicenses\u002Fby-nc-sa\u002F4.0\u002F) 进行许可。\n\n---\n","All-in-RAG 是一个专注于检索增强生成（RAG）技术的全栈指南项目。该项目提供了从理论到实践、从基础到进阶的全面学习资源，帮助开发者构建完整的RAG技术体系。核心功能包括系统化的学习路径、丰富的动手实践案例以及对多种相关技术如langchain、llama-index和Milvus等的支持。适合希望深入了解并应用RAG技术于实际项目中的AI开发者及研究人员使用。",2,"2026-06-11 03:39:56","high_star"]