[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-11247":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":8,"htmlUrl":8,"language":8,"languages":8,"totalLinesOfCode":8,"stars":9,"forks":10,"watchers":11,"openIssues":12,"contributorsCount":12,"subscribersCount":12,"size":12,"stars1d":13,"stars7d":14,"stars30d":15,"stars90d":12,"forks30d":12,"starsTrendScore":14,"compositeScore":16,"rankGlobal":8,"rankLanguage":8,"license":8,"archived":17,"fork":17,"defaultBranch":18,"hasWiki":19,"hasPages":17,"topics":20,"createdAt":8,"pushedAt":8,"updatedAt":21,"readmeContent":22,"aiSummary":23,"trendingCount":12,"starSnapshotCount":12,"syncStatus":13,"lastSyncTime":24,"discoverSource":25},11247,"LLMBeginner","MLNLP-World\u002FLLMBeginner","MLNLP-World",null,169,20,1,0,2,6,18,3.97,false,"main",true,[],"2026-06-12 02:02:30","\u003Cdiv align=\"center\">\n\n\u003Cimg src=\"asset\u002Fimage.png\" alt=\"Slay the LLM Maze\" width=\"320\" \u002F>\n\n# 零基础通关 LLM 的项目式学习路线\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FLLMBeginner\u002Fstargazers\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FMLNLP-World\u002FLLMBeginner?style=flat&logo=github&label=Stars&color=111827\" alt=\"GitHub stars\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FLLMBeginner\u002Fnetwork\u002Fmembers\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002FMLNLP-World\u002FLLMBeginner?style=flat&logo=github&label=Forks&color=111827\" alt=\"GitHub forks\" \u002F>\u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FLLMBeginner\u002Fissues\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002FMLNLP-World\u002FLLMBeginner?style=flat&logo=github&label=Issues&color=111827\" alt=\"GitHub issues\" \u002F>\u003C\u002Fa>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002FMLNLP-World\u002FLLMBeginner?style=flat&label=License&color=111827\" alt=\"License\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flast-commit\u002FMLNLP-World\u002FLLMBeginner?style=flat&label=Last%20Commit&color=111827\" alt=\"Last Commit\" \u002F>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLLM-Learning%20Path-2563eb?style=flat\" alt=\"LLM Learning Path\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FProject--Based-Study-2563eb?style=flat\" alt=\"Project Based Study\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FZero%20to-Agent-2563eb?style=flat\" alt=\"Zero to Agent\" \u002F>\n\u003C\u002Fp>\n\n> 该项目旨在为初学者提供一条清晰的大模型学习路径，从零基础出发，循序渐进地理解 LLM 的核心原理、训练机制与应用范式，并逐步过渡到智能体（Agent）的构建与基础实践。我们希望在“会用”的基础上，进一步帮助学习者实现“看懂、做出、跑通”。由于我们能力与经验有限，内容难免存在不足，欢迎交流与指正。😀 \n\n\n\n\u003C\u002Fdiv>\n\n\u003Ctable>\n  \u003Ctr>\n    \u003Ctd width=\"33%\" valign=\"top\">\n      \u003Ch3>🧭 你能获得什么\u003C\u002Fh3>\n      \u003Cp>从 Big Picture 到 DL \u002F RL、LLM、Agent 的完整学习主线。\u003C\u002Fp>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"33%\" valign=\"top\">\n      \u003Ch3>🧱 这份路线怎么学\u003C\u002Fh3>\n      \u003Cp>按阶段推进，每阶段都给出目标、资料与可落地的练习方向。\u003C\u002Fp>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"33%\" valign=\"top\">\n      \u003Ch3>🎯 适合谁\u003C\u002Fh3>\n      \u003Cp>适合零基础入门且准备做 LLM或Agent 项目的人。\u003C\u002Fp>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\u003C!-- > 由于我们能力与经验有限，内容难免存在不足或疏漏，欢迎交流、补充与指正。😀  -->\n\n\u003C\u002Fdiv>\n\n\n\u003C!-- \u003Ctable>\n  \u003Ctr>\n    \u003Ctd width=\"50%\" valign=\"top\">\n      \u003Ch4>✨ 快速入口\u003C\u002Fh4>\n      \u003Cp>\n        \u003Ca href=\"#-路线总览\">路线总览\u003C\u002Fa>\u003Cbr\u002F>\n        \u003Ca href=\"#-学习路径选择\">学习路径选择\u003C\u002Fa>\u003Cbr\u002F>\n        \u003Ca href=\"#stage-0-big-picture\">Stage 0\u003C\u002Fa>\u003Cbr\u002F>\n        \u003Ca href=\"#stage-1-dl--rl-基础\">Stage 1\u003C\u002Fa>\n      \u003C\u002Fp>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"50%\" valign=\"top\">\n      \u003Ch4>🛠️ 学习方式\u003C\u002Fh4>\n      \u003Cp>看懂概念 → 精读资料 → 跑通代码 → 做小项目 → 构建自己的知识图谱\u003C\u002Fp>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable> -->\n\n\n\n---\n\n## 🔥 News\n\n- **2026-04** - 项目启动，建立学习路线框架\n\n## 📋 路线总览\n\n本仓库采用阶段式学习路径（Staged Learning Path），旨在帮助你从零基础逐步成长为具备 LLM 研究能力的开发者。每个阶段都有明确的学习重点和核心目标。\n\n\u003C!-- \u003Cp>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FStage_0-Big_Picture-fde68a?style=for-the-badge&labelColor=92400e\" alt=\"Stage 0\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FStage_1-DL_%2B_RL-bbf7d0?style=for-the-badge&labelColor=166534\" alt=\"Stage 1\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FStage_2-LLM-dbeafe?style=for-the-badge&labelColor=1d4ed8\" alt=\"Stage 2\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FStage_3-Agent-f5d0fe?style=for-the-badge&labelColor=a21caf\" alt=\"Stage 3\" \u002F>\n\u003C\u002Fp> -->\n\u003Cdiv align=\"center\">\n\n| 阶段 | 学习重点 | 核心目标 |\n|:---:|:---:|:---|\n| 🗺️ **Stage 0** | Big Picture | 理解整体路径与最终目标 |\n| 📚 **Stage 1** | DL + RL | 建立深度学习与强化学习基础 |\n| 🤖 **Stage 2** | LLM | 构建大语言模型并掌握后训练方法 |\n| 🧩 **Stage 3** | Agent | 构建智能体框架与应用 |\n\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"asset\u002Fimage_route.png\" alt=\"LLM Beginner Route\" width=\"90%\" \u002F>\n\u003C\u002Fdiv>\n\n---\n## 🚀 学习路径选择\n\n针对不同程度的学习者，本项目建立了两个版本的学习路径供您选择：\n\n\u003Cdiv align=\"center\">\n\u003Ctable width=\"100%\">\n  \u003Ctr>\n    \u003Ctd width=\"5%\" align=\"center\">⚡\u003C\u002Ftd>\n    \u003Ctd width=\"45%\" valign=\"middle\">\n      \u003Ca href=\"#-精简版本\">\u003Cb>精简版本\u003C\u002Fb>\u003C\u002Fa>\u003Cbr\u002F>\n      \u003Csub>快速跑通主线，尽快建立整体框架。\u003C\u002Fsub>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"5%\" align=\"center\">📚\u003C\u002Ftd>\n    \u003Ctd width=\"45%\" valign=\"middle\">\n      \u003Ca href=\"#-详细版本\">\u003Cb>详细版本\u003C\u002Fb>\u003C\u002Fa>\u003Cbr\u002F>\n      \u003Csub>系统打牢基础，补充更多代码实践。\u003C\u002Fsub>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\u003C\u002Fdiv>\n\n\u003Cbr>\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"asset\u002Fversion_compare.png\" alt=\"LLM Beginner Version Compare\" width=\"90%\" \u002F>\n\u003C\u002Fdiv>\n\n---\n\n\n\u003Cdiv style=\"background:#EAF4E2; color:#000000; border-left:5px solid #8BAF68; padding:12px 16px; border-radius:8px;\">\n\n### ⚡ 精简版本说明\n- **适用人群**：时间有限、希望快速入门的学习者  \n- **学习目标**：建立大模型的整体认知与基本实践能力  \n- **内容特点**：聚焦核心概念与关键技术，路径精简、节奏紧凑\n\n\u003C\u002Fdiv>\n\n\u003Cdetails>\n\u003Csummary>\u003Cstrong>查看精简版本内容\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n\u003Cdiv style=\"margin-left: 1.5em;\">\n\n\u003Cdetails>\n\u003Csummary>\u003Cstrong>🗺️ Stage 0: Big Picture\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n在开始学习任何技术细节之前，先建立对整个 LLM 领域的全局认知至关重要。很多初学者容易陷入\"学了很多，但不知道自己在哪里\"的困境——Stage 0 就是为了避免这种迷失。\n\n**本阶段目标：** 理解 LLM 的来龙去脉、主流技术路线、以及你自己的学习路径，产出一份个人学习计划。\n\u003C!-- > 补充材料：见 [stage0\u002Fsupply.md](stage0\u002Fsupply.md) -->\n\n### 🧭 0.1 理解 LLM 的全貌\n\n**① LLM 是什么？能做什么？**\n\n在深入学习之前，先从宏观视角理解大语言模型：\n\n- LLM 的核心能力来自海量数据上的预训练（Pre-training）\n- 通过指令微调（Instruction Tuning）和人类反馈强化学习（RLHF）使模型变得\"有用\"\n- 当前主流模型：GPT-4、Claude、Gemini、LLaMA、Qwen 等\n\n**② LLM 的技术演进脉络**\n\n理解历史脉络有助于理解为何现在的技术是这样的：\n\n```\n词向量时代（Word2Vec）\n    → RNN \u002F LSTM 序列模型\n        → Transformer 架构（2017, Attention is All You Need）\n            → BERT（理解型）\u002F GPT（生成型）\n                → 大规模预训练（GPT-3, 175B 参数）\n                    → 指令对齐（InstructGPT, RLHF）\n                        → 当代 LLM（ChatGPT, Claude, Gemini...）\n```\n\n### 📖 0.2 推荐阅读\n\n**李沐精读论文系列**\n\n- 🔗 视频地址：https:\u002F\u002Fspace.bilibili.com\u002F1567748478\u002Flists?sid=32139\n- 💡 推荐理由：逐行精读 Transformer、BERT、GPT 等奠基论文，帮助你建立\"读论文\"的能力，这是 LLM 研究者的核心技能。\n\n\n### 🎯 0.3 制定你的个人学习计划\n\n在完成上述内容后，请根据自身情况回答以下问题，写出你的学习计划：\n\n| 问题 | 思考方向 |\n|:---|:---|\n| 我的目标是什么？ | 做应用开发 \u002F 研究模型 \u002F 理解原理 |\n| 我的时间预算？ | 每周可投入多少小时 |\n| 我的已有基础？ | Python 熟练度 \u002F 数学基础（线代、概率） |\n| 我计划跳过哪些内容？ | 结合目标裁剪路径，避免无效学习 |\n\n\n> 💬 建议：把你的学习计划写成一个 Markdown 文件放在本地仓库的专用文件夹，定期回顾和更新。\n\n\u003C\u002Fdetails>\n\n\n\n\n\n\u003Cdetails>\n\u003Csummary>\u003Cstrong>📚 Stage 1: DL + RL 基础\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n\u003C!-- > 补充材料：见 [stage1\u002Fsupply.md](stage1\u002Fsupply.md) -->\n\n### 🟦 一、深度学习 (Deep Learning)\n\n深度学习是理解 LLM 的基石。本部分帮助你掌握神经网络、反向传播、优化算法等核心概念，为后续学习 Transformer 架构打下坚实基础。\n\n#### 🎬 1.1 视频课程\n\n**吴恩达：深度学习专项课程**\n\n- 🔗 课程链接：https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1FT4y1E74V\u002F\n- 📒 配套笔记：https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FDeep_Learning_Notes\n- 💡 推荐理由：系统性强，适合建立完整的深度学习知识体系。\n\n\n#### 💻 1.2 代码学习\n\n**经典论文代码实现**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Flabmlai\u002Fannotated_deep_learning_paper_implementations\n- ⭐ GitHub Stars: 66k+\n- 💡 特点：论文逐行注释讲解，适合深入理解 Transformer、GPT 等模型实现细节\n\n\n---\n\n### 🟩 二、强化学习 (Reinforcement Learning)\n\n强化学习是 LLM 后训练（RLHF）的核心技术。掌握 RL 基础将帮助你理解如何通过人类反馈优化模型行为。\n\n#### 🎬 2.1 视频课程\n\n**动画中学强化学习**\n\n- 🔗 课程链接：https:\u002F\u002Fspace.bilibili.com\u002F399855081\u002Flists\u002F4452634?type=series\n- 📒 配套笔记：https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FReinforcement-Learning-Comic-Notes\u002F\n- 💡 推荐理由：以漫画形式讲解 RL 核心概念，零基础友好，大幅降低入门门槛。\n\n\n#### 💻 2.2 代码学习\n\n**Hands-on-RL（动手学强化学习）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fboyu-ai\u002FHands-on-RL\n- 💡 推荐理由：配套教材《动手学强化学习》，从基础算法（Q-Learning）到 PPO 逐步实现，代码简洁，适合边学理论边写代码\n\n\n---\n\n\u003C\u002Fdetails>\n\n\n\n\n\n\u003Cdetails>\n\u003Csummary>\u003Cstrong>🤖 Stage 2: LLM\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n完成 Stage 1 后，你已具备深度学习与强化学习的基础。Stage 2 的目标是真正理解 LLM 的内部机制，并亲手构建和训练一个语言模型。\n\n**本阶段目标：** 掌握 Transformer 架构原理 → 理解预训练与后训练方法 → 掌握推理模型 → 从零实现小型 LLM → 在真实大模型上做微调实战 → 拓展到多模态。\n\u003C!-- > 补充材料：见 [stage2\u002Fsupply.md](stage2\u002Fsupply.md) -->\n\n---\n\n### 🔩 一、LLM 基础知识快览\n\n在动手写代码之前，必须真正理解 Transformer 的每一个组件——注意力机制不是魔法，它是有数学直觉的。\n\n#### 📖 1.1 核心论文精读\n\n**Attention is All You Need**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F1706.03762\n- 🔗 李沐精读视频：https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1pu411o7BE\n- 💡 重点理解：Multi-Head Self-Attention、位置编码（Positional Encoding）、Encoder-Decoder 结构\n\n\n#### 🎬 1.2 视频讲解\n\n**李宏毅：生成式 AI 时代下的机器学习（LLM 重点章节）**\n\n- 🔗 课程地址：https:\u002F\u002Fspeech.ee.ntu.edu.tw\u002F~hylee\u002Fml\u002F2026-spring.php\n- 💡 推荐理由：中文讲解清晰，能够把 Transformer、预训练、对齐与生成式 AI 的整体脉络串起来，适合作为 Stage 2 的主线视频课。\n\n---\n\n\n### 🛠️ 二、动手实战：从零实现一个 LLM\n\n理论学完，动手是关键。这一部分帮助你把前面所学串联起来，亲手训练一个完整的小型语言模型。\n\n\n**① minimind**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fjingyaogong\u002Fminimind ｜ https:\u002F\u002Fgithub.com\u002Fjingyaogong\u002Fminimind-v     （多模态版本）\n- ⭐ GitHub Stars: 20k+\n- 💡 推荐理由：完整实现了预训练 → SFT → RLHF 全流程，代码注释详细，中文社区友好，适合跟着走完整个训练 pipeline。\n- 📑 推荐学习顺序：\n  * 在 minimind 上走完 预训练 → SFT → DPO 全流程\n  * 尝试修改超参数（层数、头数、学习率），观察训练曲线变化\n\n**② LLM-from-scratch （从零实现大模型功能拆解讲述）**\n\n- 🔗 中文翻译版本仓库地址：https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FLLMs-from-scratch-CN\n- ⭐ GitHub Stars: 2k+\n- 🔗 原仓库地址：https:\u002F\u002Fgithub.com\u002Frasbt\u002FLLMs-from-scratch\n- ⭐ GitHub Stars: 91k+\n- 💡 推荐理由：不仅关注 LLMs 的基础构建，如 Transformer 架构、序列建模 等，还深入探索了 GPT、BERT 等深度学习模型 的底层实现。项目中的每一部分均配备详细的代码实现和学习资源，帮助学习者从零开始构建 LLMs，全面掌握其核心技术。\n\n---\n\n\u003C\u002Fdetails>\n\n\n\n\n\n\u003Cdetails>\n\u003Csummary>\u003Cstrong>🧩 Stage 3: Agent\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n完成 Stage 2 后，你已掌握 LLM 的训练、推理与部署。Stage 3 关注如何把模型放进**闭环**：感知 → 决策 → 行动 → 观察 → 更新状态，直至任务完成。\n\n**本阶段目标：** 从范式上区分“聊天模型”与“行动者”→ 掌握规划（任务分解、动态规划与反思）、记忆（短期\u002F长期记忆管理）与工具调用的核心能力 → 理解多智能体的协议、组织与环境 → 跟跑至少一个开源项目，并自选垂直场景深入。\n\u003C!-- > 补充材料：见 [stage3\u002Fsupply.md](stage3\u002Fsupply.md) -->\n\n---\n\n### 🧭 一、理解 Agent：从 LLM 到行动者\n\n**定义：** 智能体（Agent）被定义为一种能够感知环境、进行推理、自主决策并采取行动以实现特定目标的系统。\n\n**与普通 Chatbot 的区别：**\n\n| Chatbot | Agent |\n|:---|:---|\n| 被动响应用户输入 | 主动规划并执行任务 |\n| 单轮或有限轮对话 | 多轮迭代直至目标达成 |\n| 仅依赖内置知识 | 可调外部工具获取实时信息 |\n\n**能力边界：**\n\n✅ **能做到**：多步推理与规划、调用外部工具扩展能力、与环境\u002F用户持续交互、利用长期记忆保持上下文。\n\n❌ **做不到**：完全自主设定目标（仍需人类定义任务）、真正的理解与意识（仍是模式匹配）。\n\n**李宏毅：一堂课搞懂 AI Agent 的原理**\n\n- 🔗 视频地址：https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=M2Yg1kwPpts\n- 💡 推荐理由：系统讲解 Agent 的核心概念，适合快速建立整体认知并入门。\n\n\n\n### 🧪 二、实战项目\n\n#### 🔍 DeepResearch Agent\n\n**langchain-ai\u002Fopen_deep_research**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Fopen_deep_research   \n- ⭐ GitHub Stars: 11k+  \n- 💡 推荐理由：适合作为全流程主线的多轮检索、压缩与成稿 pipeline，和 LangChain 生态、Provider\u002FMCP 组合较好接；想一次性完成“子研究 → 综合 → 报告”的模块切分时优先选它。\n\n\n#### 🖥️ GUI Agent\n\n**UI-TARS**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fbytedance\u002FUI-TARS  \n- ⭐ GitHub Stars: 10k+ \n- 💡 推荐理由：字节开源的原生 GUI 交互 \u002F 多模态智能体，支持桌面与移动端，结合 VLM 视觉理解与精准动作预测。\n\n#### 🌐 Computer Use Agent\n\n**Browser Use**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fbrowser-use\u002Fbrowser-use   \n- ⭐ GitHub Stars: 90k+  \n- 💡 推荐理由：社区热度较高浏览器自动化 Agent，能够控制真实浏览器，支持表单填写、购物等网页操作。\n\n#### 🛍️ 基于 OpenClaw 部署小红书自动运营\n\n**① OpenClaw**\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fopenclaw\u002Fopenclaw\n- ⭐ GitHub Stars: 360k+（GitHub 史上最快破记录的开源项目）\n- 💡 项目背景：由奥地利独立开发者 Peter Steinberger 于 2025 年 11 月发布，本地运行、全平台支持，通过 Skill 插件体系可扩展各类自动化能力，接入 Telegram \u002F Feishu \u002F WeChat 等 20+ 渠道，100 天内超过 Linux 和 React 成为 GitHub 最多 Star 的软件仓库。\n\n**② xiaohongshu-ops-skill（OpenClaw 小红书运营插件）**\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FXiangyu-CAS\u002Fxiaohongshu-ops-skill\n- ⭐ GitHub Stars: 600+\n- 💡 推荐理由：将 OpenClaw 变成小红书运营助手，支持\"分析竞品 → 智能选题 → 生成文案 → 自动发布\"全流程，基于浏览器自动化（CDP）真实账号操作，作者实测 20 天从 0 粉涨到 1000+ 粉，且未触发风控。\n- 🛠️ 推荐实现路径：\n  ```\n  1. 安装 OpenClaw 本体，配置 LLM API Key\n  2. 安装小红书 Skill：https:\u002F\u002Fgithub.com\u002FXiangyu-CAS\u002Fxiaohongshu-ops-skill\n  3. 扫码绑定小红书账号（仅需一次）\n  4. 下达自然语言指令，Agent 自动完成热点抓取 → 文案创作 → 定时发布\n  ```\n- ⚠️ 注意：控制操作频率，避免短时大量发布触发平台风控。\n\n\n\u003C\u002Fdetails>\n\n\n\n\u003C\u002Fdetails>\n\n\n\n---\n\n\n\u003Cdiv style=\"background:#F3F0D7; color:#000000; border-left:5px solid #A3B18A; padding:12px 16px; border-radius:8px;\">\n\n\n\n\n### 📚 详细版本说明\n- **适用人群**：有充足时间、希望系统深入学习的学习者  \n- **学习目标**：全面掌握从原理到应用的完整技术体系  \n- **内容特点**：覆盖基础理论、模型训练、推理机制、Agent 系统与工程实践等全流程内容  \n\n\u003C\u002Fdiv>\n\n\n\n\n\u003Cdetails>\n\u003Csummary>\u003Cstrong>查看详细版本内容\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n\n\u003Cdiv style=\"margin-left: 1.5em;\">\n\n\n\u003Cdetails>\n\u003C!-- ## 🗺️ Stage 0: Big Picture -->\n\u003Csummary>\u003Cstrong>🗺️ Stage 0: Big Picture\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n\n\n在开始学习任何技术细节之前，先建立对整个 LLM 领域的全局认知至关重要。很多初学者容易陷入\"学了很多，但不知道自己在哪里\"的困境——Stage 0 就是为了避免这种迷失。\n\n**本阶段目标：** 理解 LLM 的来龙去脉、主流技术路线、以及你自己的学习路径，产出一份个人学习计划。\n\n### 🧭 0.1 理解 LLM 的全貌\n\n**① LLM 是什么？能做什么？**\n\n在深入学习之前，先从宏观视角理解大语言模型：\n\n- LLM 的核心能力来自海量数据上的预训练（Pre-training）\n- 通过指令微调（Instruction Tuning）和人类反馈强化学习（RLHF）使模型变得\"有用\"\n- 当前主流模型：GPT-4、Claude、Gemini、LLaMA、Qwen 等\n\n**② LLM 的技术演进脉络**\n\n理解历史脉络有助于理解为何现在的技术是这样的：\n\n```\n词向量时代（Word2Vec）\n    → RNN \u002F LSTM 序列模型\n        → Transformer 架构（2017, Attention is All You Need）\n            → BERT（理解型）\u002F GPT（生成型）\n                → 大规模预训练（GPT-3, 175B 参数）\n                    → 指令对齐（InstructGPT, RLHF）\n                        → 当代 LLM（ChatGPT, Claude, Gemini...）\n```\n\n### 📖 0.2 推荐阅读\n\n**① 李沐精读论文系列（必看）**\n\n- 🔗 视频地址：https:\u002F\u002Fspace.bilibili.com\u002F1567748478\u002Flists?sid=32139\n- 💡 推荐理由：逐行精读 Transformer、BERT、GPT 等奠基论文，帮助你建立\"读论文\"的能力，这是 LLM 研究者的核心技能。\n\n**② Andrej Karpathy：Neural Networks: Zero to Hero**\n\n- 🔗 视频地址：https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ\n- 💡 推荐理由：从最基础的神经网络一路讲到 GPT，是目前最好的 LLM 入门叙事线，强烈建议作为 Stage 0 的压轴内容。\n\n### 🎯 0.3 制定你的个人学习计划\n\n在完成上述内容后，请根据自身情况回答以下问题，写出你的学习计划：\n\n| 问题 | 思考方向 |\n|:---|:---|\n| 我的目标是什么？ | 做应用开发 \u002F 研究模型 \u002F 理解原理 |\n| 我的时间预算？ | 每周可投入多少小时 |\n| 我的已有基础？ | Python 熟练度 \u002F 数学基础（线代、概率） |\n| 我计划跳过哪些内容？ | 结合目标裁剪路径，避免无效学习 |\n\n\n> 💬 建议：把你的学习计划写成一个 Markdown 文件放在本地仓库的专用文件夹，定期回顾和更新。\n\n\u003C\u002Fdetails>\n\n\n\n\n\n\n\u003Cdetails>\n\u003C!-- ## 📚 Stage 1: DL + RL 基础 -->\n\n\u003Csummary>\u003Cstrong>📚 Stage 1: DL + RL 基础\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n\n\n### 🟦 一、深度学习 (Deep Learning)\n\n深度学习是理解 LLM 的基石。本部分帮助你掌握神经网络、反向传播、优化算法等核心概念，为后续学习 Transformer 架构打下坚实基础。\n\n#### 🎬 1.1 视频课程\n\n**① 吴恩达：深度学习专项课程**\n\n- 🔗 课程链接：https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1FT4y1E74V\u002F\n- 📒 配套笔记：https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FDeep_Learning_Notes\n- 💡 推荐理由：系统性强，适合建立完整的深度学习知识体系。\n\n**② 李沐：动手学深度学习**\n\n- 🔗 课程链接：https:\u002F\u002Fspace.bilibili.com\u002F1567748478\u002Flists?sid=358497\n- 📒 配套笔记：https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FDeep_Learning_Notes\n- 💡 推荐理由：理论与代码结合紧密，注重动手实践。\n\n#### 💻 1.2 代码学习\n\n**① 经典论文代码实现（强烈推荐）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Flabmlai\u002Fannotated_deep_learning_paper_implementations\n- ⭐ GitHub Stars: 66k+\n- 💡 特点：论文逐行注释讲解，适合深入理解 Transformer、GPT 等模型实现细节\n\n**② 可视化学习网站**\n\n- 🔗 网站地址：https:\u002F\u002Fnn.labml.ai\u002F\n- 💡 推荐理由：代码与解释同步展示，交互式体验，非常适合初学者直观理解模型结构。\n\n---\n\n### 🟩 二、强化学习 (Reinforcement Learning)\n\n强化学习是 LLM 后训练（RLHF）的核心技术。掌握 RL 基础将帮助你理解如何通过人类反馈优化模型行为。\n\n#### 🎬 2.1 视频课程\n\n**① 动画中学强化学习（最容易理解）**\n\n- 🔗 课程链接：https:\u002F\u002Fspace.bilibili.com\u002F399855081\u002Flists\u002F4452634?type=series\n- 📒 配套笔记：https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FReinforcement-Learning-Comic-Notes\u002F\n- 💡 推荐理由：以漫画形式讲解 RL 核心概念，零基础友好，大幅降低入门门槛。\n\n**② 李宏毅：强化学习课程**\n\n- 🔗 课程链接：https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1XP4y1d7Bk\n- 💡 推荐理由：中文讲解清晰，善用直观类比，适合快速建立 RL 整体认知。\n\n**③ 王树森：深度强化学习（DRL）**\n\n- 🔗 课程链接：https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV12o4y197US\n- 💡 推荐理由：史蒂文斯理工学院王树森博士主讲，语言简洁有力，抛弃繁琐的数学推导，直接给出直观易懂的结论，初学者能在短时间内快速建立 DRL 整体体系认知。\n\n#### 💻 2.2 代码学习\n\n**① Hands-on-RL（动手学强化学习）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fboyu-ai\u002FHands-on-RL\n- 💡 推荐理由：配套教材《动手学强化学习》，从基础算法（Q-Learning）到 PPO 逐步实现，代码简洁，适合边学理论边写代码\n\n**② easy-rl（强化学习中文教程）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fdatawhalechina\u002Feasy-rl\n- 💡 推荐理由：Datawhale 出品，中文注释详细，覆盖主流 RL 算法实现，社区活跃，适合中文学习者系统入门。\n\n---\n\n\u003C\u002Fdetails>\n\n\n\n\n\n\u003Cdetails>\n\u003C!-- ## 🤖 Stage 2: LLM -->\n\u003Csummary>\u003Cstrong>🤖 Stage 2: LLM\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n\n\n完成 Stage 1 后，你已具备深度学习与强化学习的基础。Stage 2 的目标是真正理解 LLM 的内部机制，并亲手构建和训练一个语言模型。\n\n**本阶段目标：** 掌握 Transformer 架构原理 → 理解预训练与后训练方法 → 掌握推理模型 → 从零实现小型 LLM → 在真实大模型上做微调实战 → 拓展到多模态。\n\n---\n\n### 🔩 一、机制理解：Attention & Transformer\n\n在动手写代码之前，必须真正理解 Transformer 的每一个组件——注意力机制不是魔法，它是有数学直觉的。\n\n#### 📖 1.1 核心论文精读\n\n**① Attention is All You Need（2017，必读）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F1706.03762\n- 🔗 李沐精读视频：https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1pu411o7BE\n- 💡 重点理解：Multi-Head Self-Attention、位置编码（Positional Encoding）、Encoder-Decoder 结构\n\n**② The Illustrated Transformer（最直观的图解）**\n\n- 🔗 文章地址：https:\u002F\u002Fjalammar.github.io\u002Fillustrated-transformer\u002F\n- 💡 推荐理由：全程配图讲解 Attention 的计算过程，是理解 Transformer 最友好的入门材料，建议与论文配合阅读。\n\n#### 🎬 1.2 视频讲解\n\n**李宏毅：生成式 AI 时代下的机器学习（LLM 重点章节）**\n\n- 🔗 课程地址：https:\u002F\u002Fspeech.ee.ntu.edu.tw\u002F~hylee\u002Fml\u002F2026-spring.php\n- 💡 推荐理由：中文讲解清晰，能够把 Transformer、预训练、对齐与生成式 AI 的整体脉络串起来，适合作为 Stage 2 的主线视频课。\n\n**Andrej Karpathy：Let's build GPT from scratch**\n\n- 🔗 视频地址：https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=kCc8FmEb1nY\n- 🔗 配套代码：https:\u002F\u002Fgithub.com\u002Fkarpathy\u002FnanoGPT\n- 💡 推荐理由：2 小时内从零手写一个 GPT，边写边讲原理，是目前最好的 Transformer 实践教程。\n\n---\n\n### 🏋️ 二、预训练（Pre-training）\n\n预训练是 LLM 能力的来源。理解预训练的目标函数、数据处理和训练技巧，是研究 LLM 的必要基础。\n\n**核心概念：**\n\n- **Next Token Prediction**：自回归语言模型的训练目标，模型通过预测下一个词来学习语言规律\n- **Scaling Law**：模型参数量、数据量、计算量三者的幂律关系，指导如何高效扩大模型规模\n- **训练技巧**：混合精度训练（FP16\u002FBF16）、梯度累积、学习率调度（Warmup + Cosine Decay）\n\n**① Scaling Laws for Neural Language Models（必读论文）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.08361\n- 💡 重点理解：为什么更大的模型 + 更多数据 = 更好的效果，以及如何用有限算力做出最优决策\n\n**② LLaMA 技术报告（工程实践参考）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.13971\n- 💡 推荐理由：Meta 开源模型的技术细节，展示了完整的预训练工程实践，包括数据配比、训练稳定性等问题的解决方案。\n\n---\n\n### 🎯 三、后训练（Post-training）\n\n预训练后的模型只会\"续写文本\"，后训练让模型变得\"听话\"且\"有用\"。这是当前 LLM 研究最活跃的方向之一。\n\n**后训练技术路线：**\n\n```\n预训练模型（Base Model）\n    → SFT 监督微调：用高质量对话数据教模型\"怎么回答\"\n        → RM 奖励模型训练：学习人类对回答质量的偏好\n            → RLHF \u002F PPO：用 RL 让模型最大化奖励，对齐人类期望\n                → DPO：更简洁的对齐方案，无需显式 RM\n```\n\n**① InstructGPT 论文（RLHF 的奠基之作）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2203.02155\n- 🔗 李沐精读视频：https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1hd4y187CR\n- 💡 重点理解：三阶段训练流程（SFT → RM → PPO），以及为什么 RLHF 能显著提升模型有用性\n\n**② DPO 论文（更简洁的对齐方法）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.18290\n- 💡 推荐理由：绕过奖励模型，直接从偏好数据优化策略，是目前工业界最常用的对齐方案之一\n\n\n\n---\n\n### 🧠 四、推理（Reasoning）\n\n传统 LLM 是\"快思考\"模型，直接输出答案。推理模型引入\"慢思考\"机制，通过显式的推理过程（如思维链、自我反思）来提升复杂问题的求解能力。\n\n#### 4.1 System 2 Thinking（慢思考 \u002F 推理模型）\n\n**核心思想：** 让模型在回答前先\"思考\"——生成中间推理步骤，而不是直接给出答案。这类似人类的 System 2 思维（深思熟虑），而非 System 1（直觉反应）。\n\n**代表模型：**\n\n- **OpenAI o1 系列**：通过强化学习训练模型生成长推理链，在数学、编程等任务上显著超越 GPT-4\n- **DeepSeek-R1**：开源的推理模型，公开了训练方法和推理过程，是目前最具影响力的开源推理模型\n\n**① DeepSeek-R1 技术报告（必读）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2501.12948\n- 💡 重点理解：如何用 RL 训练模型生成高质量推理链，以及推理模型与传统 LLM 的训练差异\n\n**② Chain-of-Thought Prompting（思维链提示）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2201.11903\n- 💡 推荐理由：推理模型的理论基础，展示了\"让模型一步步思考\"如何显著提升复杂推理任务的表现。\n\n**③ 代码实践：OpenR（开源推理模型训练框架）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fopenreasoner\u002Fopenr\n- ⭐ GitHub Stars: 3k+\n- 💡 推荐理由：提供完整的推理模型训练 pipeline，包括推理数据生成、RL 训练等，是动手实践推理模型的最佳起点。\n\n---\n\n### 🛠️ 五、轻量小项目：从零实现一个 LLM\n\n理论学完，动手是关键。这一部分帮助你把前面所学串联起来，亲手训练一个完整的小型语言模型。\n\n**① nanoGPT（最推荐的起点）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fkarpathy\u002FnanoGPT\n- ⭐ GitHub Stars: 40k+\n- 💡 推荐理由：Karpathy 出品，约 300 行核心代码实现完整 GPT 训练，可在单张 GPU 上跑通，是从零实现 LLM 的最佳模板。\n\n**② minimind（中文小模型全流程实现）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fjingyaogong\u002Fminimind ｜ https:\u002F\u002Fgithub.com\u002Fjingyaogong\u002Fminimind-v （多模态版本）\n- ⭐ GitHub Stars: 20k+\n- 💡 推荐理由：完整实现了预训练 → SFT → RLHF 全流程，代码注释详细，中文社区友好，适合跟着走完整个训练 pipeline。\n\n**③ LLM-from-scratch （从零实现大模型功能拆解讲述）**\n\n- 🔗 中文翻译版本仓库地址：https:\u002F\u002Fgithub.com\u002FMLNLP-World\u002FLLMs-from-scratch-CN\n- ⭐ GitHub Stars: 2k+\n- 🔗 原仓库地址：https:\u002F\u002Fgithub.com\u002Frasbt\u002FLLMs-from-scratch\n- ⭐ GitHub Stars: 91k+\n- 💡 推荐理由：不仅关注 LLMs 的基础构建，如 Transformer 架构、序列建模 等，还深入探索了 GPT、BERT 等深度学习模型 的底层实现。项目中的每一部分均配备详细的代码实现和学习资源，帮助学习者从零开始构建 LLMs，全面掌握其核心技术。\n\n**推荐学习顺序：**\n\n1. 跑通 nanoGPT，理解训练循环的每一行代码\n2. 在 minimind 上走完 预训练 → SFT → DPO 全流程\n3. 尝试修改超参数（层数、头数、学习率），观察训练曲线变化\n\n---\n\n### 🚀 六、大模型实战：微调与部署\n\n在真实大模型上做实验，是从\"理解原理\"到\"工程落地\"的关键一步。\n\n#### 6.1 高效微调（PEFT）\n\n全量微调大模型成本极高，PEFT 方法只训练少量参数，即可达到接近全量微调的效果。\n\n**① LoRA（最主流的高效微调方法）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2106.09685\n- 💡 核心思想：将权重更新分解为两个低秩矩阵的乘积，只训练约 0.1% 的参数量即可达到不错效果\n\n**② LLaMA-Factory（一站式微调框架）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fhiyouga\u002FLLaMA-Factory\n- ⭐ GitHub Stars: 40k+\n- 💡 推荐理由：支持主流开源模型（LLaMA、Qwen、Mistral 等）的 SFT \u002F DPO \u002F LoRA 微调，提供 WebUI，降低工程门槛。\n\n\n**③ veRL（大规模 RLHF 训练框架）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fvolcengine\u002Fverl\n- ⭐ GitHub Stars: 8k+\n- 💡 推荐理由：字节跳动开源的分布式 RLHF 训练框架，支持 PPO \u002F GRPO 等算法，与 HuggingFace 生态无缝集成，是目前在真实大模型上做 RLHF 实验的最佳选择之一\n\n#### 6.2 推理与部署\n\n**① Ollama（本地运行大模型最简单的方式）**\n\n- 🔗 官网地址：https:\u002F\u002Follama.com\u002F\n- 💡 推荐理由：一行命令在本地运行 LLaMA、Qwen 等模型，适合快速体验和调试。\n\n**② vLLM（高性能推理框架）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fvllm-project\u002Fvllm\n- ⭐ GitHub Stars: 45k+\n- 💡 推荐理由：基于 PagedAttention 技术，大幅提升推理吞吐量，是目前生产环境部署 LLM 的主流选择。\n\n---\n\n### 🖼️ 七、多模态 LLM（Multimodal LLM）\n\n纯文本 LLM 之外，多模态模型能够同时理解图像、视频、音频等信息。这是当前前沿研究和产品落地最活跃的方向之一。\n\n**多模态的核心问题：** 如何把不同模态的信息\"对齐\"到同一个语义空间，让语言模型能够理解图像？\n\n**模态融合的主流架构：**\n\n```\n图像编码器（Vision Encoder，如 ViT \u002F CLIP）\n    → 将图像切成 Patch，编码为向量序列\n        → 投影层（Projector）：把视觉 token 映射到语言模型的词向量空间\n            → 语言模型（LLM）：统一处理文字 + 图像 token，生成回答\n```\n\n#### 📖 7.1 核心论文\n\n**① CLIP（视觉-语言对齐的奠基之作）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.00020\n- 💡 重点理解：对比学习如何让图像和文本在同一空间对齐，这是多模态模型的底层基础\n\n**② LLaVA（最具影响力的开源多模态模型）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.08485\n- 🔗 李沐精读视频：https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1iN411r7ma\n- 💡 推荐理由：结构简洁（CLIP + Projector + LLaMA），用指令微调实现视觉问答，是理解多模态 LLM 架构的最佳入门论文。\n\n**③ Qwen-VL 技术报告（工程实践参考）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.12966\n- 💡 推荐理由：详细描述了一个完整的多模态模型训练流程，包括多阶段训练策略和数据配比，适合工程落地参考。\n\n#### 💻 7.2 代码实践\n\n**LLaVA 官方仓库**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fhaotian-liu\u002FLLaVA\n- ⭐ GitHub Stars: 22k+\n- 💡 推荐理由：代码结构清晰，支持自定义数据集微调，是动手实践多模态模型的最佳起点。\n\n---\n\n\u003C!-- ## 🧩 Stage 3: Agent -->\n\n\u003C\u002Fdetails>\n\n\n\n\n\n\u003Cdetails>\n\n\u003Csummary>\u003Cstrong>🧩 Stage 3: Agent\u003C\u002Fstrong>\u003C\u002Fsummary>\n\n完成 Stage 2 后，你已掌握 LLM 的训练、推理与部署。Stage 3 关注如何把模型放进**闭环**：感知 → 决策 → 行动 → 观察 → 更新状态，直至任务完成。\n\n**本阶段目标：** 从范式上区分“聊天模型”与“行动者”→ 掌握规划（任务分解、动态规划与反思）、记忆（短期\u002F长期记忆管理）与工具调用的核心能力 → 理解多智能体的协议、组织与环境 → 跟跑至少一个开源项目，并自选垂直场景深入。\n\n---\n\n### 🧭 一、理解 Agent：从 LLM 到行动者\n\n#### 📋 1.1 Agent 的核心定义与能力边界\n\n**定义：** 智能体（Agent）被定义为一种能够感知环境、进行推理、自主决策并采取行动以实现特定目标的系统。\n\n**与普通 Chatbot 的区别：**\n\n| Chatbot | Agent |\n|:---|:---|\n| 被动响应用户输入 | 主动规划并执行任务 |\n| 单轮或有限轮对话 | 多轮迭代直至目标达成 |\n| 仅依赖内置知识 | 可调外部工具获取实时信息 |\n\n**能力边界：**\n\n✅ **能做到**：多步推理与规划、调用外部工具扩展能力、与环境\u002F用户持续交互、利用长期记忆保持上下文。\n\n❌ **做不到**：完全自主设定目标（仍需人类定义任务）、真正的理解与意识（仍是模式匹配）。\n\n**① 李宏毅：一堂课搞懂 AI Agent 的原理**\n\n- 🔗 视频地址：https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=M2Yg1kwPpts\n- 💡 推荐理由：系统讲解 Agent 的核心概念，适合快速建立整体认知并入门。\n\n**② 吴恩达：Agentic AI**\n\n- 🔗 视频地址：https:\u002F\u002Flearn.deeplearning.ai\u002Fcourses\u002Fagentic-ai\u002F\n- 💡 推荐理由：从 Agentic Workflow 基础概念到 Reflection、Tool Use、多 Agent 协作等设计模式，是系统学习 Agent 工程实践的入门课程。\n\n**③ Lilian Weng：LLM Powered Autonomous Agents**\n\n- 🔗 博文地址：https:\u002F\u002Flilianweng.github.io\u002Fposts\u002F2023-06-23-agent\u002F\n- 💡 推荐理由：全面解析 LLM Agent 的设计范式与关键技术，配有丰富的案例分析，是理解 LLM Agent 架构设计的优质参考。\n\n**④ Agent 领域综述**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fpdf\u002F2309.07864\n- 💡 推荐理由：长文综述类材料，可按目录选读，用于扩展视野。\n\n---\n\n### ⚙️ 二、Agent 核心能力\n\nAgent 的本质是“系统”而非“模型”，LLM 提供推理能力，而系统架构决定 Agent 能否从“对话”走向“行动”。这涉及三个核心能力——规划、记忆和工具调用。\n\n**规划 (Planning)**：决定任务如何分解、执行顺序如何安排、遇到错误如何调整。包括任务拆解（将复杂目标拆分为可执行的子任务链）、动态规划（ReAct 模式的推理-行动-观察循环）和自我反思（从失败中学习并优化策略）。\n\n**记忆 (Memory)**：管理信息的存储与检索。短期记忆利用上下文窗口记录当前对话状态；长期记忆通过向量数据库存储历史经验或专业知识，随取随用。\n\n**工具调用 (Tool Use)**：让 Agent 能操作外部环境。通过 API 调用搜索引擎、运行代码、访问数据库等，需要约定清晰的接口规范、权限控制和错误处理机制。\n\n#### 🎯 2.1 规划\n\n规划（Planning）是 Agent 的\"大脑\"，决定任务如何分解、执行顺序如何安排、遇到错误如何调整。好的规划能力让 Agent 从单次响应走向多步迭代，从被动执行走向主动优化。\n\n**任务分解：**\n\n将复杂目标拆分为可管理的子任务链。例如“帮我写一篇行业分析报告”可分解为：确定主题→搜集资料→整理大纲→撰写各章节→审核修改。每个子任务有明确的输入、输出和验收标准，便于 Agent 逐一执行和检查进度。\n\n**动态规划与反思：**\n\n- **ReAct 模式**：推理（Reasoning）→ 行动（Action）→ 观察（Observation）→ 再推理的循环。Agent 在每一步行动前先思考\"我需要做什么\"，执行后观察结果，再决定下一步。这种\"思考-行动-反馈\"的闭环让 Agent 能根据环境反馈调整策略。\n\n- **自我反思（Self-Reflection）**：当行动结果不达标或出现错误时，Agent 能分析失败原因、总结教训并调整后续计划。Reflexion 等框架通过将失败经验存入记忆，让 Agent 在类似场景下避免重复犯错。\n\n**推荐阅读：**\n\n**① ReAct**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fpdf\u002F2210.03629\n- 💡 重点理解：核心在于将思维链与动作交替结合，形成“思考-行动-观察”的闭环。模型在每一步行动前先写出推理过程，这不仅提高了决策的透明度，还允许模型根据环境的实时观察动态修正后续的推理。\n\n**② Plan-and-Solve Prompting**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fpdf\u002F2305.04091 \n- 💡 重点理解：提出了“先全局规划，后分步执行”的策略。模型首先将复杂任务拆解为子任务列表，然后再逐一解决，显著提升了处理多步骤逻辑问题的稳定性与准确率。\n\n**③ Reflexion**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fpdf\u002F2303.11366   \n- 💡 重点理解：引入了自我反思机制，通过在外部环境中试错来获取语言反馈。模型将失败的尝试存储在短期记忆中，并在下一次迭代时根据这些“教训”修正策略，这种“自省”能力让 Agent 具备了在不更新参数的情况下进行自我优化的能力。\n\n#### 🧠 2.2 记忆\n\n本节探讨 Agent 如何管理信息的存储与流动：短期（工作）记忆关注在有限上下文窗口内如何保留关键信息，长期记忆解决跨会话的知识持久化与检索，RAG 则负责将外部知识库实时接入推理过程。\n\n**短期（工作）记忆：**\n\n上下文窗口有限，只能保留最近的对话。常用策略：\n- **滑动窗口**：仅保留最近 k 轮或固定长度 Token。实现最简单，但超出窗口的早期信息会彻底丢失。\n- **摘要压缩**：周期性将历史压缩为摘要再继续。多次压缩可能导致细节失真。\n\n**长期记忆：**\n\n- 语义检索 + 重排序：将文档等知识转为向量存入数据库，检索时先用语义相似度召回候选片段，再用重排序模型精选最相关的内容。解决“如何从海量知识中找到当前问题真正需要的片段”。\n- 结构化存储：将用户画像、任务状态、会话上下文等以结构化形式（如 JSON、数据库记录）持久化存储，随需读取。解决“跨会话记住用户偏好和应用状态”。 \n\n**RAG 技术（检索增强生成）：**\n\n- 推理时实时从外部知识库（文档、网页、数据库等）检索最相关的片段，再交给模型生成答案。这样模型既能利用实时\u002F私有知识，又不受训练数据截止日期限制。\n\n**推荐阅读：**\n\n**① MemGPT**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.08560\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fcpacker\u002FMemGPT\n- 💡 推荐理由：将 LLM 视为操作系统，通过虚拟上下文管理和分层存储实现“无限记忆”，是理解记忆层架构设计的奠基性工作。\n\n**② Anthropic：Effective Context Engineering for AI Agents**\n\n- 🔗 文档地址：https:\u002F\u002Fwww.anthropic.com\u002Fengineering\u002Feffective-context-engineering-for-ai-agents\n- 💡 推荐理由：讲解如何有效地收集和管理上下文信息，最大化 Agent 的推理效率与输出质量。\n\n**③ Claude-Mem**\n\n- 🔗 文档地址：https:\u002F\u002Fdocs.claude-mem.ai\u002Fintroduction\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fthedotmack\u002Fclaude-mem\n- 💡 推荐理由：工程向的长期记忆\u002F持久化参考，适合自建部署时阅读。\n\n**④ Mem0**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fmem0ai\u002Fmem0\n- ⭐ GitHub Stars: 54k+\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fpdf\u002F2504.19413\n- 🔗 博客地址：https:\u002F\u002Fget.mem.ai\u002Fblog\n- 💡 推荐理由：为LLM提供的智能的，可自我改进的记忆层，可以实现在各种应用中提供更加个性化的和连贯一致的用户体验，是较常用的记忆层实现参考之一。\n\n\n**⑤ Agent Memory 综述（长文 PDF，选读）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fpdf\u002F2512.13564\n- 💡 推荐理由：可作为 agent memory 研究进展的补充阅读。\n\n\n**⑥ LangChain 文档：RAG**\n\n- 🔗 文档地址：https:\u002F\u002Fdocs.langchain.com\u002Foss\u002Fpython\u002Flangchain\u002Frag\n- 💡 推荐理由：官方文档里从加载、切分、向量库到检索接模型的主线，适合动手搭第一条 RAG 链路。\n\n#### 🔧 2.3 工具调用\n\n**工具是什么：把外部能力封装成可调用的函数**\n\n工具是 Agent 的“手脚”：搜索、计算器、访问数据库、发消息等。除了名字和说明要清楚，还要约定入参\u002F出参、超时、重试、是否改数据、给多大权限。\n\n**工具设计原则：**\n\n- **命名清晰**：函数名和参数名要直观表达功能，如 `search_weather` 优于 `func_01`；\n- **描述详尽**：在函数描述中说明用途、返回值格式、可能的错误情况；\n- **参数精简**：只暴露必要的参数，过多参数会增加模型理解负担；\n- **错误处理**：定义清晰的错误码和回退策略，让 Agent 知道如何重试或报告。\n\n**常见工具类型：**\n\n| 类型 | 示例 | 用途 |\n|:---|:---|:---|\n| 信息获取 | 搜索引擎、天气查询、数据库查询 | 补充模型知识盲点 |\n| 操作执行 | 发送邮件、创建日程、文件操作 | 与外部系统交互 |\n| 计算处理 | 计算器、代码执行器、数据分析 | 处理精确计算任务 |\n| 决策辅助 | 风险评估、合规检查、评分系统 | 提供结构化判断 |\n\n**工具 vs 技能（Tool vs Skill）：**\n\n- 工具（Tool）：底层原子能力，通常对应单个函数、API 或能力接口（如查询天气、获取时间、搜索知识点）。\n- 技能（Skill）：业务层封装的复合能力模块，由一个或多个工具按业务逻辑组合而成，面向真实场景提供完整解决方案（如旅行规划 = 查天气 + 查航班 + 查酒店 + 生成路线）。\n\n在实际项目中，Skill 往往对应一个可复用的能力模块，通过组合不同 Tool 实现完整场景闭环。\n\n**推荐阅读：**\n\n**① OpenAI：Function Calling 指南**\n\n- 🔗 文档地址：https:\u002F\u002Fplatform.openai.com\u002Fdocs\u002Fguides\u002Ffunction-calling\n- 💡 推荐理由：结构化调用的行业常用约定，对应自然语言如何变成 JSON 参数、运行时如何执行与回写的闭环。\n\n**② Anthropic：Tool Use 概览**\n\n- 🔗 文档地址：https:\u002F\u002Fdocs.anthropic.com\u002Fclaude\u002Fdocs\u002Ftool-use\n- 💡 推荐理由：介绍 Client\u002FServer 工具的执行模式、Agent 循环的工作机制，以及工具调用的流程，适合理解工具集成的核心概念与实现路径。\n\n**③ Model Context Protocol（MCP）**\n\n- 🔗 文档地址：https:\u002F\u002Fmodelcontextprotocol.io\u002Fintroduction\n- 🔗 参考实现：https:\u002F\u002Fgithub.com\u002Fmodelcontextprotocol\u002Fservers\n- 💡 推荐理由：提供标准化的工具与数据暴露方式，支持多种客户端复用同一套 MCP 服务。\n\n**④ Agent Skills with Anthropic**\n\n- 🔗 视频地址：https:\u002F\u002Flearn.deeplearning.ai\u002Fcourses\u002Fagent-skills-with-anthropic\u002Finformation\n- 💡 推荐理由：学习用开放标准构建可复用的智能体技能，掌握将技能、MCP 与子智能体组合的方法，搭建能访问外部数据、具备专业知识的强大的智能体系统。\n\n---\n\n### 🤝 三、多智能体系统\n\n\n多智能体系统（Multi-Agent System，MAS）是指由多个具有自主决策能力的 AI Agent 协同完成复杂任务的系统。多 Agent 的核心优势在于任务分解、角色专业化与并行执行。\n\n\n#### 🎯 3.1 什么是多智能体系统：任务驱动协作、自治群体交互\n\n**核心思想**： 将一个复杂任务拆解给多个具有不同角色或能力的 Agent，让它们通过协作共同完成目标——类似于一个软件开发团队，产品经理、程序员、测试员各司其职。\n\n**两种典型范式：**\n\n| 范式 | 说明 | 代表系统 |\n| :--- | :--- | :--- |\n| **任务驱动协作** | 由明确目标驱动，Agent 分工完成子任务，最终汇总结果 | ChatDev、AutoGen |\n| **自治群体交互** | Agent 在共享环境中自由交互，涌现出复杂的社会行为 | 斯坦福小镇 (Generative Agents) |\n\n**推荐课程：**\n\n**① 吴恩达：多智能体系统入门介绍**\n\n- 🔗 课程地址：https:\u002F\u002Flearn.deeplearning.ai\u002Fcourses\u002Fagentic-ai\u002Flesson\u002Fjcl177\u002Fplanning-workflows\n- 💡 推荐理由：介绍多 Agent 的核心概念与应用场景。\n  \n**② HuggingFace Agents Course（系统入门首选）**\n\n- 🔗 课程地址：https:\u002F\u002Fhuggingface.co\u002Flearn\u002Fagents-course\u002F\n- 💡 推荐理由：HuggingFace 官方出品，从单 Agent 基础到多 Agent 协作循序渐进，配有可直接运行的代码实践，是目前最完整的开源 Agent 入门课程。\n\n**代表系统精读：**\n\n**① ChatDev（任务驱动的软件开发多智能体）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2307.07924\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FOpenBMB\u002FChatDev\n- ⭐ GitHub Stars: 32k+\n- 💡 重点理解：将软件开发流程（需求分析 → 设计 → 编码 → 测试）映射为多 Agent 角色分工，每个阶段由不同”职能” Agent 负责，Agent 间通过对话完成交接\n\n**② Generative Agents：斯坦福小镇（自治群体交互）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.03442\n- 💡 重点理解：25 个 Agent 在模拟小镇中自主生活、社交、形成记忆，展示了 LLM 驱动的群体涌现行为。核心机制：记忆流（Memory Stream）+ 反思（Reflection）+ 行动规划（Planning）\n\n\n**延伸阅读：**\n\n**① A Survey on LLM-based Autonomous Agents（全景综述）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.11432\n- 💡 推荐理由：全面梳理 LLM Agent 的记忆、规划、工具使用与多 Agent 协作四大模块，适合在深入某个方向前建立完整的认知框架。\n\n**② Large Language Model based Multi-Agents: A Survey of Progress and Challenges（多智能体专项综述）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2402.01680\n- 💡 推荐理由：专注于多 Agent 系统本身，系统梳理 LLM 驱动的多 Agent 在通信、组织、环境与应用上的最新进展与挑战。\n\n#### 📡 3.2 智能体之间如何「说话」？——交互协议\n\n多 Agent 协作的基础是通信。不同系统对 Agent 间的消息格式、通信方式有不同设计。\n\n**① 自然语言消息（最常见）**\n\n- Agent 直接用自然语言对话，灵活但容易产生歧义\n- 代表框架：AutoGen、ChatDev\n\n**② 结构化消息（更可靠）**\n\n- 消息包含固定字段：role \u002F content \u002F tool_calls \u002F metadata\n- 降低解析错误，便于流程控制\n- 代表框架：OpenAI Swarm、LangGraph\n- 前沿趋势：跳过文本，直接在模型的 hidden embedding 层交换信息（潜空间通信）\n\n**③ 共享黑板（Blackboard）**\n\n- Agent 不直接通信，而是读写一块共享状态\n- 适合异步、松耦合的协作场景\n- 代表框架：部分 CrewAI 实现\n\n**④ 工具调用（Tool Call）**\n\n- Agent 通过调用对方暴露的”工具接口”间接协作\n- 本质是函数调用，类型安全，易于调试\n\n**关键设计问题：**\n\n- 同步 vs 异步：Agent 是轮流发言（同步对话）还是并行执行后汇总（异步）？\n- 消息路由：谁决定把消息发给哪个 Agent？（广播 \u002F 点对点 \u002F 中心调度）\n- 终止条件：多 Agent 对话何时结束？如何避免无限循环？\n\n**推荐课程：**\n\n**① CMU: Agents and Multi-Agent Communication**\n\n- 🔗 课程地址：https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=ixLXrgF77ME\n- 💡 推荐理由：Graham Neubig 教授主讲的《高级自然语言处理》课程讲座，是深入理解 Agents 交流机制的绝佳资源。\n\n**推荐阅读：**\n\n**① AutoGen 论文（结构化多 Agent 对话框架）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.08155\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fautogen\n- ⭐ GitHub Stars: 57k+\n- 💡 推荐理由：微软提出的多 Agent 对话框架，支持灵活定义 Agent 角色与对话流程，是目前学术和工程中使用最广泛的 MAS 框架之一\n\n**② CAMEL（角色扮演的多 Agent 通信范式）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.17760\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fcamel-ai\u002Fcamel\n- ⭐ GitHub Stars: 16k+\n- 💡 推荐理由：最早系统研究 LLM Agent 间角色扮演通信的论文，提出用\"任务指定 Agent\"驱动\"执行 Agent\"的双 Agent 通信范式，是理解 Agent 对话如何被设计的经典入门文献。\n\n#### 🏛️ 3.3 智能体团队如何「组织」？——组织结构\n\nAgent 的组织方式决定了任务如何分解、结果如何汇聚、错误如何被发现与纠正。\n\n```\n① 层级式（Hierarchical）\n    Orchestrator Agent（总指挥）\n        ├── Sub-Agent A（负责子任务 1）\n        ├── Sub-Agent B（负责子任务 2）\n        └── Sub-Agent C（负责子任务 3）\n    → 适合任务边界清晰、需要统一调度的场景\n    → 代表：AutoGen GroupChat with Manager、LangGraph supervisor\n② 扁平式（Flat \u002F Peer-to-Peer）\n    Agent A ←→ Agent B ←→ Agent C\n    → Agent 平等协商，无中心节点\n    → 灵活但容易陷入无效循环，需要设计好终止机制\n③ 流水线式（Pipeline）\n    Agent A → Agent B → Agent C → 输出\n    → 每个 Agent 处理上一个的输出，适合有明确先后依赖的任务\n    → 代表：ChatDev 的开发流程、RAG pipeline\n```\n\n**角色设计的核心原则：**\n\n- 专业化：每个 Agent 聚焦一个能力领域（如”代码审查员”只负责 review）\n- 互补性：不同 Agent 的能力边界要清晰，避免职责重叠导致冲突\n- 对抗验证：引入”批评者 Agent”检查其他 Agent 的输出，提升系统鲁棒性\n\n**推荐课程：**\n\n**① DeepLearning.AI：Multi AI Agent Systems with crewAI**\n\n- 🔗 课程地址：https:\u002F\u002Fwww.deeplearning.ai\u002Fshort-courses\u002Fmulti-ai-agent-systems-with-crewai\u002F\n- 💡 推荐理由：crewAI 作者主讲，从层级式到流水线式手把手搭建多 Agent 系统，是理解 Agent 团队组织方式最直观的实战课程。\n\n\n**推荐阅读：**\n\n**① CrewAI（角色扮演式多 Agent 框架）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FcrewAIInc\u002FcrewAI\n- ⭐ GitHub Stars: 49k+\n- 💡 推荐理由：以”crew（团队）”为核心抽象，每个 Agent 有明确的 role \u002F goal \u002F backstory，支持层级式和顺序式两种协作模式，上手简单，适合快速搭建角色分工明确的多 Agent 应用。\n\n**② LangGraph（基于图结构的 Agent 编排）**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Flanggraph\n- ⭐ GitHub Stars: 30k+\n- 💡 推荐理由：将 Agent 协作流程建模为有向图（节点 = Agent\u002F工具，边 = 消息流），支持条件分支、循环、并行执行，适合需要精确控制流程的复杂 MAS 场景。\n\n**③ MetaGPT（将公司 SOP 编码为 Agent 协作规范）**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.00352\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fgeekan\u002FMetaGPT\n- ⭐ GitHub Stars: 67k+\n- 💡 推荐理由：将软件公司的标准操作流程（SOP）嵌入 Agent 角色定义，产品经理 → 架构师 → 工程师 → QA 的流水线协作，是\"流水线式组织结构\"最典型的实现，也是 GitHub 上最受关注的多 Agent 框架之一\n\n#### 🌍 3.4 智能体在什么「世界」里活动？——协作环境\n\nAgent 的行动空间（Environment）定义了它能感知什么、能执行什么操作。不同任务对环境的要求差异很大。\n```\n① 文本\u002F对话环境\n    → Agent 的世界就是消息历史（Context Window）\n    → 感知：读取对话历史；行动：生成文本或调用工具\n    → 适合：问答、写作、代码生成等纯语言任务\n② 工具\u002F代码执行环境\n    → Agent 可以调用外部工具：搜索引擎、代码解释器、数据库、API\n    → 感知：工具返回结果；行动：选择并调用工具\n    → 适合：需要与真实世界交互的任务（如数据分析、网页操作）\n    → 代表：OpenAI Code Interpreter、LangChain Tools\n③ 模拟\u002F沙盒环境\n    → 为 Agent 构建一个模拟的”世界”（如模拟小镇、虚拟代码仓库）\n    → 感知：环境状态（位置、物品、其他 Agent 的行为）；行动：移动、交互、修改环境\n    → 适合：研究 Agent 的社会行为、测试复杂策略\n    → 代表：斯坦福小镇（Smallville）、SWE-bench（模拟软件工程任务）\n```\n\n**关键挑战：**\n- 长期记忆：如何让 Agent 记住跨轮次的关键信息？（向量数据库 + 记忆压缩）\n- 环境反馈质量：工具返回的信息是否足够让 Agent 做下一步决策？\n- 安全边界：如何防止 Agent 执行危险操作？（沙盒隔离、权限控制）\n\n**推荐阅读：**\n\n**① AgentVerse**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.10848\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FOpenBMB\u002FAgentVerse\n- ⭐ GitHub Stars: 5k+\n- 💡 推荐理由：专为多 Agent 协作设计的模拟环境框架，支持动态调整 Agent 数量与角色，研究多 Agent 在共享环境中的涌现行为与协作策略，适合理解\"如何为多 Agent 系统构建合适的协作环境\"。\n\n**② MultiAgentBench**\n\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2503.01935\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fulab-uiuc\u002FMARBLE\n- 💡 推荐理由：MultiAgentBench 是一个模块化且可扩展的架构，支持开发者快速构建、测试和评估多智能体系统。它通过统一的 API 管理智能体间的通讯、共享内存和环境交互。\n\n\n\n### 🧪 四、实战项目\n\n#### 4.1 🖥️ GUI Agent \n\n**① MobileRun**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fdroidrun\u002Fmobilerun  \n- ⭐ GitHub Stars: 8k+ \n- 💡 推荐理由：面向Android 等真机\u002F模拟器的自然语言操作框架，多模型后端、多步规划与截屏\u002F可访问性等感知组合较完整，适合从一条可复现的移动端指令跑通到自定义流程。\n\n**② UI-TARS**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fbytedance\u002FUI-TARS  \n- ⭐ GitHub Stars: 10k+ \n- 💡 推荐理由：字节开源的原生 GUI 交互 \u002F 多模态智能体，支持桌面与移动端，结合 VLM 视觉理解与精准动作预测。\n\n**③ AgentCPM-GUI**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FOpenBMB\u002FAgentCPM-GUI  \n- ⭐ GitHub Stars: 1.4k+ \n- 💡 推荐理由：OpenBMB社区开源的GUI-Agent强调轻量模型 + 强化学习微调，便于在端侧设备上运行，适合端上隐私敏感场景与低延迟需求。\n\n#### 4.2 🌐 Computer Use Agent\n\n**① Browser Use**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fbrowser-use\u002Fbrowser-use   \n- ⭐ GitHub Stars: 90k+  \n- 💡 推荐理由：社区热度较高浏览器自动化 Agent，能够控制真实浏览器，支持表单填写、购物等网页操作。\n\n**② Anthropic Computer Use**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fanthropics\u002Fanthropic-quickstarts    \n- ⭐ GitHub Stars: 16k+  \n- 💡 推荐理由：Anthropic 官方的Computer Use 示例集合，包含截图+键鼠控制的完整 Agent 实现，提供操作系统级操作能力（文件管理、多应用协调等），适合需要跨应用\u002F跨窗口、脱离浏览器的桌面自动化场景。\n\n#### 4.3 🔍 DeepResearch Agent\n\n**① langchain-ai\u002Fopen_deep_research**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Fopen_deep_research   \n- ⭐ GitHub Stars: 11k+  \n- 💡 推荐理由：适合作为全流程主线的多轮检索、压缩与成稿 pipeline，和 LangChain 生态、Provider\u002FMCP 组合较好接；想一次性完成“子研究 → 综合 → 报告”的模块切分时优先选它。\n\n**② dzhng\u002Fdeep-research**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fdzhng\u002Fdeep-research   \n- ⭐ GitHub Stars: 18k+  \n- 💡 推荐理由：极简实现（约 500 行核心代码），无框架依赖，原生展示多轮 query 生成、并发抓取、汇总成 Markdown 的完整链路。适合快速理解 DeepResearch 原理、教学拆解或迁移到自己的技术栈。\n\n\n#### 4.4 🛍️ 基于 OpenClaw 部署小红书自动运营\n\n**① OpenClaw**\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002Fopenclaw\u002Fopenclaw\n- ⭐ GitHub Stars: 360k+（GitHub 史上最快破记录的开源项目）\n- 💡 项目背景：由奥地利独立开发者 Peter Steinberger 于 2025 年 11 月发布，本地运行、全平台支持，通过 Skill 插件体系可扩展各类自动化能力，接入 Telegram \u002F Feishu \u002F WeChat 等 20+ 渠道，100 天内超过 Linux 和 React 成为 GitHub 最多 Star 的软件仓库。\n\n**② xiaohongshu-ops-skill（OpenClaw 小红书运营插件）**\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FXiangyu-CAS\u002Fxiaohongshu-ops-skill\n- ⭐ GitHub Stars: 600+\n- 💡 推荐理由：将 OpenClaw 变成小红书运营助手，支持\"分析竞品 → 智能选题 → 生成文案 → 自动发布\"全流程，基于浏览器自动化（CDP）真实账号操作，作者实测 20 天从 0 粉涨到 1000+ 粉，且未触发风控。\n- 🛠️ 推荐实现路径：\n  ```\n  1. 安装 OpenClaw 本体，配置 LLM API Key\n  2. 安装小红书 Skill：https:\u002F\u002Fgithub.com\u002FXiangyu-CAS\u002Fxiaohongshu-ops-skill\n  3. 扫码绑定小红书账号（仅需一次）\n  4. 下达自然语言指令，Agent 自动完成热点抓取 → 文案创作 → 定时发布\n  ```\n- ⚠️ 注意：控制操作频率，避免短时大量发布触发平台风控。\n\n\n\n#### 4.5 ⚖️ 法律智能体\n\n**① ChatLaw**\n\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FPKU-YuanGroup\u002FChatLaw\n- 🔗 论文地址：https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.16092\n- ⭐ GitHub Stars: 7k+\n- 💡 推荐理由：北大元语言团队出品，采用 MoE 混合专家模型 + 多智能体协作架构，内置四类 Agent 角色（信息收集、法律研究、法律建议、报告生成），在 LawBench 上以 60.08 分显著超越 GPT-4（52.35 分）。融合知识图谱与 9.3 万份判决书训练的相似度模型，是目前最完整的中文法律多 Agent 系统实现。\n- 🎯 实战建议：跑通多 Agent 协作的离婚咨询 Demo，理解\"信息收集 → 法规检索 → 生成咨询报告\"的完整 SOP 流程。\n- ⚠️ 注意：该项目仅适合作为教学 Demo，不应替代律师意见或真实法律决策。\n\n#### 4.6 📈 金融智能体\n\n**① FinGPT**\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FAI4Finance-Foundation\u002FFinGPT\n- ⭐ GitHub Stars: 19k+\n- 💡 推荐理由：AI4Finance Foundation 出品，用 LoRA 低成本微调开源 LLM，在金融情感分析数据集上取得最优成绩。支持量化投资、智能投顾、算法交易等核心金融场景，是目前最具影响力的开源金融 LLM 项目。\n\n**② FinRobot（金融 Agent 平台，更推荐实战）**\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FAI4Finance-Foundation\u002FFinRobot\n- ⭐ GitHub Stars: 6k+\n- 💡 推荐理由：FinGPT 的 Agent 进阶版，集成 LLM + 强化学习 + 量化分析三大能力，提供完整的投研自动化、交易策略生成、风险评估 Agent pipeline，适合作为金融智能体实战的完整项目模板。\n\n- ⚠️ 注意：该项目仅适合作为教学 Demo，不构成投资建议，不应用于真实交易决策。\n\n#### 4.7 🏥 医疗健康助手\n\n**① HuatuoGPT**\n- 🔗 仓库地址：https:\u002F\u002Fgithub.com\u002FFreedomIntelligence\u002FHuatuoGPT\n- 🔗 在线 Demo：https:\u002F\u002Fwww.huatuogpt.cn\u002F\n- ⭐ GitHub Stars: 1k+\n- 💡 推荐理由：香港中文大学（深圳）出品，同时融合 ChatGPT 蒸馏数据与真实医生对话数据进行训练，提供 7B \u002F 13B \u002F 34B 多个版本。HuatuoGPT-II 在专家评测和中国执医考试中均超越 GPT-4，是目前最具代表性的开源中文医疗 LLM。\n- 🎯 实战建议：在 HuatuoGPT 基础上，结合病历知识库（RAG）构建一个\"症状描述 → 初步分诊 → 用药建议 → 转诊提醒\"的完整问诊 Agent，注意加入安全边界设计。\n- ⚠️ 注意：该项目仅适合作为教学 Demo，不构成任何专业医疗建议。\n\u003C\u002Fdetails>\n\n\n\n\u003C\u002Fdetails>\n\n---\n\n\n### 👥 组织者\n\n\n\u003Cp align=\"left\">\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FchenyuanTKCY\">\u003Cimg src=\"https:\u002F\u002Fimages.weserv.nl\u002F?url=github.com\u002FchenyuanTKCY.png?v=4&mask=circle\" width=\"80\">\u003C\u002Fa>&nbsp;&nbsp;\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fffcosmos\">\u003Cimg src=\"https:\u002F\u002Fimages.weserv.nl\u002F?url=github.com\u002Fffcosmos.png?v=4&mask=circle\" width=\"80\">\u003C\u002Fa>&nbsp;&nbsp;\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FNahtreom\">\u003Cimg src=\"https:\u002F\u002Fimages.weserv.nl\u002F?url=github.com\u002FNahtreom.png?v=4&mask=circle\" width=\"80\">\u003C\u002Fa>&nbsp;&nbsp;\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002FQianc62\">\u003Cimg src=\"https:\u002F\u002Fimages.weserv.nl\u002F?url=github.com\u002FQianc62.png?v=4&mask=circle\" width=\"80\">\u003C\u002Fa>&nbsp;&nbsp;\n  \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fqinlibo-hit\">\u003Cimg src=\"https:\u002F\u002Fimages.weserv.nl\u002F?url=github.com\u002Fqinlibo-hit.png?v=4&mask=circle\" width=\"80\">\u003C\u002Fa>\n\u003C\u002Fp>","该项目为零基础学习者提供了一条清晰的大模型（LLM）学习路径，帮助他们从基础知识逐步过渡到智能体（Agent）的构建与实践。核心功能包括分阶段推进的学习路线，每个阶段都设有明确的学习目标、推荐资料和实践练习方向，覆盖从大图景到深度学习\u002F强化学习、LLM以及Agent的完整知识体系。适合希望入门并着手进行LLM或Agent相关项目开发的新手使用。通过这种方式，学习者不仅能掌握如何使用这些技术，还能深入理解其背后的原理，并有能力独立完成小型项目。","2026-06-11 03:31:31","CREATED_QUERY"]