[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-1079":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":17,"stars7d":18,"stars30d":19,"stars90d":16,"forks30d":16,"starsTrendScore":20,"compositeScore":21,"rankGlobal":10,"rankLanguage":10,"license":10,"archived":22,"fork":22,"defaultBranch":23,"hasWiki":24,"hasPages":24,"topics":25,"createdAt":10,"pushedAt":10,"updatedAt":26,"readmeContent":27,"aiSummary":28,"trendingCount":16,"starSnapshotCount":16,"syncStatus":29,"lastSyncTime":30,"discoverSource":31},1079,"AIInfraGuide","caomaolufei\u002FAIInfraGuide","caomaolufei","AI Infra 全栈从0入门学习资料：https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002F","",null,"Astro",850,54,1,6,0,74,145,394,222,9.22,false,"main",true,[],"2026-06-12 02:00:22","# AIInfraGuide（内容持续更新中）\n\n> 从零开始深入理解 AI Infra 的核心全栈技术\n\n**在线浏览：[https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002F](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002F)**\n\nAI Infra 正在成为大模型时代最关键的工程能力之一。本项目系统梳理从 GPU 硬件到分布式训练、从 CUDA 编程到推理优化的完整技术栈，帮助工程师构建扎实的 AI 基础设施知识体系。同时提供了面试宝典模块（共收录 180+ 场面试真题，覆盖 40+ 家公司）。\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fcaomaolufei\u002FAIInfraGuide.svg?style=flat\" alt=\"Stars\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002Fcaomaolufei\u002FAIInfraGuide.svg?style=flat\" alt=\"Forks\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-MIT-blue.svg\" alt=\"License\" \u002F>\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPRs-welcome-brightgreen.svg\" alt=\"PRs Welcome\" \u002F>\n\u003C\u002Fdiv>\n\n\u003Cimg src=\"https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fimages\u002FAIinfraGuideWeb.png\" alt=\"AIinfraGuideWeb\" style=\"max-width: 100%; display: block; margin: 0 auto;\" \u002F>\n\n\u003Cimg src=\"https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fimages\u002FAIinfraGuideWeb1.png\" alt=\"AIinfraGuideWeb1\" style=\"max-width: 100%; display: block; margin: 0 auto;\" \u002F>\n\n---\n\n\u003Cbr>\n\n## 🚀 为什么需要 AIInfraGuide\n\n大模型时代，AI 基础设施（AI Infra）已经成为支撑训练、推理和服务的核心技术底座。然而，这个领域有一个显著的矛盾——技术迭代极快，但系统化的中文学习资料却严重匮乏。\n\n很多工程师在学习 AI Infra 时面临相似的困境：\n\n- CUDA 编程的入门资料散落各处，缺乏从基础到算子优化的完整路径\n- 分布式训练涉及 DDP、FSDP、3D 并行等众多概念，不知道该从哪里开始\n- 推理优化技术（PagedAttention、量化、Speculative Decoding）发展迅猛，难以跟上节奏\n- 性能分析工具（Nsight Systems、Nsight Compute）功能强大，但上手门槛不低\n\nAIInfraGuide 正是为了解决这些问题而创建的——一个**开源、系统、面向实践**的 AI Infra 知识库，帮助工程师构建从硬件到软件、从训练到推理的完整知识体系。\n\n\u003Cbr>\n\n## 📖 AIInfraGuide 内容体系\n\n知识库围绕 **4 大学习模块 + 2 个辅助板块 + 面试宝典**，覆盖 AI Infra 工程师需要掌握的关键技术栈：\n\n| 板块 | 涵盖内容 |\n|---|---|\n| **AIInfra 学习路线** | 系统化的学习路径、知识图谱、推荐资源 |\n| **模块一：前置知识** | 编程语言基础、数学基础、Transformer 架构、PyTorch 框架、GPU 硬件概论、集合通信基础 |\n| **模块二：CUDA 编程与算子优化** | CUDA 编程入门、性能优化基础、Reduce\u002FGEMM\u002FSoftmax\u002FAttention 经典算子实现、AI 编译器、性能分析工具链 |\n| **模块三：分布式训练** | 分布式训练总论、数据并行(DP\u002FDDP\u002FFSDP)、ZeRO 系列、张量并行与序列并行、流水线并行、3D 并行、训练框架实战 |\n| **模块四：推理优化** | LLM 推理基础、推理引擎核心技术、主流推理框架(vLLM 等)、量化、Speculative Decoding、PD 解耦架构、性能分析与 Benchmark |\n| **性能分析** | Nsight Systems\u002FCompute、Roofline 模型、Profiling 实战 |\n| **面试宝典** | 目前共收录 180+ 场面试真题，覆盖 40+ 家公司，按梯队分类组织，助你高效备战拿下心仪 Offer |\n\n每篇文章都遵循「先白话后术语」的写作原则——先用通俗的语言解释\"是什么、为什么需要\"，再给出严谨的技术细节，确保读者既看得懂也学得对。\n\n\u003Cbr>\n\n## 🗺️ AIInfra 学习路线\n\n| 序号 | 文章 | 说明 |\n|:---:|------|------|\n| 0 | [从零理解 AI Infra](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fguides\u002Fai-infra-introduction\u002F) | AI Infra 的定义、技术栈全貌与核心组件 |\n| 1 | [AI Infra 学习路线](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fguides\u002Fai-infra学习路线\u002F) | 系统化的学习路径与知识图谱 |\n\n\u003Cbr>\n\n## 📚 模块一：前置知识\n\n涵盖 GPU 架构、编程语言基础、数学基础、Transformer 架构、PyTorch 框架和集合通信等核心前置知识，为后续深入 AI Infra 打好坚实基础。\n\n| 章节 | 主要内容 |\n|------|----------|\n| 第 1 章 编程语言基础 | Python 进阶、C\u002FC++ 核心、Linux 与开发环境 |\n| 第 2 章 数学基础 | 线性代数、概率论与统计、微积分 |\n| 第 3 章 Transformer 架构详解 | Self-Attention、前馈网络、位置编码、归一化层、模型架构变种 |\n| 第 4 章 PyTorch 框架 | Tensor 与自动微分、Module 与训练流程、调试与性能分析 |\n| 第 5 章 GPU 硬件概论 | GPU 架构总览、存储层次、主流 GPU 规格对比、互联拓扑 |\n| 第 6 章 集合通信基础 | 通信原语、通信算法、NCCL |\n\n**已更新文章：**\n\n| 序号 | 文章 | 说明 |\n|:---:|------|------|\n| 第3章 | [🔥 Transformer 架构：快速入门篇](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002Ftransformer架构快速入门\u002F) | Encoder-Decoder 结构、Self-Attention 机制入门 |\n| 3.1 | [AI Infra 工程师为什么必须懂 Transformer](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F31-ai-infra工程师为什么必须懂transformer\u002F) | 从 Infra 视角理解 Transformer 的计算与显存特性 |\n| 3.2 | [Transformer 全貌及代码实现](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F32-transformer全貌及代码实现\u002F) | 完整 Transformer 架构拆解与 PyTorch 实现 |\n| 3.3 | [Self-Attention机制深入理解](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F33-self-attention机制深入理解\u002F) | Self-Attention 是 Transformer 的心脏，也是当代大模型中计算量最集中、优化手段最丰富的模块 |\n| 3.4 | [Transformer前馈网络ffn深入理解](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F34-transformer前馈网络ffn深入理解) | 前馈网络FFN 责对每个 token 进行独立的非线性变换，是模型记忆知识和深度推理的核心载体 |\n| 3.5 | [Transformer位置编码深入理解](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F35-transformer位置编码深入理解) | 位置编码是 Transformer 架构中一个看似不起眼却至关重要的组件 |\n| 3.6 | [LayerNorm与残差连接深入理解](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F36-layernorm与残差连接深入理解) | LayerNorm 和 残差连接 决定了大模型能不能学会 |\n| 3.7 | [Transformer Decoder Block完整解析](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F37-transformer-decoder-block完整解析) | 大语言模型的核心计算单元是 Transformer Decoder Block |\n| 3.8 | [从Transformer到LLM自回归生成深入理解](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F38-从transformer到llm自回归生成深入理解\u002F) | 从宏观视角理解 Transformer 到 LLM 自回归生成的计算流程 |\n| 3.9 | [Tokenization与词嵌入](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Ftransformer\u002F39-tokenization与词嵌入\u002F) | 一段文字变成模型输入之前，需要先经过两道关键变换：Tokenization（分词） 和 Embedding（词嵌入） |\n| 第4章 | [🔥 PyTorch框架入门](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Fpyroch\u002Fpytorch框架入门\u002F) | PyTorch 是当前大模型训练和推理的事实标准框架 |\n| 第5章 | [🔥 GPU基础知识：从硬件架构到AI计算](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Fgpu\u002Fgpu-basics\u002F) | CPU vs GPU、SM 架构、显存层级、Tensor Core |\n| 5.1 | [NVIDIA GPU 架构演进：从 Volta 到 Blackwell](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Fgpu\u002Fnvidia-gpu-evolution\u002F) | V100 → A100 → H100 → B200 架构演进 |\n| 第6章 | [🔥 集群通信网络与NCCL：分布式训练的通信骨架](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fprerequisites\u002F模块一-前置知识\u002Fcommunication\u002Fcollective-communication-primer\u002F) | 从通信原语到 Ring AllReduce 算法，再到 NCCL 实战，快速建立分布式训练集群通信的完整认知体系 |\n\n\n\n\n\u003Cbr>\n\n## ⚡ 模块二：CUDA 编程与算子优化\n\n从 CUDA 编程入门到经典算子实现（Reduce、GEMM、Softmax、Attention），再到 AI 编译器和性能分析工具链，系统掌握 GPU 编程与算子优化技术。\n\n| 章节 | 主要内容 |\n|------|----------|\n| 第 1 章 CUDA 编程入门 | 开发环境搭建、编程模型、内存模型、第一个实用 Kernel |\n| 第 2 章 CUDA 性能优化基础 | Warp 与执行模型、内存访问优化、Occupancy 与资源分配、同步与原子操作 |\n| 第 3 章 经典算子实现 - Reduce | 朴素实现、共享内存+树形归约、Warp Shuffle 优化、多级归约 |\n| 第 4 章 经典算子实现 - GEMM | 矩阵乘法基础、Shared Memory Tiling、进一步优化、与 cuBLAS 对比 |\n| 第 5 章 经典算子实现 - Softmax 与算子融合 | Softmax 数值稳定实现、Online Softmax、算子融合 |\n| 第 6 章 Attention 算子 | FlashAttention V1\u002FV2\u002FV3、Decode 阶段加速、PagedAttention CUDA 实现 |\n| 第 7 章 AI 编译器 | Triton、torch.compile、TVM\u002FXLA 概述 |\n| 第 8 章 性能分析工具链 | Nsight Systems\u002FCompute、PyTorch Profiler |\n\n**已更新文章：**\n\n| 序号 | 文章 | 说明 |\n|:---:|------|------|\n| 1 | [CUDA 编程入门指南](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fcuda\u002F模块二-cuda编程与算子优化\u002Fcuda编程入门指南\u002F) | CUDA 编程模型、线程层级、内存模型与 Kernel 编写 |\n\n\u003Cbr>\n\n## 🌐 模块三：分布式训练\n\n从分布式训练总论出发，深入数据并行、ZeRO 系列、张量并行、流水线并行、3D 并行策略，最终通过训练框架实战串联全部知识。\n\n| 章节 | 主要内容 |\n|------|----------|\n| 第 1 章 分布式训练总论 | 为什么需要分布式训练、训练状态显存分析、并行策略全景 |\n| 第 2 章 数据并行 | DataParallel、DistributedDataParallel、FSDP |\n| 第 3 章 ZeRO 系列 | ZeRO 核心思想、ZeRO-1\u002F2\u002F3、ZeRO-Offload、选型指南 |\n| 第 4 章 张量并行与序列并行 | 张量并行原理、序列并行、GQA\u002FMQA 下的 TP 切分 |\n| 第 5 章 流水线并行 | GPipe、PipeDream、1F1B 调度、气泡率分析 |\n| 第 6 章 3D 并行与混合训练策略 | 3D 并行组合、混合精度训练、梯度累积、Activation Checkpointing |\n| 第 7 章 训练框架实战 | Megatron-LM、DeepSpeed、实战配置 |\n\n**已更新文章：**\n\n| 序号 | 文章 | 说明 |\n|:---:|------|------|\n| 1 | [PyTorch 分布式训练：从原理到实战](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fdistributed\u002F模块三-分布式训练\u002Fpytorch-distributed\u002F) | DDP、FSDP、ZeRO、通信原语、torchrun 多机训练 |\n\n\u003Cbr>\n\n## 🚀 模块四：推理优化\n\n覆盖 LLM 推理基础、推理引擎核心技术、主流推理框架、量化、Speculative Decoding、PD 解耦架构，以及性能分析与端到端实战。\n\n| 章节 | 主要内容 |\n|------|----------|\n| 第 1 章 LLM 推理基础 | Prefill\u002FDecode 两阶段、KV Cache、推理性能指标 |\n| 第 2 章 推理引擎核心技术 | PagedAttention、Continuous Batching、调度策略 |\n| 第 3 章 主流推理框架 | vLLM、SGLang、TensorRT-LLM 等 |\n| 第 4 章 量化 | INT8\u002FINT4 量化、GPTQ、AWQ、SmoothQuant |\n| 第 5 章 Speculative Decoding | 投机解码原理、Draft Model、验证策略 |\n| 第 6 章 PD 解耦架构 | Prefill-Decode 解耦部署、异构推理 |\n| 第 7 章 性能分析与 Benchmark | 推理性能评估、延迟\u002F吞吐量分析 |\n| 第 8 章 推理优化选型与端到端实战 | 方案选型、部署实战、生产环境最佳实践 |\n\n**已更新文章：**\n\n| 序号 | 文章 | 说明 |\n|:---:|------|------|\n| 1 | [vLLM 快速入门](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Finference\u002Fvllm快速入门\u002F) | 从安装到部署你的第一个 LLM 推理服务 |\n\n\u003Cbr>\n\n## 📊 性能分析\n\n> 🚧 施工中，敬请期待...\n\n---\n\n\u003Cbr>\n\n## 🎯 面试宝典\n\n共收录 **180+ 场面试真题**，覆盖 **40+ 家公司**，按梯队分类组织。[在线浏览 →](https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Finterview)\n\n涵盖公司包括字节跳动、阿里巴巴、腾讯、百度、快手、美团、蚂蚁、英伟达、MiniMax、蔚来、小鹏、理想等。\n\n\u003Cimg src=\"https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fimages\u002FAIinfraGuideWeb2.png\" alt=\"AIinfraGuideWeb2\" style=\"max-width: 100%; display: block; margin: 0 auto;\" \u002F>\n\n\u003Cbr>\n\n**投递总览：**\n\n| 梯队 | 公司 | 主要 AI Infra 岗位 |\n|------|------|------|\n| **T0 大厂** | 字节跳动、阿里巴巴、腾讯、百度 | AI Infra 工程师、高性能计算研发、推理优化工程师、**分布式训练框架** |\n| **T1 大厂\u002F独角兽** | 快手、拼多多、美团、蚂蚁、OPPO、华为、蔚来 | AI Infra、高性能计算、大模型推理优化、AI 平台开发 |\n| **T2 AI 独角兽** | MiniMax、阶跃星辰、智谱AI、面壁智能、月之暗面 | AI Infra、大模型算法 (偏 Infra)、推理系统开发、Agent Infra |\n| **T3 芯片\u002F硬件厂商** | 英伟达、摩尔线程、海光、寒武纪、壁仞科技、飞腾 | 算子开发、CUDA 优化、GPU 软件工程师、AI 编译器、高性能计算 |\n| **T4 自动驾驶\u002F车企** | 小鹏汽车、蔚来、理想、卓驭(大疆车载)、小马智行、元戎启行 | AI Infra、高性能计算、大模型推理优化、AI 平台 |\n| **T5 其他** | 科大讯飞、网易、海康威视、联想、猿辅导、好未来等 | AI Infra、高性能计算、推理引擎开发、大模型算法 |\n\n> 注：分布式训练相关的岗位特别少，一般只有搞大模型的大厂才有，所有大家在准备的求职的过程中，可以重点关注算子优化、推理优化、推理框架这类岗位，训练相关的技术点了解即可，不用深钻。\n\n\u003Cbr>\n\n### 各梯队面试侧重点\n\n| 梯队 | 考察侧重 |\n|------|----------|\n| **T0 大厂**（字节\u002F阿里\u002F腾讯\u002F百度） | 结构化面试 2-3 轮，项目深挖 + 模型架构 + 推理\u002F训练优化 + C++ 八股 + LeetCode Medium |\n| **T1 大厂\u002F独角兽**（快手\u002F美团\u002F蚂蚁等） | 与 T0 类似，推理优化问得多，部分公司重视系统设计 |\n| **T2 AI 独角兽**（MiniMax\u002F阶跃\u002F智谱） | 偏研究导向，深挖 MoE 路由优化、RLHF 细节、前沿 paper，传统八股较少 |\n| **T3 芯片\u002F硬件**（英伟达\u002F壁仞\u002F寒武纪） | 重 GPU 架构、CUDA 编程、HPC 基础，手写 kernel 频率最高 |\n| **T4 车企\u002F自动驾驶**（蔚来\u002F大疆车载\u002F小鹏） | 重 C++ 功底、推理部署（TensorRT\u002FTVM\u002F量化）、边缘实时性能，LLM 问得少 |\n| **T5 其他**（海康\u002F科大讯飞等） | 难度适中，C++ 和推理部署为主 |\n\n\n\u003Cbr>\n\n**投递时间线：**\n\n| 时间段 | 投递策略 |\n|--------|----------|\n| **3-4月** | 暑期实习提前批（字节、阿里、腾讯、快手）|\n| **5-6月** | 暑期实习正式批 + 日常实习（美团、拼多多、中小厂）|\n| **7-8月** | 秋招提前批（字节 AML、百度、华为）|\n| **9-10月** | 秋招正式批（全面投递）|\n| **11-12月** | 秋招补录 + 春招准备 |\n| **次年2-4月** | 春招（HC 较少，竞争激烈）|\n\n---\n\n\u003Cbr>\n\n## 🤝 欢迎参与贡献\n\nAIInfraGuide 是一个开源项目，欢迎通过以下方式参与共建：\n\n- **提交 Issue**：发现错误、提出建议，或者告诉我们你希望看到的主题\n- **贡献 PR**：分享你的实践经验、补充技术细节、改进现有内容\n- **Star & Share**：如果觉得有帮助，请在 [GitHub](https:\u002F\u002Fgithub.com\u002Fcaomaolufei\u002FAIInfraGuide) 上给个 Star，让更多人发现这个项目\n\n💡 **提示**：如果你不确定从哪里开始，推荐先阅读知识库中的「AIInfra 学习路线」，它会帮你梳理一条清晰的学习路径。\n\n让我们一起构建 AI Infra 社区的知识基础设施。\n\n\u003Cdiv id=\"contribute\">\u003C\u002Fdiv>\n\n\u003Cdiv align='center'>\n\u003Ca href=\"https:\u002F\u002Fstar-history.com\u002F#caomaolufei\u002FAIInfraGuide&Date\">\n \u003Cpicture>\n   \u003Csource media=\"(prefers-color-scheme: dark)\" srcset=\"https:\u002F\u002Fapi.star-history.com\u002Fsvg?repos=caomaolufei\u002FAIInfraGuide&type=Date&theme=dark\" \u002F>\n   \u003Csource media=\"(prefers-color-scheme: light)\" srcset=\"https:\u002F\u002Fapi.star-history.com\u002Fsvg?repos=caomaolufei\u002FAIInfraGuide&type=Date\" \u002F>\n   \u003Cimg width=400 height=300 alt=\"Star History Chart\" src=\"https:\u002F\u002Fapi.star-history.com\u002Fsvg?repos=caomaolufei\u002FAIInfraGuide&type=Date\" \u002F>\n \u003C\u002Fpicture>\n\u003C\u002Fa>\n\u003C\u002Fdiv>\n\n## 联系方式\n\n欢迎通过以下方式与我交流：\n\n- 公众号: [《AI炼金炉》](https:\u002F\u002Fmp.weixin.qq.com\u002Fs\u002FoxUBDTd-b1aZnh0jGR5tqw)\n- 知乎: [草帽路飞](https:\u002F\u002Fzhihu.com\u002Fpeople\u002Fzi-you-zi-zai-de-zhan-sheng)\n- 社群: （vx： caomaolufei2026）\n\u003Cimg src=\"https:\u002F\u002Fcaomaolufei.github.io\u002FAIInfraGuide\u002Fimages\u002Fwx_qun.png\" alt=\"wx_qun\" style=\"max-width: 50%; display: block; margin: 0 auto;\" \u002F>\n\n## License\n\nMIT\n","AIInfraGuide 是一个旨在帮助工程师从零开始系统学习 AI 基础设施（AI Infra）全栈技术的开源项目。该项目涵盖了从 GPU 硬件、CUDA 编程到分布式训练和推理优化的核心内容，提供了一个结构化且面向实践的知识体系。特别地，它还包括了面试宝典模块，收录了超过 180 场面试真题，覆盖 40 多家公司，助力求职者准备相关岗位。适合于希望深入理解和掌握 AI 基础设施技术的软件开发者、数据科学家以及对大模型时代核心技术感兴趣的从业者。",2,"2026-06-11 02:41:29","CREATED_QUERY"]