[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-72734":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":17,"stars7d":18,"stars30d":19,"stars90d":16,"forks30d":16,"starsTrendScore":20,"compositeScore":21,"rankGlobal":10,"rankLanguage":10,"license":22,"archived":23,"fork":23,"defaultBranch":24,"hasWiki":25,"hasPages":23,"topics":26,"createdAt":10,"pushedAt":10,"updatedAt":32,"readmeContent":33,"aiSummary":34,"trendingCount":16,"starSnapshotCount":16,"syncStatus":35,"lastSyncTime":36,"discoverSource":37},72734,"AISystem","Infrasys-AI\u002FAISystem","Infrasys-AI","AISystem 主要是指AI系统，包括AI芯片、AI编译器、AI推理和训练框架等AI全栈底层技术","https:\u002F\u002Finfrasys-ai.github.io\u002Faisystem-docs\u002F",null,"Jupyter Notebook",16918,2396,186,6,0,17,66,181,51,120,"Apache License 2.0",false,"main",true,[27,28,29,30,31],"ai","aiinfra","aisys","dlsys","mlsys","2026-06-12 04:01:07","# AI System & AI Infra\n\n大模型内容太多啦！！因此最新大模型的内容归档在 [AIFoundation](https:\u002F\u002Fgithub.com\u002Fchenzomi12\u002FAIFoundation\u002F) https:\u002F\u002Fgithub.com\u002Fchenzomi12\u002FAIFoundation\u002F 上面，欢迎大家移步过去哦！！\n\n--------------\n\n文字课程内容正在一节节补充更新，尽可能抽空继续更新正在 [AISys](https:\u002F\u002Fchenzomi12.github.io\u002F) ，希望您多多鼓励和参与进来！！！\n\n文字课程开源在 [AISys](https:\u002F\u002Finfrasys-ai.github.io\u002Faisystem-docs\u002F)，系列视频托管[B 站](https:\u002F\u002Fspace.bilibili.com\u002F517221395)和[油管](https:\u002F\u002Fwww.youtube.com\u002F@zomi6222\u002Fvideos)，PPT 开源在[github](https:\u002F\u002Fgithub.com\u002Fchenzomi12\u002FAISystem)，欢迎取用！！！\n\n## 课程背景\n\n这个开源课程英文名字叫做**AI System(AISys)**，中文名字叫做**AI 系统**。\n\n本开源课程主要是跟大家一起探讨和学习人工智能、深度学习的系统设计，而整个系统是围绕着 ZOMI 在工作当中所积累、梳理、构建 AI 系统全栈的内容。希望跟所有关注 AI 开源课程的好朋友一起探讨研究，共同促进学习讨论。\n\n![AI 系统全栈](images\u002Faisystem.png)\n\n## 课程内容大纲\n\n课程主要包括以下五大模块：\n\n| 教程内容  | 简介   | 地址  |\n| ------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |\n| AI 系统全栈概述  | AI 基础知识和 AI 系统的全栈概述的AI 系统概述，以及深度学习系统的系统性设计和方法论，主要是整体了解 AI 训练和推理全栈的体系结构内容。 | [[Slides](.\u002F01Introduction\u002FREADME.md)] |\n| AI 芯片与体系架构   | 作为 AI 的硬件体系架构主要是指 AI 芯片，这里就很硬核了，从CPU、GPU 的芯片基础到 AI 芯片的原理、设计和应用场景范围，AI 芯片的设计不仅仅考虑针对 AI 计算的加速，还需要充分考虑到AI 的应用算法、AI 框架等中间件，而不是停留在天天喊着吊打英伟达和 CUDA，实际上芯片难以用起来。 | [[Slides](.\u002F02Hardware\u002FREADME.md)] |\n| AI 编程与计算架构  | 进阶篇介绍 AI 编程与计算架构，将站在系统设计的角度，思考在设计现代机器学习系统中需要考虑的编译器问题，特别是中间表达乃至后端优化。 | [[Slides](.\u002F03Compiler\u002FREADME.md)]  |\n| AI 推理系统与引擎  | 实际应用推理系统与引擎，讲了太多原理身体太虚容易消化不良，还是得回归到业务本质，让行业、企业能够真正应用起来，而推理系统涉及一些核心算法和注意的事情也分享下。 | [[Slides](.\u002F04Inference\u002FREADME.md)]  |\n| AI 框架核心技术  | 介绍 AI 框架核心技术，首先介绍任何一个 AI 框架都离不开的自动微分，通过自动微分功能后就会产生表示神经网络的图和算子，然后介绍 AI 框架前端的优化，还有最近很火的大模型分布式训练在 AI 框架中的关键技术。  | [[Slides](.\u002F05Framework\u002FREADME.md)]  |\n\n## 课程设立目的\n\n本课程主要为本科生高年级、硕博研究生、AI 系统从业者设计，帮助大家：\n\n1. 完整了解 AI 的计算机系统架构，并通过实际问题和案例，来了解 AI 完整生命周期下的系统设计。\n\n2. 介绍前沿系统架构和 AI 相结合的研究工作，了解主流框架、平台和工具来了解 AI 系统。\n\n## 课程部分\n\n### **[一. AI 系统概述](.\u002F01Introduction\u002F)**\n\n| 编号  | 名称       | 具体内容      |\n|:---:|:----- |:--- |\n| 1      | [AI 系统](.\u002F01Introduction\u002F) | 算法、框架、体系结构的结合，形成 AI 系统  |\n\n### **[二. AI 芯片体系结构](.\u002F02Hardware\u002F)**\n\n| 编号  | 名称       | 具体内容      |\n|:---:|:----- |:--- |\n| 1      | [AI 计算体系](.\u002F02Hardware\u002F01Foundation\u002F) | 神经网络等 AI 技术的计算模式和计算体系架构  |\n| 2      | [AI 芯片基础](.\u002F02Hardware\u002F02ChipBase\u002F)   | CPU、GPU、NPU 等芯片体系架构基础原理       |\n| 3      | [图形处理器 GPU](.\u002F02Hardware\u002F03GPUBase\u002F)  | GPU 的基本原理，英伟达 GPU 的架构发展  |\n| 4      | [英伟达 GPU 详解](.\u002F02Hardware\u002F04NVIDIA\u002F) | 英伟达 GPU 的 Tensor Core、NVLink 深度剖析 |\n| 5      | [国外 AI 处理器](.\u002F02Hardware\u002F05Abroad\u002F)   | 谷歌、特斯拉等专用 AI 处理器核心原理  |\n| 6      | [国内 AI 处理器](.\u002F02Hardware\u002F06Domestic\u002F)   | 寒武纪、燧原科技等专用 AI 处理器核心原理  |\n| 7      | [AI 芯片黄金 10 年](.\u002F02Hardware\u002F07Thought\u002F)   | 对 AI 芯片的编程模式和发展进行总结  |\n\n### **[三. AI 编译原理](.\u002F03Compiler\u002F)**\n\n| 编号  | 名称       | 具体内容      |\n|:---:|:----- |:--- |\n| 1      | [传统编译器](.\u002F03Compiler\u002F01Tradition\u002F)    | 传统编译器 GCC 与 LLVM，LLVM 详细架构  |\n| 2      | [AI 编译器](.\u002F03Compiler\u002F02AICompiler\u002F)  | AI 编译器发展与架构定义，未来挑战与思考   |\n| 3      | [前端优化](.\u002F03Compiler\u002F03Frontend\u002F)      | AI 编译器的前端优化(算子融合、内存优化等)  |\n| 4      | [后端优化](.\u002F03Compiler\u002F04Backend\u002F)       | AI 编译器的后端优化(Kernel 优化、AutoTuning) |\n| 5      | 多面体      | 待更 ing...      |\n| 6      | [PyTorch2.0](.\u002F03Compiler\u002F06PyTorch\u002F) | PyTorch2.0 最重要的新特性：编译技术栈  |\n\n### **[四. AI 推理系统](.\u002F04Inference\u002F)**\n\n| 编号  | 名称       | 具体内容      |\n|:---:|:----- |:--- |\n| 1      | [推理系统](.\u002F04Inference\u002F01Inference\u002F)  | 推理系统整体介绍，推理引擎架构梳理  |\n| 2      | [轻量网络](.\u002F04Inference\u002F02Mobilenet\u002F)  | 轻量化主干网络，MobileNet 等 SOTA 模型介绍 |\n| 3      | [模型压缩](.\u002F04Inference\u002F03Slim\u002F)       | 模型压缩 4 件套，量化、蒸馏、剪枝和二值化       |\n| 4      | [转换&优化](.\u002F04Inference\u002F04Converter\u002F) | AI 框架训练后模型进行转换，并对计算图优化      |\n| 5      | [Kernel 优化](.\u002F04Inference\u002F05Kernel\u002F) | Kernel 层、算子层优化，对算子、内存、调度优化  |\n\n### **[五. AI 框架核心技术](.\u002F05Framework\u002F)**\n\n| 编号  | 名称       | 具体内容      |\n|:---:|:----- |:--- |\n| 1   | [AI 框架基础](.\u002F05Framework\u002F01Foundation\u002F) | AI 框架的作用、发展、编程范式    |\n| 2   | [自动微分](.\u002F05Framework\u002F02AutoDiff\u002F)     | 自动微分的实现方式和原理       |\n| 3   | [计算图](.\u002F05Framework\u002F03DataFlow\u002F)      | 计算图的概念，图优化、图执行、控制流表达  |\n\n### 知识清单\n\n![知识清单](images\u002Fknowledge_list.png)\n\n## 备注\n\n> 这个仓已经到达疯狂的 10G 啦（ZOMI 把所有制作过程、高清图片都原封不动提供），如果你要 git clone 会非常的慢，因此建议优先到  [Releases · chenzomi12\u002FAISystem](https:\u002F\u002Fgithub.com\u002Fchenzomi12\u002FAISystem\u002Freleases) 来下载你需要的内容\n\n> 非常希望您也参与到这个开源课程中，B 站给 ZOMI 留言哦！\n> \n> 欢迎大家使用的过程中发现 bug 或者勘误直接提交代码 PR 到开源社区哦！\n>\n> 请大家尊重开源和 ZOMI 的努力，引用 PPT 的内容请规范转载标明出处哦！\n","AISystem 项目是一个全面介绍人工智能系统设计与实现的开源课程，涵盖了从AI芯片、编译器到推理和训练框架等全栈底层技术。其核心功能包括对AI硬件架构（如CPU、GPU及专用AI处理器）的深入解析、AI编程与计算架构的设计考量、以及AI推理系统与引擎的实际应用，并且特别强调了自动微分在AI框架中的作用。该项目适合高年级本科生、研究生以及AI系统领域的从业者学习使用，旨在帮助参与者理解AI系统的完整生命周期及其系统设计方法论。通过结合理论知识与实践案例，AISystem不仅促进了对当前主流AI平台和技术的理解，也为探索前沿研究提供了宝贵的资源。",2,"2026-06-11 03:43:27","high_star"]