ZOMI 酱:GPU 架构原理系列
课程简介
- 授课教师:ZOMI 酱(陈巍)
- 先修要求:深度学习基础、体系结构基础
- 课程难度:🌟🌟🌟
- 预计学时:30+ 讲(持续更新)
国内最系统的中文 GPU 微架构系列。 按代际拆解 NVIDIA GPU:Fermi → Kepler → Maxwell → Volta → Turing → Ampere → Hopper,每代讲清楚引入了什么新硬件单元及其动机(Tensor Core 为什么在 Volta 出现、NVLink 解决什么问题)。配套开源项目 AISystem 含完整 PDF 讲义,结构化程度远超碎片博客。
优点:中文、覆盖面广、代际演进叙事清晰。局限:面向 AI 系统方向,对底层微架构(warp 调度的流水线细节)不如 ETH HetSys 深。
课程资源
- 课程视频(B 站,从第一集开始):GPU 架构原理 01,后续各集见 ZOMI 酱 B 站主页
- 配套讲义(开源):AISystem GitHub