跳转至

深度生成模型学习路线

注：本课程页继承自 CS自学指南。

近几年大语言模型成为热门方向，也和笔者博士期间课题密切相关。本路线图分享笔者学习深度生成模型过程中参考的学习地图，方便感兴趣的同学按阶段选取。

生成模型基础

覆盖 VAE、GAN、Flow、Diffusion 等主流架构，推荐按顺序选择：

MIT 6.S184 — 以微分方程视角讲解 Flow Matching 与 Diffusion，数学严谨，有配套小实验
UCB CS294-158: Deep Unsupervised Learning — Pieter Abbeel 主讲，内容最全面，作业需从头实现模型，极为硬核

大语言模型

Stanford CS336: Language Modeling from Scratch — 从零构建 LLM 全链路，最硬核，推荐有系统能力追求的同学
CMU 11-711: Advanced NLP — 各子方向广泛覆盖，适合建立宏观认知

延伸阅读

Awesome-LLM — 大语言模型相关资料汇总
LLMSys-PaperList — LLM 系统方向论文汇总
MLsys-Guide — 深度学习系统入门指南