深度生成模型学习路线
注:本课程页继承自 CS自学指南。
近几年大语言模型成为热门方向,也和笔者博士期间课题密切相关。本路线图分享笔者学习深度生成模型过程中参考的学习地图,方便感兴趣的同学按阶段选取。
生成模型基础
覆盖 VAE、GAN、Flow、Diffusion 等主流架构,推荐按顺序选择:
- MIT 6.S184 — 以微分方程视角讲解 Flow Matching 与 Diffusion,数学严谨,有配套小实验
- UCB CS294-158: Deep Unsupervised Learning — Pieter Abbeel 主讲,内容最全面,作业需从头实现模型,极为硬核
大语言模型
- Stanford CS336: Language Modeling from Scratch — 从零构建 LLM 全链路,最硬核,推荐有系统能力追求的同学
- CMU 11-711: Advanced NLP — 各子方向广泛覆盖,适合建立宏观认知
延伸阅读
- Awesome-LLM — 大语言模型相关资料汇总
- LLMSys-PaperList — LLM 系统方向论文汇总
- MLsys-Guide — 深度学习系统入门指南