深度生成模型
深度生成模型研究让 AI 能“生成”内容——文本(LLM)、图像(扩散模型)、3D、音频、视频。这是 2020 年代 AI 革命的核心:ChatGPT、Sora、Stable Diffusion、Midjourney 全部是生成模型。
对硬件研究者来说,生成模型的算力消耗规律是设计大规模 AI 系统的关键参考——LLM 训练 / 推理的 memory bandwidth、计算密度、稀疏性都直接决定加速器设计。
graph LR
A["深度学习基础"]
B["MIT 6.S184"]
C["UCB CS294-158 深度无监督学习"]
D["Stanford CS336 从零实现 LLM"]
E["CMU 11-711 Advanced NLP"]
A --> B
A --> C
B --> D
C --> D
C --> E
classDef beginner fill:#EFF6FF,stroke:#3B82F6,color:#1e3a5f
classDef intermediate fill:#F0FDF4,stroke:#16A34A,color:#14532d
classDef advanced fill:#F8FAFC,stroke:#64748B,color:#1e293b
class A beginner
class B,C intermediate
class D,E advanced