AI 系统
AI 系统(ML Systems / AI Systems)研究如何把 AI 模型高效地跑起来——不是怎么设计更好的算法,而是怎么把现有算法部署到 GPU/NPU/手机/边缘设备上,做到延迟低、吞吐高、功耗省。这是与芯片设计交叉最深的 AI 子方向。
近年最热的话题:LLM 推理加速、量化、剪枝、稀疏注意力、KV Cache 管理、张量并行——它们同时投递 NeurIPS/ICML 和 ISCA/ASPLOS,因为本质就是算法 × 硬件 × 系统的三方协同。
graph LR
classDef prereq fill:#FEF9C3,stroke:#CA8A04,color:#713F12
classDef intermediate fill:#EFF6FF,stroke:#3B82F6,color:#1E3A8A
classDef advanced fill:#F0FDF4,stroke:#16A34A,color:#14532D
P1([深度学习基础]):::prereq
P2([体系结构基础]):::prereq
A["智能计算系统 UCAS"]:::intermediate
B["深度学习系统 CMU 10-414"]:::intermediate
C["机器学习编译 陈天奇"]:::advanced
D["高效推理与 TinyML MIT 6.5940"]:::advanced
P1 --> A
P2 --> A
P1 --> B
P2 --> B
A --> C
B --> C
A --> D
B --> D