机器学习:补充资源
经典教材
周志华《机器学习》(西瓜书)★ 中文圣经
- 国内机器学习入门首选,覆盖监督/非监督/集成/概率图等主要话题
- 配套南瓜书(https://github.com/datawhalechina/pumpkin-book)详细推导每个公式
Christopher Bishop — Pattern Recognition and Machine Learning (PRML)
- 微软研究院出品,贝叶斯视角
- 偏理论,数学要求高,适合做 ML 理论方向的同学
Hastie, Tibshirani, Friedman — The Elements of Statistical Learning (ESL)
- 教材主页(免费 PDF):https://hastie.su.domains/ElemStatLearn/
- Stanford 统计学派写的 ML 教材,统计味浓
- 入门版《Introduction to Statistical Learning》(ISL) 也免费,R 语言实现
Kevin Murphy — Probabilistic Machine Learning
- 主页:https://probml.github.io/pml-book/
- 三册全免费,2022-2024 陆续出版,是新一代 ML 圣经
- 涵盖现代主题:深度学习、扩散模型、强化学习
进阶课程
林轩田《机器学习基石》+《机器学习技法》
- 台湾大学公开课,YouTube 全集 + B 站完整中字
- 风格亲和,从 PAC 学习理论讲起,把 VC 维 / 正则化 / 核方法等概念讲得极其清晰
- 适合 CS229 之后想深化“为什么这样做”
CMU 10-701: Machine Learning
- 课程主页:https://www.cs.cmu.edu/~10701/
- 比 CS229 更偏理论,含 Boosting、HMM、贝叶斯网络等深入内容
MIT 6.036: Introduction to Machine Learning
- MIT OCW:https://ocw.mit.edu/courses/6-036-introduction-to-machine-learning-fall-2020/
- 适合本科生,数学要求比 CS229 低
实战工具
- scikit-learn:经典 ML 算法 Python 实现的事实标准,文档极佳
- PyTorch / JAX:深度学习框架,但 JAX 在传统 ML 研究里也常用
- Hugging Face:预训练模型生态,几行代码调用 SOTA
- Weights & Biases / MLflow:实验管理工具
作业实现参考
CS229(Stanford)
@PKUFlyingPig 的 CS229 资源与作业实现:
Coursera Machine Learning(吴恩达)
由于课程过于出名,网上参考资料极为丰富,Coursera 上课程资料一应俱全。相关作业实现在 GitHub 搜索 “Coursera Machine Learning Andrew Ng” 可以找到大量参考。
西瓜书 + 南瓜书代码实现
- https://github.com/datawhalechina/pumpkin-book
- 配套西瓜书每个公式的推导和 numpy 实现
数据集与竞赛入门
- Kaggle:https://www.kaggle.com/ ── 入门竞赛(Titanic、House Prices)是最好的练手项目
- UCI Machine Learning Repository:经典小型数据集集合
- OpenML:可直接 import 到 sklearn 的标准化数据集库
在 IC 中的应用
机器学习对 IC 学生不是“另一个学科”而是研究工具: - ML for EDA:用 GNN 做布局布线、用 RL 做时序优化(Google Apollo / DREAMPlace 等) - 硬件感知 ML:模型量化、剪枝、神经架构搜索 ── 直接对应 AI 算法与系统 方向 - 传感器信号智能处理:CMOS 图像传感器、生物医学信号 ── 对应 生物电子与脑机接口 - 故障诊断:芯片测试中的异常检测、wafer map classification
学完 CS229/CS189 之后,推荐再看 AI 系统板块 把“算法层 + 系统层”串起来。