跳转至

机器学习:补充资源

经典教材

周志华《机器学习》(西瓜书)★ 中文圣经

Christopher Bishop — Pattern Recognition and Machine Learning (PRML)

  • 微软研究院出品,贝叶斯视角
  • 偏理论,数学要求高,适合做 ML 理论方向的同学

Hastie, Tibshirani, Friedman — The Elements of Statistical Learning (ESL)

  • 教材主页(免费 PDF):https://hastie.su.domains/ElemStatLearn/
  • Stanford 统计学派写的 ML 教材,统计味浓
  • 入门版《Introduction to Statistical Learning》(ISL) 也免费,R 语言实现

Kevin Murphy — Probabilistic Machine Learning

进阶课程

林轩田《机器学习基石》+《机器学习技法》

  • 台湾大学公开课,YouTube 全集 + B 站完整中字
  • 风格亲和,从 PAC 学习理论讲起,把 VC 维 / 正则化 / 核方法等概念讲得极其清晰
  • 适合 CS229 之后想深化“为什么这样做”

CMU 10-701: Machine Learning

MIT 6.036: Introduction to Machine Learning

实战工具

  • scikit-learn:经典 ML 算法 Python 实现的事实标准,文档极佳
  • PyTorch / JAX:深度学习框架,但 JAX 在传统 ML 研究里也常用
  • Hugging Face:预训练模型生态,几行代码调用 SOTA
  • Weights & Biases / MLflow:实验管理工具

作业实现参考

CS229(Stanford)

@PKUFlyingPig 的 CS229 资源与作业实现:

Coursera Machine Learning(吴恩达)

由于课程过于出名,网上参考资料极为丰富,Coursera 上课程资料一应俱全。相关作业实现在 GitHub 搜索 “Coursera Machine Learning Andrew Ng” 可以找到大量参考。

西瓜书 + 南瓜书代码实现

数据集与竞赛入门

  • Kaggle:https://www.kaggle.com/ ── 入门竞赛(Titanic、House Prices)是最好的练手项目
  • UCI Machine Learning Repository:经典小型数据集集合
  • OpenML:可直接 import 到 sklearn 的标准化数据集库

在 IC 中的应用

机器学习对 IC 学生不是“另一个学科”而是研究工具: - ML for EDA:用 GNN 做布局布线、用 RL 做时序优化(Google Apollo / DREAMPlace 等) - 硬件感知 ML:模型量化、剪枝、神经架构搜索 ── 直接对应 AI 算法与系统 方向 - 传感器信号智能处理:CMOS 图像传感器、生物医学信号 ── 对应 生物电子与脑机接口 - 故障诊断:芯片测试中的异常检测、wafer map classification

学完 CS229/CS189 之后,推荐再看 AI 系统板块 把“算法层 + 系统层”串起来。