David Silver:UCL Reinforcement Learning
课程简介
- 所属大学:University College London(UCL)/ DeepMind
- 授课教师:David Silver
- 先修要求:概率论、线性代数
- 课程难度:🌟🌟🌟
- 预计学时:10 讲(约 15 小时)
AlphaGo 主设计者的 RL 经典讲义,重直觉而非推导密度。10 讲覆盖 MDP 基础、动态规划、蒙特卡洛、TD 学习、函数近似、策略梯度、model-based RL。表述清晰,例子丰富,是国际上引用量最高的 RL 入门课之一。
与赵世钰课的关系:Silver 课重直觉推导,是常用的英文入门;赵世钰课推导更严格、覆盖 Actor-Critic 更完整,适合需要数学基础做研究的同学。
课程资源
- 课程视频(YouTube,DeepMind 官方):UCL RL Course by David Silver
- 课程讲义(官方 PDF):David Silver 课程主页