李宏毅强化学习 Eureka

Emily Johnson

-Mar 12, 2026, 9:41 PM

李宏毅老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂，他会通过很多有趣的例子来讲解强化学习理论。比如老师经常会用玩 Atari 游戏的例子来讲解强化学习算法。此外，为了教程的完整性，我们整理了周博磊老师的《强化学习纲要》、李科浇老师的《世界冠军带你从零实践强化学习》以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。本教程也称为“蘑菇书”，寓意是希望此书能够为读者注入活力，让读者“吃”下这本蘑菇之后，能够饶有兴致地探索强化学习，像马里奥那样愈加强大，继而在人工智能领域觅得意外的收获。豆瓣评分：https://book.douban.com/subject/35781275/ 勘误修订表：https://datawhalechina.github.io/easy-rl/#/errata 地址：https://datawhalechina.github.io/easy-rl/ 这是李宏毅老师机器学习【第十二节课程】的笔记（仅用于个人学习记录），本节课程简单对强化学习（Reinforcement Learning）进行了介绍。

叫机器学习下围棋，一个是最好的下一步可能人类根本就不知道。我们不知道正确答案是什么的情况下,往往就是 RL 可以派上用场的时候, RL 在学习的时候,虽然不知道正确的答案是什么,但是机器会知道什么是好,什么是不好,机器会跟环境去做互动,得到Reward Reinforcement Learning 裡面呢,我们会有一个 Actor,还有一个 Environment。Actor 跟 Environment,会进行互动：一整局游戏称为一个episode（片段），游戏中每个行为都可能得到Reward，把所有的 Reward加和，得到整场游戏的 Total Reward⇒Return 李宏毅老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂，他会通过很多有趣的例子来讲解强化学习理论。比如老师经常会用玩 Atari 游戏的例子来讲解强化学习算法。此外，为了课程的完整性，我们整理了周博磊老师的《强化学习纲要》、李科浇老师的《百度强化学习》以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。地址：https://datawhalechina.github.io/leedeeprl-notes/

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

People Also Search

李宏毅老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂，他会通过很多有趣的例子来讲解强化学习理论。比如老师经常会用玩 Atari 游戏的例子来讲解强化学习算法。此外，为了教程的完整性，我们整理了周博磊老师的《强化学习纲要》、李科浇老师的《世界冠军带你从零实践强化学习》以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。本教程也称为“蘑菇书”，寓意是希望此书能够为读者注入活力，让读者“吃”下这本蘑菇之后，能够饶有兴致地探索强化学习，像马里奥那样愈加强大，继而在人工智能领域觅得意外的收获。豆瓣评分：https://book.douban.com/subject/35781275/ 勘误修订表：https://datawhalechina.github.io/easy-rl/#/errata 地址：https://datawhalechina.github.io/easy-rl/ 这是李宏毅老师机器学习【第十二节课程】的笔记（仅用于个人学习记录），本节课程简单对强化学习（Reinforcement Learning）进行了介绍。

叫机器学习下围棋，一个是最好的下一步可能人类根本就不知道。我们不知道正确答案是什么的情况下,往往就是 RL 可以派上用场的时候, RL 在学习的时候,虽然不知道正确的答案是什么,但是机器会知道什么是好,什么是不好,机器会跟环境去做互动,得到Reward Reinforcement Learning 裡面呢,我们会有一个 Actor,还有一个 Environment。Actor