深度强化学习课程文档

强化学习中的“深度”

Hugging Face's logo
加入 Hugging Face 社区

并获取增强型文档体验

开始使用

强化学习中的“深度”

到目前为止,我们讨论的是强化学习。但是,“深度”是如何发挥作用的呢?

深度强化学习引入了**深度神经网络来解决强化学习问题**,因此得名“深度”。

例如,在下一单元中,我们将学习两种基于值的算法:Q 学习(经典的强化学习)和深度 Q 学习。

你会发现,在第一种方法中,**我们使用传统算法**创建一个 Q 表,帮助我们找到每个状态下应该采取的动作。

在第二种方法中,**我们将使用神经网络**(来近似 Q 值)。

Value based RL
受 Udacity 的 Q 学习笔记本启发的示意图

如果你不熟悉深度学习,你应该观看FastAI 的面向程序员的实用深度学习(免费)。

< > 在 GitHub 上更新