深度强化学习课程文档

强化学习中的“深度”

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

强化学习中的“深度”

到目前为止,我们讨论的是强化学习。但是“深度”在其中扮演什么角色呢?

深度强化学习引入了深度神经网络来解决强化学习问题——因此得名“深度”。

例如,在下一个单元中,我们将学习两种基于价值的算法:Q-Learning(经典强化学习)和深度 Q-Learning。

您将看到区别在于,在第一种方法中,我们使用传统算法来创建一个 Q 表,以帮助我们找到每个状态应采取的行动。

在第二种方法中,我们将使用神经网络(来近似 Q 值)。

Value based RL
灵感来自 Udacity 的 Q learning notebook 的模式

如果您不熟悉深度学习,您绝对应该观看 FastAI Practical Deep Learning for Coders(免费)。

< > GitHub 上更新