深度强化学习课程文档

强化学习中的“深度”

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

强化学习中的“深度”

到目前为止我们谈论的是强化学习。但“深度”又体现在哪里呢?

深度强化学习引入了深度神经网络来解决强化学习问题——因此得名“深度”。

例如,在下一个单元中,我们将学习两种基于价值的算法:Q-学习(经典强化学习)和深度Q-学习。

你会发现不同之处在于,第一种方法中,我们使用传统算法来创建一个Q表格,帮助我们找到每个状态下应采取的行动。

在第二种方法中,我们将使用神经网络(来近似Q值)。

Value based RL
图示灵感来源于Udacity的Q学习笔记本

如果你不熟悉深度学习,你绝对应该观看FastAI面向程序员的实用深度学习课程(免费)。

< > 在 GitHub 上更新