强化学习中的“深度”
到目前为止,我们讨论的是强化学习。但是,“深度”是如何发挥作用的呢?
深度强化学习引入了**深度神经网络来解决强化学习问题**,因此得名“深度”。
例如,在下一单元中,我们将学习两种基于值的算法:Q 学习(经典的强化学习)和深度 Q 学习。
你会发现,在第一种方法中,**我们使用传统算法**创建一个 Q 表,帮助我们找到每个状态下应该采取的动作。
在第二种方法中,**我们将使用神经网络**(来近似 Q 值)。
如果你不熟悉深度学习,你应该观看FastAI 的面向程序员的实用深度学习(免费)。
< > 在 GitHub 上更新