深度强化学习课程文档

任务类型

Hugging Face's logo
加入 Hugging Face 社区

并获得增强型文档体验

开始使用

任务类型

任务是强化学习问题的实例。我们有两种任务类型:情节型持续型

情节型任务

在这种情况下,我们有一个起点和一个终点(一个终止状态)。这形成了一个情节:一个状态、动作、奖励和新状态的列表。

例如,想想超级马里奥兄弟:一个情节从新的马里奥关卡开始,当你被杀或者到达关卡的尽头时结束

Mario
新情节的开始。

持续型任务

这些是无限持续的任务(没有终止状态)。在这种情况下,智能体必须学习如何选择最佳动作并同时与环境交互

例如,一个进行自动股票交易的智能体。对于此任务,没有起点和终止状态。智能体持续运行,直到我们决定停止它

Stock Market

回顾

任务回顾 < > 在 GitHub 上更新