任务类型
任务是强化学习问题的实例。我们有两种任务类型:情节型和持续型。
情节型任务
在这种情况下,我们有一个起点和一个终点(一个终止状态)。这形成了一个情节:一个状态、动作、奖励和新状态的列表。
例如,想想超级马里奥兄弟:一个情节从新的马里奥关卡开始,当你被杀或者到达关卡的尽头时结束。
持续型任务
这些是无限持续的任务(没有终止状态)。在这种情况下,智能体必须学习如何选择最佳动作并同时与环境交互。
例如,一个进行自动股票交易的智能体。对于此任务,没有起点和终止状态。智能体持续运行,直到我们决定停止它。
回顾
< > 在 GitHub 上更新