深度强化学习课程文档
结论
加入 Hugging Face 社区
并获得增强的文档体验
开始
结论:
恭喜您完成本奖励单元! 您已经学习了记录专家演示以及使用 IL 训练智能体的过程,在某些情况下,这可以替代使用 RL 训练游戏内智能体。
本教程由 Ivan Dodic 编写。 感谢 Edward Beeching 和 Thomas Simonini 的审阅和反馈。
< > 在 GitHub 上更新深度强化学习课程文档
结论
并获得增强的文档体验
开始
恭喜您完成本奖励单元! 您已经学习了记录专家演示以及使用 IL 训练智能体的过程,在某些情况下,这可以替代使用 RL 训练游戏内智能体。
本教程由 Ivan Dodic 编写。 感谢 Edward Beeching 和 Thomas Simonini 的审阅和反馈。
< > 在 GitHub 上更新