深度强化学习课程文档

结论

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始

结论:

恭喜您完成本奖励单元! 您已经学习了记录专家演示以及使用 IL 训练智能体的过程,在某些情况下,这可以替代使用 RL 训练游戏内智能体。

本教程由 Ivan Dodic 编写。 感谢 Edward BeechingThomas Simonini 的审阅和反馈。

< > 在 GitHub 上更新