总结
恭喜您完成本单元!信息量很大。并且恭喜您完成了教程。您刚刚使用 PyTorch 从头开始编写了第一个深度强化学习代理,并在 Hub 上分享了它 🥳。
不要犹豫,通过改进更复杂环境的实现来迭代本单元(例如,如何将网络更改为卷积神经网络以处理帧作为观察结果)?
在下一个单元中,我们将进一步了解 Unity MLAgents,通过在 Unity 环境中训练代理。这样,您就可以准备参加AI 对抗 AI 挑战,在这些挑战中,您将训练您的代理在雪仗和足球比赛中与其他代理竞争。
听起来很有趣吗?下次再见!
最后,我们非常乐意了解您对本课程的看法以及我们如何改进它。如果您有任何反馈,请👉 填写此表单