深度强化学习课程文档

介绍

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

介绍

Thumbnail

自本课程开始以来,我们学习了在单智能体系统中训练智能体,在单智能体系统中,我们的智能体独自处于环境中:它不与其他智能体合作或协作

这效果很好,单智能体系统在许多应用中都很有用。

Patchwork
自本课程开始以来,你训练智能体的所有环境的拼凑

但是,作为人类,**我们生活在一个多智能体世界中**。 我们的智慧来自与其他智能体的互动。 因此,我们的**目标是创建可以与其他人和其他智能体互动的智能体**。

因此,我们必须研究如何在多智能体系统中训练深度强化学习智能体,以构建能够适应、协作或竞争的强大智能体。

因此,今天我们将**学习多智能体强化学习 (MARL) 这一引人入胜的主题的基础知识**。

最令人兴奋的部分是,在本单元中,你将首次在多智能体系统中训练你的智能体:**一支需要击败对方球队的 2v2 足球队**。

你还将参加 **AI vs. AI 挑战赛**,在其中你训练的智能体将每天与同学们的智能体竞争,并在新的排行榜上排名。

SoccerTwos
此环境由 Unity MLAgents 团队制作

那么,让我们开始吧!

< > 在 GitHub 上更新