深度强化学习课程文档
值得尝试的有趣环境
并获得增强的文档体验
开始使用
值得尝试的有趣环境
在这里,我们提供了一些有趣的强化学习环境,您可以在其中训练您的智能体
DIAMBRA Arena

DIAMBRA Arena 是一个软件包,其中包含一系列用于强化学习研究和实验的高质量环境。它为流行的街机模拟视频游戏提供了标准接口,提供了完全符合 OpenAI Gym/Gymnasium 格式的 Python API,使其采用流畅而直接。
它支持所有主流操作系统(Linux、Windows 和 MacOS),并且可以通过 Python PIP 轻松安装。它完全免费使用,用户只需在官方网站注册即可。
此外,它的 GitHub 存储库提供了涵盖主要感兴趣用例的示例集合,只需几个步骤即可运行。
主要功能
所有环境都是回合制强化学习任务,具有离散动作(游戏手柄按钮)和由屏幕像素以及附加数值数据(RAM 值,如角色生命条或角色舞台侧面)组成的观察结果。
它们都支持单人(1P)和双人(2P)模式,使其成为探索标准强化学习、竞争性多智能体、竞争性人机、自玩、模仿学习和人在回路的完美资源。
接口游戏是从最流行的格斗复古游戏中选择的。虽然它们共享相同的基础机制,但它们提供了不同的挑战,具有特定功能,例如不同类型和数量的角色、如何执行连击、生命条充能等。
DIAMBRA Arena 旨在最大限度地兼容所有主要的强化学习库。它原生提供了与两个最重要的软件包的接口:Stable Baselines 3 和 Ray RLlib,而 Stable Baselines 也可用但已弃用。它们的用法在官方文档和DIAMBRA Agents 示例存储库中都有说明。它可以通过类似的方式轻松地与任何其他软件包连接。
竞赛平台
DIAMBRA 还提供了一个与 Hugging Face Hub 完全集成的竞赛平台,您可以在其中提交您训练的智能体,并在史诗般的视频游戏锦标赛中与全球其他程序员竞争!
它设有一个公共排行榜,用户根据其智能体在我们不同环境中获得的最佳分数进行排名。
它还提供了根据您的智能体性能解锁酷炫成就的可能性。
提交的智能体将接受评估,其回合将在 DIAMBRA Twitch 频道上进行直播。
参考资料
要开始使用此环境,请查看以下资源
MineRL

MineRL 是一个 Python 库,它提供了一个 Gym 接口,用于与视频游戏 Minecraft 交互,并附带人类游戏玩法数据集。每年都会有与此库相关的挑战。查看网站
要开始使用此环境,请查看以下资源
DonkeyCar 模拟器

要开始使用此环境,请查看以下资源
预训练智能体
星际争霸 II

星际争霸 II 是一款著名的即时战略游戏。DeepMind 曾使用这款游戏进行深度强化学习研究,其成果为 Alphastar
要开始使用此环境,请查看以下资源
作者
本节由 Thomas Simonini 撰写
< > 在 GitHub 上更新