深度强化学习课程文档

有趣的环境尝试

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

有趣的环境尝试

在这里,我们提供了一个有趣的环境列表,你可以尝试在这些环境中训练你的智能体

DIAMBRA Arena

diambraArena

DIAMBRA Arena 是一款软件包,其中包含一系列高质量的环境,用于强化学习研究和实验。它为流行的街机模拟视频游戏提供了标准接口,提供完全兼容 OpenAI Gym/Gymnasium 格式的 Python API,使其易于平稳直接地采用。

它支持所有主要的操作系统(Linux、Windows 和 MacOS),并且可以通过 Python PIP 轻松安装。它是完全免费使用的,用户只需在 官方网站 上注册即可。

此外,其 GitHub 存储库 提供了一系列示例,涵盖了主要的感兴趣用例,只需几个步骤即可运行。

主要特点

所有环境都是 episodic 强化学习任务,具有离散动作(游戏手柄按钮)和由屏幕像素加上额外的数值数据(RAM 值,如角色生命条或角色舞台侧面)组成的观察。

它们都支持单人 (1P) 和双人 (2P) 模式,使其成为探索标准强化学习、竞争性多智能体、竞争性人机交互、自博弈、模仿学习和人在环路中的完美资源。

接口游戏 已从最流行的格斗复古游戏中选择。虽然它们具有相同的基本机制,但它们提供了不同的挑战,具有特定的功能,例如不同类型和数量的角色、如何执行连击、生命条充能等。

DIAMBRA Arena 的构建旨在最大限度地提高与所有主要强化学习库的兼容性。它原生提供了与两个最重要的软件包的接口:Stable Baselines 3Ray RLlib,而 Stable Baselines 也可用但已弃用。它们的用法在 官方文档DIAMBRA Agents 示例存储库 中进行了说明。它可以轻松地以类似的方式与任何其他软件包接口。

竞赛平台

DIAMBRA 还提供了一个与 Hugging Face Hub 完全集成的竞赛平台,您可以在该平台上提交您训练有素的智能体,并与全球其他程序员在史诗般的视频游戏锦标赛中竞争!

它具有一个公共排行榜,用户根据他们的智能体在我们不同的环境中取得的最佳分数进行排名。

它还提供了根据您的智能体的性能解锁酷炫成就的可能性。

提交的智能体将进行评估,其 episodes 将在 DIAMBRA Twitch 频道 上直播。

参考资料

要开始使用此环境,请查看以下资源

MineRL

MineRL

MineRL 是一个 Python 库,它提供了一个 Gym 接口,用于与视频游戏 Minecraft 交互,并附带人类游戏数据集。每年都有关于此库的挑战赛。查看 网站

要开始使用此环境,请查看以下资源

DonkeyCar 模拟器

Donkey Car Donkey 是一个用于业余遥控车的自动驾驶汽车平台。此模拟器版本构建在 Unity 游戏平台上。它使用其内部物理和图形,并连接到 donkey Python 进程,以使用我们训练的模型来控制模拟的 Donkey(汽车)。

要开始使用此环境,请查看以下资源

星际争霸 II

Alphastar

星际争霸 II 是一款著名的实时战略游戏。DeepMind 在其使用 Alphastar 的深度强化学习研究中使用了这款游戏

要开始使用此环境,请查看以下资源

作者

本节由 Thomas Simonini 撰写

< > 在 GitHub 上更新