Hub 文档

在 Hugging Face 使用 RL-Baselines3-Zoo

Hugging Face's logo
加入 Hugging Face 社区

并获得增强版文档体验

开始使用

在 Hugging Face 上使用 RL-Baselines3-Zoo

rl-baselines3-zoo 是一个使用 Stable Baselines3 进行强化学习的训练框架。

在 Hub 上探索 RL-Baselines3-Zoo

您可以在 模型页面 左侧的过滤器中找到 RL-Baselines3-Zoo 模型。

Stable-Baselines3 团队托管了一系列 +150 个训练过的强化学习代理,它们具有经过优化的超参数,您可以在 这里 找到它们。

Hub 上的所有模型都具有有用的功能

  1. 自动生成的模型卡片,其中包含描述、训练配置等。
  2. 有助于发现的元数据标签。
  3. 评估结果,用于与其他模型进行比较。
  4. 一个视频小部件,您可以在其中观看您的代理执行操作。

使用现有模型

您可以使用 load_from_hub 从 Hub 下载模型。

# Download ppo SpaceInvadersNoFrameskip-v4 model and save it into the logs/ folder
python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga sb3
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/

您可以定义三个参数

  • --repo-name: 仓库名称。
  • -orga: Hugging Face 用户名或组织。
  • -f: 目标文件夹。

分享您的模型

您可以使用 push_to_hub 轻松上传您的模型。这将保存模型、对其进行评估、生成模型卡片并记录您代理的回放视频,然后将完整的仓库推送到 Hub。

python -m rl_zoo3.push_to_hub  --algo dqn  --env SpaceInvadersNoFrameskip-v4  --repo-name dqn-SpaceInvadersNoFrameskip-v4  -orga ThomasSimonini  -f logs/

您可以定义三个参数

  • --repo-name: 仓库名称。
  • -orga: 您的 Hugging Face 用户名。
  • -f: 保存模型的文件夹。

其他资源

< > 更新 在 GitHub 上