在 Hugging Face 使用 RL-Baselines3-Zoo

rl-baselines3-zoo 是一个使用 Stable Baselines3 进行强化学习的训练框架。

探索 Hub 中的 RL-Baselines3-Zoo

您可以通过在模型页面左侧过滤来查找 RL-Baselines3-Zoo 模型。

Stable-Baselines3 团队托管了超过 150 个经过训练的强化学习代理，并带有已调整的超参数，您可以在此处找到它们。

Hub 上的所有模型都附带了有用的功能

一个自动生成的模型卡片，包含描述、训练配置等信息。
有助于发现的元数据标签。
与其他模型进行比较的评估结果。
一个视频小部件，您可以在其中观看您的智能体执行任务。

使用现有模型

您可以使用 load_from_hub 从 Hub 中简单下载一个模型

# Download ppo SpaceInvadersNoFrameskip-v4 model and save it into the logs/ folder
python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga sb3
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/

您可以定义三个参数

--repo-name：仓库的名称。
-orga：Hugging Face 用户名或组织。
-f：目标文件夹。

共享您的模型

您可以使用 push_to_hub 轻松上传您的模型。这将保存模型，评估模型，生成模型卡，并记录您的代理的重放视频，然后将完整的仓库推送到 Hub。

python -m rl_zoo3.push_to_hub  --algo dqn  --env SpaceInvadersNoFrameskip-v4  --repo-name dqn-SpaceInvadersNoFrameskip-v4  -orga ThomasSimonini  -f logs/