Hub 文档
在 Hugging Face 使用 RL-Baselines3-Zoo
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
在 Hugging Face 使用 RL-Baselines3-Zoo
rl-baselines3-zoo
是一个使用 Stable Baselines3 进行强化学习的训练框架。
探索 Hub 中的 RL-Baselines3-Zoo
您可以通过在模型页面左侧过滤来查找 RL-Baselines3-Zoo 模型。
Stable-Baselines3 团队托管了超过 150 个经过训练的强化学习代理,并带有已调整的超参数,您可以在此处找到它们。
Hub 上的所有模型都附带了有用的功能
- 一个自动生成的模型卡片,包含描述、训练配置等信息。
- 有助于发现的元数据标签。
- 与其他模型进行比较的评估结果。
- 一个视频小部件,您可以在其中观看您的智能体执行任务。
使用现有模型
您可以使用 load_from_hub
从 Hub 中简单下载一个模型
# Download ppo SpaceInvadersNoFrameskip-v4 model and save it into the logs/ folder
python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga sb3
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/
您可以定义三个参数
--repo-name
:仓库的名称。-orga
:Hugging Face 用户名或组织。-f
:目标文件夹。
共享您的模型
您可以使用 push_to_hub
轻松上传您的模型。这将保存模型,评估模型,生成模型卡,并记录您的代理的重放视频,然后将完整的仓库推送到 Hub。
python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 --repo-name dqn-SpaceInvadersNoFrameskip-v4 -orga ThomasSimonini -f logs/
您可以定义三个参数
--repo-name
:仓库的名称。-orga
:您的 Hugging Face 用户名。-f
:模型保存的文件夹。