Hub 文档
在 Hugging Face 上使用 RL-Baselines3-Zoo
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
在 Hugging Face 上使用 RL-Baselines3-Zoo
rl-baselines3-zoo
是一个使用 Stable Baselines3 的强化学习训练框架。
在 Hub 中探索 RL-Baselines3-Zoo
您可以通过在模型页面的左侧进行筛选来找到 RL-Baselines3-Zoo 模型。
Stable-Baselines3 团队托管了包含 150 多个经过训练的强化学习智能体的集合,这些智能体具有调整后的超参数,您可以在这里找到它们。
Hub 上的所有模型都带有有用的功能
- 自动生成的模型卡片,包含描述、训练配置等。
- 有助于发现的元数据标签。
- 用于与其他模型比较的评估结果。
- 一个视频小部件,您可以在其中观看您的智能体执行。
使用现有模型
您可以简单地使用 load_from_hub
从 Hub 下载模型
# Download ppo SpaceInvadersNoFrameskip-v4 model and save it into the logs/ folder
python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga sb3
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/
您可以定义三个参数
--repo-name
: 仓库的名称。-orga
: Hugging Face 用户名或组织。-f
: 目标文件夹。
分享您的模型
您可以使用 push_to_hub
轻松上传您的模型。 这将保存模型,评估它,生成模型卡片并记录您的智能体的重播视频,然后再将完整的仓库推送到 Hub。
python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 --repo-name dqn-SpaceInvadersNoFrameskip-v4 -orga ThomasSimonini -f logs/
您可以定义三个参数
--repo-name
: 仓库的名称。-orga
: 您的 Hugging Face 用户名。-f
: 模型保存的文件夹。