Hugging Face
模型
数据集
Spaces
帖子
文档
企业版
定价
登录
注册
Learn
深度强化学习课程文档
附加阅读
深度强化学习课程
🏡 查看所有资源
智能体课程
音频课程
社区计算机视觉课程
深度强化学习课程
扩散模型课程
LLM 课程
3D 机器学习课程
游戏机器学习课程
开源 AI 食谱
搜索文档
EN
单元 0. 欢迎来到课程
单元 1. 深度强化学习介绍
奖励单元 1. 使用 Huggy 深度强化学习介绍
直播 1. 课程如何进行,问答,以及玩转 Huggy
单元 2. Q-Learning 介绍
单元 3. 使用 Atari 游戏的深度 Q-Learning
介绍
从 Q-Learning 到深度 Q-Learning
深度 Q 网络 (DQN)
深度 Q 算法
词汇表
实践
测验
结论
附加阅读
奖励单元 2. 使用 Optuna 自动超参数调优
单元 4. 使用 PyTorch 的策略梯度
单元 5. Unity ML-Agents 介绍
单元 6. 使用机器人环境的 Actor Critic 方法
单元 7. 多智能体和 AI vs AI 介绍
单元 8. 第 1 部分 近端策略优化 (PPO)
单元 8. 第 2 部分 使用 Doom 的近端策略优化 (PPO)
奖励单元 3. 强化学习中的高级主题
奖励单元 5. 使用 Godot RL Agents 的模仿学习
认证与祝贺
加入 Hugging Face 社区
并获得增强的文档体验
协作进行模型、数据集和 Spaces
通过加速推理获得更快的示例
切换文档主题
注册
开始使用
附加阅读
这些是
可选的阅读材料
,如果您想深入了解。
深度强化学习基础系列,L2 深度 Q-Learning,作者:Pieter Abbeel
使用深度强化学习玩 Atari 游戏
双重深度 Q-Learning
优先经验回放
决斗深度 Q-Learning
<
>
在 GitHub 上更新
←
结论
介绍
→
附加
阅读