Hugging Face
模型
数据集
空间
帖子
文档
解决方案
定价
登录
注册
深度强化学习课程文档
额外阅读
深度强化学习课程
🏡 查看所有资源
音频课程
社区计算机视觉课程
深度强化学习课程
扩散课程
3D 机器学习课程
游戏机器学习课程
自然语言处理课程
开源 AI 食谱
搜索文档
英文
单元 0. 欢迎来到课程
单元 1. 深度强化学习简介
简介
什么是强化学习?
强化学习框架
任务类型
探索/利用权衡
解决强化学习问题的两种主要方法
深度强化学习中的“深度”
总结
术语表
实践
测验
结论
额外阅读
单元 1 附加内容. 使用 Huggy 进行深度强化学习简介
直播 1. 课程工作方式、问答和与 Huggy 玩耍
单元 2. Q 学习简介
单元 3. 使用 Atari 游戏进行深度 Q 学习
单元 2 附加内容. 使用 Optuna 自动超参数调整
单元 4. 使用 PyTorch 进行策略梯度
单元 5. Unity ML-Agents 简介
单元 6. 使用机器人环境的 Actor-Critic 方法
单元 7. 多智能体和 AI 对抗 AI 简介
单元 8. 第 1 部分 近端策略优化 (PPO)
单元 8. 第 2 部分 使用 Doom 的近端策略优化 (PPO)
单元 3 附加内容. 强化学习高级主题
单元 5 附加内容. 使用 Godot RL 智能体进行模仿学习
认证和祝贺
加入 Hugging Face 社区
并获得增强文档体验的访问权限
协作模型、数据集和空间
使用加速推理加快示例速度
在文档主题之间切换
注册
开始使用
额外阅读
如果您想深入了解,这些是**可选阅读**。
深度强化学习
强化学习:导论,Richard Sutton 和 Andrew G. Barto 第 1、2 和 3 章
深度强化学习基础系列,L1 马尔可夫决策过程、精确求解方法、最大熵强化学习,作者:Pieter Abbeel
OpenAI 的 Spinning Up RL 第 1 部分:强化学习的关键概念
Gym
OpenAI Gym 入门:基本构建块
创建您自己的 Gym 自定义环境
<
>
更新
在 GitHub 上
←
结论
简介
→
额外
阅读
深度
强化
学习
Gym