Hugging Face
模型
数据集
Spaces
帖子
文档
企业版
定价
登录
注册
Learn
深度强化学习课程文档
拓展阅读
深度强化学习课程
🏡 查看所有资源
Agents 课程
音频课程
社区计算机视觉课程
深度强化学习课程
扩散模型课程
LLM 课程
3D 机器学习课程
游戏机器学习课程
开源 AI 食谱
搜索文档
中文
单元 0. 欢迎来到课程
单元 1. 深度强化学习介绍
介绍
什么是强化学习?
强化学习框架
任务类型
探索/利用权衡
解决强化学习问题的两种主要方法
深度强化学习中的“深度”
总结
术语表
实践操作
测验
结论
拓展阅读
奖励单元 1. Huggy 深度强化学习介绍
直播 1. 课程如何进行、问答环节以及与 Huggy 互动
单元 2. Q-学习介绍
单元 3. 基于 Atari 游戏的深度 Q-学习
奖励单元 2. 使用 Optuna 进行自动超参数调优
单元 4. 基于 PyTorch 的策略梯度
单元 5. Unity ML-Agents 介绍
单元 6. 基于机器人环境的 Actor Critic 方法
单元 7. 多智能体和 AI 对抗 AI 介绍
单元 8. 第 1 部分 近端策略优化 (PPO)
单元 8. 第 2 部分 基于 Doom 的近端策略优化 (PPO)
奖励单元 3. 强化学习中的高级主题
奖励单元 5. 基于 Godot RL Agents 的模仿学习
认证与祝贺
加入 Hugging Face 社区
并获取增强的文档体验
在模型、数据集和 Spaces 上协作
通过加速推理获得更快的示例
切换文档主题
注册
开始
拓展阅读
如果您想深入学习,这些是
可选阅读材料
。
深度强化学习
《Reinforcement Learning: An Introduction》,Richard Sutton 和 Andrew G. Barto 著,第 1、2 和 3 章
深度强化学习基础系列,L1 MDP、精确解法、最大熵强化学习,作者 Pieter Abbeel
OpenAI Spinning Up RL 第 1 部分:强化学习的关键概念
Gym
OpenAI Gym 入门:基本构建模块
创建您自己的 Gym 自定义环境
<
>
在 GitHub 上更新
←
结论
介绍
→
拓展
阅读
深度
强化
学习
Gym