Python 中的高级强化学习:从 DQN 到 SAC
使用深度强化学习和 PyTorch 构建人工智能 (AI) 代理:DDPG、TD3、SAC、NAF、HER
课程英文名:Advanced Reinforcement Learning in Python from DQN to SAC
此视频教程共5.0小时,中英双语字幕,画质清晰无水印,源码附件全
下载地址
课程编号:251
百度网盘地址:https://pan.baidu.com/s/1_eoVIwUijTDjw8v5pVDccA?pwd=ndku
夸克网盘(不限速)地址:https://pan.quark.cn/s/ac8226352700
课程内容
你将会学到的
- 掌握一些最先进的强化学习算法。
- 了解如何创建可以在复杂环境中行动以实现其目标的 AI。
- 使用 Python 最流行的工具(PyTorch Lightning、OpenAI gym、Brax、Optuna)从头开始创建高级强化学习代理
- 了解如何执行超参数调整(为我们的 AI 学习选择最佳实验条件)
- 从根本上了解每种算法的学习过程。
- 调试和扩展所提供的算法。
- 从研究论文中理解和实施新算法。
课程内容
14 个章节 - 115 个讲座 - 总时长 8 小时 5 分钟展开所有章节
介绍5 个讲座 - 8 分钟
复习:马尔可夫决策过程 (MDP)11 个讲座 - 32 分钟
复习:Q-Learning5 个讲座 - 11 分钟
复习:神经网络简介7 个讲座 - 34 分钟
复习:深度 Q 学习4 个讲座 - 9 分钟
PyTorch 闪电15 个讲座 - 1 小时 20 分钟
使用 Optuna 进行超参数调整6 个讲座 - 25 分钟
连续动作空间的深度 Q 学习(归一化优势函数)19 个讲座 - 1 小时 17 分钟
复习:策略梯度方法5 个讲座 - 20 分钟
深度确定性策略梯度 (DDPG)13 个讲座 - 1 小时 9 分钟
还有 4 个章节
要求
- 熟悉 Python 编程
- 完成我们的课程”强化学习初学者到掌握”或熟悉强化学习的基础知识(或观看本课程中包含的练级部分)。
- 了解基本统计数据(均值、方差、正态分布)
说明
这是 Udemy 上最完整的高级强化学习课程。在其中,你将学习使用 PyTorch 和 PyTorch 闪电在 Python 中实现一些最强大的深度强化学习算法。你将从头开始实施根据经验解决控制任务的自适应算法。你将学习将这些技术与神经网络和深度学习方法相结合,以创建能够解决决策任务的自适应人工智能代理。
本课程将向你介绍强化学习技术的最新技术。它还将为你准备本系列的下一个课程,我们将在其中探索在其他类型的任务中表现出色的其他高级方法。
该课程的重点是培养实践技能。因此,在学习了每个方法家族最重要的概念之后,我们将从头开始在 jupyter notebook 中实现它们的一种或多种算法。
调平模块:
– 复习:马尔可夫决策过程 (MDP)。
– 复习:Q-Learning。
– 复习:神经网络简介。
– 复习:深度 Q 学习。
– 复习:策略梯度方法
高级强化学习:
– PyTorch 闪电。
– 使用 Optuna 进行超参数调整。
– 连续动作空间的深度 Q 学习(归一化优势函数 – NAF)。
– 深度确定性策略梯度 (DDPG)。
– 双延迟 DDPG (TD3)。
– 软演员-评论家 (SAC)。
– 事后经验回放 (HER)。
此课程面向哪些人:
- 想要在机器学习领域找到工作的开发人员。
- 寻求扩展知识广度的数据科学家/分析师和机器学习从业者。
- 机器人专业的学生和研究人员。
- 工科学生和研究人员。