强化学习7日体会

首页版块访问AI主站注册发帖

强化学习7日体会

137*****812 发布于2020-06 浏览:1315 回复:0

强化学习7日体会

快速回复

近日参加了百度强化学习7日线上学习，初步了解了强化学习的基本概念。

第一课：初时强化学习

1. 强化学习的概念及应用
2. 强化学习的核心知识
3. GYM、PARL
第二课：基于表格型方法求解RL

1. Sarsa 和 Q-Learning 算法
2. MDP 和 Q表格
3. 强化概念、TD更新等
4. 代码解析

第三课：基于神经网络方法求解RL

1. DQN 算法
2. 函数逼近与神经网络
3. DQN算法解析
4. PARLDQN代码
5. DQN训练展示

第四课：基于策略梯度求解RL

1. Policy_Gradient
2. 随机策略与策略梯度
3. PG算法
4. PG代码解析

第五课：连续动作空间上求解RL

1. DDPG 算法
2. 连续动作空间
3. DDPG代码与总结

其他

个赞

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服