近日参加了百度强化学习7日线上学习,初步了解了强化学习的基本概念。
第一课:初时强化学习
1. 强化学习的概念及应用
2. 强化学习的核心知识
3. GYM、PARL
第二课:基于表格型方法求解RL
1. Sarsa 和 Q-Learning 算法
2. MDP 和 Q表格
3. 强化概念、TD更新等
4. 代码解析
第三课:基于神经网络方法求解RL
1. DQN 算法
2. 函数逼近与神经网络
3. DQN算法解析
4. PARLDQN代码
5. DQN训练展示
第四课:基于策略梯度求解RL
1. Policy_Gradient
2. 随机策略与策略梯度
3. PG算法
4. PG代码解析
第五课:连续动作空间上求解RL
1. DDPG 算法
2. 连续动作空间
3. DDPG代码与总结
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块