7天强化学习总结

首页版块访问AI主站注册发帖

7天强化学习总结

秃————狼发布于2020-06 浏览:1488 回复:0

0

收藏

7天强化学习总结

快速回复

主要是自己的7天强化学习总结，具体的公式暂时不敲了（等大论文搞完再说吧），网上都有，这里主要说一些文字性的东西。
PARL这个框架把强化学习分为Agent、Model和Algorithm这三个部分，从代码上来说层次分明，各个接口调用都很方便。
课程内容干货满满，通过学习对5中算法的理解进一步加深，尤其是off-policy和on-policy、随机策略和确定性策略这两个方面。
调参方面，除了学习率之外，不同的算法搭配不同的网络激活函数；不涉及图像输入的话，2层全连接足够；
以上。

其他

收藏

点赞

0

个赞

快速回复

小编推荐

【征稿计划第二期】评测报告、使用攻略、行业案例

用户已被禁言 14回复

Baidu Create 2019 | 百度大脑

用户已被禁言 6回复

【颁奖】第三期百度大脑新品体验师

用户已被禁言 19回复

【四月评测】远场语音识别套件

goJhou 17回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服