Lesson1 强化学习初印象 学习笔记
发布于2020-06 浏览:3030 回复:2
2
收藏

1.智能
智能一部分来自遗传,另一部分来自后天的学习,后天的学习包括模仿和对环境的探索。

2.人工智能
人工智能最主要的是赋予物体自我学习意识,通过模仿和对已知环境的理解和认识来探索和应对未知的环境及事物。
人工智能对未知的事物进行多次的探索与试错可以自己总结出一条最佳的解决方案,然后进行强化学习,对以后遇到类似的情况进行更快速和高效的处理。

3.强化学习
1)核心思想:智能体在环境中学习,根据环境的状态,执行动作,并根据环境的反馈来指导更好的动作。
2)强化学习主要是试错和探索,强化学习在探索与利用中来实现预测和控制。
3)强化学习的两种方案:基于价值和基于策略。
4)分类:根据环境是否已知、按照学习目标和按照学习方式。

4.总结
RL的基本概念:智能体和环境、状态、动作和反馈信息;
RL应用:游戏、机器人、交通等;
RL与监督学习的主要区别:一个是同分布数据,一个是序列决策数据
RL如何解决问题:探索与利用

5.感想
人工智能最主要的实现自我学习,通过已知的事物学习解决未知的事物,对未知的事物可以进行智能的探索和学习,可以通过自己学习解决相似的问题能力。
通过第一课的学习让我重新认识了人工智能与强化学习的关系,知道了强化学习就是在不断的探索和利用来解决未知的事物,实现人工智能。

 

收藏
点赞
2
个赞
共2条回复 最后由電1705222OO02_回复于2022-04
#3用户已被禁言回复于2021-05

上海
http://xasgkfp.diytrade.com/
https://xasgkfp.diytrade.com/
http://cdfapiao.simplesite.com/
http://xakfp.simplesite.com/

0
#2用户已被禁言回复于2021-01

不错

0
TOP
切换版块