首页 > 其他好文 > 详细

有监督学习、无监督学习、强化学习比较

时间：2018-09-22 19:52:34 阅读：491 评论：0 收藏：0 [点我收藏+]

标签：状态功能难题解决标识问题聚类难度学习

有监督学习Supervised Learning：

从已经标记的样本中进行学习
可用于目标识别、分类
本身不适合交互环境，但是若用正确的行为(action)对场景(situation)进行标注，也可学习。
适用于标注难度不大，成本不高的情况。

无监督学习Unsupervised Learning：

从没有标记的样本中进行学习，以发现其中的结构
常用于聚类，标注不易的场景。

强化学习Reinforcement Learning：

其中没有监督者，只有一个reward信号
在与situation的交互中获取样例（训练样本）
agent的行为会影响之后一系列的data

Deep Q-Network

Q-Learning与神经网络的结合，简称 DQN。
解决的问题难题：状态的数量过多，并且需要人工去设计特征，而且一旦特征设计不好，则得不到想要的结果。
用神经网络处理状态过多的问题，取代原来 Q 表的功能。

有监督学习、无监督学习、强化学习比较

标签：状态功能难题解决标识问题聚类难度学习

原文地址：https://www.cnblogs.com/xbit/p/9690700.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！